LLM/ML Engineer
05 Июля 2025

Город:
Санкт-Петербург
Занятость:
Полная занятость
Компания "Мэлон Фэшн Груп"
Обязанности:
- Разработка, оптимизация и поддержка пайплайнов обучения и инференса LLM и ML моделей.
- Интеграция LLM решений в бизнес-процессы (например, чат-боты, автоматизация коммуникаций, генерация описаний товаров, анализ клиентских обращений).
- Настройка и поддержка инфраструктуры для деплоя LLM (GPU, FastAPI, Kubernetes, inference-слои).
- Оптимизация моделей (quantization, distillation, sparsity), снижение стоимости и времени инференса.
- Поддержка CI/CD процессов для ML/LLM пайплайнов, настройка мониторинга качества моделей.
- Участие в проектировании feature stores и подготовке экспериментальных витрин (совместно с Data Scientists и Data Engineers).
- Документирование архитектуры, подходов к деплою и best practices.
- Взаимодействие с Data Engineering и бизнес-командами для масштабирования и поддержки решений.
Требования:
- Опыт разработки ML/LLM решений и деплоя моделей в production — от 2 лет.
- Отличное знание Python, включая ML/DL-стек (PyTorch, TensorFlow, Transformers, Hugging Face).
- Опыт работы с LLM (fine-tuning, RAG, кастомизация под бизнес-задачи).
- Глубокое понимание архитектуры inference пайплайнов (FastAPI, Triton Inference Server, ONNX).
- Опыт работы с GPU (CUDA, управление нагрузкой, профилирование).
- Понимание CI/CD для ML (Kubeflow, MLflow, Argo, GitLab CI).
- Знание принципов мониторинга моделей (drift detection, логирование, метрики качества).
- Опыт работы с объектными хранилищами (S3), Spark и Data Lake House архитектурой.
Будет плюсом:
- Опыт оптимизации больших языковых моделей (LLM quantization, pruning, distillation).
- Знание архитектуры real-time inference (low-latency приложения).
- Опыт интеграции LLM в клиентские каналы (мессенджеры, CRM, e-commerce).
- Понимание GDPR/ФЗ-152 и data privacy.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
08 Июля
Senior AQA Python Engineer (Auto, Python)
Санкт-Петербург
от 250 000 до 300 000 руб.
Компания "Live Typing" Привет! Мы – компания Лайв Тайпинг. Уже более 14 лет создаем мобильные приложения и веб-сервисы для наших клиентов. Мы...
08 Июля
QA Engineer( Nexign (АО «Нэксайн») )
Санкт-Петербург
Компания "Nexign (АО «Нэксайн»)" Ищем QA-инженера в команду автоматизации E2E тестирования. о задачах Автоматизация автотестов для...
08 Июля
Senior Network engineer for PreSale support / Старший сетевой инженер по поддержке PreSale(KORNFELD)
Санкт-Петербург
Компания "КНС ГРУПП" Мы активно расширяем портфель наших продуктов и открываем поиск талантливого Старшого сетевого инженера по поддержке...
08 Июля
ML-инженер GPT, LLM( OCS Distribution )
Санкт-Петербург
Компания "OCS Distribution" Мы – компания OCS Distribution, крупнейший в РФ дистрибьютор высоких технологий, инженерных решений, компьютерной и...
08 Июля
Инженер по тестированию программного обеспечения (QA Engineer)
Санкт-Петербург
от 110 000 до 180 000 руб.
Компания "Комита Автоматизация" Задачи и обязанности: Анализ требований и подготовка исходных данных Дизайн тест-планов и тест-кейсов...
Вакансия размещена в отрасли