LLM/ML Engineer

05 Июля 2025

Мэлон Фэшн Груп
Мэлон Фэшн Груп

Город:

Санкт-Петербург

Занятость:

Полная занятость

Откликнуться

Компания "Мэлон Фэшн Груп"

Обязанности:

  • Разработка, оптимизация и поддержка пайплайнов обучения и инференса LLM и ML моделей.
  • Интеграция LLM решений в бизнес-процессы (например, чат-боты, автоматизация коммуникаций, генерация описаний товаров, анализ клиентских обращений).
  • Настройка и поддержка инфраструктуры для деплоя LLM (GPU, FastAPI, Kubernetes, inference-слои).
  • Оптимизация моделей (quantization, distillation, sparsity), снижение стоимости и времени инференса.
  • Поддержка CI/CD процессов для ML/LLM пайплайнов, настройка мониторинга качества моделей.
  • Участие в проектировании feature stores и подготовке экспериментальных витрин (совместно с Data Scientists и Data Engineers).
  • Документирование архитектуры, подходов к деплою и best practices.
  • Взаимодействие с Data Engineering и бизнес-командами для масштабирования и поддержки решений.

Требования:

  • Опыт разработки ML/LLM решений и деплоя моделей в production — от 2 лет.
  • Отличное знание Python, включая ML/DL-стек (PyTorch, TensorFlow, Transformers, Hugging Face).
  • Опыт работы с LLM (fine-tuning, RAG, кастомизация под бизнес-задачи).
  • Глубокое понимание архитектуры inference пайплайнов (FastAPI, Triton Inference Server, ONNX).
  • Опыт работы с GPU (CUDA, управление нагрузкой, профилирование).
  • Понимание CI/CD для ML (Kubeflow, MLflow, Argo, GitLab CI).
  • Знание принципов мониторинга моделей (drift detection, логирование, метрики качества).
  • Опыт работы с объектными хранилищами (S3), Spark и Data Lake House архитектурой.

Будет плюсом:

  • Опыт оптимизации больших языковых моделей (LLM quantization, pruning, distillation).
  • Знание архитектуры real-time inference (low-latency приложения).
  • Опыт интеграции LLM в клиентские каналы (мессенджеры, CRM, e-commerce).
  • Понимание GDPR/ФЗ-152 и data privacy.

Открыть контакты работодателя

Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя

Прикрепите резюме для отклика

Похожие вакансии

08 Июля

Senior AQA Python Engineer (Auto, Python)

Санкт-Петербург

от 250 000  до 300 000 руб.

Компания "Live Typing" Привет! Мы – компания Лайв Тайпинг. Уже более 14 лет создаем мобильные приложения и веб-сервисы для наших клиентов. Мы...

08 Июля

QA Engineer( Nexign (АО «Нэксайн») )

Санкт-Петербург

Компания "Nexign (АО «Нэксайн»)" Ищем QA-инженера в команду автоматизации E2E тестирования. о задачах Автоматизация автотестов для...

08 Июля

Senior Network engineer for PreSale support / Старший сетевой инженер по поддержке PreSale(KORNFELD)

Санкт-Петербург

Компания "КНС ГРУПП" Мы активно расширяем портфель наших продуктов и открываем поиск талантливого Старшого сетевого инженера по поддержке...

08 Июля

ML-инженер GPT, LLM( OCS Distribution )

Санкт-Петербург

Компания "OCS Distribution" Мы – компания OCS Distribution, крупнейший в РФ дистрибьютор высоких технологий, инженерных решений, компьютерной и...

08 Июля

Инженер по тестированию программного обеспечения (QA Engineer)

Санкт-Петербург

от 110 000  до 180 000 руб.

Компания "Комита Автоматизация" Задачи и обязанности: Анализ требований и подготовка исходных данных Дизайн тест-планов и тест-кейсов...

Подпишитесь на похожие вакансии