Senior Data Science/ML ops

23 Декабря

Партнерские Вакансии

Город:

Санкт-Петербург

Занятость:

Полная занятость

Опыт:

Более 6 лет

Компания "Совкомбанк Технологии"

Совкомбанк Технологии – IT-компания финансовой Группы «Совкомбанк», топ-3 работодателей по версии Хабр Карьера.

У нас работает более 7000 специалистов. Мы развиваем экосистему карты рассрочки Халва, приложение Совкомбанк Инвестиции и собственные корпоративные продукты, проводим масштабные интеграции сервисов и компаний.

Присоединяйся к команде – давай вместе прокачивать финтех!

ПРОЕКТ: Участие в разработке и внедрении масштабируемой, отказоустойчивой ML-платформы для обработки речи и семантического анализа, включающей автоматическое распознавание речи (ASR), синтез речи (TTS), языковые модели (LLM), а также RAG-решения для генерации и извлечения информации. Проект ориентирован на production-эксплуатацию в высоконагруженной среде с низкой задержкой, включая интеграцию с VoIP-платформами и автоматизацию бизнес-процессов.

СТЕК:

  • ML/AI: PyTorch, Transformers, LLM (включая fine-tuning), RAG, CTC, RNNT, кластеризация, векторные БД (Qdrant), графовые БД.
  • Инференс и оптимизация: NVIDIA Triton Inference Server (BLS, TensorRT), ONNX, CUDA.
  • Оптимизация производительности ML Ops: Airflow, Kubeflow, Grafana, CI/CD для ML.
  • Интеграции и коммуникации: gRPC, Kafka, Redis, PostgreSQL (с оптимизацией запросов), WebRTC, SIP.
  • Backend и автоматизация: Golang, Java, Python (asyncio, multiprocessing), FastAPI.
  • Инфраструктура: Docker, Kubernetes, микросервисная архитектура, брокеры сообщений.
  • Дополнительно: n8n (оркестрация бизнес-процессов), векторные и графовые БД (например, Neo4j), VoIP-интеграции.

Обязанности:

  • Разработка, дообучение и оптимизация ML-моделей: LLM, ASR (CTC, RNNT), TTS, RAG-систем на основе трансформеров.
  • Развертывание и настройка высокопроизводительного инференса с использованием Triton Inference Server и TensorRT.
  • Построение и поддержка ML-пайплайнов: ETL, препроцессинг, обучение, валидация, A/B тестирование.
  • Обеспечение CI/CD в ML: автоматизация тестирования, версионирование моделей, мониторинг дрейфа данных и качества.
  • Интеграция ML-моделей в production-системы через gRPC, Kafka, REST (FastAPI) Разработка запросов к PostgreSQL, работа с векторными (Qdrant) и графовыми БД для семантического поиска и связей.
  • Построение отказоустойчивых микросервисных систем: контейнеризация (Docker), оркестрация (Kubernetes), масштабирование.
  • Интеграция с VoIP-платформами, обработка аудиопотоков в реальном времени.
  • Автоматизация бизнес-процессов с использованием n8n.
  • Наставничество, декомпозиция сложных задач, код-ревью, участие в R&D и внедрении новых технологий.
  • Обеспечение production-ready решений с акцентом на производительность, масштабируемость и отказоустойчивость.
Требования:
  • Глубокие знания в ML/AI, включая обучение и дообучение моделей (LLM, RAG, трансформеры, кластеризация).
  • Опыт работы с Triton Inference Server (развертывание, оптимизация, BLS, TensorRT).
  • Практика в ML Ops: CI/CD для ML, мониторинг моделей, управление пайплайнами (Airflow, Kubeflow, Grafana).
  • Умение развертывать и дообучать ASR, STT, TTS модели (например CTC, RNNT).
  • Навыки работы с GRPC, Kafka, Redis, PostgreSQL (включая оптимизацию запросов).
  • Программирование: Golang, Java, асинхронный/многопоточный Python (asyncio, multiprocessing).
  • Глубокие знания библиотек Numpy, Pandas, sklearn, FastAPi.
  • Глубокие знания Pytorch.
Условия:
  • Работу в аккредитованной ИТ-компании;
  • Оформление по ТК РФ с первого дня выхода на работу;
  • График работы: 5/2 (выходные: суббота, воскресенье);
  • Гибкое начало и окончание рабочего дня;
  • Рассматриваем кандидатов в разных городах: Казань, Уфа, Новосибирск, Санкт-Петербург, Нижний Новгород, Краснодар и другие;
  • Профессиональную команду и опытных наставников;
  • Погружение в ИИ-культуру – взаимодействуем с искусственным интеллектом на постоянной основе и обучаем этому новичков, предоставляем бесплатных ИИ-помощников;

  • У нас широкий портфель бенефитов по программе софинансирования (ДМС со стоматологией, фитнес, школа ин. языков на выбор, скидки на коробочные продукты банка и партнеров);
  • Мы поможем развить вашу проф. экспертизу: оплатим профессиональные тренинги и внешние образовательные курсы, участвуем в ИТ активностях (митапы, хакатоны, юконы);
  • Вовлеченность, комфорт, свобода, минимум бюрократии, нет дресс-кода, гибкое начало и завершение рабочего дня, приходи – с нами будет интересно!
Похожие вакансии

17 Декабря

Middle/Senior Frontend Developer (React)

Санкт-Петербург

Компания "Evercode Lab" Привет! Наша крутая команда из подразделения Evercode Lab развивает финансовый сервис мирового уровня, которым...

Отправить резюме подробнее

17 Декабря

DevOps инженер (ученик)

Санкт-Петербург

от 70 000 до 80 000 руб.

Компания "Aston" Кто сказал, что нужен опыт? Мы ценим твой потенциал! Мы — российская аккредитованная ИТ-компания, обладатель премии...

Отправить резюме подробнее

17 Декабря

ML Engineer

Санкт-Петербург

Компания "IT-hunters" Мы ищем в нашу команду Middle/Senior ML-инженеров. У нас большая экспертиза в используемых технологиях и мало legacy. Мы...

Отправить резюме подробнее

17 Декабря

DevOps-инженер (Яндекс Браузер для организаций)

Санкт-Петербург

от 78 000 руб.

Компания "Yandex Crowd" Если вы работали с технически сложными проектами, знакомы с автоматизацией процессов и хотите участвовать в развитии...

Отправить резюме подробнее

17 Декабря

Data analyst / Аналитик данных (стажер)

Санкт-Петербург

от 90 000 до 100 000 руб.

Компания "Aston" Мы — российская аккредитованная ИТ-компания, четырехкратный обладатель премии «Работодатель года» по версии Habr. C 2007 года...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: