• Войти
Работа в Санкт-Петербурге
наверх
Ищу сотрудников
Ищу работу
Создать вакансию
Подбор персонала
Войти Работа в Санкт-Петербурге
Работа в Санкт-Петербурге
наверх
  1. Работа в Санкт-Петербурге
  2. База резюме
  3. ⚫ Информационные технологии / IT / Интернет✔
отправить приглашение
file_download

Data scientist

от 19 Февраля 2025

Ильдар Мухамедович

Возраст

22 года (04 Августа 2003)

Город

Санкт-Петербург
Переезд невозможен

Гражданство

Россия

Зарегистрируйтесь или войдите, чтобы увидеть контакты соискателя
Тип занятости

Полная занятость

Опыт работы

1 год

Data scientist
МТС в Санкт-Петербурге
Информационные технологии / IT / Интернет
1 год ,
Декабрь 2023 - Декабрь 2024

Обязанности:
- Отбор и настройка языковых моделей (LLAMA, QWEN и др.) для различных задач: парсинг, семантический анализ, структурированный вывод
- Обучение моделей Spacy, промпт-инжиниринг, fine-tuning языковых моделей (Llama 3.1, Bert, e5-large, QWEN)
- Решение задач семантического анализа, матчинга, классификации текстов, выделения именованных сущностей, суммаризации текстов
- Разворачивание и оптимизация работы vLLM на сервере с GPU, настройка асинхронных запросов и обеспечение стабильности работы
- End-to-end разработка и внедрение ML-решений от идеи до production: сбор данных, обучение моделей, автоматизация расчетов, упаковка в сервисы и контейнеризация
- Разработка умных парсеров на основе языковых моделей для извлечения структурированных данных из HTML-страниц
- Разработка мультиагентных чатботов с использованием LangChain и LangGraph, настройка RAG-систем и модерации
- Разработка, рефакторинг, тестирование и разворачивание ETL-пайплайнов (Kafka, ClickHouse) и API (Flask, FastAPI)
- Создание серверов на FastAPI, настройка асинхронных обработок и интеграция с брокерами сообщений (Kafka)
- Мониторинг производительности и точности моделей, поддержка и развитие внедренных решений
- Проведение исследований и проверка гипотез с использованием LLM и классических ML-моделей
- Анализ трендов в области AI и NLP, исследование новых методов и подходов в машинном обучении

Достижения:
- Внедрение и настройка языковой модели на локальных серверах позволило снизить затраты бизнеса на запросы к языковым моделям на 40%
- Оптимизация работы vLLM позволила сократить время обработки запросов на 600%, что увеличило производительность всех сервисов и продуктов, использующих языковую модель
- Разработанный умный парсер повысил точность извлечения данных из HTML-страниц до 95%, а также добавил данным структурированность по сущностям
- Fine-tuning языковых моделей улучшил точность классификации при семантическом анализе текстов до 93%, что позволило увеличить конверсию в рекомендательной системе на 20%
- Разработанный мультиагентный чатбот снизил нагрузку на старые сервисы на 15%, обработав более 100 тысяч запросов за первый месяц работы
- Внедрение RAG-системы для чатбота увеличило точность ответов на 30%, что повысило удовлетворенность пользователей и повысило общий функционал продукта

Реализованные проекты:
- Развернута и настроена локальная языковая модель (LLM), способная без падений обслуживать высокие нагрузки со стороны пользователей
- Создан полностью рабочий пайплайн из 3 моделей, который классифицирует, суммирует и рекомендует контент на основе объектов из баз данных, увеличив вовлеченность пользователей в рекомендательной медиа-системе
- Разработан чатбот с использованием LangChain и RAG-систем, который обрабатывает запросы пользователей и предоставляет структурированные данные по сайтам
- Созданы инструменты, которые позволяют полностью автоматизировать процессы извлечения данных, сократив время обработки

Образование
Санкт-Петербургский политехнический университет Петра Великого (СПбПУ)

Высшее

Физико-Мехначеский Институт, Прикладная математика и информатика (биоинформатика)

Санкт-Петербург, 2021 — 2025 гг.

Курсы и тренинги
Прикладной DS в финтехе
2023 — 2024 гг.

Alfa Campus, образовательные курсы по IT от Альфа-Банка (Data science)

Специализация по машинному обучению и анализу данных
2021 — 2021 гг.

coursera (Data science)

Иностранные языки

Китайский — Базовые знания

Английский — Разговорный

О себе

О себе:

- Промышленный опыт разработки на Python/SQL
- Уверенное владение инструментами ML/DL: PyTorch, NumPy, Pandas, SciPy, sklearn, HuggingFace, Transformers, matplotlib, Spark и т.д.
- Развитые инженерные навыки, знакомство с инструментами разработки: bash, git, gitlab, jira;
- Знание look-alike моделей, response моделей и uplift-моделирования (t-learner, x-learner, RandomForest)
- Знание пайплайнов для прогнозирования временных рядов (от feature engineering до построения бустинговых моделей и SARIMAX-решений)
- Знание комплексных моделей CLTV (с использованием продуктовых кластеров и структурного анализа продуктов)
- Знание основ линейной алгебры, теории вероятностей и математической статистики
- Понимание основных алгоритмов Machine Learning (линейные модели, дерево решений, бустинг, бэггинг, kmeans, svd и т.д.) и Deep Learning (рекуррентные и свёрточные сети, современные языковые модели)
- Знакомство с архитектурой transformers
- Опыт в написании и оптимизации промптов (в том числе системных промптов) для больших языковых моделей.
- Знание PySpark, SQL, опыт работы с базами данных
- Опыт работы с брокером сообщений kafka
- Опыт работы с NLP-библиотеками: pymorphy2, NLTK, Gensim, spaCy, regexp
- Индустриальный опыт разработки, обучения, тестирования, выведения моделей в эксплуатацию и мониторинга качества


Достижения:

Хакатон EESTech Challenge 2024 [30 - 31 март 2024г] Победа в хакатоне (1 место)
- Дата-клининг и дата-препроцессинг
- Построение модели поиска аномалий в работе трактора на основе данных его телеметрии.
- Построение модели предсказания поломки транспорта на основе данных его телеметрии.
- Разработка демо-версии десктоп приложения для дальнейшей его интеграции в бизнес.
- Модели бустинга (catboost), модели кластеризации, поиск аномалий, pyQt6.

Хакатон NEFTECODE 2024 [Апрель 2024г] Призер (3 место)
- Дата-клининг и дата-препроцессинг
- Feature engeneering для химических данных
- Построение модели и пайплайна предсказания физического свойства смеси по химической формуле его составляющих
- Fine-tune модели BERT для создания и дальнейшего использования эмбеддингов, построенных на основе химических формул
- Разработка и использование моделей GAN для увеличения обучающей выборки

Хакатон IT Purple Hack [9 - 15 марта 2024г] Финалист
- Построение модели предсказания перехода клиентов банка между продуктовыми кластерами в рамках задачи CLTV
- Модели бустинга (catboost, LightGBM), Соревновательный Data science.

Чемпионат Cup IT 2024 [18 марта ‐ 2 апреля 2024г] HQA (High Quality Award)
- Построение рекомендательные системы для составления планограммы магазина
- Построение модели прогнозирования спроса
- Анализ датасета, предсказание временных рядов, расчёт операционных метрик для ритейла (OSA, OOS, SOS), машинное зрение

Открыть контакты соискателя

Зарегистрируйтесь или войдите, чтобы увидеть контакты соискателя

Похожие резюме

24 мая, 2009

Младший системный администратор

20 000 руб

Владимир Валентинович

Город

Санкт-Петербург

Возраст

51 год (29 декабря 1974)

Опыт работы:

2 года и 11 месяцев

Последнее место работы:

Ведущий специалист, ООО Луком-А
01.2005 - 12.2007

отправить приглашение подробнее

29 марта, 2010

Менеджер по продажам

25 000 руб

Андрей Сергеевич

Город

Санкт-Петербург

Возраст

39 лет (20 мая 1986)

Опыт работы:

2 года

Последнее место работы:

монтажник (бригадир), Электронстрой
01.2006 - 01.2008

отправить приглашение подробнее

28 мая, 2009

Java-разработчик

60 000 руб

Никита Геннадьевич

Город

Санкт-Петербург

Возраст

40 лет ( 7 мая 1985)

Опыт работы:

20 лет и 6 месяцев

Последнее место работы:

Java developer, Exigen Services
07.2008 - по текущее время

отправить приглашение подробнее
Все похожие резюме

Резюме размещено в отрасли

Информационные технологии / IT / Интернет:
  • Другое
Подпишитесь на похожие резюме
к поиску резюме
Популярные специализации
  • Продавец-консультант
  • Продавец-кассир
  • Другое
  • Менеджер по продажам
  • Менеджер по работе с клиентами
  • Администратор
Инструменты соискателя
  • Разместить резюме
  • Найти работу
  • Поиск вакансий
  • Каталог вакансий
  • Соглашение по содействию в трудоустройстве
  • Защита персональных данных
  • Архивный каталог
  • Вакансии по профессиям
  • Поиск по городам
Инструменты работодателя
  • Разместить вакансию
  • Найти сотрудника
  • Поиск резюме
  • Каталог резюме
  • Тарифы
  • Информер с вакансиями
  • Резюме по профессиям
Больше всего ищут
  • Бармен
  • Брокер
  • Водитель такси
  • Корреспондент
  • Охранник
  • Переводчик

© 2007 - 2026 «Карьерист.ру»

  • О нас
  • Обратная связь