Data scientist
Ильдар Мухамедович
Возраст
22 года (04 Августа 2003)
Город
Санкт-Петербург
Переезд невозможен
Гражданство
Россия
Полная занятость
1 год
Информационные технологии / IT / Интернет
Обязанности:
- Отбор и настройка языковых моделей (LLAMA, QWEN и др.) для различных задач: парсинг, семантический анализ, структурированный вывод
- Обучение моделей Spacy, промпт-инжиниринг, fine-tuning языковых моделей (Llama 3.1, Bert, e5-large, QWEN)
- Решение задач семантического анализа, матчинга, классификации текстов, выделения именованных сущностей, суммаризации текстов
- Разворачивание и оптимизация работы vLLM на сервере с GPU, настройка асинхронных запросов и обеспечение стабильности работы
- End-to-end разработка и внедрение ML-решений от идеи до production: сбор данных, обучение моделей, автоматизация расчетов, упаковка в сервисы и контейнеризация
- Разработка умных парсеров на основе языковых моделей для извлечения структурированных данных из HTML-страниц
- Разработка мультиагентных чатботов с использованием LangChain и LangGraph, настройка RAG-систем и модерации
- Разработка, рефакторинг, тестирование и разворачивание ETL-пайплайнов (Kafka, ClickHouse) и API (Flask, FastAPI)
- Создание серверов на FastAPI, настройка асинхронных обработок и интеграция с брокерами сообщений (Kafka)
- Мониторинг производительности и точности моделей, поддержка и развитие внедренных решений
- Проведение исследований и проверка гипотез с использованием LLM и классических ML-моделей
- Анализ трендов в области AI и NLP, исследование новых методов и подходов в машинном обучении
Достижения:
- Внедрение и настройка языковой модели на локальных серверах позволило снизить затраты бизнеса на запросы к языковым моделям на 40%
- Оптимизация работы vLLM позволила сократить время обработки запросов на 600%, что увеличило производительность всех сервисов и продуктов, использующих языковую модель
- Разработанный умный парсер повысил точность извлечения данных из HTML-страниц до 95%, а также добавил данным структурированность по сущностям
- Fine-tuning языковых моделей улучшил точность классификации при семантическом анализе текстов до 93%, что позволило увеличить конверсию в рекомендательной системе на 20%
- Разработанный мультиагентный чатбот снизил нагрузку на старые сервисы на 15%, обработав более 100 тысяч запросов за первый месяц работы
- Внедрение RAG-системы для чатбота увеличило точность ответов на 30%, что повысило удовлетворенность пользователей и повысило общий функционал продукта
Реализованные проекты:
- Развернута и настроена локальная языковая модель (LLM), способная без падений обслуживать высокие нагрузки со стороны пользователей
- Создан полностью рабочий пайплайн из 3 моделей, который классифицирует, суммирует и рекомендует контент на основе объектов из баз данных, увеличив вовлеченность пользователей в рекомендательной медиа-системе
- Разработан чатбот с использованием LangChain и RAG-систем, который обрабатывает запросы пользователей и предоставляет структурированные данные по сайтам
- Созданы инструменты, которые позволяют полностью автоматизировать процессы извлечения данных, сократив время обработки
Высшее
Санкт-Петербург, 2021 — 2025 гг.
Прикладной DS в финтехе
Alfa Campus, образовательные курсы по IT от Альфа-Банка (Data science)
Специализация по машинному обучению и анализу данных
coursera (Data science)
Китайский — Базовые знания
Английский — Разговорный
О себе:
- Промышленный опыт разработки на Python/SQL
- Уверенное владение инструментами ML/DL: PyTorch, NumPy, Pandas, SciPy, sklearn, HuggingFace, Transformers, matplotlib, Spark и т.д.
- Развитые инженерные навыки, знакомство с инструментами разработки: bash, git, gitlab, jira;
- Знание look-alike моделей, response моделей и uplift-моделирования (t-learner, x-learner, RandomForest)
- Знание пайплайнов для прогнозирования временных рядов (от feature engineering до построения бустинговых моделей и SARIMAX-решений)
- Знание комплексных моделей CLTV (с использованием продуктовых кластеров и структурного анализа продуктов)
- Знание основ линейной алгебры, теории вероятностей и математической статистики
- Понимание основных алгоритмов Machine Learning (линейные модели, дерево решений, бустинг, бэггинг, kmeans, svd и т.д.) и Deep Learning (рекуррентные и свёрточные сети, современные языковые модели)
- Знакомство с архитектурой transformers
- Опыт в написании и оптимизации промптов (в том числе системных промптов) для больших языковых моделей.
- Знание PySpark, SQL, опыт работы с базами данных
- Опыт работы с брокером сообщений kafka
- Опыт работы с NLP-библиотеками: pymorphy2, NLTK, Gensim, spaCy, regexp
- Индустриальный опыт разработки, обучения, тестирования, выведения моделей в эксплуатацию и мониторинга качества
Достижения:
Хакатон EESTech Challenge 2024 [30 - 31 март 2024г] Победа в хакатоне (1 место)
- Дата-клининг и дата-препроцессинг
- Построение модели поиска аномалий в работе трактора на основе данных его телеметрии.
- Построение модели предсказания поломки транспорта на основе данных его телеметрии.
- Разработка демо-версии десктоп приложения для дальнейшей его интеграции в бизнес.
- Модели бустинга (catboost), модели кластеризации, поиск аномалий, pyQt6.
Хакатон NEFTECODE 2024 [Апрель 2024г] Призер (3 место)
- Дата-клининг и дата-препроцессинг
- Feature engeneering для химических данных
- Построение модели и пайплайна предсказания физического свойства смеси по химической формуле его составляющих
- Fine-tune модели BERT для создания и дальнейшего использования эмбеддингов, построенных на основе химических формул
- Разработка и использование моделей GAN для увеличения обучающей выборки
Хакатон IT Purple Hack [9 - 15 марта 2024г] Финалист
- Построение модели предсказания перехода клиентов банка между продуктовыми кластерами в рамках задачи CLTV
- Модели бустинга (catboost, LightGBM), Соревновательный Data science.
Чемпионат Cup IT 2024 [18 марта ‐ 2 апреля 2024г] HQA (High Quality Award)
- Построение рекомендательные системы для составления планограммы магазина
- Построение модели прогнозирования спроса
- Анализ датасета, предсказание временных рядов, расчёт операционных метрик для ритейла (OSA, OOS, SOS), машинное зрение
24 мая, 2009
20 000 руб
Владимир Валентинович
Город
Санкт-Петербург
Возраст
51 год (29 декабря 1974)
Опыт работы:
2 года и 11 месяцев
Последнее место работы:
Ведущий специалист, ООО Луком-А
01.2005 - 12.2007
29 марта, 2010
25 000 руб
Андрей Сергеевич
Город
Санкт-Петербург
Возраст
39 лет (20 мая 1986)
Опыт работы:
2 года
Последнее место работы:
монтажник (бригадир), Электронстрой
01.2006 - 01.2008
28 мая, 2009
60 000 руб
Резюме размещено в отрасли