Data Engineer( Центральный банк Российской Федерации )

22 Декабря

Партнерские Вакансии

Город:

Санкт-Петербург

Занятость:

Полная занятость

Компания "Центральный банк Российской Федерации"

Мы делаем Единое Хранилище данных по всем процессам Банка России. А это почти полный охват финансового рынка и всех связанных сущностей, требуемых для контроля и прогнозирования развития экономики в целом и участников в частности.
Основная задача – загрузить и получить на выходе максимально полные и достоверные данные по каждой сущности в удобном для дальнейшего использования виде.
Мы делаем приложения на базе Единого Хранилища Данных
Основной функционал: Монетизация данных- сбор данных из разных источников, в первую очередь из "озера данных" и Единого Хранилища данных- анализ и поиск закономерностей в разнообразных данных- построение моделей, основанных на данных- автоматизация работы.

Обязанности:
• консультирование заказчика с целью выбора инструментария Big Data экосистемы;
• администрирование инструментария Big Data экосистемы;
• внедрение ML-моделей в рамках MLOps;
• оптимизация ETL-процедур обработки информационных массивов;
• миграция ETL-процедур обработки информационных массивов и соответствующих моделей машинного обучения на целевые инструменты Big Data экосистемы;
• доработка/написание CI/CD-пайплайнов;
• участие в развитие Big Data экосистемы;

Требования:

• высшее техническое образование
• знания по проектированию Хранилища данных
• современные тенденции и технологии Big Data
• знания и практические навыки написания SQL запросов, опыт оптимизации запросов
• опыт работы с одной из аналитических или реляционных СУБД Oracle, Greenplum, Clickhouse, PostgreSQL, Postgres Pro или опыт работы со стеком Big Data (Hadoop/spark/hive) от 3-х лет;

• опыт работы с элементами современной Big Data экосистемы в качестве администратора, аналитика данных или специалиста по исследованию данных;

• навык работы со средствами версионного контроля;
• знание процесса непрерывного развертывания и опыт установки изменений в рамках конвейера CI/CD;

Наш стек:
• Кластеризация: Apache Hadoop (HDP, CDP)
• Контейнеризация: Docker Swarm, Kubernetes
• CI/CD: Ansible, Jenkins, Gitlab
• Технологии распределенных вычислений: Apache Spark, Apache Hive, Cloudera Impala
• IDE: Apache Zeppelin, JupyterLab., IntelliJ IDEA, VSCode
• ETL: IPC, Airflow
• Языки программирования: Python, Scala.

Компенсация релокации

Гибридный график: 50% - офис, 50% - удаленный режим

Похожие вакансии

17 Декабря

QA Engineer( i-Digital )

Санкт-Петербург

Компания "i-Digital" i-Digital создает и внедряет решения для продуктивных коммуникаций брендов с потребителями через мобильные каналы,...

Отправить резюме подробнее

17 Декабря

Инженер данных/Data Engineer

Санкт-Петербург

Компания "585, Золотой" Что предстоит делать: Подготовка витрин данных; Поиск и решение проблем в ETL-процессах; Описание витрин и...

Отправить резюме подробнее

18 Декабря

Middle QA engineer( ЛИПТ Софт )

Санкт-Петербург

до 200 000 руб.

Компания "ЛИПТ Софт" Липтсофт – лаборатория информационных платежных технологий. Мы создаём высоконагруженные отказоустойчивые системы и являемся...

Отправить резюме подробнее

18 Декабря

Data Engineer/Дата инженер (ученик)( Aston )

Санкт-Петербург

от 100 000 до 110 000 руб.

Компания "Aston" Мы — российская аккредитованная ИТ-компания, четырехкратный обладатель премии «Работодатель года» по версии Habr. C 2007 года...

Отправить резюме подробнее

18 Декабря

Data Engineer / Инженер данных

Санкт-Петербург

Компания "Aston" Мы — аутсорсинговая IT-компания Aston, разрабатываем программное обеспечение на заказ и оказываем услуги IT-аутсорсинга...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: