Senior Data Engineer в Маркет
Город:
Санкт-Петербург
Занятость:
Полная занятость
Компания "Яндекс"
Яндекс Маркет — один из крупнейших мультикатегорийных маркетплейсов, которым ежедневно пользуются миллионы людей. Наши команды помогают покупателям приобретать товары не выходя из дома и получать заказы по всей стране, а партнёрам — развивать свой бизнес, повышая продажи и привлекая новых клиентов.
Мы команда инженеров данных, и продукт нашей команды — Data WareHouse (хранилище данных), которое мы строим для нужд бизнес-подразделений. Нашими пользователями являются как руководители Маркета, которым нужна отчётность для принятия решений, так и эксперты в области глубокого анализа данных. Можно утверждать, что все бизнес-подразделения Маркета являются потребителями поставляемых нами данных.
Технологически ядро хранилища построено на системах хранения данных YTsaurus и СlickHouse. Разработка процессов ETL идёт на собственном фреймворке, который создан внутри Яндекса.
Наше хранилище данных сейчас одно из самых крупных в России — порядка 30 петабайт — и с учётом темпов роста бизнеса оно будет самым большим. Стоит отметить, что к нему предъявляются высокие требования по надёжности, что ставит перед нашей командой далеко не тривиальные задачи, для которых нет готовых решений.
Что нужно делать:
В это входит проектирование схем поставок данных. Выбор подхода к внесению доработок в витрины за оптимальное время с минимизацией рисков от релизов. Критический взгляд на результат в интересах потребителей данных.
Применяя существующие инструменты работы с данными выделять их недостатки. Продвигать повестку по их улучшению или поиску новых для более эффективного решения задач.
Понимая алгоритмическую составляющую инструментов находить эффективные решения в том числе упрощая постановку задачи
Мы ждем, что вы:
- Уверенно знаете Python на уровне написания собственного фреймворка и SQL на уровне оптимизации запросов
- Умеете проектировать DWH: слои, модели хранения данных, процессы ETL
- Хорошо понимаете принципы работы распроданных систем Hadoop или YTSaurus, ClickHouse
- Умеете выбирать технологии для решения конкретных задач
- Знаете основные алгоритмы и структуры данных, особенно используемые в области работы с большими данными
- Имеете опыт работы от 3х лет
- Имеете работать в командной строке систем Unix-like: Linux, macOS
Будет плюсом, если вы:
- Имеете опыт промышленной разработки на C++
- Имеете опыт работы в E-com отрасли
- Имели опыт решения задач в роли аналитика или опыт управления командой или проектами
09 Января
QA Engineer / Тестировщик ПО( Minto )
Санкт-Петербург
Компания "Minto" Minto.finance - децентрализованная платформа для майнинга, которая объединяет преимущества DeFi и облачного майнинга. Мы...
09 Января
Санкт-Петербург
Компания "АНДАТА" Компания АнДата – IT компания, аккредитованная в Минцифры РФ (отсрочка от призыва в армию и частичной мобилизации),...
09 Января
Senior backend разработчик (kotlin/java)
Санкт-Петербург
до 500 000 руб.
Компания "ЛИПТ Софт" Привет! Липтсофт уже более 10 лет занимается разработкой финтех решений банковского и финансового сектора. Мы расширяем...
09 Января
Санкт-Петербург
Компания "Сбербанк" Команда «Миссури», проект «Инкассация» – это решения для управления заявками и договорами на кассово-инкассаторские услуги...
09 Января
Middle Data Analyst( WaveAccess )
Санкт-Петербург
Компания "WaveAccess" Ищем опытного дата аналитика (Data Analyst) с уверенным знанием SQL и опытом работы с BI-инструментами. Ваша...
Вакансия размещена в отрасли