Требуемый опыт работы: 3–6 лет
Полная занятость, полный день
Департамент развития информационных технологий блока Риски находится в поисках кандидатов на вакансии data-инженеров.
Задача:
Оперативное обеспечение Data Science специалистов блока Риски качественными выборками из различных информационных систем Банка, необходимыми для построения новых моделей, а также для оценки качества и корректировки существующих моделей. Результатом работы дата-инженера и дата-сайнтиста становится прототип математической модели исследуемого бизнес-процесса, который становится основой для внедрения модели в промышленные системы. Для успешного внедрения прототип должен быть подробно задокументирован, как с точки зрения алгоритма получения выборки (зона ответственности дата-инженера), так и с точки зрения заложенной в модель математики (зона ответственности дата-сайнтиста).
Технологический стек:
Вам предстоит:
Мы ждем, что у вас есть:
Работа у нас — это:
Полная занятость, полный день
Департамент развития информационных технологий блока Риски находится в поисках кандидатов на вакансии data-инженеров.
Задача:
Оперативное обеспечение Data Science специалистов блока Риски качественными выборками из различных информационных систем Банка, необходимыми для построения новых моделей, а также для оценки качества и корректировки существующих моделей. Результатом работы дата-инженера и дата-сайнтиста становится прототип математической модели исследуемого бизнес-процесса, который становится основой для внедрения модели в промышленные системы. Для успешного внедрения прототип должен быть подробно задокументирован, как с точки зрения алгоритма получения выборки (зона ответственности дата-инженера), так и с точки зрения заложенной в модель математики (зона ответственности дата-сайнтиста).
Технологический стек:
- Bigdata: Hadoop, Hive, Impala, Spark, Scala, Python
- СУБД: Oracle, Teradata, Greenplum
- ETL: Informatica, SAS Enterprise Guide
- управление требованиями: Jira, Confluence, BitBucket
Вам предстоит:
- разовые поставки данных для Data Science специалистов в рамках текущих задач. Разовые поставки включают в себя следующие активности:
- уточнение постановки задачи для определения оптимального состава данных для выборки
- коммуникации с экспертным сообществом Банка для идентификации необходимых систем-источников и особенностей хранения данных внутри них
- извлечение данных из источников
- разработка и документирование детерминированного алгоритма трансформации и очистки данных
- контроль качества выборки
- разработка регулярно обновляемых витрин, способных закрывать большую часть потребностей Data Science специалистов в выборках для моделирования. Витрины должны минимизировать трудозатраты дата-инженеров на разовые поставки данных. Активности в рамках данного направления:
- обобщение накопленного опыта разовых поставок, проектирование модели данных для витрин
- разработка и поддержка витрин в «небоевом» контуре лаборатории данных. Данные витрины будут являться источниками данных для разовых поставок и прототипами для внедрения в «боевые» Хранилища Данных
- разработка технологий интеграции с боевыми Хранилищами Данных: совместимые модели данных, технологические стеки, тех процессы и DevOps практики, с целью минимизации затрат на перенос прототипов витрин в боевые системы
Мы ждем, что у вас есть:
- высшее, техническое либо финансовое образование
- опыт работы от 3х лет с одной или несколькими СУБД: Oracle, MS SQL, Teradata либо СУБД стэка Bigdata
- опыт работы с хранилищами данных от 1го года
- опыт работы в роли аналитика с функцией подготовки выгрузки данных для заказчика
- сильные компетенции в области реляционных СУБД и хранилищ данных:
- уверенное знание SQL: сложные запросы, аналитически функции, понимание физической реализации join’ов, оптимизация производительности запросов
- знание одного или нескольких языков программирования: PL/SQL, T-SQL, Java, Python, Scala на уровне переменных, процедур, функций, циклов, условных операторов
- знание одного или нескольких ETL-инструментов: Informatica, MS SSIS, SAS, ODI
Работа у нас — это:
- команда профессионалов, готовых поддержать ваши инициативы;
- возможность работы с новыми технологиями;
- обучение за счёт компании;
- гибкий график (5/2, Сб и Вс - выходные дни), возможна дистанционная работа;
- красивый и комфортный офис в Санкт-Петербурге на п. Карла Фаберже д.8 (5 мин. от метро Ладожская);
- ДМС (медицинское страхование);
- прозрачная система бонусов и премий, достойная зарплата — размер обсудим на собеседовании.