Data инженер / Data engineer - Сбер для экспертов - Санкт-Петербург

Kate

Administrator
Команда форума
Требуемый опыт работы: 3–6 лет
Полная занятость, полный день

Департамент развития информационных технологий блока Риски находится в поисках кандидатов на вакансии data-инженеров.

Задача:

Оперативное обеспечение Data Science специалистов блока Риски качественными выборками из различных информационных систем Банка, необходимыми для построения новых моделей, а также для оценки качества и корректировки существующих моделей. Результатом работы дата-инженера и дата-сайнтиста становится прототип математической модели исследуемого бизнес-процесса, который становится основой для внедрения модели в промышленные системы. Для успешного внедрения прототип должен быть подробно задокументирован, как с точки зрения алгоритма получения выборки (зона ответственности дата-инженера), так и с точки зрения заложенной в модель математики (зона ответственности дата-сайнтиста).

Технологический стек:

  • Bigdata: Hadoop, Hive, Impala, Spark, Scala, Python
  • СУБД: Oracle, Teradata, Greenplum
  • ETL: Informatica, SAS Enterprise Guide
  • управление требованиями: Jira, Confluence, BitBucket

Вам предстоит:

  • разовые поставки данных для Data Science специалистов в рамках текущих задач. Разовые поставки включают в себя следующие активности:
  • уточнение постановки задачи для определения оптимального состава данных для выборки
  • коммуникации с экспертным сообществом Банка для идентификации необходимых систем-источников и особенностей хранения данных внутри них
  • извлечение данных из источников
  • разработка и документирование детерминированного алгоритма трансформации и очистки данных
  • контроль качества выборки
  • разработка регулярно обновляемых витрин, способных закрывать большую часть потребностей Data Science специалистов в выборках для моделирования. Витрины должны минимизировать трудозатраты дата-инженеров на разовые поставки данных. Активности в рамках данного направления:
  • обобщение накопленного опыта разовых поставок, проектирование модели данных для витрин
  • разработка и поддержка витрин в «небоевом» контуре лаборатории данных. Данные витрины будут являться источниками данных для разовых поставок и прототипами для внедрения в «боевые» Хранилища Данных
  • разработка технологий интеграции с боевыми Хранилищами Данных: совместимые модели данных, технологические стеки, тех процессы и DevOps практики, с целью минимизации затрат на перенос прототипов витрин в боевые системы

Мы ждем, что у вас есть:

  • высшее, техническое либо финансовое образование
  • опыт работы от 3х лет с одной или несколькими СУБД: Oracle, MS SQL, Teradata либо СУБД стэка Bigdata
  • опыт работы с хранилищами данных от 1го года
  • опыт работы в роли аналитика с функцией подготовки выгрузки данных для заказчика
  • сильные компетенции в области реляционных СУБД и хранилищ данных:
    • уверенное знание SQL: сложные запросы, аналитически функции, понимание физической реализации join’ов, оптимизация производительности запросов
    • знание одного или нескольких языков программирования: PL/SQL, T-SQL, Java, Python, Scala на уровне переменных, процедур, функций, циклов, условных операторов
    • знание одного или нескольких ETL-инструментов: Informatica, MS SSIS, SAS, ODI


Работа у нас — это:

  • команда профессионалов, готовых поддержать ваши инициативы;
  • возможность работы с новыми технологиями;
  • обучение за счёт компании;
  • гибкий график (5/2, Сб и Вс - выходные дни), возможна дистанционная работа;
  • красивый и комфортный офис в Санкт-Петербурге на п. Карла Фаберже д.8 (5 мин. от метро Ладожская);
  • ДМС (медицинское страхование);
  • прозрачная система бонусов и премий, достойная зарплата — размер обсудим на собеседовании.
 
Сверху