Senior DevOps (k8s) Skyeng Москва

Kate

Administrator
Команда форума
Требуемый опыт работы: 3–6 лет
Полная занятость, удаленная работа

Мы в Skyeng меняем традиционное образование с помощью технологий. Сейчас в нашей IT-команде более 500 сотрудников, включая 200+ разработчиков. Наша разработка — это 49 независимых и быстрых продуктовых команд с опытными тимлидами и продактами.
Наши продукты — это онлайн-платформа Vimbox, Android и IOS-приложения, словари, браузерные расширения, внутренние CRM и финансовые системы. В 2020 году Skyeng вошел в топ 10 IT-компаний России.

За что отвечает команда Ops в Skyeng:
  • Стабильную работу production окружения. У нас гибридная инфраструктура из облачных решения и on premise в нескольких ЦОДах, для реализации изменений требуются качественные технические решения которые прорабатывает Tech Lead. Для этого необходимо обеспечивать развитие следующих направлений:
    • Docker кластер - мы умеем готовить Swarm до состояния production ready, готовимся к миграции на Kubernetes в Q3
    • IaC - на базе Ansible + AWX, Terraform
    • Мониторинг - собираем несколько десятков тысяч метрик, хотим знать все что происходит в инфраструктуре и влияет на работу прода. Реализованоа на базе Prometheus + Alertmanager (мигрируем из Zabbix), Graphite, Newrelic (как APM)
    • Базы данных - много postgresql, меньше mysql и clickhouse, как в виде RDS так и на bare metal
    • Шина данных - Кластера RabbitMQ и Kafka (для отдельного сервиса сбора событий), органический рост и бесперебойная работа в любых условиях
    • Сеть в ЦОД, VPN - мы умеем измерять качественную работу сети, требуется поддерживать ее работу в рамках SLA
    • Группа серверов балансировки трафика - используем Nginx, есть несколько подгрупп для разного типа трафика
    • Резервное копирование данных - активно используем обычные сервера и S3 для хранения резервных данных
  • Катастрофоустойчивость инфраструктуры - возможность переключить нагрузку всех сервисов в резервный ЦОД
  • Международные площадки - мы активно развиваемся и пробуем предоставлять услуги в других странах
  • Стабильная работа ключевых сервисов - в экосистеме сервисов есть ряд крупных подсистем (сервис авторизации, сервис проведения уроков), от работы которых зависит возможность оказания услуг. Для стабильной работы требуется обеспечить развитие инфраструктуры без простоя в работе сервисов
Наша инфраструктура:
  • 293 продуктивных сервера, как в облаках так и on premise
  • ~232 сервиса в prod, из них 205 в Docker swarm кластере, и остальные в облаке или на on premise
  • Backend всех сервисов написан на PHP, 85% на фреймворке Symfony
Ближайшие планы команды:
  • Q3 - MVP kuber: для тестового и prod окружения;
  • Q3 - DBaaS для тестового и prod окружения;
  • Q4 - 100% kuber;
Для общения и документации у нас современные инструменты: Slack, Google Meet, JIRA, Confluence, Github
Мы не любим бюрократии: мы не боимся ошибаться, а если так происходит, то проводим post mortem, разбираем ошибки и работаем дальше
Чем предстоит заниматься
  • Развитие и поддержка инфраструктуры kubernetes: dev, test и prod кластеры, обеспечение их стабильной работы, интеграции с CI/CD, мониторингом и т.д.
  • Поддержка текущего swarm кластера до окончания миграции.
  • Помощь командам в миграции проектов.
  • Поддержка/разработка самописных инструментов для docker кластеров на python/go.
Наши ожидания от кандидата
  • Опыт поддержки и развития Kubernetes кластеров, понимание принципов их работы;
  • Опыт реализации Service Mesh на базе Istio, Consul;
  • Опыт реализация сборки и деплоя приложений на базе Gitlab, Helm, Werf;
  • Опыт программирования на Python, Go;
  • Опыт установки и настройки систем мониторинга, создание дашбордов (Prometheus/Grafana);
  • Опыт настройки и сопровождения Linux-based систем на базе Debian/Ubuntu;
  • Опыт работы с системами управления конфигурациями (Ansible/Terraform);
  • Будет плюсом опыт администрирования Docker Swarm кластеров;
  • Будет плюсом опыт работы с HashiCorp Consul и Vault;
  • Понимание как бесперебойно эксплуатировать продуктивные системы под постоянной нагрузкой;
  • Ответственность, целеустремленность;
Пара причин работать с нами
  • Меняем образование — это важная цель в глобальном масштабе, делать социально-важное нереально круто, попробуй!
  • Уникальный опыт: действительно сложные проблемы, которые можно встретить только в нагруженных проектах и сильно растущих компаниях.
  • Учимся сами: регулярные доклады разработчиков внутри компании, участие и выступления на конференциях.
  • Скидка 50% на уроки английского каждому сотруднику и другу.
  • Конференции, профессиональные курсы, выбирай и учись с оплатой от компании.
  • Можно влиять на компанию и её процессы.
  • Оплачиваемые отпуск и больничный.
  • Стабильная заработная плата два раза в месяц.
  • Работа в большой и амбициозной IT-компании с процессами, но без бюрократии.
  • Можно работать удаленно из любой точки мира, а также из нашего уютного офиса в Москве (м. Таганская).
 
Сверху