Senior DevOps (k8s) Skyeng Москва

Kate · 20 Июл 2021

Требуемый опыт работы: 3–6 лет
Полная занятость, удаленная работа

Мы в Skyeng меняем традиционное образование с помощью технологий. Сейчас в нашей IT-команде более 500 сотрудников, включая 200+ разработчиков. Наша разработка — это 49 независимых и быстрых продуктовых команд с опытными тимлидами и продактами.
Наши продукты — это онлайн-платформа Vimbox, Android и IOS-приложения, словари, браузерные расширения, внутренние CRM и финансовые системы. В 2020 году Skyeng вошел в топ 10 IT-компаний России.

За что отвечает команда Ops в Skyeng:

Стабильную работу production окружения. У нас гибридная инфраструктура из облачных решения и on premise в нескольких ЦОДах, для реализации изменений требуются качественные технические решения которые прорабатывает Tech Lead. Для этого необходимо обеспечивать развитие следующих направлений:
- Docker кластер - мы умеем готовить Swarm до состояния production ready, готовимся к миграции на Kubernetes в Q3
- IaC - на базе Ansible + AWX, Terraform
- Мониторинг - собираем несколько десятков тысяч метрик, хотим знать все что происходит в инфраструктуре и влияет на работу прода. Реализованоа на базе Prometheus + Alertmanager (мигрируем из Zabbix), Graphite, Newrelic (как APM)
- Базы данных - много postgresql, меньше mysql и clickhouse, как в виде RDS так и на bare metal
- Шина данных - Кластера RabbitMQ и Kafka (для отдельного сервиса сбора событий), органический рост и бесперебойная работа в любых условиях
- Сеть в ЦОД, VPN - мы умеем измерять качественную работу сети, требуется поддерживать ее работу в рамках SLA
- Группа серверов балансировки трафика - используем Nginx, есть несколько подгрупп для разного типа трафика
- Резервное копирование данных - активно используем обычные сервера и S3 для хранения резервных данных
Катастрофоустойчивость инфраструктуры - возможность переключить нагрузку всех сервисов в резервный ЦОД
Международные площадки - мы активно развиваемся и пробуем предоставлять услуги в других странах
Стабильная работа ключевых сервисов - в экосистеме сервисов есть ряд крупных подсистем (сервис авторизации, сервис проведения уроков), от работы которых зависит возможность оказания услуг. Для стабильной работы требуется обеспечить развитие инфраструктуры без простоя в работе сервисов

Наша инфраструктура:

293 продуктивных сервера, как в облаках так и on premise
~232 сервиса в prod, из них 205 в Docker swarm кластере, и остальные в облаке или на on premise
Backend всех сервисов написан на PHP, 85% на фреймворке Symfony

Ближайшие планы команды:

Q3 - MVP kuber: для тестового и prod окружения;
Q3 - DBaaS для тестового и prod окружения;
Q4 - 100% kuber;

Для общения и документации у нас современные инструменты: Slack, Google Meet, JIRA, Confluence, Github
Мы не любим бюрократии: мы не боимся ошибаться, а если так происходит, то проводим post mortem, разбираем ошибки и работаем дальше
Чем предстоит заниматься

Развитие и поддержка инфраструктуры kubernetes: dev, test и prod кластеры, обеспечение их стабильной работы, интеграции с CI/CD, мониторингом и т.д.
Поддержка текущего swarm кластера до окончания миграции.
Помощь командам в миграции проектов.
Поддержка/разработка самописных инструментов для docker кластеров на python/go.

Наши ожидания от кандидата

Опыт поддержки и развития Kubernetes кластеров, понимание принципов их работы;
Опыт реализации Service Mesh на базе Istio, Consul;
Опыт реализация сборки и деплоя приложений на базе Gitlab, Helm, Werf;
Опыт программирования на Python, Go;
Опыт установки и настройки систем мониторинга, создание дашбордов (Prometheus/Grafana);
Опыт настройки и сопровождения Linux-based систем на базе Debian/Ubuntu;
Опыт работы с системами управления конфигурациями (Ansible/Terraform);
Будет плюсом опыт администрирования Docker Swarm кластеров;
Будет плюсом опыт работы с HashiCorp Consul и Vault;
Понимание как бесперебойно эксплуатировать продуктивные системы под постоянной нагрузкой;
Ответственность, целеустремленность;

Пара причин работать с нами

Меняем образование — это важная цель в глобальном масштабе, делать социально-важное нереально круто, попробуй!
Уникальный опыт: действительно сложные проблемы, которые можно встретить только в нагруженных проектах и сильно растущих компаниях.
Учимся сами: регулярные доклады разработчиков внутри компании, участие и выступления на конференциях.
Скидка 50% на уроки английского каждому сотруднику и другу.
Конференции, профессиональные курсы, выбирай и учись с оплатой от компании.
Можно влиять на компанию и её процессы.
Оплачиваемые отпуск и больничный.
Стабильная заработная плата два раза в месяц.
Работа в большой и амбициозной IT-компании с процессами, но без бюрократии.
Можно работать удаленно из любой точки мира, а также из нашего уютного офиса в Москве (м. Таганская).

Senior DevOps (k8s) Skyeng Москва

Kate

Administrator