Требуемый опыт работы: 3–6 лет
Полная занятость, удаленная работа
Мы в Skyeng меняем традиционное образование с помощью технологий. Сейчас в нашей IT-команде более 500 сотрудников, включая 200+ разработчиков. Наша разработка — это 49 независимых и быстрых продуктовых команд с опытными тимлидами и продактами.
Наши продукты — это онлайн-платформа Vimbox, Android и IOS-приложения, словари, браузерные расширения, внутренние CRM и финансовые системы. В 2020 году Skyeng вошел в топ 10 IT-компаний России.
За что отвечает команда Ops в Skyeng:
Мы не любим бюрократии: мы не боимся ошибаться, а если так происходит, то проводим post mortem, разбираем ошибки и работаем дальше
Чем предстоит заниматься
Полная занятость, удаленная работа
Мы в Skyeng меняем традиционное образование с помощью технологий. Сейчас в нашей IT-команде более 500 сотрудников, включая 200+ разработчиков. Наша разработка — это 49 независимых и быстрых продуктовых команд с опытными тимлидами и продактами.
Наши продукты — это онлайн-платформа Vimbox, Android и IOS-приложения, словари, браузерные расширения, внутренние CRM и финансовые системы. В 2020 году Skyeng вошел в топ 10 IT-компаний России.
За что отвечает команда Ops в Skyeng:
- Стабильную работу production окружения. У нас гибридная инфраструктура из облачных решения и on premise в нескольких ЦОДах, для реализации изменений требуются качественные технические решения которые прорабатывает Tech Lead. Для этого необходимо обеспечивать развитие следующих направлений:
- Docker кластер - мы умеем готовить Swarm до состояния production ready, готовимся к миграции на Kubernetes в Q3
- IaC - на базе Ansible + AWX, Terraform
- Мониторинг - собираем несколько десятков тысяч метрик, хотим знать все что происходит в инфраструктуре и влияет на работу прода. Реализованоа на базе Prometheus + Alertmanager (мигрируем из Zabbix), Graphite, Newrelic (как APM)
- Базы данных - много postgresql, меньше mysql и clickhouse, как в виде RDS так и на bare metal
- Шина данных - Кластера RabbitMQ и Kafka (для отдельного сервиса сбора событий), органический рост и бесперебойная работа в любых условиях
- Сеть в ЦОД, VPN - мы умеем измерять качественную работу сети, требуется поддерживать ее работу в рамках SLA
- Группа серверов балансировки трафика - используем Nginx, есть несколько подгрупп для разного типа трафика
- Резервное копирование данных - активно используем обычные сервера и S3 для хранения резервных данных
- Катастрофоустойчивость инфраструктуры - возможность переключить нагрузку всех сервисов в резервный ЦОД
- Международные площадки - мы активно развиваемся и пробуем предоставлять услуги в других странах
- Стабильная работа ключевых сервисов - в экосистеме сервисов есть ряд крупных подсистем (сервис авторизации, сервис проведения уроков), от работы которых зависит возможность оказания услуг. Для стабильной работы требуется обеспечить развитие инфраструктуры без простоя в работе сервисов
- 293 продуктивных сервера, как в облаках так и on premise
- ~232 сервиса в prod, из них 205 в Docker swarm кластере, и остальные в облаке или на on premise
- Backend всех сервисов написан на PHP, 85% на фреймворке Symfony
- Q3 - MVP kuber: для тестового и prod окружения;
- Q3 - DBaaS для тестового и prod окружения;
- Q4 - 100% kuber;
Мы не любим бюрократии: мы не боимся ошибаться, а если так происходит, то проводим post mortem, разбираем ошибки и работаем дальше
Чем предстоит заниматься
- Развитие и поддержка инфраструктуры kubernetes: dev, test и prod кластеры, обеспечение их стабильной работы, интеграции с CI/CD, мониторингом и т.д.
- Поддержка текущего swarm кластера до окончания миграции.
- Помощь командам в миграции проектов.
- Поддержка/разработка самописных инструментов для docker кластеров на python/go.
- Опыт поддержки и развития Kubernetes кластеров, понимание принципов их работы;
- Опыт реализации Service Mesh на базе Istio, Consul;
- Опыт реализация сборки и деплоя приложений на базе Gitlab, Helm, Werf;
- Опыт программирования на Python, Go;
- Опыт установки и настройки систем мониторинга, создание дашбордов (Prometheus/Grafana);
- Опыт настройки и сопровождения Linux-based систем на базе Debian/Ubuntu;
- Опыт работы с системами управления конфигурациями (Ansible/Terraform);
- Будет плюсом опыт администрирования Docker Swarm кластеров;
- Будет плюсом опыт работы с HashiCorp Consul и Vault;
- Понимание как бесперебойно эксплуатировать продуктивные системы под постоянной нагрузкой;
- Ответственность, целеустремленность;
- Меняем образование — это важная цель в глобальном масштабе, делать социально-важное нереально круто, попробуй!
- Уникальный опыт: действительно сложные проблемы, которые можно встретить только в нагруженных проектах и сильно растущих компаниях.
- Учимся сами: регулярные доклады разработчиков внутри компании, участие и выступления на конференциях.
- Скидка 50% на уроки английского каждому сотруднику и другу.
- Конференции, профессиональные курсы, выбирай и учись с оплатой от компании.
- Можно влиять на компанию и её процессы.
- Оплачиваемые отпуск и больничный.
- Стабильная заработная плата два раза в месяц.
- Работа в большой и амбициозной IT-компании с процессами, но без бюрократии.
- Можно работать удаленно из любой точки мира, а также из нашего уютного офиса в Москве (м. Таганская).