12 дней назад
Руководитель группы SRE дисковых сервисов в Яндекс 360
Мэтч & Сопровод
Для мэтча с этой вакансией нужен Plus
Описание вакансии
Текст:
TL;DR
Руководитель группы SRE дисковых сервисов в Яндекс 360 (SRE/DevOps): управление группой SRE для дисковых сервисов Яндекс 360 с акцентом на надёжность и доступность. Фокус на построении стратегии SRE, оптимизации мониторинга и реагирования на инциденты, а также на проектировании отказоустойчивой и масштабируемой архитектуры.
Локация: не указана
Компания
развивает сервисы Яндекс 360 для пользователей и организаций, повышая качество и производительность продуктов.
Что делать
- Руководить командой из 7 SRE-инженеров: постановка задач, распределение нагрузки, контроль сроков и качества.
- Формировать и внедрять стратегию надёжности: мониторинг, реагирование на инциденты и постинцидентный анализ.
- Участвовать в проектировании архитектуры сервисов с фокусом на надёжность, масштабируемость и отказоустойчивость.
- Анализировать метрики надёжности, устранять узкие места и координировать устранение критических инцидентов.
- Внедрять практики DevOps/SRE и согласовывать подходы с командами разработки, эксплуатации и безопасности.
- Планировать ресурсы команды и готовить отчёты о надёжности и эффективности работы.
Требования
- Опыт работы SRE или DevOps-инженером 3–4 года.
- Опыт руководства командой инженеров от 2 лет.
- Глубокое понимание SRE-подхода: SLI/SLO/SLA, budget ошибок, автоматизация, мониторинг и управление инцидентами.
- Навыки проектирования отказоустойчивых и масштабируемых систем.
- Уверенная работа с Linux, сетевыми протоколами и инфраструктурой.
- Практический опыт с контейнеризацией и оркестрацией (Docker, Kubernetes), мониторингом и алертингом (Prometheus, Grafana, Zabbix), автоматизацией (Ansible, Terraform) и базами данных (SQL и NoSQL).
Хорошо, если есть
- Опыт с облачными платформами ( Cloud, AWS, GCP, Azure).
- Участие в disaster-recovery и chaos engineering.
- Доклады на конференциях или публикации по профильным темам.
- Знакомство с микросервисной архитектурой и сервисными сетками (Istio, Linkerd).
- Сертификаты по Kubernetes (CKA), AWS/GCP или другим релевантным технологиям.
Культура и преимущества
- Расширенная медицинская страховка с первого месяца, включая стоматологию, ежегодные чекапы и неотложную помощь за рубежом.
- Психотерапия в офисе или онлайн, лазерная коррекция зрения через год работы, ведение беременности и роды через два года.
- Страховка для детей и супругов по схеме 80/20.
- Внутренняя образовательная платформа, менторство и программы для руководителей.
- Оплата участия в профильных конференциях и возможность выступать спикером.
- Гибкий график без фиксированного времени начала и конца рабочего дня.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →