Эта вакансия в архиве
Посмотреть похожие вакансии ↓Описание вакансии
Текст:
TL;DR
SRE-инженер (Kubernetes/Grafana): Обеспечение стабильности и отказоустойчивости высоконагруженных систем с акцентом на автоматизацию инфраструктуры и мониторинг. Фокус на управлении инцидентами, настройке observability-стека и повышении масштабируемости сервисов.
Локация: Полностью удалённая работа (РФ). Возможно посещение офиса в Москве (м. Проспект Мира) по желанию.
Компания
Крупная международная розничная сеть.
Что делать
- Обеспечивать стабильность и производительность продакшн-систем.
- Разрабатывать инструменты автоматизации для инфраструктуры.
- Организовывать процесс реагирования на инциденты, документировать RCA и постмортемы.
- Настраивать и администрировать Grafana-стек, оптимизировать алерты.
- Взаимодействовать с разработчиками для обеспечения масштабируемости и надёжности.
- Участвовать в планировании мощности (capacity planning) и оптимизации затрат.
Требования
- Опыт в роли SRE/DevOps/Infrastructure Engineer от 3 лет.
- Практический опыт работы с Kubernetes и контейнеризацией.
- Глубокое понимание observability (метрики, логи, трейсы) и принципов SLI/SLO.
- Навыки написания скриптов (Python, Bash или Go).
- Знание принципов CI/CD и работы распределённых систем.
Хорошо, если есть
- Опыт работы с clickhouse, keycloak, rancher или php.
- Знание паттернов отказоустойчивости (circuit breaker, retry).
- Опыт построения multi-region или multi-cloud архитектур.
Культура и преимущества
- Официальное оформление по ТК РФ с полностью «белой» заработной платой.
- Возможность обучения в корпоративном университете с получением дипломов.
- Программа ДМС и корпоративные скидки на фитнес.
- Доплата к больничным и отпускам до 100% от оклада.
- Гибкий подход к рабочим процессам и поддержка профессионального развития.