SRE Engineer

Формат работы

remote (только Russia)/hybrid

Тип работы

fulltime

Грейд

middle/senior

Страна

Russia

Описание вакансии

Текст:

TL;DR

SRE-инженер (Kubernetes/Grafana): Обеспечение стабильности и отказоустойчивости высоконагруженных систем с акцентом на автоматизацию инфраструктуры и мониторинг. Фокус на управлении инцидентами, настройке observability-стека и повышении масштабируемости сервисов.

Локация: Полностью удалённая работа (РФ). Возможно посещение офиса в Москве (м. Проспект Мира) по желанию.

Компания

Крупная международная розничная сеть.

Что делать

Обеспечивать стабильность и производительность продакшн-систем.
Разрабатывать инструменты автоматизации для инфраструктуры.
Организовывать процесс реагирования на инциденты, документировать RCA и постмортемы.
Настраивать и администрировать Grafana-стек, оптимизировать алерты.
Взаимодействовать с разработчиками для обеспечения масштабируемости и надёжности.
Участвовать в планировании мощности (capacity planning) и оптимизации затрат.

Требования

Опыт в роли SRE/DevOps/Infrastructure Engineer от 3 лет.
Практический опыт работы с Kubernetes и контейнеризацией.
Глубокое понимание observability (метрики, логи, трейсы) и принципов SLI/SLO.
Навыки написания скриптов (Python, Bash или Go).
Знание принципов CI/CD и работы распределённых систем.

Хорошо, если есть

Опыт работы с clickhouse, keycloak, rancher или php.
Знание паттернов отказоустойчивости (circuit breaker, retry).
Опыт построения multi-region или multi-cloud архитектур.

Культура и преимущества

Официальное оформление по ТК РФ с полностью «белой» заработной платой.
Возможность обучения в корпоративном университете с получением дипломов.
Программа ДМС и корпоративные скидки на фитнес.
Доплата к больничным и отпускам до 100% от оклада.
Гибкий подход к рабочим процессам и поддержка профессионального развития.