Назад
обновлено 3 дня назад

SRE Engineer

Формат работы
remote (только Russia)/hybrid
Тип работы
fulltime
Грейд
senior/lead
Страна
Russia

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Текст:
/

TL;DR

SRE-инженер (Reliability/Platform): Проектирование и поддержка надежности высоконагруженных облачных сервисов с акцентом на внедрение SLO/SLI, capacity planning и автоматизацию процессов. Фокус на предотвращении инцидентов, оптимизации производительности систем и внедрении практик observability для повышения стабильности платформы.

Локация: Удаленно или гибрид (Москва). Работа возможна только из РФ.

Компания

Cloud.ru — один из ведущих облачных провайдеров в России, развивающий инновационные продукты с командой более 1700 человек.

Что делать

  • Управлять надежностью сервисов через проектирование и внедрение SLO/SLI и контроль Error Budget.
  • Разрабатывать метрики, алертинг, дашборды и ранбуки для обеспечения прозрачности состояния систем.
  • Заниматься прогнозированием нагрузки (capacity planning) и оптимизацией узких мест производительности.
  • Выполнять роль Incident Commander при устранении инцидентов и проводить расследования причин (RCA).
  • Автоматизировать рутинные задачи с помощью IaC (Terraform/Ansible) и скриптов (Python/Go).
  • Менторить команды разработки в вопросах надежности и проведения postmortems.

Требования

  • Глубокая экспертиза в SRE-практиках: SLO/SLI, error budget, toil reduction.
  • Опыт построения quality gates в CI/CD для управления рисками при релизах.
  • Экспертный уровень эксплуатации Linux, включая глубокую диагностику ядра.
  • Глубокие знания сетевого стека на уровнях L2-L7.
  • Практический опыт работы с Kubernetes и понимание его внутренних механизмов.
  • Локация: работа возможна только из РФ.

Хорошо, если есть

  • Системное мышление для анализа сложных сценариев отказа.
  • Навыки написания качественной технической документации.
  • Опыт ведения переговоров с разработчиками и бизнесом о балансе надежности и скорости разработки.

Культура и преимущества

  • Масштабные инновационные задачи в составе команды из 1700+ человек.
  • Профессиональное развитие в роли уровня Senior/TechLead.
  • Гибкий подход к формату работы (удаленка или гибрид).

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →