Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Описание вакансии
TL;DR
SRE-инженер (Reliability/Platform): Проектирование и поддержка надежности высоконагруженных облачных сервисов с акцентом на внедрение SLO/SLI, capacity planning и автоматизацию процессов. Фокус на предотвращении инцидентов, оптимизации производительности систем и внедрении практик observability для повышения стабильности платформы.
Локация: Удаленно или гибрид (Москва). Работа возможна только из РФ.
Компания
Cloud.ru — один из ведущих облачных провайдеров в России, развивающий инновационные продукты с командой более 1700 человек.
Что делать
- Управлять надежностью сервисов через проектирование и внедрение SLO/SLI и контроль Error Budget.
- Разрабатывать метрики, алертинг, дашборды и ранбуки для обеспечения прозрачности состояния систем.
- Заниматься прогнозированием нагрузки (capacity planning) и оптимизацией узких мест производительности.
- Выполнять роль Incident Commander при устранении инцидентов и проводить расследования причин (RCA).
- Автоматизировать рутинные задачи с помощью IaC (Terraform/Ansible) и скриптов (Python/Go).
- Менторить команды разработки в вопросах надежности и проведения postmortems.
Требования
- Глубокая экспертиза в SRE-практиках: SLO/SLI, error budget, toil reduction.
- Опыт построения quality gates в CI/CD для управления рисками при релизах.
- Экспертный уровень эксплуатации Linux, включая глубокую диагностику ядра.
- Глубокие знания сетевого стека на уровнях L2-L7.
- Практический опыт работы с Kubernetes и понимание его внутренних механизмов.
- Локация: работа возможна только из РФ.
Хорошо, если есть
- Системное мышление для анализа сложных сценариев отказа.
- Навыки написания качественной технической документации.
- Опыт ведения переговоров с разработчиками и бизнесом о балансе надежности и скорости разработки.
Культура и преимущества
- Масштабные инновационные задачи в составе команды из 1700+ человек.
- Профессиональное развитие в роли уровня Senior/TechLead.
- Гибкий подход к формату работы (удаленка или гибрид).
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →