Вакансия из Telegram канала - Название доступно после авторизации
Пожаловаться
55
Средняя вакансия
развернуть
Описание вакансии довольно подробное, но отсутствие информации о зарплате и неясные данные о компании вызывают некоторые опасения по поводу прозрачности и качества возможности.
Кликните для подробной информации
Зарплата не указанаПодробное описание ролиНет информации о компании
Оценка от Hirify AI
Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Создать профиль и узнать мэтч
Описание вакансии
SRE-инженер
Мы привлекаем амбициозных профессионалов по всей России, чтобы вместе решать прорывные задачи и создавать инновации. Нас уже более 1700 человек
Мы растем и нам нужен SR-инженер уровня Senior/TechLead, который поможет нам сделать наши продукты надежными; который понимает, что надежность - это не только uptime, но и предсказуемость, удовлетворенность наших пользователей, душевное спокойствие инженеров и постоянная работа над процессами.
Если ты знаешь, как превратить SLO/SLI в работающую систему, а не просто красивые графики; умеешь предсказывать проблемы до того, как они станут инцидентами; уверен, что главное - довольные пользователи; можешь объяснить, почему error budget важнее "фичи, которую надо запилить к утру", понимаешь, что "починить сейчас" и "сделать, чтобы больше не ломалось" - это разные вещи; и для тебя incident/problem management — это процесс, а не героизм - то откликайся! На этой позиции тебе предстоит:
управление надежностью сервисов: проектирование, внедрение и поддержка SLO/SLI, error budget, координация процесса соблюдения SLO, управление использованием Error Budget;
мониторинг и алертинг: разработка метрик, алертов, дашбордов, ранбуков (и их регулярный анализ/рефакторинг);
capacity planning: прогнозирование нагрузки и планирование ресурсов;
performance optimization: выявление и устранение bottleneck, оптимизация производительности;
incident & problem management: участие в устранении инцидентов (роль Incident Commander), расследование причин (RCA); ревью postmortems, разработка и внедрение corrective actions, при необходимости - заведение проблем и контроль их решения;
повышение отказоустойчивости: улучшение observability (логи, трейсы, метрики: обогащение, добавление, ревизия...);
ревью DRP, участие в качестве координатора в DRT, поддержание DRP в актуальном состоянии;
автоматизация: устранение рутины - IaC (Terraform/Ansible) и Python/Go/Bash;
менторство и обучение: проведение внутренних воркшопов для команд разработки по темам надёжности, observability, помощь в развитии навыков SRE у других инженеров.
Что мы ждем от кандидата:
экспертиза и практический опыт в SRE-практиках: глубокое понимание SLO/SLI, error budget, toil reduction, automation first... умение применять это практически для обеспечения надежности сервисов;
умение проводить code review для оценки готовности к выходу в production новых функций и сервисов с точки зрения надёжности, наблюдаемости и эффективности, понимание, как изменения в коде влияют на смежные системы и общую стабильность платформы;
практический опыт построения и внедрения quality gates в CI/CD процесс для управления рисками при развертывании: для предотвращения попадания нестабильных изменений в production;
эксперт в эксплуатации Linux, включая диагностику на уровне ядра (процессы, память, сеть);
глубокие знания и понимание того, как работают сети на уровнях L2-L7;
опыт работы с Kubernetes и понимание его internal'ов для диагностики сложных проблем.
Было бы неплохо иметь:
системное мышление и умение анализировать сложные failure-сценарии, выявлять корневые причины, находить способы их устранения;
опыт написания и ревью технической документации (runbooks, postmortems...);
опыт коммуникации с разработчиками и бизнесом (объяснение trade-offs между reliability и feature dev).
Зарплата
Не указана
Похожие специалисты получают 254 000 - 459 000
Требования
Инженер по доступности сервисов • Старший (Senior) • SQL
Местоположение и тип занятости
Москва • Можно удалённо
Контакт:
Показать контакты
Будьте осторожны: если вас просят войти в iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Текст вакансии взят без изменений
Источник - Telegram канал. Название доступно после авторизации