Вакансия из Telegram канала - Название доступно после авторизации
Пожаловаться
60
Средняя вакансия
развернуть
Роль сочетает в себе различные обязанности, характерные для DevOps и SRE, но отсутствует прозрачность по зарплате и информации о компании, что может настораживать потенциальных соискателей.
Кликните для подробной информации
Зарплата не указанаНеясная информация о компанииСмешанные обязанностиСовременный стек технологий
О проекте:
Мы развиваем платформу для автоматизации работы консультантов поддержки. Продукт включает в себя комплексные решения: от пользовательских виджетов до бэк-офиса для операторов.
🎯 В чем суть роли?
Вы займете ключевую позицию на стыке DevOps, SRE и Operations, где фокус — на стабильности, прозрачности и управляемости production-систем. Ваша основная миссия — развитие системы мониторинга и observability, а также построение эффективных процедур реагирования на инциденты.
Основные направления работы:
• Мониторинг и Observability: Проектирование и развитие системы мониторинга для сервисов на базе .NET / C# / React в Kubernetes. Настройка метрик, логов, трейсов (VictoriaMetrics/Prometheus, Grafana, ELK). Разработка дашбордов и осмысленного алертинга.
• Инциденты и поддержка L1/L2: Разработка и поддержка runbook’ов для команд поддержки. Описание сценариев инцидентов, шагов диагностики и эскалации. Участие в пост-мортемах и улучшении процессов.
• Эксплуатация и стабильность: Участие в обеспечении стабильной работы Kubernetes-кластеров и сервисов. Анализ инцидентов, связанных с производительностью и доступностью. Взаимодействие с командами разработки для внедрения best practices.
• Процессная работа: Тесное взаимодействие с командами разработки, DevOps и Support. Консультационная роль по вопросам мониторинга и эксплуатации. Стандартизация подходов к observability.
⚡ Что предстоит сделать?
Необходимо усилить support-команду техническим специалистом, который построит инструменты и протоколы реагирования на инциденты на основе количественных метрик (Grafana, Kibana, Sentry).
Мы ждем, что у вас есть:
• Опыт работы в роли Operations Engineer / DevOps Engineer / SRE от 3 лет.
• Практический опыт работы с Kubernetes в production.
• Опыт настройки мониторинга и алертинга на базе Prometheus/VictoriaMetrics, Grafana, ELK stack.
• Понимание принципов observability (metrics, logs, traces).
• Опыт написания и поддержки эксплуатационной документации (runbooks).
• Понимание процессов инцидент-менеджмента.
• Технический бэкграунд: понимание .NET/C# приложений, Linux, контейнеров, сетевых основ.
Будет большим плюсом:
• Опыт внедрения OpenTelemetry.
• Опыт построения SLI/SLO.
• Опыт работы с high-load системами.
• Опыт автоматизации (bash, terraform, ansible, helm).
• Опыт участия в on-call ротациях.
Будьте осторожны: если вас просят войти в iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Текст вакансии взят без изменений
Источник - Telegram канал. Название доступно после авторизации