Назад
2 дня назад

Operations Engineer (Observability & Monitoring)

Формат работы
remote (Global)
Тип работы
fulltime
Грейд
middle/senior
Английский
b2
Страна
Serbia, Armenia, Cyprus, Georgia
vacancy_detail.hirify_telegram_tooltipВакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

🚀 Вакансия: Operations Engineer (Observability & Monitoring)

О проекте:
Мы развиваем платформу для автоматизации работы консультантов поддержки. Продукт включает в себя комплексные решения: от пользовательских виджетов до бэк-офиса для операторов.

🎯 В чем суть роли?
Вы займете ключевую позицию на стыке DevOps, SRE и Operations, где фокус — на стабильности, прозрачности и управляемости production-систем. Ваша основная миссия — развитие системы мониторинга и observability, а также построение эффективных процедур реагирования на инциденты.

Основные направления работы:
• Мониторинг и Observability: Проектирование и развитие системы мониторинга для сервисов на базе .NET / C# / React в Kubernetes. Настройка метрик, логов, трейсов (VictoriaMetrics/Prometheus, Grafana, ELK). Разработка дашбордов и осмысленного алертинга.
• Инциденты и поддержка L1/L2: Разработка и поддержка runbook’ов для команд поддержки. Описание сценариев инцидентов, шагов диагностики и эскалации. Участие в пост-мортемах и улучшении процессов.
• Эксплуатация и стабильность: Участие в обеспечении стабильной работы Kubernetes-кластеров и сервисов. Анализ инцидентов, связанных с производительностью и доступностью. Взаимодействие с командами разработки для внедрения best practices.
• Процессная работа: Тесное взаимодействие с командами разработки, DevOps и Support. Консультационная роль по вопросам мониторинга и эксплуатации. Стандартизация подходов к observability.

Что предстоит сделать?
Необходимо усилить support-команду техническим специалистом, который построит инструменты и протоколы реагирования на инциденты на основе количественных метрик (Grafana, Kibana, Sentry).

Мы ждем, что у вас есть:
• Опыт работы в роли Operations Engineer / DevOps Engineer / SRE от 3 лет.
• Практический опыт работы с Kubernetes в production.
• Опыт настройки мониторинга и алертинга на базе Prometheus/VictoriaMetrics, Grafana, ELK stack.
• Понимание принципов observability (metrics, logs, traces).
• Опыт написания и поддержки эксплуатационной документации (runbooks).
• Понимание процессов инцидент-менеджмента.
• Технический бэкграунд: понимание .NET/C# приложений, Linux, контейнеров, сетевых основ.

Будет большим плюсом:
• Опыт внедрения OpenTelemetry.
• Опыт построения SLI/SLO.
• Опыт работы с high-load системами.
• Опыт автоматизации (bash, terraform, ansible, helm).
• Опыт участия в on-call ротациях.

📍 Локация: Сербия, Грузия, Кипр, Армения. Формат: удаленно, офис, гибрид.

📨 Контакты для отклика и вопросов:

#OperationsEngineer #DevOps #SRE #Observability #Мониторинг #Kubernetes #Вакансия #ITJobs #Сербия

Будьте осторожны: если вас просят войти в iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -