4 дня назад

Operations Engineer

Формат работы

onsite

Тип работы

fulltime

Грейд

senior

Страна

Serbia

Загружаем источник...

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Operations Engineer

Мы ищем Operations Engineer, который будет отвечать за развитие системы мониторинга и observability платформы, а также за подготовку и стандартизацию процедур реагирования на инциденты для команд поддержки L1 / L2.
Роль находится на стыке DevOps, SRE и Operations: фокус не на разработке фич, а на стабильности, прозрачности и управляемости продакшен-систем.

Основные обязанности:
-Проектирование и развитие системы мониторинга для сервисов на базе .NET / C# / React в Kubernetes.
-Настройка и сопровождение метрик, логов и трейсов: VictoriaMetrics/Prometheus, Grafana, ELK
-Разработка дашбордов, отражающих: техническое состояние системы,
ключевые SLI/SLO, признаки деградации сервиса и пользовательского опыта.
-Настройка алертинга с приоритетами и трешхолдами, ориентированными на реальные инциденты, а не шум.
-Разработка и поддержка runbook’ов / playbook’ов для команд поддержки L1 / L2.
-Описание типовых сценариев инцидентов, шагов диагностики и эскалации.
-Подготовка инструкций по использованию дашбордов и алертов для быстрого определения масштаба и причины проблемы.
-Участие в разборе инцидентов, формирование улучшений мониторинга и процессов.
-Участие в обеспечении стабильной работы Kubernetes-кластеров и сервисов.
-Анализ инцидентов, связанных с производительностью, доступностью и отказоустойчивостью.
-Взаимодействие с командами разработки для внедрения observability best practices.
-Участие в стандартизации подходов к observability и incident management.

Обязательные требования:
-Опыт работы в роли Operations Engineer/DevOps Engineer/SRE от 5 лет.
-Практический опыт работы с Kubernetes в production.
-Опыт настройки мониторинга и алертинга на базе: Prometheus/VictoriaMetrics, Grafana, ELK
-Понимание принципов observability: metrics, logs, traces.
-Опыт написания и поддержки эксплуатационной документации (runbooks).
-Понимание процессов инцидент-менеджмента и эскалаций.
-Понимание работы backend-приложений на .NET/C# (метрики, логирование, health endpoints).
-Базовое понимание frontend-метрик (React, web vitals — будет плюсом).
-Опыт работы с Linux, контейнерами, Helm.
-Понимание сетевых основ (HTTP, TCP, DNS).

Будет плюсом:
-Опыт внедрения OpenTelemetry.
-Опыт построения SLI/SLO.
-Опыт работы с high-load системами.
-Опыт автоматизации (bash, terraform, ansible, helm).
-Опыт участия в on-call ротациях.

Мы можем предложить:
-Офисная работа в Белграде
-График работы 5/2, гибкое начало рабочего дня с 8:00 до 10:00
-Оплачиваемый отпуск
-Гибкий подход к управлению, постановке задач, процессам
-Перспективные проекты и продвинутые технологии
-Интересные задачи в дружной и большой команде
-Отсутствие ненужной бюрократии, возможность реализовывать свои идеи

Контакт:

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -

Operations Engineer

Мэтч & Сопровод

Описание вакансии

Похожие вакансии

Operations Engineer (Observability & Monitoring)

Devsecops Team Lead (Igaming)

Senior DevOps Engineer (iGaming)