Назад
5 часов назад

SRE Инженер

Формат работы
remote (только Russia)
Тип работы
fulltime
Грейд
senior
Страна
Russia
vacancy_detail.hirify_telegram_tooltip Загружаем источник...

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

SRE-инженер

Требования

Инженер по доступности сервисов Git Kubernetes Высоконагруженные системы

Условия

Можно удалённо Москва Fix Price Вам предстоит:

  • Обеспечивать стабильность, производительность и отказоустойчивость продакшн-систем;
  • Разрабатывать и поддерживать инструменты для автоматизации инфраструктуры и наблюдаемости;
  • Мониторить состояние систем, реагировать на инциденты и проводить анализ первопричин (RCA);
  • Сотрудничать с командами разработки для повышения масштабируемости и надёжности сервисов;
  • Определять и контролировать SLI, SLO и Error Budgets;
  • Руководить инцидентами: организовывать процесс восстановления, документировать RCA и проводить постмортемы;
  • Настраивать и администрировать Grafana стэк, проектировать информативные дашборды и оптимизировать алерты;
  • Интегрировать и мониторить внешние системы, взаимодействовать с технической поддержкой поставщиков;
  • Автоматизировать рутинные операции (toil elimination): развертывание, масштабирование, бэкапы, восстановление;
  • Тесно взаимодействовать с командой безопасности (DevSecOps) для обеспечения соответствия инфраструктуры;
  • Участвовать в планировании мощности (capacity planning) и оптимизации затрат на облачную/физическую инфраструктуру.

Мы ожидаем: ​​​​​​​

  • Опыт работы в роли SRE/DevOps/Infrastructure Engineer от 3 лет;
  • Отличное понимание принципов observability (metrics, logs, traces);
  • Практический опыт работы с Grafana(администрирование, настройка, оптимизация алертов);
  • Опыт работы с Kubernetes и контейнеризацией;
  • Знание и применение принципов SLI/SLO/Error Budgets на практике;
  • Опыт проведения и документирования инцидентов и постмортемов;
  • Навыки написания скриптов для автоматизации (Python, Bash или Go);
  • Понимание принципов работы распределённых систем и сетевых протоколов;
  • Понимание принципов и процессов CI/CD.

Будет плюсом:

  • Опыт построения отказоустойчивых multi-region или multi-cloud архитектур;
  • Знание паттернов resilience (circuit breaker, retry, backoff);
  • Знание: Clickhouse, Keycloak / LDAP / Authentic, kyverno, Rancher, php, kustomize.

Стек: Docker, Docker-compose, Grafana/Prometheus, ELK, Kubernetes, Gitlab + gitlab-ci, MySql, PostgreSQL, Ingress Nginx, KrakenD, php + Yii2, shell. ​​​​​​​​​​​​​​Мы предлагаем:

  • Работу в крупной международной компании;
  • Официальное оформление по ТК РФ;
  • Полностью белую заработную плату;
  • График: 5/2, полностью удаленный формат работы;
  • Возможность посещения офиса - м. Проспект Мира (5 минут пешком).

Дополнительные бонусы:

  • Работа в дружной команде и развитая корпоративная жизнь;
  • Возможность профессионального и карьерного роста, гибкое отношение к новым идеям;
  • Возможность повышения квалификации и переподготовки по выбранной специальности в нашем корпоративном университете с получением сертификата или диплома;
  • Программа ДМС;
  • Корпоративные скидки в фитнес-клубы;
  • Премиум доступ к платформе со скидками от партнеров;
  • Реферальная программа для сотрудников;
  • Подарки на день рождения;
  • Доплата к больничным и отпускам до полной заработной платы.

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -