Назад
11 часов назад

Supercomputer Operations Engineer (Cloud)

Тип работы
fulltime
Страна
Russia

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Текст:
/

TL;DR

Инженер эксплуатации суперкомпьютеров (Linux/K8s): Обеспечение стабильной работы инфраструктуры суперкомпьютеров и устранение технических сбоев с акцентом на диагностику инцидентов, мониторинг и восстановление сервисов. Фокус на администрировании Linux, управлении контейнеризацией в Kubernetes и автоматизации эксплуатации через Ansible.

Локация: Москва

Компания

Cloud.ru — провайдер облачных решений и высокопроизводительных вычислений.

Что делать

  • Устранять проблемы инфраструктуры, сервисов и клиентов.
  • Реагировать на инциденты (переданные с L2) и оповещения систем мониторинга.
  • Проводить диагностику, выявлять причины сбоев и восстанавливать работоспособность сервисов.
  • Участвовать в OnCall-дежурствах и разборах корневых причин инцидентов (post-mortem).
  • Формировать техническую документацию и инструкции для инженеров поддержки 2-го и 3-го уровней.
  • Совместно с SRE-командой работать над повышением надёжности систем.

Требования

  • Опыт сопровождения сложных информационных систем и ИТ-инфраструктуры.
  • Уверенные знания администрирования Linux и сетевых технологий.
  • Опыт работы с Kubernetes и технологиями контейнеризации.
  • Практические навыки работы с инструментами мониторинга и логирования (Zabbix, Prometheus, Grafana, ELK).
  • Опыт использования Ansible.
  • Знание систем контроля версий (Git) и инструментов CI/CD (Gitlab, Jenkins).

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →