Назад
2 дня назад

MLOps Engineer (AI/Infrastructure)

Тип работы
fulltime
Грейд
middle
Страна
Russia

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Текст:
/

TL;DR

MLOps Инженер (AI/Infrastructure): Проектирование и внедрение инфраструктуры для AI-систем с акцентом на GPU-планирование и ML-пайплайны. Фокус на деплое LLM-инференс серверов, оптимизации распределения ресурсов GPU и построении надежных CI/CD процессов для моделей.

Локация: Москва

Компания

Лаборатория Касперского — ведущий мировой эксперт в области кибербезопасности.

Что делать

  • Проектировать архитектуру AI-систем от прототипа до production.
  • Внедрять и развивать GPU-планировщики (Kueue, Volcano и др.) для эффективного шаринга ресурсов.
  • Создавать и поддерживать ML-пайплайны обучения, валидации и деплоя моделей.
  • Настраивать CI/CD для моделей, включая версионирование данных и экспериментов.
  • Оптимизировать LLM и inference-серверы (vLLM, TGI, Triton).
  • Решать классические DevOps-задачи: оркестрация в K8s, IaC (Terraform, Ansible) и мониторинг.

Требования

  • Локация: Москва
  • Бэкграунд в ML/DS и понимание процессов обучения и инференса.
  • Опыт от 2 лет в MLOps или DevOps с ML-спецификой.
  • Опыт работы с Docker и Kubernetes (Helm) в production.
  • Уверенное владение Python и глубокие знания Linux.
  • Опыт управления GPU-кластерами (NVIDIA, CUDA) и работы с планировщиками.
  • Навыки работы с MLflow, Kubeflow, Airflow или аналогами.

Хорошо, если есть

  • Опыт работы с vLLM, TGI или Triton.
  • Знакомство со стеком: Kafka, RabbitMQ, Elasticsearch, Vault, Keycloak.
  • Понимание multi-tenant GPU-шаринга (MIG, MPS, time-slicing).
  • Опыт работы с Talos OS, Flatcar или построением гетерогенной инфраструктуры.

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →