Эта вакансия в архиве

Посмотреть похожие вакансии ↓
обновлено 1 день назад

MLOps Engineer (Trust and Safety)

Формат работы
remote (только Russia)/hybrid
Тип работы
fulltime
Грейд
senior
Страна
Russia

Описание вакансии

Текст:
/

TL;DR

MLOps Engineer (Trust and Safety): Develop and automate ML training and deployment pipelines with an accent on GPU Kubernetes cluster architecture and Nvidia Triton Inference Server optimization. Focus on scaling infrastructure and standardizing processes for a growing data science team within Trust & Safety.

Локация: Москва или удалённо из России

Компания

Wildberries и Russ — лидеры рынков e-commerce и наружной рекламы в России и странах СНГ, создающие крупнейшую онлайн-платформу для покупки и продажи товаров.

Что делать

  • Развивать и автоматизировать ML-пайплайны обучения и деплоя моделей
  • Проектировать архитектуру GPU Kubernetes кластеров
  • Поддерживать и оптимизировать Nvidia Triton Inference Server для ускорения инференса
  • Взаимодействовать с командами DS для трансформации потребностей в технические решения
  • Поддерживать обучающие машины с Portainer и JupyterHub
  • Масштабировать инфраструктуру отдела Trust & Safety

Требования

  • Опыт работы с ClearML, Kubeflow или аналогичными MLOps платформами
  • Опыт работы с Nvidia Triton Inference Server
  • Знание Kubernetes и контейнеризации ML-сервисов
  • Опыт DevOps практик: CI/CD, инфраструктура как код, мониторинг
  • Понимание Docker и оркестрации контейнеров
  • Готовность работать удалённо из России или в офисах Москвы/Санкт-Петербурга

Хорошо, если есть

  • Опыт работы и развертывания Qdrant
  • Понимание векторных баз данных и их оптимизации
  • Опыт работы с Helm и Ansible

Культура и преимущества

  • Полная удалёнка или свободное посещение офисов в Москве и Санкт-Петербурге
  • IT-ипотека и оформление в аккредитованную IT-компанию
  • Бесплатное питание в офисах, ДМС со стоматологией после испытательного срока
  • Корпоративное обучение и IT-мероприятия

Процесс найма

  • 30-минутное HR интервью
  • Техническое интервью с лайфкодингом (1 час)
  • Интервью MLOps (1,5 часа)
  • Финальное интервью с лидом (1 час)