Эта вакансия в архиве
Посмотреть похожие вакансии ↓Описание вакансии
Текст:
TL;DR
MLOps Engineer (Trust and Safety): Develop and automate ML training and deployment pipelines with an accent on GPU Kubernetes cluster architecture and Nvidia Triton Inference Server optimization. Focus on scaling infrastructure and standardizing processes for a growing data science team within Trust & Safety.
Локация: Москва или удалённо из России
Компания
Wildberries и Russ — лидеры рынков e-commerce и наружной рекламы в России и странах СНГ, создающие крупнейшую онлайн-платформу для покупки и продажи товаров.
Что делать
- Развивать и автоматизировать ML-пайплайны обучения и деплоя моделей
- Проектировать архитектуру GPU Kubernetes кластеров
- Поддерживать и оптимизировать Nvidia Triton Inference Server для ускорения инференса
- Взаимодействовать с командами DS для трансформации потребностей в технические решения
- Поддерживать обучающие машины с Portainer и JupyterHub
- Масштабировать инфраструктуру отдела Trust & Safety
Требования
- Опыт работы с ClearML, Kubeflow или аналогичными MLOps платформами
- Опыт работы с Nvidia Triton Inference Server
- Знание Kubernetes и контейнеризации ML-сервисов
- Опыт DevOps практик: CI/CD, инфраструктура как код, мониторинг
- Понимание Docker и оркестрации контейнеров
- Готовность работать удалённо из России или в офисах Москвы/Санкт-Петербурга
Хорошо, если есть
- Опыт работы и развертывания Qdrant
- Понимание векторных баз данных и их оптимизации
- Опыт работы с Helm и Ansible
Культура и преимущества
- Полная удалёнка или свободное посещение офисов в Москве и Санкт-Петербурге
- IT-ипотека и оформление в аккредитованную IT-компанию
- Бесплатное питание в офисах, ДМС со стоматологией после испытательного срока
- Корпоративное обучение и IT-мероприятия
Процесс найма
- 30-минутное HR интервью
- Техническое интервью с лайфкодингом (1 час)
- Интервью MLOps (1,5 часа)
- Финальное интервью с лидом (1 час)