1 день назад

RL-Learning LLM Infrastructure Developer (AI)

250 000 - 500 000₽

Формат работы

hybrid

Тип работы

fulltime

Грейд

senior

Страна

Russia

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Текст:

TL;DR

Разработчик инфраструктуры RL-обучения LLM (AI): Создание инфраструктуры для обучения и дообучения больших языковых (LLM) и визуально-языковых (VLM) моделей, используемых в сервисах Яндекса, с акцентом на рациональное использование вычислительных ресурсов и минимизацию рисков сбоев. Фокус на оптимизации сложных распределённых систем для отказоустойчивости, эффективной доставки данных и минимизации задержек в коммуникациях.

Локация: Офис или гибридный формат в одном из городов: Москва, Санкт-Петербург, Екатеринбург, Новосибирск, Казань, Нижний Новгород

Salary: 250 000 – 500 000 ₽/мес на руки

Компания

Яндекс — одна из крупнейших ИТ-компаний в России, разрабатывающая популярные поисковые системы и широкий спектр сервисов для повседневной жизни и бизнеса.

Что делать

Оптимизировать инфраструктуру RL-обучения, улучшая доставку, сохранение данных и коммуникации между блоками.
Развивать инструменты диагностики для быстрого выявления и устранения инфраструктурных проблем.
Повышать отказоустойчивость инфраструктуры обучения к различным ошибкам и сбоям.
Исследовать и внедрять современные решения для организации инфраструктуры RL-обучения.

Требования

Знание Python и опыт системного программирования, разработки библиотек или фреймворков.
Практический опыт с PyTorch и распределённым обучением через torch.distributed.
Владение подходами параллелизации: data parallelism, tensor parallelism, pipeline parallelism, expert parallelism.
Интерес к LLM и MLOps, понимание задач эксплуатации больших моделей в продакшне.
Умение эффективно работать в команде и делиться знаниями.
Формат работы: Офис или гибридный в России (Москва, Санкт-Петербург, Екатеринбург, Новосибирск, Казань, Нижний Новгород)

Хорошо, если есть

Участие в создании инфраструктуры обучения ML-моделей.
Внедрение и оптимизация RL-решений.
Работа с библиотеками RL-обучения для LLM (veRL, slime, NeMo-RL, SkyRL) или инференса (vLLM, SGLang, TRTLLM).
Владение C++ и опыт низкоуровневого программирования и оптимизации.
Опыт с GPU NVIDIA, понимание архитектуры GPU, разработка/оптимизация алгоритмов с CUDA или Triton.

Культура и преимущества

Высокий совокупный доход с полугодовыми премиями.
Офисы с комфортными рабочими зонами, местами для отдыха и тренажёрными залами.
Расширенная медицинская страховка с первого месяца (включая стоматологию, психотерапию, телемедицину, и покрытие для семьи).
Возможности для обучения: внутренняя платформа с курсами, менторство, оплата профильных конференций и частичная оплата обучения иностранным языкам.
Закрытые корпоративные мероприятия и спортивные клубы.

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник - загрузка...

RL-Learning LLM Infrastructure Developer (AI)

Мэтч & Сопровод

Описание вакансии

TL;DR

Компания

Что делать

Требования

Хорошо, если есть

Культура и преимущества

Похожие вакансии

Senior LLM Developer (AI)

Senior Machine Learning Engineer (CV/NLP)

Senior AI Developer

Senior ML/NLP Инженер (чат-боты, LLM)

Senior Data Scientist (NLP/LLM)

ML Engineer (TTS Text-to-speech)