DL (LM) Researcher (AI)

Формат работы

remote (только Russia)

Тип работы

fulltime

Английский

Страна

Russia

Вакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

#ai
DL (LM) Researcher / Alfa-Gen
Remote

RnD-команда нового AI-департамента. Строим мультиагентный чат в Альфа-Мобайл: 160+ агентов, оркестрация с drift-детекцией.

Задачи:
• Синтетические данные, дообучение адаптеров (LoRA/QLoRA/DoRA)
• RL-пайплайны (фокус на GRPO), embedding tuning
• Исследования: новые архитектуры, методы трансформеров

Требования:
• Глубокое понимание LoRA (ранг, таргет-модули, мерж)
• Знание PPO/DPO/GRPO/KTO, акцент на GRPO
• Умение читать arXiv и воспроизводить идеи
• PyTorch, PEFT, TRL, Unsloth, bitsandbytes

Инфраструктура:
• Кластер 250+ H200 (42 выделено под команду)
• Любые открытые модели — деплой за 3 дня
• Полная свобода в архитектуре и исследованиях

Процесс: 1 технический собес → оффер сразу, fast-track.
Инференс/деплой — отдельная команда.

Для отклика и отправки резюме:
ТГ:

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -

DL (LM) Researcher (AI)

Мэтч & Сопровод

Описание вакансии

Похожие вакансии

Программист-исследователь (AI/LLM)

ML-инженер (LLM)

Pretrain Data LLM Researcher (AI)

Data Scientist (AI)

ML-инженер (Python/ML/NLP/LLM)

ML/RL Research Engineer (AI)

Разработка

Game Dev

Design и Creative

Аналитика

Менеджмент

People & Business