Назад

Не получаете ответ?

Telegram-вакансии старше 7 дней могут быть уже неактуальны.

27 дней назад

DL (LM) Researcher (AI)

Формат работы
remote (только Russia)
Тип работы
fulltime
Английский
b2
Страна
Russia
vacancy_detail.hirify_telegram_tooltipВакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

#ai
DL (LM) Researcher / Alfa-Gen
Remote

RnD-команда нового AI-департамента. Строим мультиагентный чат в Альфа-Мобайл: 160+ агентов, оркестрация с drift-детекцией.

Задачи:
• Синтетические данные, дообучение адаптеров (LoRA/QLoRA/DoRA)
• RL-пайплайны (фокус на GRPO), embedding tuning
• Исследования: новые архитектуры, методы трансформеров

Требования:
• Глубокое понимание LoRA (ранг, таргет-модули, мерж)
• Знание PPO/DPO/GRPO/KTO, акцент на GRPO
• Умение читать arXiv и воспроизводить идеи
• PyTorch, PEFT, TRL, Unsloth, bitsandbytes

Инфраструктура:
• Кластер 250+ H200 (42 выделено под команду)
• Любые открытые модели — деплой за 3 дня
• Полная свобода в архитектуре и исследованиях

Процесс: 1 технический собес → оффер сразу, fast-track.
Инференс/деплой — отдельная команда.

Для отклика и отправки резюме:
ТГ:

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -