Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Описание вакансии
Текст:
TL;DR
Data Scientist (LLM): Разработка и дообучение языковых моделей с акцентом на синтетические данные, RL-пайплайны и NLP-роутинг. Фокус на внедрении методов GRPO, оптимизации адаптеров (LoRA/QLoRA) и построении процессов оценки качества моделей (LLM-as-a-Judge).
Локация: Удаленно, только из РФ
Зарплата: 400 000 — 500 000 ₽/мес
Компания
Selecty — аккредитованная IT-компания, специализирующаяся на IT-аутсорсинге и цифровой трансформации для крупного бизнеса с 2013 года.
Что делать
- Работать с синтетическими данными: генерация, фильтрация, дедупликация и борьба с data contamination.
- Дообучать адаптеры под агентов, используя LoRA, QLoRA и DoRA.
- Разрабатывать и оптимизировать RL-пайплайны (GRPO, PPO, DPO, KTO) и reward-модели.
- Реализовывать NLP-задачи для роутинга: классификация интентов, NLI, query understanding и drift-детекция.
- Проводить исследования в области embedding tuning и интерпретируемости моделей.
Требования
- Локация: проживание в РФ
- Глубокое понимание Transformer-архитектур и современных методов обучения LLM.
- Опыт работы с LoRA, включая выбор ранга и стратегии мержа.
- Знание RL-методов (PPO, DPO, GRPO, KTO) с фокусом на GRPO.
- Опыт работы с пайплайнами фильтрации данных и инструментами оценки (Lm-eval-harness, G-Eval).
- Умение читать научные статьи (arXiv) и воспроизводить их результаты.
- Опыт трекинга экспериментов в W&B или MLflow.
Хорошо, если есть
- Опыт работы с JAX.
- Знания в области Mechanistic Interpretability.
- Опыт работы с PyTorch, PEFT, TRL, Unsloth.
- Знакомство с RuAdapt.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Похожие вакансии
GigaChat
23 часа назад
Pretrain Data LLM Researcher (AI)
400 000 - 1 000 000₽
Wildberries and Russ
15 часов назад
Senior Data Scientist (NLP)
Avito
3 дня назад
Data Scientist (Deep Learning)
350 000 - 500 000₽
RWB
13 часов назад
Senior ML Engineer (Geo)
RWB
7 часов назад
Data Scientist (AI)
2 дня назад
Middle+/Senior Computer Vision Engineer (Medtech)
300 000 - 400 000₽