Назад
18 часов назад

Data Scientist (LLM)

400 000 - 500 000
Формат работы
remote (только Russia)
Тип работы
fulltime
Грейд
middle/senior
Английский
b2
Страна
Russia

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Текст:
/

TL;DR

Data Scientist (LLM): Разработка и дообучение языковых моделей с акцентом на синтетические данные, RL-пайплайны и NLP-роутинг. Фокус на внедрении методов GRPO, оптимизации адаптеров (LoRA/QLoRA) и построении процессов оценки качества моделей (LLM-as-a-Judge).

Локация: Удаленно, только из РФ

Зарплата: 400 000 — 500 000 ₽/мес

Компания

Selecty — аккредитованная IT-компания, специализирующаяся на IT-аутсорсинге и цифровой трансформации для крупного бизнеса с 2013 года.

Что делать

  • Работать с синтетическими данными: генерация, фильтрация, дедупликация и борьба с data contamination.
  • Дообучать адаптеры под агентов, используя LoRA, QLoRA и DoRA.
  • Разрабатывать и оптимизировать RL-пайплайны (GRPO, PPO, DPO, KTO) и reward-модели.
  • Реализовывать NLP-задачи для роутинга: классификация интентов, NLI, query understanding и drift-детекция.
  • Проводить исследования в области embedding tuning и интерпретируемости моделей.

Требования

  • Локация: проживание в РФ
  • Глубокое понимание Transformer-архитектур и современных методов обучения LLM.
  • Опыт работы с LoRA, включая выбор ранга и стратегии мержа.
  • Знание RL-методов (PPO, DPO, GRPO, KTO) с фокусом на GRPO.
  • Опыт работы с пайплайнами фильтрации данных и инструментами оценки (Lm-eval-harness, G-Eval).
  • Умение читать научные статьи (arXiv) и воспроизводить их результаты.
  • Опыт трекинга экспериментов в W&B или MLflow.

Хорошо, если есть

  • Опыт работы с JAX.
  • Знания в области Mechanistic Interpretability.
  • Опыт работы с PyTorch, PEFT, TRL, Unsloth.
  • Знакомство с RuAdapt.

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →