Назад
2 часа назад

Data Scientist (NLP|LLM)

Формат работы
remote (только Russia)/hybrid/onsite
Тип работы
fulltime
Грейд
middle
Страна
Russia

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Текст:
/

TL;DR

Data Scientist (NLP|LLM): Проектировать и поддерживать полный цикл улучшения медицинских LLM с акцентом на сбор/очистку данных, обучение/дообучение (SFT, DPO/ORPO, instruction tuning). Фокус на разработке LLM-based пайплайнов и агентов для медицинских задач, создании системы оценивания (бенчмарки, LLM-as-a-judge, A/B-тесты) и исследовательских итерациях с экспериментами и публикациями.

Локация: Можно удалённо или гибридный формат в офисе Москва (Сити)

Компания

Крупнейшая в России Digital Health платформа, аккредитованная IT-компания с 380+ IT-специалистами, развивающая медицинский AI.

Что делать

  • Проектировать полный цикл улучшения медицинских LLM: данные, обучение/дообучение.
  • Строить датасеты и контуры разметки, включая синтетические данные и анализ ошибок.
  • Разрабатывать LLM-пайплайны и агенты: RAG, tool-calling, multi-step workflows, guardrails.
  • Создавать систему оценивания: бенчмарки, метрики, экспертная валидация, A/B-тесты.
  • Проводить исследования: гипотезы, эксперименты, ablations, публикации.

Требования

  • 3+ лет в NLP/ML, уверенный Python (типизация, тесты, прод-код).
  • Опыт обучения трансформеров: PyTorch + HuggingFace, Accelerate/DeepSpeed.
  • Построение data-pipelines, воспроизводимые эксперименты (MLflow/ClearML).
  • Понимание LLM-систем: retrieval, агенты, галлюцинации.
  • Навыки оценки: метрики, error analysis, ablations, разметка.

Хорошо, если есть

  • Опыт в медицине/биомеде (ICD-10, клинические тексты).
  • Alignment: RLHF, DPO, safety eval.
  • Прод-инференс: vLLM, Docker, K8s.
  • Retrieval-стек: FAISS, pgvector, chunking.

Культура и преимущества

  • Сильная команда MedTech-профессионалов.
  • Гибридный формат в офисе Сити (Москва), корпоративная техника.
  • Медицинская программа (телемедицина, клиники, психологи, диагностика).
  • Оплачиваемые курсы английского и профобучение (СберУниверситет).
  • Спорт: корпоративные занятия, компенсация абонементов.

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →