Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Описание вакансии
TL;DR
Data Scientist (NLP|LLM): Проектировать и поддерживать полный цикл улучшения медицинских LLM с акцентом на сбор/очистку данных, обучение/дообучение (SFT, DPO/ORPO, instruction tuning). Фокус на разработке LLM-based пайплайнов и агентов для медицинских задач, создании системы оценивания (бенчмарки, LLM-as-a-judge, A/B-тесты) и исследовательских итерациях с экспериментами и публикациями.
Локация: Можно удалённо или гибридный формат в офисе Москва (Сити)
Компания
Крупнейшая в России Digital Health платформа, аккредитованная IT-компания с 380+ IT-специалистами, развивающая медицинский AI.
Что делать
- Проектировать полный цикл улучшения медицинских LLM: данные, обучение/дообучение.
- Строить датасеты и контуры разметки, включая синтетические данные и анализ ошибок.
- Разрабатывать LLM-пайплайны и агенты: RAG, tool-calling, multi-step workflows, guardrails.
- Создавать систему оценивания: бенчмарки, метрики, экспертная валидация, A/B-тесты.
- Проводить исследования: гипотезы, эксперименты, ablations, публикации.
Требования
- 3+ лет в NLP/ML, уверенный Python (типизация, тесты, прод-код).
- Опыт обучения трансформеров: PyTorch + HuggingFace, Accelerate/DeepSpeed.
- Построение data-pipelines, воспроизводимые эксперименты (MLflow/ClearML).
- Понимание LLM-систем: retrieval, агенты, галлюцинации.
- Навыки оценки: метрики, error analysis, ablations, разметка.
Хорошо, если есть
- Опыт в медицине/биомеде (ICD-10, клинические тексты).
- Alignment: RLHF, DPO, safety eval.
- Прод-инференс: vLLM, Docker, K8s.
- Retrieval-стек: FAISS, pgvector, chunking.
Культура и преимущества
- Сильная команда MedTech-профессионалов.
- Гибридный формат в офисе Сити (Москва), корпоративная техника.
- Медицинская программа (телемедицина, клиники, психологи, диагностика).
- Оплачиваемые курсы английского и профобучение (СберУниверситет).
- Спорт: корпоративные занятия, компенсация абонементов.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →