Вакансия из Telegram канала - Название доступно после авторизации
Пожаловаться
Зарплата и рынок
ЗП не указана
На похожих ролях по рынку
$3.4к$4.2кмедиана$5.5к
35 в выборке
На международном рынке: $150к/год ($60к - $205к)
88
Крутая вакансия
развернуть
Сильная вакансия в MedTech с передовым LLM-стеком и редким балансом между глубоким ресерчем и полноценным продакшн-инжинирингом.
Кликните для подробной информации
Зарплата не указанаПередовой стекТрендовый доменПотенциал для ресерчаПонятный scope
Оценка от Hirify AI
Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Создать профиль и узнать мэтч
Описание вакансии
SeniorData Scientist (NLP|LLM)
Локация: Удалённо в РФ Компания: Digital Health платформа, DocDoc ЗП: обсуждается на собеседовании Занятость: Полная
Обязанности:
Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning).
Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias.
Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails.
Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge там, где уместно, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде.
Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации.
Требования:
3+ лет в NLP/ML, уверенный Python: типизация, тестирование, профилирование, аккуратный продакшн-код.
Практический опыт обучения и дообучения трансформеров: PyTorch + HuggingFace, понимание Accelerate, DeepSpeed или аналогов.
Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow или ClearML), умение делать корректные сравнения.
Понимание LLM-систем: retrieval, tool-calling, агенты, деградации качества, галлюцинации, ограничения продакшна.
Навыки оценки качества: метрики, бенчмарки, error analysis, ablations, работа с разметкой и экспертной валидацией.
Опыт в медицине или биомеде: клинические тексты, ICD-10, клин. рекомендации, понимание доменных рисков.
Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation. Практика продакшн-инференса: vLLM, оптимизация стоимости и задержки, Docker, K8s, мониторинг, трассировка.
Опыт с retrieval-стеком: hybrid search, rerankers, FAISS, Elastic, pgvector, продуманноеchunking, grounding.
Условия:
Мы предлагаем:
Удаленку из России, гибрид или офис (уютный офис в БЦ Симонов Плаза с видом на Москва-реку);
Свободный дресс-код и общение на «ты»;
ДМС после прохождения испытательного срока;
Оплачиваемые курсы английского языка в нашем офисе;
Бесплатные занятия спортом: йога, сайкл, футбол/волейбол;
Свою библиотеку бумажных книг, которая пополняется по запросу;
Компенсацию спортивного абонемента. 💬Резюме отправлять:Показать контакты (отправлять с пометкой DS)
–––
Забирай 📚
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Текст вакансии взят без изменений
Источник - Telegram канал. Название доступно после авторизации