Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Описание вакансии
TL;DR
Руководитель Команды Данных (AI): Создание и развитие команды, отвечающей за подготовку датасетов для post-training больших языковых моделей, с акцентом на online RL, cold start и обучение reward-моделей. Фокус на выстраивании процессов взаимодействия с ML-командами и обеспечении стабильного производства качественных данных.
Локация: Россия, удалённо
Salary: 700 000 — 1 300 000 ₽/мес на руки
Компания
Сбербанк — крупнейший банк в России, Центральной и Восточной Европе, один из ведущих международных финансовых институтов.
Что делать
- Сформировать с нуля команду данных для post-training, определив роли, зоны ответственности и принципы работы.
- Организовать производство датасетов для online RL, cold start, reward modeling и других направлений post-training.
- Ввести стандарты качества для датасетов и организовать контроль качества данных.
- Построить устойчивый процесс работы с внутренними заказчиками, обеспечивая быстрый и предсказуемый цикл от запроса до передачи готового датасета.
- Развивать инфраструктуру и инструменты для работы с данными, обеспечивая хранение, версионирование и переиспользование данных.
- Руководить командой дата-специалистов, развивая экспертизу по сбору, подготовке и контролю качества данных для LLM.
Требования
- Опыт руководства командой данных, разметки, data production или смежным направлением.
- Опыт построения процессов с нуля, включая найм, распределение ролей, организацию потока задач, контроль качества и сроков.
- Умение работать с внутренними заказчиками и переводить их потребности в понятные требования к данным.
- Понимание влияния данных на качество ML-моделей, особенно в задачах post-training.
- Опыт построения устойчивых процессов подготовки датасетов, а не только разовых проектов.
- Сильные управленческие и коммуникационные навыки.
Хорошо, если есть
- Опыт работы с данными для LLM, recommendation systems или других сложных ML-продуктов.
- Понимание специфики датасетов для online RL, cold start, reward modeling.
- Опыт построения quality control процессов для больших объёмов данных.
- Опыт запуска новой команды или нового направления внутри крупной организации.
- Понимание полного цикла post-training больших языковых моделей.
Культура и преимущества
- Возможность с нуля построить важную для всей организации data-функцию.
- Большое влияние на качество обучения и развитие GigaChat.
- Сильные внутренние заказчики и задачи на переднем крае развития LLM.
- Возможность собрать свою команду и определить принципы её работы.
- Конкурентная компенсация, премии и расширенный соцпакет.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →