Senior Engineering Manager (AI/LLM)
Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Описание вакансии
TL;DR
Senior Engineering Manager (AI/LLM): Руководство направлением Online RL для STEM-задач в команде GigaChat с акцентом на развитие методов post-training, построение пайплайнов данных и верификацию рассуждений модели. Фокус на глубокой технической проработке архитектуры обучения, проведении экспериментов и управлении командой исследователей для достижения лидерства в качестве модели.
Локация: Россия (удалённо)
Зарплата: 650 000 — 850 000 ₽/мес на руки
Компания
Сбер — крупнейший банк в России и один из ведущих международных финансовых институтов, активно развивающий передовые AI-технологии.
Что делать
- Определять стратегию развития Online RL для STEM-домена (математика, физика, химия, биология).
- Разрабатывать и внедрять подходы post-training для улучшения цепочек рассуждений и точности ответов модели.
- Самостоятельно писать критически важный код пайплайнов обучения и инфраструктуры экспериментов.
- Организовывать контур сбора данных, включая синтетические сценарии и автоматические верификаторы.
- Руководить командой исследователей и инженеров, задавая высокие стандарты качества и скорости разработки.
- Балансировать между исследовательскими задачами и практическими результатами для модели.
Требования
- Отличное владение Python и PyTorch.
- Практический опыт в LLM post-training (RLHF, online RL).
- Глубокое понимание STEM-домена (chain-of-thought, формальная верификация).
- Опыт руководства сильной технической командой.
- Готовность лично участвовать в написании ключевых частей системы.
- Свободное владение русским языком.
Хорошо, если есть
- Сильный математический или естественнонаучный бэкграунд (олимпиадный опыт, публикации).
- Опыт построения верификаторов, reward-моделей и систем оценки качества (LLM-as-a-judge).
- Опыт работы с distributed training или large-scale inference.
- Опыт работы с synthetic data generation и curriculum learning.
Культура и преимущества
- Работа над передовыми русскоязычными LLM с высокой степенью влияния на продукт.
- Возможность совмещать управленческие функции с глубокой технической работой.
- Команда сильных инженеров и исследователей.
- Конкурентная компенсация (оклад + премии) и расширенный соцпакет.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →