Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Описание вакансии
TL;DR
NLP Engineer (Reinforcement Learning): Разработка и обучение моделей GigaChat Reasoning с акцентом на online RL, агентские навыки и tool calling. Фокус на создании сред для обучения LLM, оптимизации пайплайнов и выводе решений в продакшн с использованием высокопроизводительных кластеров.
Локация: Работа возможна удаленно из РФ или в гибридном формате в Москве (м. Кутузовская).
Зарплата: 300 000 — 500 000 ₽/мес на руки.
Компания
Крупнейшая технологическая компания, развивающая передовые AI-решения и экосистему сервисов.
Что делать
- Улучшать качество работы GigaChat Reasoning на русском и английском языках.
- Ускорять пайплайн обучения через профилирование узких мест и эффективный сэмплинг.
- Тестировать новые Loss-функции и подходы к обучению моделей.
- Помогать выводить обученные модели в продакшн.
- Изучать актуальные научные статьи и внедрять лучшие практики.
Требования
- Опыт в online RL и глубокие теоретические знания.
- Уверенное владение Python и PyTorch.
- Знание базовых алгоритмов, математики и основ Deep Learning.
- Опыт обучения моделей для продакшена.
- Понимание текущего состояния эволюции больших LLM.
Хорошо, если есть
- Наличие научных публикаций.
Культура и преимущества
- Годовая премия до 6 окладов и регулярный пересмотр зарплат.
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа.
- Доступ к более чем 400 программам СберУниверситета.
- Крупнейшее DS&AI community с регулярными митапами и обменом опытом.
- Корпоративный спортзал, зоны отдыха и ипотечные программы для сотрудников.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →