1 час назад

NLP Engineer (Reinforcement Learning)

300 000 - 500 000₽

Формат работы

remote (только Russia)/hybrid

Тип работы

fulltime

Грейд

middle/senior

Английский

Страна

Russia

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Текст:

TL;DR

NLP Engineer (Reinforcement Learning): Разработка и обучение моделей GigaChat Reasoning с акцентом на online RL, агентские навыки и tool calling. Фокус на создании сред для обучения LLM, оптимизации пайплайнов и выводе решений в продакшн с использованием высокопроизводительных кластеров.

Локация: Работа возможна удаленно из РФ или в гибридном формате в Москве (м. Кутузовская).

Зарплата: 300 000 — 500 000 ₽/мес на руки.

Компания

Крупнейшая технологическая компания, развивающая передовые AI-решения и экосистему сервисов.

Что делать

Улучшать качество работы GigaChat Reasoning на русском и английском языках.
Ускорять пайплайн обучения через профилирование узких мест и эффективный сэмплинг.
Тестировать новые Loss-функции и подходы к обучению моделей.
Помогать выводить обученные модели в продакшн.
Изучать актуальные научные статьи и внедрять лучшие практики.

Требования

Опыт в online RL и глубокие теоретические знания.
Уверенное владение Python и PyTorch.
Знание базовых алгоритмов, математики и основ Deep Learning.
Опыт обучения моделей для продакшена.
Понимание текущего состояния эволюции больших LLM.

Хорошо, если есть

Наличие научных публикаций.

Культура и преимущества

Годовая премия до 6 окладов и регулярный пересмотр зарплат.
Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа.
Доступ к более чем 400 программам СберУниверситета.
Крупнейшее DS&AI community с регулярными митапами и обменом опытом.
Корпоративный спортзал, зоны отдыха и ипотечные программы для сотрудников.

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

NLP Engineer (Reinforcement Learning)

Мэтч & Сопровод

Описание вакансии

TL;DR

Компания

Что делать

Требования

Хорошо, если есть

Культура и преимущества

Похожие вакансии

ML/NLP Engineer (LLM)

Senior Data Scientist (AI)

ML-инженер (LLM)

ML-разработчик (NLP)

Data Engineer (AI)

Junior+ Data Scientist (AI)

Разработка

Game Dev

Design и Creative

Аналитика

Менеджмент

People & Business

NLP Engineer (Reinforcement Learning)

Мэтч & Сопровод

Описание вакансии

TL;DR

Компания

Что делать

Требования

Хорошо, если есть

Культура и преимущества

Категории

Похожие вакансии

ML/NLP Engineer (LLM)

Senior Data Scientist (AI)

ML-инженер (LLM)

ML-разработчик (NLP)

Data Engineer (AI)

Junior+ Data Scientist (AI)