TL;DR
ML-инженер (AI): Сбор и улучшение пайплайнов предобработки данных для обучения моделей LLM GigaChat (Core, B2C, банковские задачи, внешние заказчики) с акцентом на Supervised Finetuning и Reinforcement Learning. Фокус на работе с проприетарными и open-source LLM, оптимизации качества данных и взаимодействии с асессорами.
Локация: Офис или гибридный формат работы в Москве (Кутузовский проспект, Sber City)
Компания
Мы — команда ML-инженеров GigaChat Data, готовящая данные для обучения линейки моделей LLM GigaChat, включая базовые модели и их адаптацию под различные сценарии.
Что делать
- Собирать данные для alignment обучения моделей (Supervised Finetuning, Reinforcement Learning).
- Улучшать пайплайны предобработки данных для разметки и обучения.
- Работать в тесной связке с командой ML, LoRA-finetuning.
- Взаимодействовать с командой асессоров/разметчиков.
- Рассчитывать метрики и принимать решения по улучшению качества данных на их основе.
Требования
- Знание Python на очень высоком уровне.
- Опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, Google Gemini, OpenAI GPT, Anthropic и пр.).
- Понимание процессов работы с данными для больших языковых моделей.
- Способность решать проблемы и организовывать работу в условиях многозадачности.
Хорошо, если есть
- Опыт работы с LLM-агентами (LangChain, LangSmith, LangGraph, FAISS, RAG, ChromaDB и пр.).
Культура и преимущества
- Комфортный офис в Москве (Sber City).
- Возможность выбрать удобный график – офис/гибрид.
- Ежегодный пересмотр зарплаты и годовая премия.
- Корпоративный спортзал и зоны отдыха.
- Более 400 образовательных программ СберУниверситета.
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа.
- Ипотека для сотрудников выгоднее до 4%.
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →