Эта вакансия в архиве
Посмотреть похожие вакансии ↓Описание вакансии
Текст:
TL;DR
Deep Learning Engineer (GigaChat Prod): Разработка и внедрение в production технологий генеративных языковых моделей (LLM) с акцентом на низкоуровневую оптимизацию и работу с аппаратным обеспечением. Фокус на построении масштабируемой инфраструктуры для обслуживания высоконагруженных моделей, балансировке запросов и выводе архитектурных решений на CUDA в продакшн.
Локация: Офисы в Москве и Санкт-Петербурге; доступны варианты работы в офисе, гибрид или удаленно из РФ.
Зарплата: от 350 000 ₽
Компания
Сбер — ведущая технологическая компания, развивающая GigaChat, современную генеративную языковую модель уровня GPT-4.
Что делать
- Заниматься низкоуровневой оптимизацией работы моделей с «железом».
- Разрабатывать и поддерживать инфраструктуру для работы с высоконагруженными кластерами.
- Отвечать за балансировку запросов в высоконагруженных системах.
- Внедрять и масштабировать вывод новых архитектур нейросетей в production.
Требования
- Глубокие знания и опыт работы в области глубокого обучения, включая LLM.
- Уверенное владение Python и глубокое знание CUDA.
- Кандидат должен иметь возможность работать из России (офис или удаленно).
Культура и преимущества
- Годовая премия и корпоративная пенсионная программа.
- Расширенный ДМС с льготным страхованием для семьи.
- Более 400 образовательных программ через СберУниверситет.
- Льготные условия по ипотеке для сотрудников.
- Подписка СберПрайм+ и корпоративный спортзал.
Процесс найма
- HR-скрининг и HR-интервью.
- Две технические секции (алгоритмы Python/C++, прикладной ML) в формате lifecoding.
- Финальное интервью с командой.