Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Описание вакансии
TL;DR
Lead Deep Learning / CUDA Engineer (AI): Разработка и оптимизация инфраструктуры инференса больших языковых моделей с акцентом на низкоуровневую оптимизацию работы с «железом» и производительность. Фокус на выводе новых архитектур в продуктив, решении задач по балансировке запросов и оптимизации стоимости эксплуатации высоконагруженных кластеров.
Локация: Москва или удаленно (только внутри РФ)
Компания
Команда GigaChat, создающая и развивающая core-технологию генеративной языковой модели.
Что делать
- Заниматься низкоуровневой оптимизацией взаимодействия ПО с аппаратным обеспечением.
- Разрабатывать инфраструктуру для управления нагрузками на кластеры и балансировки запросов.
- Обеспечивать вывод новых архитектур моделей в промышленную эксплуатацию.
- Работа над стабильностью сервисов и оптимизацией затрат (cost optimization) при инференсе LLM.
Требования
- Опыт работы в области глубокого обучения, в том числе с LLM.
- Глубокое знание CUDA и Python.
- Опыт использования GigaChat, Kandinsky и аналогичных инструментов в реальных продуктах.
- Навыки создания и использования AI-агентов.
- Для удаленного формата работы: нахождение в РФ.
Культура и преимущества
- Возможность выбора удобного графика: офис, гибрид или удаленка (в пределах РФ).
- Годовая премия, расширенный ДМС и корпоративная пенсионная программа.
- Доступ к более чем 400 образовательным программам СберУниверситета.
- Льготная ипотека для сотрудников, корпоративный спортзал и зоны отдыха.
- Бесплатная подписка СберПрайм+ и скидки на продукты компаний-партнёров.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →