Data Infrastructure & Platform Tech Lead (AI)
Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Описание вакансии
TL;DR
Data Infrastructure & Platform Tech Lead (AI/Distributed Systems): Создание и оптимизация высокопроизводительных платформ хранения и оркестрации данных для претрейна LLM с акцентом на масштабируемость, версионирование и эффективность GPU-кластеров. Фокус на проектировании data-intensive распределённых систем, оптимизации пайплайнов на тысячах узлов и внедрении инженерных стандартов платформенной команды.
Локация: Гибрид, Москва (м. Кутузовская) — 2 дня в офисе, 3 дня удалённо
Зарплата: 700 000 — 1 200 000 ₽/мес до налогов
Компания
Sber (команда GigaChat), разрабатывающая одну из крупнейших LLM-моделей.
Что делать
- Проектировать и развивать масштабные системы хранения данных, оптимизированные под паттерны доступа в претрейне LLM.
- Развивать платформу версионирования и отслеживания происхождения данных для обеспечения воспроизводимости датасетов.
- Создавать и совершенствовать системы оркестрации workflow-ов для многоэтапных пайплайнов на тысячах узлов.
- Оптимизировать инфраструктуру подачи данных на GPU-кластеры для минимизации вычислительных потерь.
- Разрабатывать внутренние SDK, API и механизмы контроля доступа/шифрования для работы с чувствительными данными.
- Формировать технические стандарты команды, проводить code review и менторить инженеров.
Требования
- Высшее образование в области computer science, systems engineering или смежной области.
- Опыт от 6 лет в infrastructure/platform engineering с глубоким опытом построения distributed systems.
- Экспертные знания облачной инфраструктуры, объектного хранения, Kubernetes, IaC и CI/CD.
- Уверенное владение минимум двумя языками из списка: Python, Rust, C++.
- Опыт проектирования систем с высокой доступностью, отказоустойчивостью и горизонтальной масштабируемостью.
- Локация: Готовность работать в гибридном режиме в Москве.
Хорошо, если есть
- Опыт работы с YTSaurus.
- Опыт поддержки ML training workloads на крупных GPU-кластерах.
- Опыт создания внутренних self-service инструментов для инженерных команд.
Культура и преимущества
- Работа с колоссальными ресурсами (десятки петабайт и десятки тысяч ядер YTSaurus).
- Сильная команда из выпускников топовых вузов (МФТИ, ВШЭ, МГУ) и экспертов из BigTech.
- Расширенный полис ДМС с первого дня и страхование для членов семьи.
- Ежегодный пересмотр зарплаты, годовая премия и льготная программа ипотеки.
- Корпоративный спортзал, зоны отдыха и система профессионального обучения.
- Бесплатная подписка СберПрайм+.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →