TL;DR
Тимлид ML-команды (AI Search, ML-сервисы): Разработка базовых технологий для ИИ-сервисов Yandex Cloud, создание мультитенантных поисковых и классификационных моделей и компонентов сервисов с акцентом на техническое руководство и организационное управление командой, проектирование ML-систем, а также непосредственное участие в разработке. Фокус на исследование и разработку SOTA-моделей для сценариев RAG, классификации и памяти, их интеграцию в инфраструктуру инференса, обеспечение метрик качества моделей и производительности бэкендов инференса.
Локация: Санкт-Петербург, офис или гибридный формат работы
Заработная плата: 410 000 — 680 000 ₽/мес на руки
Компания
Yandex Cloud — публичная облачная платформа, которая предоставляет корпорациям, среднему бизнесу и частным разработчикам масштабируемую инфраструктуру, сервисы хранения данных, инструменты машинного обучения и средства разработки.
Что делать
- Управлять командой ML-разработчиков, проводить performance review, встречи 1-to-1, ставить цели, помогать с карьерным развитием и наращивать знания и опыт команды.
- Декомпозировать продуктовые цели в технический roadmap, формировать квартальные планы команды и отвечать за их реалистичность и стабильную сходимость.
- Разрабатывать и внедрять CI/CD для моделей, процессов код-ревью, тестирования и релизного цикла ML-артефактов.
- Представлять R&D-команды в рамках v-team, формировать технические требования и запросы к смежным командам.
- Исследовать и разрабатывать SOTA-модели для сценариев RAG (поиск, ранжирование), классификации и памяти, а также интегрировать их в инфраструктуру инференса.
- Отвечать за метрики качества моделей, а также за производительность и стабильность бэкендов инференса (логирование, мониторинги, покрытие кода тестами).
- Лично участвовать в разработке (до 30–40% времени): писать код, проводить код-ревью, помогать с архитектурой и диагностикой проблем, готовить релизы моделей и бэкендов.
Требования
- Опыт управления ML-командой от одного года.
- Глубокое понимание современного ML (нейросети, трансформеры) с фокусом на NLP, Information Retrieval или Generative AI.
- Опыт разработки и вывода в продакшен ИИ-сервисов с высокими требованиями к надёжности и производительности.
- Уверенное владение Python и PyTorch.
- Понимание полного жизненного цикла ML-модели: от сбора требований и подготовки данных до эксплуатации в проде.
- Проактивность и способность самостоятельно формировать технический бэклог и roadmap, исходя из продуктовых целей.
- Локация: Санкт-Петербург, офис или гибридный формат работы
- Русский язык: необходим для работы
Хорошо, если есть
- Опыт использования опенсорс-проектов и контрибьюции в них (особенно в библиотеки для инференса, такие как TensorRT, TensorRT-LLM, vLLM, SGLang).
- Опыт работы с C++ и низкоуровневыми оптимизациями (CUDA).
- Опыт работы в распределенной команде.
- Умение или желание выступать на публике, писать технические статьи или вести блог.
Культура и преимущества
- Расширенная медицинская страховка с первого месяца (стоматология, чекапы, неотложная помощь за рубежом, лечение критических заболеваний и страхование от несчастных случаев).
- Психотерапия в офисе или онлайн-сервисах, лазерная коррекция зрения через год работы, ведение беременности и роды через два года.
- Страховка для родственников по системе 80/20.
- Внутренняя образовательная платформа, менторство, программы для руководителей, оплата участия в профильных конференциях.
- Спортзалы во всех крупных офисах, бесплатные онлайн-тренировки с FITMOST, скидки в фитнес-клубах.
- Спортивный клуб Яндекса с командами для различных соревнований.
- Гибкий график работы.
- Льготные жилищные займы для сотрудников в российских офисах.
- Все для детей: страхование, детские дни в офисе, подарки на рождение детей и чекапы при планировании беременности.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →