Назад
12 часов назад

Старший ML-разработчик агентов (AI)

Формат работы
remote (только Russia)
Тип работы
fulltime
Грейд
senior
Страна
Russia
vacancy_detail.hirify_telegram_tooltip Загружаем источник...

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Старший ML-разработчик агентов для Алисы

Компания

Яндекс 3.62

Условия

Требования

ML разработчик Senior Deep Learning NLP LLM PyTorch Python Москва Написали своего первого агента на LangGraph и хотите перейти на следующий уровень? Мы в команде Алисы строим мультиагентную платформу, которая будет решать различные задачи миллионов пользователей — от собственной продуктивности до коммерческих сценариев. WebAgents, tool calling, (V)LLM, A/GRPO, симуляторы, хардовый R&D — это всё про нас. С видеокартами мы уже разобрались, так что ищем крутых коллег, с которыми построим успешных агентов массового пользования.

Какие задачи вас ждут

Разработка и внедрение агентов на базе LLM, проектирование ML-компонентов платформы агентов
Вы будете создавать агентов, которые умеют обрабатывать сложные, multi-turn- и multi-modal-запросы пользователей. Предстоит разрабатывать системы маршрутизации задач, выбора инструментов и моделей, а также настраивать управление вызовами функций и оркестрацию различных моделей внутри пайплайна. Замена традиционных классификаторов LLM-пайплайнами и RAG-системами
Нужно будет трансформировать старые архитектуры в современные пайплайны с LLM, вызовом функций, планированием и рассуждениями. Дообучение, настройка и интеграция моделей, оптимизация inference
Вам предстоит работать как с опенсорс-моделями, так и с внутренними, включая fine-tuning, RL и адаптацию под платформу агентов. Нужно обеспечить быструю и устойчивую работу агентов на проде, включая оптимизацию inference и взаимодействие с инфраструктурой (Eagle, FP8, дистилляцию, multi-dimensional parallelism, etc.). Исследования и эксперименты с графами агентов и памятью
Мы экспериментируем с вызовами агентов, memory-подсистемами, симуляцией поведения, архитектурами reasoning и системами планирования. Участие в разработке RL-моделей для обучения диалоговых агентов
Если у вас есть опыт работы с multi-turn reinforcement learning или интерес к нему, можно будет погрузиться в постановку и реализацию таких экспериментов в масштабах Яндекса и Алисы с сотнями тулов и большим количеством тёрнов.

Мы ждем, что вы

  • Обладаете глубокими знаниями в Deep Learning и NLP
  • Работали с LLM и пайплайнами вокруг них (function calling, memory, RAG)
  • Внедряли ML-системы в продакшен
  • Мыслите системно — от архитектуры до интеграции с инфраструктурой
  • Пишете на Python, знакомы с PyTorch
  • Готовы к кросс-функциональной работе с бэкендом и продуктовыми командами

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -