💜 Аналитик-разработчик в команду Алисы
Мы разрабатываем новую технологию Нейро для Алисы. Она за минуту решает поисковые задачи, которые обычно занимают у пользователя по несколько часов. Наша цель — уверенно победить конкурентов на российском рынке, среди которых есть очень сильные международные игроки.
В основе технологии — нейросеть LLM. Она общается с пользователем в режиме диалога, анализирует данные из интернета и пишет доступные, информативные, наглядные и достоверные ответы. Первый релиз продукта вышел в 2024 году под названием
Нейро и принёс много профита Поиску Яндекса. Теперь эта технология стала частью Алисы и продолжает активно развиваться.
Наша команда аналитики — ключевая для развития новой Алисы. Каждые полгода совместно с командами ML и продукта мы готовим следующий релиз технологии. В основе каждого релиза — офлайн-разметка качества ответов, которую разрабатываем мы.
С помощью разметки оцениваем, насколько ответы Алисы соответствуют нашим продуктовым целям и ожиданиям пользователей:
• Сравниваем качество ответов Side-by-Side
• Измеряем количество ложной информации и галлюцинаций в ответах с помощью факт-чекинга
• Используем крауд-разметку (выполнение заданий людьми), обучаем LLM-as-a-judge, собираем ассистентов на основе LLM для помощи исполнителям в Yandex Crowd
Разметка используется как основной инструмент для замера качества — так же как таргет для RLHF при обучении нейросетей. Наши проекты одни из самых сложных и масштабных по офлайн-разметке качества в Яндексе. Мы обладаем уникальным опытом в этой области.
Наша команда вовлечена в весь цикл создания технологии от формулировки общих продуктовых требований до отладки и приёмки готовых моделей. Чтобы успешно развивать
наши проекты, нам нужно решать разные типы задач: от технических и аналитических до продуктовых.
Какие задачи вас ждут:
• Формализация требований к продукту
• Поиск и исправление багов LLM через обучение
• Глубокий анализ качества разметки
• Развитие больших проектов в Yandex Crowd
Мы ждём, что вы:
• Понимаете, почему важно всегда смотреть в данные
• Уверенно пишете на Python и знаете алгоритмы
• Знаете математическую статистику и использовали её для проверки гипотез
Будет плюсом, если вы:
• Интересуетесь продуктом, стремитесь понять, каким он должен быть и почему
• Умеете общаться, ясно излагать мысли, понимать и учитывать мнение коллег, убеждать
• Работали с табличными данными на SQL
• Имели дело с крауд-проектами, например делали разметку в Толоке
• Знаете основы машинного обучения
📩 Откликайтесь на вакансию на нашем сайте
#LLM #python #алиса