Эта вакансия в архиве

Посмотреть похожие вакансии ↓
обновлено 1 месяц назад

Author for Reinforcement Learning Course (AI)

50 000
Формат работы
remote (Global)
Тип работы
parttime
Грейд
middle

Описание вакансии

Текст:
/

TL;DR

Автор на курс «Обучение с подкреплением — Reinforcement Learning» (AI): Создание и улучшение учебных материалов для новых онлайн-курсов в области машинного обучения с акцентом на Deep Reinforcement Learning и практическую реализацию RL-систем. Фокус на написании текстов уроков, разработке дополнительных материалов и проектировании программы.

Локация: Полная удалёнка

Вознаграждение: от 50 000 ₽/мес

Компания

Yandex Practicum — сервис онлайн-образования, где реально освоить востребованную цифровую профессию и найти стабильную работу.

Что делать

  • Создавать материалы для новых курсов в команде с методистами, редакторами, иллюстраторами и продакт-менеджерами.
  • Писать тексты уроков, поддерживая интерес студентов к обучению.
  • Улучшать существующий контент на основе обратной связи от студентов и экспертов.
  • Разрабатывать дополнительные материалы: тренажёр, чек-листы, тесты, памятки, квизы и тестовые задания.
  • Предлагать идеи по улучшению усвоения материала.
  • Участвовать в проектировании программы курса.

Требования

  • Опыт: 3+ лет
  • Знания классических методов RL: MDP, POMDP, value-based и policy-based подходы, уравнения Беллмана.
  • Опыт работы с Deep Reinforcement Learning: DQN, Policy Gradient, Actor-Critic, PPO и смежные алгоритмы.
  • Опыт реализации RL-систем: построение агента, буфера опыта, TD-обновлений, сетевых архитектур.
  • Понимание продвинутых методов поведения: curiosity-driven подходы, RND/ICM, model-based RL, планирование.
  • Опыт работы с PyTorch: построение и обучение нейросетевых моделей, реализация policy/value-сетей.
  • Практический опыт работы с RL-средами: OpenAI Gym/Gymnasium, PettingZoo, custom environments.
  • Понимание продакшен-сервисов: API, Docker, логирование, мониторинг.
  • Опыт ведения типового ML проекта: проектирование пайплайнов, версионирование, работа с экспериментами.

Хорошо, если есть

  • Опыт применения RL в более, чем одной сфере: робототехнике, симуляторах, играх, рекомендательных системах.
  • Опыт менторства, написания статей или образовательного контента на темы RL.

Культура и преимущества

  • Предлагается удаленное сотрудничество, необходимо быть на связи в мессенджерах и иногда в Zoom.
  • Возможность экспериментировать и реализовать свой потенциал, без микроменеджмента.
  • Плавное погружение в сотрудничество с помощью команды.
  • Пополнение портфолио и выдача сертификатов о социально-полезной деятельности.
  • Нетворкинг, поддержка и вдохновение от комьюнити экспертов.
  • Возможность писать статьи и участвовать в конференциях, мероприятиях и подкастах Яндекс-Практикума.