Author for Reinforcement Learning Course (AI)

50 000₽

Формат работы

remote (Global)

Тип работы

parttime

Грейд

middle

Описание вакансии

Текст:

TL;DR

Автор на курс «Обучение с подкреплением — Reinforcement Learning» (AI): Создание и улучшение учебных материалов для новых онлайн-курсов в области машинного обучения с акцентом на Deep Reinforcement Learning и практическую реализацию RL-систем. Фокус на написании текстов уроков, разработке дополнительных материалов и проектировании программы.

Локация: Полная удалёнка

Вознаграждение: от 50 000 ₽/мес

Компания

Yandex Practicum — сервис онлайн-образования, где реально освоить востребованную цифровую профессию и найти стабильную работу.

Что делать

Создавать материалы для новых курсов в команде с методистами, редакторами, иллюстраторами и продакт-менеджерами.
Писать тексты уроков, поддерживая интерес студентов к обучению.
Улучшать существующий контент на основе обратной связи от студентов и экспертов.
Разрабатывать дополнительные материалы: тренажёр, чек-листы, тесты, памятки, квизы и тестовые задания.
Предлагать идеи по улучшению усвоения материала.
Участвовать в проектировании программы курса.

Требования

Опыт: 3+ лет
Знания классических методов RL: MDP, POMDP, value-based и policy-based подходы, уравнения Беллмана.
Опыт работы с Deep Reinforcement Learning: DQN, Policy Gradient, Actor-Critic, PPO и смежные алгоритмы.
Опыт реализации RL-систем: построение агента, буфера опыта, TD-обновлений, сетевых архитектур.
Понимание продвинутых методов поведения: curiosity-driven подходы, RND/ICM, model-based RL, планирование.
Опыт работы с PyTorch: построение и обучение нейросетевых моделей, реализация policy/value-сетей.
Практический опыт работы с RL-средами: OpenAI Gym/Gymnasium, PettingZoo, custom environments.
Понимание продакшен-сервисов: API, Docker, логирование, мониторинг.
Опыт ведения типового ML проекта: проектирование пайплайнов, версионирование, работа с экспериментами.

Хорошо, если есть

Опыт применения RL в более, чем одной сфере: робототехнике, симуляторах, играх, рекомендательных системах.
Опыт менторства, написания статей или образовательного контента на темы RL.

Культура и преимущества

Предлагается удаленное сотрудничество, необходимо быть на связи в мессенджерах и иногда в Zoom.
Возможность экспериментировать и реализовать свой потенциал, без микроменеджмента.
Плавное погружение в сотрудничество с помощью команды.
Пополнение портфолио и выдача сертификатов о социально-полезной деятельности.
Нетворкинг, поддержка и вдохновение от комьюнити экспертов.
Возможность писать статьи и участвовать в конференциях, мероприятиях и подкастах Яндекс-Практикума.

Author for Reinforcement Learning Course (AI)

Описание вакансии

TL;DR

Компания

Что делать

Требования

Хорошо, если есть

Культура и преимущества

Похожие вакансии

Part-time Instructor - AI Automation & Workflow Design (AI)

Lead AI Subject Matter Expert (AI)

Разработчик образовательных программ (AI)

LX Design Team Lead (Edtech)

Learning Experience Designer (Pharma)

Instructional Systems Designer (SoarTech)