Эта вакансия в архиве
Посмотреть похожие вакансии ↓Описание вакансии
Текст:
TL;DR
Автор на курс «Обучение с подкреплением — Reinforcement Learning» (AI): Создание и улучшение учебных материалов для новых онлайн-курсов в области машинного обучения с акцентом на Deep Reinforcement Learning и практическую реализацию RL-систем. Фокус на написании текстов уроков, разработке дополнительных материалов и проектировании программы.
Локация: Полная удалёнка
Вознаграждение: от 50 000 ₽/мес
Компания
Yandex Practicum — сервис онлайн-образования, где реально освоить востребованную цифровую профессию и найти стабильную работу.
Что делать
- Создавать материалы для новых курсов в команде с методистами, редакторами, иллюстраторами и продакт-менеджерами.
- Писать тексты уроков, поддерживая интерес студентов к обучению.
- Улучшать существующий контент на основе обратной связи от студентов и экспертов.
- Разрабатывать дополнительные материалы: тренажёр, чек-листы, тесты, памятки, квизы и тестовые задания.
- Предлагать идеи по улучшению усвоения материала.
- Участвовать в проектировании программы курса.
Требования
- Опыт: 3+ лет
- Знания классических методов RL: MDP, POMDP, value-based и policy-based подходы, уравнения Беллмана.
- Опыт работы с Deep Reinforcement Learning: DQN, Policy Gradient, Actor-Critic, PPO и смежные алгоритмы.
- Опыт реализации RL-систем: построение агента, буфера опыта, TD-обновлений, сетевых архитектур.
- Понимание продвинутых методов поведения: curiosity-driven подходы, RND/ICM, model-based RL, планирование.
- Опыт работы с PyTorch: построение и обучение нейросетевых моделей, реализация policy/value-сетей.
- Практический опыт работы с RL-средами: OpenAI Gym/Gymnasium, PettingZoo, custom environments.
- Понимание продакшен-сервисов: API, Docker, логирование, мониторинг.
- Опыт ведения типового ML проекта: проектирование пайплайнов, версионирование, работа с экспериментами.
Хорошо, если есть
- Опыт применения RL в более, чем одной сфере: робототехнике, симуляторах, играх, рекомендательных системах.
- Опыт менторства, написания статей или образовательного контента на темы RL.
Культура и преимущества
- Предлагается удаленное сотрудничество, необходимо быть на связи в мессенджерах и иногда в Zoom.
- Возможность экспериментировать и реализовать свой потенциал, без микроменеджмента.
- Плавное погружение в сотрудничество с помощью команды.
- Пополнение портфолио и выдача сертификатов о социально-полезной деятельности.
- Нетворкинг, поддержка и вдохновение от комьюнити экспертов.
- Возможность писать статьи и участвовать в конференциях, мероприятиях и подкастах Яндекс-Практикума.
Похожие вакансии
2 дня назад
Part-time Instructor - AI Automation & Workflow Design (AI)
9 600 - 12 800$
2 дня назад
Lead AI Subject Matter Expert (AI)
deeplay
4 часа назад
Разработчик образовательных программ (AI)
180 000 - 200 000₽
20 часов назад
LX Design Team Lead (Edtech)
3 000 - 3 600€
2 дня назад
Learning Experience Designer (Pharma)
8 000 - 10 400$
2 дня назад
Instructional Systems Designer (SoarTech)
65 000 - 105 000$