Автор курса Reinforcement Learning

10 000₽

Формат работы

remote (только Russia)

Тип работы

parttime

Грейд

middle/senior/lead

Страна

Russia

Вакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Автор на курс "Обучение с подкреплением - Reinforcement Learning"

Прямой работодатель Яндекс Практикум ( practicum.yandex.ru )

Россия Миддл • Сеньор • Тимлид/Руководитель группы Аналитика, Data Science, Big Data • Machine Learning • Blockchain • Computer Vision • Data Analysis • Gamedev • Hardware • IoT/IIoT • ML/AI • Natural Language Processing (NLP) • Robots/Drones • SaaS/PaaS • SmartTV • Voice assistants • VR/AR • WEB • Банковская и страховая сфера • Государственные проекты • Заказная разработка 3 апреля Удаленная работа • Частичная занятость
Опыт работы любой Работодатель Яндекс Практикум Короткая ссылка: geekjob.ru/hiKY Откликнуться Описание вакансии

Яндекс Практикум — сервис онлайн-образования, где реально освоить востребованную цифровую профессию и найти стабильную работу. А технологии и команда экспертов помогают довести дело до конца.
Мы расширяем линейку курсов по Архитектуре и ищем авторов, которые совместно с методистами, редакторами, иллюстраторами создадут контент для нового продукта.

Что делает автор?

Создаёт материалы для новых курсов в команде с другими авторами, методистами, редакторами, иллюстраторами и продакт‑менеджерами программы.
Пишет тексты уроков, в которых поддерживает интерес студентов к обучению.
Улучшает существующий контент на основе обратной связи от студентов, экспертов сопровождения и редакторов.
Разрабатывает дополнительные материалы (тренажёр, чек-листы, тесты, памятки, квизы) и тестовые задания для проверки знаний.
Предлагает идеи, как улучшить усвоение материала.

Что мы ожидаем от вас?

Знания классических методов RL: MDP, POMDP, value-based и policy-based подходы, уравнения Беллмана, стратегии исследования.
Опыт работы с Deep Reinforcement Learning: DQN, Policy Gradient, Actor-Critic, PPO и смежные алгоритмы.
Опыт реализации RL-систем: построение агента, буфера опыта, TD-обновлений, сетевых архитектур и обучающего контура.
Понимание продвинутых методов поведения: curiosity-driven подходы, RND/ICM, model-based RL, планирование, многоагентные системы.
Опыт работы с PyTorch: построение и обучение нейросетевых моделей, реализация policy/value-сетей, оптимизация.
Практический опыт работы с RL-средами: OpenAI Gym/Gymnasium, PettingZoo, custom environments.
Понимание продакшен-сервисов: API, Docker, логирование, мониторинг.
«Боевой» опыт ведения типового ML проекта: проектирование пайплайнов, версионирование, работа с экспериментами, дебагинг.

Что мы предлагаем?

Удаленное сотрудничество, нужно только быть на связи в мессенджерах и иногда в Zoom, от 10 часов в неделю.
Возможность экспериментировать и реализовать свой потенциал: мы доверяем вашему опыту и не тратим время и силы друг друга на микроменеджмент.
Плавное погружение в сотрудничество: познакомим вас с инструментами разработки курсов и с командой, которая поможет преобразовать ваши знания в целый курс.
Пополнение портфолио: мы выдаем нашим экспертам сертификаты о социально‑полезной деятельности.
Возможность писать статьи и участвовать в конференциях, мероприятиях и подкастах Яндекс Практикума.
Ежемесячное вознаграждение: 10 000 рублей за 1 стандартный урок

Специализация
Аналитика, Data Science, Big Data Machine Learning
Отрасль и сфера применения
Blockchain Computer Vision Data Analysis Gamedev Hardware IoT/IIoT ML/AI Natural Language Processing (NLP) Robots/Drones SaaS/PaaS SmartTV Voice assistants VR/AR WEB Банковская и страховая сфера Государственные проекты Заказная разработка
Уровень должности
Миддл Сеньор Тимлид/Руководитель группы

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -

Автор курса Reinforcement Learning

Мэтч & Сопровод

Описание вакансии

Автор на курс "Обучение с подкреплением - Reinforcement Learning"

Прямой работодатель Яндекс Практикум ( practicum.yandex.ru )

Похожие вакансии

Senior ML Инженер

NLP Engineer (Reinforcement Learning)

Senior Data Scientist (AI)

ML-разработчик (NLP)

Senior Data Scientist (NLP, LLM)

Lead ML Engineer (Cybersecurity)