💫 Станьте экспертом Яндекс Практикума!
Мы расширяем линейку курсов по ML&AI уровня и ищем авторов, которые совместно с методистами, редакторами, иллюстраторами создадут контент для нового продукта.
Ищем автора на
курс «Аудиоанализ, распознавание и генерация речи».
Что делает автор?
- Создаёт материалы для новых курсов в команде с другими авторами, методистами, редакторами, иллюстраторами и продакт‑менеджерами программы.
- Пишет тексты уроков, в которых поддерживает интерес студентов к обучению.
- Улучшает существующий контент на основе обратной связи от студентов, экспертов сопровождения и редакторов.
- Участвует в проектировании программы.
Почему это может быть интересно:
- благодарная аудитория,
- возможность самореализации,
- нетворкинг, группа заботы,
- удалёнка, парт-тайм,
- дополнительный доход.
Что мы ожидаем от вас?
- Знания в цифровой обработке звука (DSP) и спектральных представлениях (STFT, мел-спектрограммы и др.).
- Практический опыт решения задач аудиоанализа: классификация, детекция событий, VAD, спикерские задачи.
- Опыт разработки или применения моделей ASR (распознавание речи) и понимание современных архитектур (CTC, трансформеры, Whisper-подход).
- Опыт работы с моделями TTS (генерация речи) или хорошее понимание их архитектур (Tacotron, FastSpeech, HiFi-GAN).
- Навык работы с PyTorch, torchaudio, librosa и HuggingFace.
- Понимание особенностей подготовки аудиоданных: очистка, сегментация, аугментации, шумы.
Будет преимуществом:
- Опыт применения аудиотехнологий в разных сферах: голосовых ассистентах, музыкальном анализе, анализе разговоров и других промышленных ASR/TTS-системах
Узнать подробнее и откликнуться можно
здесь.