TL;DR
ML Engineer (TTS Text-to-speech): Разработка и оптимизация моделей синтеза речи (TTS) для GigaChat с акцентом на улучшение базового качества, внедрение мультимодальных решений и эксперименты. Фокус на ускорении обучения, клонировании голоса, работе с низкоресурсными языками и применении обучения с подкреплением.
Локация: Гибридный или удаленный формат работы (офис в Москве)
Компания
Наша команда отвечает за качество моделей синтеза речи (TTS) в GigaChat – той части нейросети, которая занимается звуком.
Что делать
- Улучшать модели синтеза речи и обгонять производственные метрики.
- Помогать внедрять новые решения в продакшн.
- Фантазировать, экспериментировать и исследовать новые технологии.
- Заниматься проектами, такими как ускорение обучения, voice cloning, low resource модели и reinforcement learning.
- Рассказывать о решении задач на внутренних семинарах, а также на Хабре и в Telegram.
Требования
- Уровень: Senior
- Уверенное знание Python, алгоритмов и математики.
- Глубокие знания в Deep Learning, особенно в области обработки звука.
- Опыт обучения моделей для продуктового внедрения.
- Кругозор в NLP, лингвистике, русском языке, биологии, физике (в части, относящейся к речи).
- Опыт работы с C++.
- Наличие публикаций.
Культура и преимущества
- Ежегодный пересмотр зарплаты и годовая премия.
- Корпоративный спортзал и зоны отдыха.
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития.
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа.
- Льготная ипотека для сотрудников с выгодой до 7%.
- Бесплатная подписка СберПрайм+ и скидки на продукты компаний-партнеров.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →