Назад
7 дней назад

Software Engineer ML (Speech & Audio)

3 500 - 5 000$
Формат работы
remote (только Uzbekistan/United_states/Canada)/hybrid
Тип работы
fulltime
Грейд
middle
Английский
b2
Страна
US/Canada/Uzbekistan
vacancy_detail.hirify_telegram_tooltipВакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Software Engineer ML (Production / Speech & Audio)

Компания: Международный продуктовый IT-проект (VoIP / Cloud Telephony)
Тип занятости: #full_time
Уровень: #middle
Страна: #UZ #US #CA
Локация: #hybrid #remote
Зарплата: от 3 500 USD до 5 000 USD

Подробное описание вакансии:

Нажмите, чтобы развернуть...

Мы - продуктовая команда, создающая интеллектуальную экосистему облачной телефонии для рынков США и Канады. Наш продукт - это отказоустойчивая платформа с миллионными оборотами трафика. ML у нас - не вспомогательная фича, а фундамент системы, работающий в режиме real-time. Мы ищем инженера, который досконально понимает внутреннюю архитектуру аудио-моделей и готов отвечать за их работу в высоконагруженном продакшене.

Обязанности
- Развитие системы AMD (Answering Machine Detection): дообучение и тюнинг моделей для классификации звонков (отличие человека от автоответчиков/IVR) в режиме реального времени
- Full-cycle разработка: от сбора и «грязной» разметки аудиоданных до деплоя и калибровки порогов в продакшене
- Интеграция в Core-продукт: перенос ML-компонентов в backend-инфраструктуру (C# / SIP / RTP стек) через ONNX Runtime
- Оптимизация latency: борьба за миллисекунды в условиях стриминга аудио
- Deep Analysis: поиск ошибок и разбор сложных edge cases в реальных сценариях звонков
- Исследования (R&D): эксперименты с шумоподавлением, VAD и новыми архитектурами для обработки речи

Требования
- 2+ года опыта в ML в продакшене (когда ваша модель реально работала с пользователями)
- Практический опыт со Speech/Audio: понимание того, как устроены аудио-фичи и современные архитектуры обработки звука
- Инженерный подход (QA-mindset): вам искренне интересно «копаться» в аномалиях данных и проверять систему на прочность
- Понимание классики и современности: Fine-tuning, Transfer Learning и умение работать с метриками (Precision/Recall, ROC-AUC, Calibration)
- Способность работать end-to-end: от сырого файла до оптимизированного инференса

Будет плюсом
- Опыт в Speech/Audio domain (ASR, VAD, Audio Classification)
- Понимание специфики VoIP и потоковой обработки данных
- Опыт работы с MLOps и инструментами мониторинга моделей

Что предлагаем
- Обязательный оффлайн-онбординг в Ташкенте (2-3 месяца) для погружения в продукт, далее полная удаленная работа
- Реальные production-задачи в международном продукте с высокой нагрузкой
- Возможность профессионального роста и пересмотра компенсации по мере усложнения задач
- Работа в команде с сильной инженерной экспертизой и отсутствием бюрократии

Дополнительная информация
Обязательный оффлайн-онбординг в Ташкенте (2-3 месяца) для погружения в продукт, далее полная удаленная работа. Зарплата старт от $3500 до $5000 (обсуждается индивидуально).

Контакты
- Telegram:

Стек технологий: #python #c# #wav2vec #whisper #huggingface_transformers #mfcc #embeddings #

|

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -