Lead AI Engineer (Speech)
Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Описание вакансии
Lead AI Engineer (Speech)
Ищем крутого Speech AI Engineer к нам в команду Fluently (YC W24)
Вилка: $7-11k gross + опцион
YC-Backed Команда
Мы делаем лучшего в мире AI спикинг коуча, который слушает ваши онлайн колы и помогает прокачивать английский. Недавно прошли Y Combinator и подняли $2.5M. За последние 6 месяцев выросли со $100k до $5M ARR. Команда состоит из 7 топовых ребят (prev. Google, Nvidia, Lyft, Amazon), оба фаундера с техническим и рисерч бэкграундом.
Почитать больше о компании и фаундерах можно тут:
Fluently, Forbes, Techcrunch, YC, Rebryk Blog, $5M ARR
Что надо будет делать:
-  Лидить разработку нашего Voice AI Агента (LiveKit) и внутреннего ML toolkit: брать end-to-end задачи по voice/real-time пайплайнам; иногда — backend.
- RealTime Voice AI Agent: Python, LiveKit/WebRTC, streaming ASR/TTS, VAD, diarization, state machines, session management, retries/timeouts, QoS, latency budgets.
 - ML Toolkit: тренировать модели и деплоить их в прод (ASR, TTS, VAD, speaker/diarization, embeddings, scoring), классический DSP, ffmpeg/decoding, batch/stream inference, quantization/ONNX/TensorRT, детерминированные пайплайны и reproducibility.
 - Backend (когда нужно): Nest.js/Node.js, REST/OpenAPI, Drizzle ORM, Supabase/Postgres (RLS, миграции), интеграции с внешними сервисами.
 
 - Делать applied ML вокруг LLM: RAG, tool/function-calling, prompt/response routing, safety/guardrails, memory, A/B, баланс качества и стоимости.
 - Проектировать надежные real-time системы: идемпотентность, backpressure, caching/batching, очереди/планировщики, throughput/latency trade-offs.
 - Ставить data-потоки для моделей: сбор/чистка/анонимизация данных, синтетика, offline/online evaluation, regression-тесты качества.
 - Вести observability/SLOs: Sentry, Prometheus/Grafana/Loki, tracing, alerts; быстро находить причины и фиксить проблемы.
 - Инфра и deploy: Docker, GitHub Actions, LiveKit Cloud, Modal/Render/AWS, GPU-инференс, secrets management, rollbacks, canary releases.
 - Качество и простота: uv workspaces, ruff/mypy/pytest, pydantic, строгая типизация; в JS/TS — turborepo, ESLint/Prettier, Zod, внутренние CLI/интеграционные тулзы. Документация, code review, OpenAPI, KISS.
 
Условия
- Работа на больших скоростях: единственное правило — регулярно и много деливерить в прод.
 - Ежедневная работа напрямую с CEO/CTO. Вы будете engineer #5.
 - Мы ожидаем самостоятельности: надо овнить свои проекты end-to-end.
 -  Платим competitive salary (в соответствии с вашим бэкграудом и скиллами):
- Даем опцион (оценка компании год назад — $20M).
 - Базовая часть растет после PMF и успешно завершенных проектов.
 
 -  Full Async Remote, любая таймзона:
- Устраиваем через Deel в [почти] любую страну.
 - Не нанимаем людей, находящихся в РФ.
 - Желающих можем подать на H-1B и перевезти в США.
 - Делаем 1-2 off-sites за год, последний был на Бали.
 
 
Что Мы Ценим
- Опыт работы в big tech, VC-backed startups, Yandex
 - Отсутствие опыта работы в EPAM, аутсорс галерах, консалтинге, Web3, gambling
 - Ребят из МФТИ
 - Kaggle, Codeforces, олимпиады, etc.
 - Constribution to open source github repos, >10 звезд, >500 contributions за год
 - Активный tech блог, twitter или телеграмм канал
 - Конкретные примеры классных приложений которые вы забилдили или отвечали на какую-то большую часть (нужны ссылки: web, app store, github, etc.)
 - Любой (даже неудачный) опыт фаундерства
 - Наличие вкуса, hands-on опыт в дизайне
 - Теплые рекомендации от коллег, CEO/CTO (не linkedin, а authentic)
 
Присылайте отклики через форму
Будьте осторожны: если вас просят войти в iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →