Эта вакансия в архиве

Посмотреть похожие вакансии ↓
2 месяца назад

Applied ML Engineer (Video Generation)

220 000 - 260 000$
Формат работы
remote (Global)
Тип работы
fulltime
Грейд
senior
Английский
b2

Описание вакансии

tldr: Cantina, Applied ML Engineer — Real-Time Video Generation, $220K–260K base + bonus, Remote (GMT ±3 very prefered) 🌍 (не РФ/РБ)
Есть офис в Лондоне, Нью-Йорке, Калифорнии

Ищем сильного Applied ML Engineer в команду real-time video generation в Cantina.

Это роль на стыке research и engineering: нужно уметь брать большие video generation models и доводить их до production-ready fast / real-time системы. Основной фокус — training / fine-tuning / distillation / optimization, а также ускорение инференса, снижение latency / memory / cost и интеграция моделей в реальные продуктовые сценарии.

Что предстоит делать:
- обучать и дообучать video generation models на multi-GPU сетапах;
- работать с data pipelines для видео;
- заниматься distillation / compression / acceleration моделей;
- оптимизировать inference под real-time constraints;
- собирать прототипы и доводить их до production;
- работать на стыке ML, infra и product.

Что важно:
- хороший практический опыт с generative models, особенно video;
- опыт с training, fine-tuning, distillation, optimization;
- понимание inference bottlenecks, latency / memory / throughput trade-offs;
- желательно знакомство с Docker, Kubernetes, AWS;
- плюс — TensorRT / Triton / ONNX и похожие acceleration toolchains.

Если вам интересно — лучше всего податься тут

И после этого маякнуть мне в личку: .
Также пишите в личку, если есть вопросы, — с радостью отвечу.

Если знаете сильных ребят — тоже с удовольствием посмотрю рекомендации.

Сразу оговорюсь: полноценный relocation package мы не предоставляем, но помогаем с юристами и оформлением визы.

Текст вакансии взят без изменений

Источник -