ML Engineer (AI Inference)

250 000₽

Формат работы

remote (только Russia)/hybrid/onsite

Тип работы

fulltime

Грейд

middle/senior

Страна

Russia

Описание вакансии

Текст:

TL;DR

ML-инженер (Эффективный рантайм и инференс): Оптимизация производительности нейросетевых моделей для продакшн-систем с акцентом на архитектуры GPU и низкоуровневую разработку. Фокус на повышении throughput и снижении latency в задачах NLP, LLM, CV и речи через использование современных фреймворков и инструментов ускорения.

Локация: Москва, Санкт-Петербург или удаленно из РФ

Зарплата: от 250 000 ₽/мес

Компания

Т-Банк — крупнейшая российская онлайн-экосистема финансовых и лайфстайл-услуг с 50 миллионами клиентов.

Что делать

Оптимизировать производительность моделей машинного обучения для архитектур GPU.
Работать с современными фреймворками для ускорения вычислений и деплоя нейросетей.
Разрабатывать производительный низкоуровневый код на C++, оптимизированный под CUDA.
Внедрять передовые модели в высоконагруженные продукты компании.
Участвовать в R&D-исследованиях и профильных семинарах команды.

Требования

Нахождение в РФ (для удаленной работы).
Опыт разработки ML-моделей на PyTorch, Jax или Tensorflow в продакшене.
Понимание DL-архитектур и глубокое знание методов оптимизации инференса.
Опыт работы с TensorRT, TRT-LLM, Triton Inference Server.
Навыки C++ и понимание высоконагруженных систем будут преимуществом.

Культура и преимущества

Возможность работы в офисе или удаленно.
Аккредитованная ИТ-компания со всеми льготами.
Расширенная программа ДМС со стоматологией.
Доступ к платформе обучения и менторству «Т-Банк Апгрейд».
Три дополнительных дня отпуска ежегодно.
Компенсация участия в топовых профильных конференциях.

ML Engineer (AI Inference)

Описание вакансии

TL;DR

Компания

Что делать

Требования

Культура и преимущества

Похожие вакансии

ML Engineer (NLP/LLM)

Ml Engineer / Data Scientist (Deep Learning)

ML-инженер (LLM)

ML-разработчик (Автономный транспорт)

ML Engineer (RecSys/NLP)

Data Scientist / Deep Learning Engineer (Time Series / NLP / Fintech)

Разработка

Game Dev

Design и Creative

Аналитика

Менеджмент

People & Business