7 дней назад

Руководитель команды CUDA-инференса (Автономный транспорт)

Тип работы

fulltime

Грейд

lead

Страна

Russia

Вакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

🔍

Руководитель команды CUDA-инференса в Автономный транспорт

Основной стек: PyTorch → ONNX → TensorRT, внутренняя инфраструктура профилирования, экспериментов и performance-аналитики. Фокус: как именно выполняются вычисления на GPU и других ускорителях, достижение измеримого ускорения в end-to-end сценариях.

Какие задачи вас ждут:

• Руководство командой CUDA-оптимизации инференса
People management, формирование технических планов и приоритетов, контроль исполнения проектов и ответственность за достижение измеримых результатов по latency, throughput и эффективности использования памяти на целевом железе.

• Проектирование и оптимизация вычислительных ядер
Разработка и оптимизация CUDA-kernel и fusion операций для ключевых блоков моделей (matmul, conv, attention и др.), снижая memory traffic и launch overhead.

• Работа с архитектурой GPU
Эффективное использование memory hierarchy, layout данных, tiling-подходы, tensor cores и механизмы повышения occupancy. Системный анализ bottleneck с помощью Nsight и других профилировщиков и формирование вариантов оптимизаций с учётом ограничений железа.

Мы ждём, что вы:
• Имеете сильный опыт CUDA performance engineering
• Работали с kernel для matmul/conv/attention
• Понимаете memory hierarchy GPU и cost model вычислительных операций
• Умеете находить bottleneck через профилирование и доводить оптимизации до измеримого ускорения

Будет плюсом, если вы:
• Работали с CUTLASS / Triton / кастомными inference-движками
• Работали с quantization / mixed precision
• Строили roofline-модели или latency/bandwidth-оценки
• Знаете о fusion-подходах и graph-level оптимизациях

Почему у нас хорошо:
Мы предоставляем полный набор, который поможет уберечься от тревожности и выгорания: ежегодные медицинские чекапы, йога и психотерапия. Это не все бонусы — полный список тут.

📩 Откликайтесь на вакансию на нашем сайте

#автономный_транспорт #python #CPP #CUDA

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -

Руководитель команды CUDA-инференса (Автономный транспорт)

Мэтч & Сопровод

Описание вакансии

Похожие вакансии

Middle C++ Developer (AI)

Lead/Senior C++ Developer (Robotics)

Senior Software Engineer - Manage Vehicle Interfaces (C++)

Mobile Robotics Engineer (Robotics)

FPGA Разработчик (Промышленная автоматизация)

Senior Firmware Engineer (RISC-V)

Разработка

Game Dev

Design и Creative

Аналитика

Менеджмент

People & Business