Назад

Не получаете ответ?

Telegram-вакансии старше 7 дней могут быть уже неактуальны.

7 дней назад

ML Research Engineer (AI)

Формат работы
remote (Global)
Тип работы
fulltime
Грейд
middle/senior
Английский
b2
vacancy_detail.hirify_telegram_tooltipВакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Tldr: on-device AI lab, от фаундеров Prisma / Reface (100+ mln users), $10 mln raised, fully remote. 2 роли - ML Research Engineer, Inference Engineer

Про компанию:


Mirai — AI lab, разрабатывающая фундаментальную модель и инфраструктуру инференса для AI на устройствах пользователя (on-device AI), что позволяет запускать LLM локально с ультранизкой задержкой.

📱Сегодня экономика AI плохо масштабируется через облачные вычисления и GPU-инференс. Со временем значительная часть AI-нагрузок переместится с серверов непосредственно на устройства пользователей.

🔝Компания основана фаундерами Prisma labs (одними из пионеров on-device ML) и Reface (100+ млн пользователей), а также привлекла $10 млн в рамках seed-раунда.

Fully remote, distributed-команда, английский — основной рабочий язык.

Позиция - ML Research Engineer

Основные направления:
— quantization
— speculative decoding
— optimization для LLM inference
— NLP / transformer research

Что предстоит делать:
— исследовать и внедрять новые подходы к оптимизации моделей
— читать и адаптировать research papers по NLP / LLM systems
— писать production-quality ML systems

Нам интересны кандидаты с опытом в:
— Deep Learning / NLP / transformers / LLMs
— ML research / publications / open-source projects
— training, fine-tuning или оптимизации моделей

Будет плюсом:
— research labs / Kaggle / ICPC / олимпиады
— опыт реализации paper → production pipeline

Контакт -

Позиция - Inference Engineer

Обязанности
— Разрабатывать и оптимизировать основной inference stack, включая низкоуровневые compute kernels.
— Добавлять поддержку новых model architectures, modalities, а также различных hardware/software backends.
— Разрабатывать продвинутые возможности инференса, такие как KV cache paging, continuous batching, quantization.
— Создавать tooling вокруг inference stack, чтобы систему было проще тестировать, понимать и надежно выводить в продакшен.

Требования
— Сильный опыт в low-level systems engineering — вы должны понимать, как работают компьютеры на уровне ниже прикладного программирования (application-level programming).
— Уверенное владение одним из systems languages: Rust, C, C++ или аналогичными.

Будет плюсом
— Качественные open-source contributions.
— Опыт написания высокопроизводительных GPU kernels или работы с Metal, Vulkan, CUDA и аналогичными технологиями.

Контакт - @armantg

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -