Назад
обновлено 4 часа назад

Senior Machine Learning Engineer (LLMs / Production ML)

3 500 - 4 000$
Формат работы
remote
Тип работы
fulltime
Грейд
senior
Английский
b2
Страна
US
Вакансия от Hirify. Размещена напрямую Вакансия размещена на Hirify напрямую от HR/нанимающего менеджера

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Компания MindWave
 
 Senior Machine Learning Engineer (LLMs / Production ML)
 
 О продукте
 AI-платформа в health tech / US healthcare, которая помогает больницам и медицинским учреждениям анализировать большие объёмы медицинской документации. Продукт работает в HIPAA-совместимой среде, находится на стадии активного роста после привлечения VC-инвестиций. Команда — senior-heavy, с высоким инженерным стандартом и сильной культурой ownership.
 Описание роли
 Ищем Senior Machine Learning Engineer, который будет полностью владеть ML-циклом: от проектирования датасетов до деплоя моделей в продакшн. Основной фокус — LLM-based системы, работа с большими текстовыми корпусами и оптимизация моделей для production-использования.
 Основные обязанности
 Проектирование, обучение и деплой ML-моделей в production-среде.
 Работа с LLM-решениями: fine-tuning, prompt engineering, RAG, эффективный inference.
 Проектирование и валидация датасетов с нуля для медицинских документов.
 Оптимизация моделей под продакшн-нагрузки: quantization, pruning, distillation, bitsandbytes.
 Проведение экспериментов и hyperparameter optimization (Optuna, Ray Tune и аналоги).
 Настройка и анализ ML-экспериментов с использованием MLflow или Weights & Biases.
 Участие в архитектурных решениях и масштабировании ML-пайплайнов.
 Тесное взаимодействие с инженерной командой и участие в принятии продуктовых решений.
 
 Требования
 3–5+ лет коммерческого опыта в разработке и деплое ML-моделей в продакшене.
 Отличное знание Python.
 Практический опыт работы с PyTorch.
 Реальный опыт работы с LLMs (fine-tuning, prompt engineering, RAG, inference).
 Опыт hyperparameter optimization (Optuna, Ray Tune и т.п.).
 Опыт production-оптимизации моделей (quantization, pruning, distillation).
 Опыт проектирования и валидации датасетов с нуля.
 Высокий уровень самостоятельности и ответственности.
 Английский язык — Upper-Intermediate+.
 
 Будет плюсом
 Опыт работы с Transformers, Mixture of Experts (MoE).
 MLOps-экспертиза: Docker, Kubernetes, MLflow, Kubeflow, Prometheus.
 Опыт работы с AWS (core инфраструктура) и GCP (Vertex AI, Storage для LLM-нагрузок).
 Open-source контрибуции или сильные personal ML-проекты.
 Технологический стек
 Python, PyTorch, LLMs, RAG, MLflow / Weights & Biases, Optuna / Ray Tune, quantization & pruning, Docker, Kubernetes, AWS, GCP, HIPAA-compliant environment.
 
 Условия
 Формат работы: полностью удалённый.
 Тип занятости: full-time.
 Длительность: долгосрочно.
 Старт: ASAP.
 Таймзона: пересечение с Toronto / North America (вторая половина дня — вечер по EU).
 Процесс найма
 Скрининг.
 Take-home задание.
 Интервью по дизайну ML-систем.
 Небольшой coding-этап.
 
  - контактные данные
 
 3500-4000$

Будьте осторожны: если вас просят войти в iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Вакансия размещена на Hirify напрямую от HR/нанимающего менеджера