Покажет вашу совместимость и напишет письмо
Компания MindWave
Senior Machine Learning Engineer (LLMs / Production ML)
О продукте
AI-платформа в health tech / US healthcare, которая помогает больницам и медицинским учреждениям анализировать большие объёмы медицинской документации. Продукт работает в HIPAA-совместимой среде, находится на стадии активного роста после привлечения VC-инвестиций. Команда — senior-heavy, с высоким инженерным стандартом и сильной культурой ownership.
Описание роли
Ищем Senior Machine Learning Engineer, который будет полностью владеть ML-циклом: от проектирования датасетов до деплоя моделей в продакшн. Основной фокус — LLM-based системы, работа с большими текстовыми корпусами и оптимизация моделей для production-использования.
Основные обязанности
Проектирование, обучение и деплой ML-моделей в production-среде.
Работа с LLM-решениями: fine-tuning, prompt engineering, RAG, эффективный inference.
Проектирование и валидация датасетов с нуля для медицинских документов.
Оптимизация моделей под продакшн-нагрузки: quantization, pruning, distillation, bitsandbytes.
Проведение экспериментов и hyperparameter optimization (Optuna, Ray Tune и аналоги).
Настройка и анализ ML-экспериментов с использованием MLflow или Weights & Biases.
Участие в архитектурных решениях и масштабировании ML-пайплайнов.
Тесное взаимодействие с инженерной командой и участие в принятии продуктовых решений.
Требования
3–5+ лет коммерческого опыта в разработке и деплое ML-моделей в продакшене.
Отличное знание Python.
Практический опыт работы с PyTorch.
Реальный опыт работы с LLMs (fine-tuning, prompt engineering, RAG, inference).
Опыт hyperparameter optimization (Optuna, Ray Tune и т.п.).
Опыт production-оптимизации моделей (quantization, pruning, distillation).
Опыт проектирования и валидации датасетов с нуля.
Высокий уровень самостоятельности и ответственности.
Английский язык — Upper-Intermediate+.
Будет плюсом
Опыт работы с Transformers, Mixture of Experts (MoE).
MLOps-экспертиза: Docker, Kubernetes, MLflow, Kubeflow, Prometheus.
Опыт работы с AWS (core инфраструктура) и GCP (Vertex AI, Storage для LLM-нагрузок).
Open-source контрибуции или сильные personal ML-проекты.
Технологический стек
Python, PyTorch, LLMs, RAG, MLflow / Weights & Biases, Optuna / Ray Tune, quantization & pruning, Docker, Kubernetes, AWS, GCP, HIPAA-compliant environment.
Условия
Формат работы: полностью удалённый.
Тип занятости: full-time.
Длительность: долгосрочно.
Старт: ASAP.
Таймзона: пересечение с Toronto / North America (вторая половина дня — вечер по EU).
Процесс найма
Скрининг.
Take-home задание.
Интервью по дизайну ML-систем.
Небольшой coding-этап.
3500-4000$
Будьте осторожны: если вас просят войти в iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Вакансия размещена на Hirify напрямую от HR/нанимающего менеджера