ОБЯЗАННОСТИ
• Проектирование, разработка и деплой ML-моделей в продакшн (AWS, GCP, Azure, on-prem).
• Создание масштабируемых ML-пайплайнов для распределенного обучения и инференса на multi-GPU.
• Реализация стратегий деплоя с использованием Docker, Kubernetes, Terraform и CI/CD-процессов.
• Оптимизация обслуживания LLM и GenAI-моделей для минимизации задержек и обеспечения высокой доступности.
• Коллаборация с Data Scientists, MLOps и инженерами для операционализации моделей.
• Мониторинг, обеспечение наблюдаемости и тонкая настройка производительности моделей в масштабе.
• Внедрение лучших практик версионирования, воспроизводимости и соответствия требованиям (безопасность, управление данными).
• Участие в архитектурных решениях, оценке инструментов и улучшении процессов деплоя ML-моделей.
ТРЕБОВАНИЯ
• 5+ лет опыта в ML-инженерии с акцентом на деплой и промышленную эксплуатацию моделей.
• Уверенное владение Python (обязательно), знание Java будет преимуществом.
• Практический опыт работы с LLM, GenAI и распределенным обслуживанием моделей.
• Глубокое понимание мультиоблачных сред (AWS, GCP, Azure) и гибридных инфраструктур.
• Опыт с контейнеризацией (Docker) и оркестрацией (Kubernetes) для ML-задач.
• Знание методов оптимизации инференса моделей, GPU-ускорения и параллельных вычислений.
• Работа с инструментами: TensorFlow Serving, TorchServe, Triton Inference Server, ONNX Runtime или аналогичными.
• Опыт проектирования высоконагруженных систем, REST/gRPC API для обслуживания моделей, стратегий масштабирования.
• Понимание концепций MLOps: CI/CD, мониторинг, детекция дрифта, процессы переобучения.
БУДЕТ ПЛЮСОМ
• Знание KubeFlow, MLflow, SageMaker, Vertex AI, Azure ML.
• Опыт с квантованием, прунингом и другими методами оптимизации моделей.
• Понимание вопросов безопасности данных, приватности и соответствия регуляторным требованиям.
• Работа в agile-командах и кросс-функциональных проектах.
*работа в англогворящей команде, часовой пояс Калифорнии
Откликнуться:
Показать контакты
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Текст вакансии взят без изменений
Источник - Telegram канал. Название доступно после авторизации