💡 Требования:
Развертывание и поддержка LLM-платформы в Kubernetes (Helm, Terraform, K8s Operators)
Настройка CI/CD для ML/AI сервисов (обучение, inference, data pipelines)
Автоматизация ML workflow в Kubeflow
Настройка и поддержка мониторинга моделей (latency, drift, cost metrics)
Управление пайплайнами данных для обучения и inference (Kafka, DataLake, объектное хранилище S3, векторные БД)
Оптимизация работы GPU-кластера (распределённое обучение, эффективное использование ресурсов)
Обеспечение безопасности и комплаенса: изоляция сред, контроль доступа, логирование
📋Задачи:
Опыт работы с Kubernetes и облачными/on-prem кластерами
Знание Python и инструментов ML Ops (Kubeflow, Airflow)
Опыт настройки CI/CD (Jenkins)
Опыт работы с системами хранения и векторными БД (Weaviate/Qdrant/PGVector)
Знания в области мониторинга и логирования (Prometheus, Grafana, ELK, OpenTelemetry)
Понимание принципов работы LLM/GenAI и RAG-систем будет плюсом
📨 Оставить отклик можно по короткой гугл форме. или напрямую ответственному менеджеру
Показать контакты
#DevOps #Удаленно #вакансия
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Текст вакансии взят без изменений
Источник - Telegram канал. Название доступно после авторизации