💡 Требования:
Идеальный кандидат — это гибрид питониста, ML-Ops и Data-инженера. Его фокус — построение масштабируемой, надежной и управляемой платформы, которая позволит команде быстро и безопасно запускать эксперименты и выводить проекты в прод, начиная с чат-бота и code-review агента. Он должен говорить на языке данных (SQL, Greenplum), инфраструктуры (K8s, Docker) и машинного обучения (Python, MLflow).
Технический стек:
- Production-опыт с фреймворками MLOps: Kubeflow, MLflow, Airflow для оркестрации. Понимание их интеграции в CI/CD пайплайны.
- Контейнеризация и оркестрация: Продвинутый уровень работы с Docker и Kubernetes (в контексте развертывания моделей как сервисов).
- Облачная инфраструктура: Опыт работы с одним из major cloud-провайдеров (желательно GCP, так как Greenplum часто там развернут, или AWS/Azure с пониманием hybrid-cloud).
- Data Engineering: Умение работать с большими данными. Обязателен опыт с Greenplum (или аналогичными MPP-системами: Teradata, Exasol). Понимание распределенных вычислений (Spark).
- ML-фреймворки и API: Практический опыт работы с LangChain/LlamaIndex, FastAPI, знание фреймворков для работы с LLM (Hugging Face, vLLM и т.д.).
- Языки программирования: Свободный Python. Знание SQL на очень высоком уровне для работы с data vault.
- Системы контроля версий: Git, GitLab CI/CD.
Проектный опыт:
- Реальный опыт вывода в production NLP-приложений (чат-боты, семантический поиск, классификация текстов).
- Опыт построения и оптимизации ML пайплайнов для обучения, инференса и мониторинга моделей.
- Опыт работы с векторными базами данных (например, Qdrant, Weaviate, pgvector) для RAG-систем (актуально для чат-бота по Confluence).
📋Задачи:
Ключевая задача: Разработка и внедрение MLOps-платформы для быстрого вывода AI-агентов в продакшен.
-Создание AI-агентов и платформы для них:
Ведущая разработка и внедрение агентов на базе LLM (LangChain, Hugging Face).
Построение RAG-систем с векторными базами (Qdrant, pgvector).
Разработка отказоустойчивых ML-сервисов (FastAPI, Docker, K8s).
-Построение MLOps-инфраструктуры:
Автоматизация жизненного цикла моделей (MLflow, Kubeflow) и CI/CD пайплайнов (GitLab CI/CD).
Интеграция с облаком (GCP/AWS) и on-premise окружением.
-Работа с данными для ML:
Проектирование эффективного доступа к данным для обучения/инференса в связке с Data-инженером.
Написание сложных SQL-запросов к Greenplum (Data Vault).
Мониторинг данных и моделей в продакшене.
📨 Оставить отклик можнопо короткой гугл форме. или напрямую ответственному менеджеруПоказать контакты
#MLOps #Удаленно #вакансия
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Текст вакансии взят без изменений
Источник - Telegram канал. Название доступно после авторизации