Назад
обновлено 21 час назад

Middle AI Engineer

Формат работы
remote (только Russia)
Тип работы
parttime
Грейд
middle
Страна
Russia
vacancy_detail.hirify_telegram_tooltipВакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

AI-инженер
                                                                                                       
Локация: Удалённо в РФ
Компания: Green Wave Palace ltd
ЗП: обсуждается на собеседовании
Занятость: Частичная
                                                                                       
Оформление:Самозанятость / ИП / ТК РФ

‼️Можно совмещать с основной работой ‼️

Чем предстоит заниматься:
• Проектировать и внедрять продукционные LLM-сервисы: от ingestion и индексирования данных до генерации ответов и обратной связи пользователей.
• Строить RAG-пайплайны: гибридный поиск (векторный + BM25), сжатие контекста, переранжирование (cross-encoder/learning-to-rank), фильтрация по метаданным.
• Оркестрировать агентные сценарии (LangChain / LangGraph): планирование шагов, вызов инструментов, обработка ошибок и фолбэков.
• MCP (Model Context Protocol): умение поднимать/подключать MCP-серверы и публиковать tools/resources/prompts для хоста (например, Claude/ChatGPT/IDE), понимание безопасности и аутентификации MCP.
• Выполнять оценку качества: автоматические и человек-в-контуре (groundedness, factuality, relevance, hallucination rate).
• Разрабатывать и поддерживать REST/HTTP API (FastAPI, async/await), сервисные интеграции и очереди фоновой обработки.
• Обеспечивать надежность и безопасность: контроль PII, guardrails, валидация и санитизация входных данных.
Обязательные требования
• Python 3.x: асинхронщина (asyncio/httpx), типизация, Pydantic, FastAPI, SQLAlchemy; уверенный практический опыт продакшн-бэкенда.
• Опыт построения RAG: выбор эмбеддингов (OpenAI, e5, BGE и др.), стратегия чанкинга/оверлапа, индексация и обновление индексов, векторные БД (FAISS, Pinecone, Weaviate), гибридный поиск и переранжирование.
• LangChain/LangGraph или любой другой агентский фреймворк; умение собирать цепочки/графы, подключать инструменты, внешние API и хранилища.
• Работа с несколькими LLM-провайдерами (OpenAI, Anthropic, Mistral, Gemini, др.), маршрутизация моделей и фолбэки; базовая настройка токен-параметров и системных промптов.
• Практика оценки и наблюдаемости: метрики качества, латентности и стоимости; умение построить простую eval-линию.

Желательно (будет плюсом):
• LLMOps/Observability: Langfuse/Arize Phoenix, Promptfoo/Ragas, cost & latency dashboards, трейсинг цепочек.
• Поиск: Elasticsearch/OpenSearch, гибридный (BM25 + dense), внешние reranker-модели (например, cross-encoder/Cohere ReRank).
• Облака и инфраструктура: AWS/GCP/Azure (в т.ч. Azure OpenAI/Bedrock/Vertex), Docker/K8s, очереди (Celery/Kafka), Redis. Jobgether
• Мультимодальность (VLM), OCR, извлечение структурированных фактов из документов.

💬 Резюме отправлять:

–––
Бесплатный постинг вакансий: @freeIT_job
Забирай 📚 Базу Знаний

Будьте осторожны: если вас просят войти в iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -