5 дней назад

Middle AI Developer (RAG)

Тип работы

fulltime

Грейд

middle

Страна

Russia

Вакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Middle AI Developer в Grand Line

МоскваОбязанности: Текстовые модели и RAG-системы (основной фокус)

Разработка мультиагентных RAG-систем для ответов на вопросы пользователей и сотрудников
Интеграция LLM в чат-боты и корпоративные приложения
Prompt engineering и оптимизация запросов к LLM API (батчинг, кэширование, параллезация запросов)
Работа с моделями эмбеддеров, использование LLM как реранкеров
Работа с векторными базами данных (Qdrant, Chroma)
Работа с графовыми базами знаний (GraphRAG + Neo4j)
Создание pipeline для аналитики на больших текстовых датасетах
Обработка текста: токенизация, нормализация, очистка, работа с большими объемами данных
Оценка качества решений: настройка метрик релевантности и точности ответов
Создание API endpoints (FastAPI, Flask) для развертывания ML-моделей
Разработка собственных workflow агентных систем для интеграции моделей в продукты
Оптимизация пайплайна обработки данных с учетом быстродействия и стоимости
Настройка мониторинга производительности и качества моделей в продакшене
Работа с арендованными GPU-серверами для развертывания моделей
Асинхронное программирование для обработки больших объемов параллельных запросов -Компьютерное зрение: интеграция моделей детекции объектов, работа с Vision-Language Models (VLM), около-реалтайм обработка видео-потоков -Обработка речи: батчевая обработка аудио-записей, разработка голосовых интерфейсов (TTS+STT), анализ качества звонков Требования: Текстовые модели и RAG (основной фокус):
Опыт работы с Hugging Face Transformers, LangChain (или аналогичными фреймворками)
Понимание работы с LLM, их настроек и принципов выбора
Опыт разработки RAG (Retrieval-Augmented Generation) архитектур
Prompt engineering и оптимизация запросов к LLM API
Работа с embeddings: создание, сравнение, поиск похожих текстов
Работа с векторными базами данных: Milvus, FAISS, Chroma
Работа с графовыми базами знаний: GraphRAG, Neo4j
Обработка текста: токенизация, нормализация, очистка
Работа с большими текстовыми датасетами для анализа и предиктивной аналитики
Понимание метрик качества для RAG-систем (recall@k, accuracy, faithfulness и т.д.)
Понимание особенностей Guardrails
Знание Structured Output и умение выстраивать workflow на их основе, применение Schema-guided reasoning и иных подходов
Python: middle-уровень (pandas, numpy, scipy)
Работа с данными: загрузка, очистка, предобработка, EDA
Понимание базовых концепций ML: обучение/валидация/тестирование
Понимание особенностей работы с временными рядами
Визуализация данных (matplotlib, seaborn, plotly)
Базовое понимание статистики и теории вероятности
Понимание метрик для различных классов задач (accuracy, precision, recall, F1, recall@k и т.д.)
Умение балансировать производительность, стоимость и качество
Понимание микросервисной архитектуры
Создание API для ML-моделей: FastAPI, Flask, REST API
Работа с базами данных: SQL (PostgreSQL) - средний уровень
NoSQL (MongoDB), графовые базы (Neo4j) - базовый уровень
Асинхронное программирование: asyncio, aiohttp
Базовое понимание веб-разработки
Разработка собственных workflow для интеграции моделей в продукты
Работа с арендованными GPU-серверами
2-3 года коммерческого опыта разработки с использованием ML/AI
Наличие реальных проектов с RAG-системами или интеграцией LLM
Опыт работы в команде: понимание процессов разработки, code review, git workflow
Опыт работы по Agile
Опыт интеграции ML-решений в продукты
Практичность: умение выбирать подходящие под задачу инструменты
Самостоятельность: способность находить решения под потребности бизнеса
Аналитическое мышление: умение разбираться в проблемах и дебажить проблемы в workflow c LLM
Коммуникация: способность объяснять технические решения нетехническим коллегам
Гибкость: способность переключаться между различными проектами Будет плюсом:
Fine-tuning языковых моделей с Unsloth
Опыт работы с библиотеками: PyTorch, TensorFlow, ONNX Runtime, vLLM
Опыт работы с омни-моделями
Опыт работы с OpenCV, Roboflow
Опыт работы с Yolo, CLIP и аналогами
Обработка видео: форматы, кодеки, стриминг (около-реалтайм)
Детекция объектов, трекинг, сегментация
Понимание работы с Vision-Language Models (VLM)
Понимание архитектур: ResNet, EfficientNet, Vision Transformers
Работа с видео-стримами в реальном времени
Работа с STT - Whisper, RIVA, Omnilingual ASR
Синтез речи (TTS), опыт с Silero и аналогичными генераторами
Обработка аудио: librosa, soundfile, pydub
Батчевая обработка аудио Условия:
Работа в команде с датасаентистами и аналитиками
Работа по методологии Agile
Работа с арендованными GPU-серверами
Возможность карьерного роста до техлида
Возможность развития в сторону MLOps
Внутрикорпоративное обучение Откликнуться: hh.ru/vacancy/131469416 Также укажите, что узнали о вакансии в телеграм-канале IT / Tech job

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -

Middle AI Developer (RAG)

Мэтч & Сопровод

Описание вакансии

Middle AI Developer в Grand Line

Похожие вакансии

AI/ML Engineer (LLM)

Senior Software Engineer (Python/AI)

AI Архитектор (AI)

AI Agent Engineer (Python)

Java/Python Developer (AI)

AI Инженер