Назад
5 дней назад

Middle AI Developer (RAG)

Тип работы
fulltime
Грейд
middle
Страна
Russia
vacancy_detail.hirify_telegram_tooltipВакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Middle AI Developer в Grand Line

МоскваОбязанности: Текстовые модели и RAG-системы (основной фокус)

  • Разработка мультиагентных RAG-систем для ответов на вопросы пользователей и сотрудников
  • Интеграция LLM в чат-боты и корпоративные приложения
  • Prompt engineering и оптимизация запросов к LLM API (батчинг, кэширование, параллезация запросов)
  • Работа с моделями эмбеддеров, использование LLM как реранкеров
  • Работа с векторными базами данных (Qdrant, Chroma)
  • Работа с графовыми базами знаний (GraphRAG + Neo4j)
  • Создание pipeline для аналитики на больших текстовых датасетах
  • Обработка текста: токенизация, нормализация, очистка, работа с большими объемами данных
  • Оценка качества решений: настройка метрик релевантности и точности ответов
  • Создание API endpoints (FastAPI, Flask) для развертывания ML-моделей
  • Разработка собственных workflow агентных систем для интеграции моделей в продукты
  • Оптимизация пайплайна обработки данных с учетом быстродействия и стоимости
  • Настройка мониторинга производительности и качества моделей в продакшене
  • Работа с арендованными GPU-серверами для развертывания моделей
  • Асинхронное программирование для обработки больших объемов параллельных запросов -Компьютерное зрение: интеграция моделей детекции объектов, работа с Vision-Language Models (VLM), около-реалтайм обработка видео-потоков -Обработка речи: батчевая обработка аудио-записей, разработка голосовых интерфейсов (TTS+STT), анализ качества звонков Требования: Текстовые модели и RAG (основной фокус):
  • Опыт работы с Hugging Face Transformers, LangChain (или аналогичными фреймворками)
  • Понимание работы с LLM, их настроек и принципов выбора
  • Опыт разработки RAG (Retrieval-Augmented Generation) архитектур
  • Prompt engineering и оптимизация запросов к LLM API
  • Работа с embeddings: создание, сравнение, поиск похожих текстов
  • Работа с векторными базами данных: Milvus, FAISS, Chroma
  • Работа с графовыми базами знаний: GraphRAG, Neo4j
  • Обработка текста: токенизация, нормализация, очистка
  • Работа с большими текстовыми датасетами для анализа и предиктивной аналитики
  • Понимание метрик качества для RAG-систем (recall@k, accuracy, faithfulness и т.д.)
  • Понимание особенностей Guardrails
  • Знание Structured Output и умение выстраивать workflow на их основе, применение Schema-guided reasoning и иных подходов
  • Python: middle-уровень (pandas, numpy, scipy)
  • Работа с данными: загрузка, очистка, предобработка, EDA
  • Понимание базовых концепций ML: обучение/валидация/тестирование
  • Понимание особенностей работы с временными рядами
  • Визуализация данных (matplotlib, seaborn, plotly)
  • Базовое понимание статистики и теории вероятности
  • Понимание метрик для различных классов задач (accuracy, precision, recall, F1, recall@k и т.д.)
  • Умение балансировать производительность, стоимость и качество
  • Понимание микросервисной архитектуры
  • Создание API для ML-моделей: FastAPI, Flask, REST API
  • Работа с базами данных: SQL (PostgreSQL) - средний уровень
  • NoSQL (MongoDB), графовые базы (Neo4j) - базовый уровень
  • Асинхронное программирование: asyncio, aiohttp
  • Базовое понимание веб-разработки
  • Разработка собственных workflow для интеграции моделей в продукты
  • Работа с арендованными GPU-серверами
  • 2-3 года коммерческого опыта разработки с использованием ML/AI
  • Наличие реальных проектов с RAG-системами или интеграцией LLM
  • Опыт работы в команде: понимание процессов разработки, code review, git workflow
  • Опыт работы по Agile
  • Опыт интеграции ML-решений в продукты
  • Практичность: умение выбирать подходящие под задачу инструменты
  • Самостоятельность: способность находить решения под потребности бизнеса
  • Аналитическое мышление: умение разбираться в проблемах и дебажить проблемы в workflow c LLM
  • Коммуникация: способность объяснять технические решения нетехническим коллегам
  • Гибкость: способность переключаться между различными проектами Будет плюсом:
  • Fine-tuning языковых моделей с Unsloth
  • Опыт работы с библиотеками: PyTorch, TensorFlow, ONNX Runtime, vLLM
  • Опыт работы с омни-моделями
  • Опыт работы с OpenCV, Roboflow
  • Опыт работы с Yolo, CLIP и аналогами
  • Обработка видео: форматы, кодеки, стриминг (около-реалтайм)
  • Детекция объектов, трекинг, сегментация
  • Понимание работы с Vision-Language Models (VLM)
  • Понимание архитектур: ResNet, EfficientNet, Vision Transformers
  • Работа с видео-стримами в реальном времени
  • Работа с STT - Whisper, RIVA, Omnilingual ASR
  • Синтез речи (TTS), опыт с Silero и аналогичными генераторами
  • Обработка аудио: librosa, soundfile, pydub
  • Батчевая обработка аудио Условия:
  • Работа в команде с датасаентистами и аналитиками
  • Работа по методологии Agile
  • Работа с арендованными GPU-серверами
  • Возможность карьерного роста до техлида
  • Возможность развития в сторону MLOps
  • Внутрикорпоративное обучение Откликнуться: hh.ru/vacancy/131469416 ​​Также укажите, что узнали о вакансии в телеграм-канале IT / Tech job

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -