Назад
4 минуты назад

Data Science / ML Engineer (LLM/RAG)

240 000 - 320 000
Формат работы
remote (только Russia)
Тип работы
fulltime
Грейд
middle/senior
Страна
Russia
vacancy_detail.hirify_telegram_tooltipВакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Вакансия: Data Science / ML Engineer (универсальная роль)
Компания: IMS
Город: Санкт-Петербург
Формат: удалёнка
Занятость: full-time / part-time
Зарплатная вилка: обсуждабельна (1500-2000/час, зависит от уровня кандидата, возможно обсуждение фиксированной оплаты)
Трудоустройство: ГПХ, ИП, самозанятость, также обязательно подписание NDA и у нас высокие требования к конфиденциальности

Задачи
• Развивать AI-контур продукта: от обработки пользовательского запроса до финального ответа и визуализации результата.
• Проектировать и улучшать retrieval/pipeline-логику для мульти-источников (Qdrant, MemGraph, PostgreSQL, нереляционные источники).
• Развивать LLM-агентный контур (Query Planner loop): классификация запросов, декомпозиция подзадач, tool-calls, оценка достаточности данных.
• Работать с эмбеддингами, семантическим поиском и качеством выдачи (релевантность, дедупликация, фильтрация, ранжирование).
• Участвовать в оптимизации LLM-инференса (Qwen-семейство, LiteLLM-прокси), стоимости запросов и latency.
• Настраивать и улучшать data/ML pipeline для обработки документов, мультимодального контента и подготовки данных для поиска/графа.
• Взаимодействовать с backend-командой (FastAPI/WebSocket), участвовать в проектировании контрактов и интеграций сервисов.
• Участвовать в формировании технических решений по масштабированию и производительности (кэширование в Redis, нагрузка, стабильность).

Требования
• Опыт работы в Data Science / ML Engineering от 2–5 лет (Middle / Middle+/Senior).
• Уверенный Python и опыт production-разработки ML/DS-сервисов.
• Практический опыт с LLM/NLP: промптинг, оркестрация вызовов, оценка качества ответов, оптимизация пайплайнов.
• Опыт с векторным поиском и эмбеддингами (желательно Qdrant или аналогичные Vector DB).
• Понимание работы с графовыми и реляционными БД (MemGraph/Neo4j, PostgreSQL) в контексте AI-поиска и аналитики.
• Опыт проектирования API/интеграций (REST; понимание WebSocket и сервисного взаимодействия).
• Умение формулировать гипотезы, проводить эксперименты и аргументированно выбирать технические решения.


Будет большим плюсом
• Опыт построения RAG/agentic систем в production.
• Опыт оптимизации LLM-моделей и инфраструктуры инференса (latency/cost/quality trade-off).
• Знание Redis-кэширования и подходов к session-aware caching.
• Опыт с мультимодальными сценариями (текст + документы/медиа).
• Опыт формализации контрактов между сервисами (в т.ч. gRPC/YAML/OpenAPI).
• Опыт построения pipeline’ов обработки и классификации данных


Мы предлагаем
• Работу над технологически сложным продуктом на стыке LLM, поиска и графовых данных.
• Возможность влиять на архитектуру AI-части и ключевые технические решения.
• Гибкий удалённый формат работы.
• Конкурентную оплату по уровню.
• Сильную команду, минимум бюрократии и живое общение.

Контакт:

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -