19 часов назад

Data Engineer (AI/RAG)

450 000 - 550 000₽

Формат работы

remote (Global)

Тип работы

fulltime

Грейд

middle/senior

Английский

Страна

Russia

Вакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Мы строим внутреннее AI-ядро зарубежного банка: RAG, агенты, skills, оркестрация. Ищем инженера, который будет отвечать за слой данных под этим ядром — чтобы модели и агенты получали правильные, чистые, актуальные данные из нужных источников.
Важно: это не классический Data Engineer про ETL и витрины. Здесь фокус на подготовке и хранении данных именно для AI-сценариев — векторные базы, индексы, поисковые движки, knowledge management. При этом нужен крепкий фундамент в классической работе с данными: валидация, качество, пайплайны.

## Задачи
- Проектировать и сопровождать слой хранения для AI-платформы: векторные базы, поисковые индексы, гибридный поиск, metadata-фильтрация
- Подключать и готовить корпоративные источники данных для RAG-сценариев: документы, базы, API, внутренние системы
- Строить пайплайны подготовки данных: chunking, очистка, нормализация, обогащение, генерация embeddings
- Валидировать качество данных на входе и на выходе — включая проверку того, что сгенерировал AI
- Работать с SQL и реляционными данными: запросы, проверки, интеграция структурированных источников в AI-пайплайны
- Настраивать и оптимизировать retrieval: релевантность, полнота, скорость, reranking
- Управлять версионированием данных, индексов и конфигураций
- Обеспечивать data governance: права доступа, аудит, работа с чувствительными и персональными данными

## Ожидания по опыту
- Роли уровня Data Engineer / Analytics Engineer / ML Data Engineer / Search Engineer / Knowledge Engineer с production-ответственностью
- Практический опыт построения и сопровождения data-пайплайнов, которыми реально пользовались в проде
- Уверенная работа с SQL — не на уровне SELECT *, а умение разобраться в сложных данных, проверить гипотезу, найти проблему
- Опыт работы с поиском, индексами или retrieval-системами
- Умение работать на стыке данных и продукта: не просто «залить в базу», а понять, для какого сценария эти данные нужны и в каком виде
- Плюсом: опыт в банке, финтехе, телекоме или другой регулируемой среде

Стек:
- PostgreSQL, ClickHouse или аналогичные СУБД
- Qdrant, pgvector, Weaviate, Milvus, Elasticsearch — хотя бы часть из этого
- Embeddings, hybrid search, metadata filtering, reranking
- Airflow, Prefect, Dagster или аналогичные инструменты оркестрации пайплайнов
- Docker, Linux, Kubernetes, CI/CD

## Будет плюсом
- Опыт работы с PII, masking, анонимизацией и разграничением доступов
- Опыт с корпоративным поиском, knowledge management, data cataloging
- Опыт парсинга и извлечения данных из неструктурированных источников (PDF, сканы, HTML)
- Понимание RAG-архитектуры и того, как качество данных влияет на качество ответов

Условия:
Локация: любая
Форма взаимодействия: ИП
Вилка: 450-550 гросс
Поездки в Ереван за счет компании 2 раза в месяц на 2-3 дня
Важно: Английский на уровне разговорного
Контакт для связи: ruiter

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -

Data Engineer (AI/RAG)

Мэтч & Сопровод

Описание вакансии

Похожие вакансии

Senior Data Engineer

MLOps Аналитик (AI)

Senior Data Engineer (EdTech)

Senior MLOps Engineer (Python/Kubernetes)

Senior Data Engineer (EdTech)

Data Engineer (Scala)