Вакансия из Telegram канала - Название доступно после авторизации
Пожаловаться
75
Хорошая вакансия
развернуть
Роль четко определена с акцентом на AI-инженерию данных, но диапазон зарплаты ниже среднего для таких обязанностей.
Кликните для подробной информации
Четкая рольНизкий диапазон зарплатыТрендовый доменУдаленная работа
Оценка от Hirify AI
Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Создать профиль и узнать мэтч
Описание вакансии
Мы строим внутреннее AI-ядро зарубежного банка: RAG, агенты, skills, оркестрация. Ищем инженера, который будет отвечать за слой данных под этим ядром — чтобы модели и агенты получали правильные, чистые, актуальные данные из нужных источников.
Важно: это не классический Data Engineer про ETL и витрины. Здесь фокус на подготовке и хранении данных именно для AI-сценариев — векторные базы, индексы, поисковые движки, knowledge management. При этом нужен крепкий фундамент в классической работе с данными: валидация, качество, пайплайны.
## Задачи
- Проектировать и сопровождать слой хранения для AI-платформы: векторные базы, поисковые индексы, гибридный поиск, metadata-фильтрация
- Подключать и готовить корпоративные источники данных для RAG-сценариев: документы, базы, API, внутренние системы
- Строить пайплайны подготовки данных: chunking, очистка, нормализация, обогащение, генерация embeddings
- Валидировать качество данных на входе и на выходе — включая проверку того, что сгенерировал AI
- Работать с SQL и реляционными данными: запросы, проверки, интеграция структурированных источников в AI-пайплайны
- Настраивать и оптимизировать retrieval: релевантность, полнота, скорость, reranking
- Управлять версионированием данных, индексов и конфигураций
- Обеспечивать data governance: права доступа, аудит, работа с чувствительными и персональными данными
## Ожидания по опыту
- Роли уровня Data Engineer / Analytics Engineer / ML Data Engineer / Search Engineer / Knowledge Engineer с production-ответственностью
- Практический опыт построения и сопровождения data-пайплайнов, которыми реально пользовались в проде
- Уверенная работа с SQL — не на уровне SELECT *, а умение разобраться в сложных данных, проверить гипотезу, найти проблему
- Опыт работы с поиском, индексами или retrieval-системами
- Умение работать на стыке данных и продукта: не просто «залить в базу», а понять, для какого сценария эти данные нужны и в каком виде
- Плюсом: опыт в банке, финтехе, телекоме или другой регулируемой среде
Стек:
- PostgreSQL, ClickHouse или аналогичные СУБД
- Qdrant, pgvector, Weaviate, Milvus, Elasticsearch — хотя бы часть из этого
- Embeddings, hybrid search, metadata filtering, reranking
- Airflow, Prefect, Dagster или аналогичные инструменты оркестрации пайплайнов
- Docker, Linux, Kubernetes, CI/CD
## Будет плюсом
- Опыт работы с PII, masking, анонимизацией и разграничением доступов
- Опыт с корпоративным поиском, knowledge management, data cataloging
- Опыт парсинга и извлечения данных из неструктурированных источников (PDF, сканы, HTML)
- Понимание RAG-архитектуры и того, как качество данных влияет на качество ответов
Условия:
Локация: любая
Форма взаимодействия: ИП
Вилка: 450-550 гросс
Поездки в Ереван за счет компании 2 раза в месяц на 2-3 дня
Важно: Английский на уровне разговорного
Контакт для связи: Показать контактыruiter
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Текст вакансии взят без изменений
Источник - Telegram канал. Название доступно после авторизации