Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Описание вакансии
TL;DR
Data Engineer (AI): Разработка и поддержка сервисов обработки данных для RAG-систем и LLM с акцентом на создание отказоустойчивых ETL-процессов. Фокус на проектировании высокопроизводительных пайплайнов с использованием PySpark, Airflow и векторных хранилищ для обеспечения релевантного контекста в задачах машинного обучения.
Локация: Россия (удаленно, гибрид или офис)
Зарплата: 300 000 — 400 000 ₽/мес до налогов
Компания
Аккредитованная IT-компания, работающая с 2007 года, специализирующаяся на разработке ПО для крупных заказчиков в сферах Finance, Healthcare и Big Data.
Что делать
- Разрабатывать сервисы пакетной и потоковой обработки данных для вычисления векторов (embeddings).
- Реализовывать промышленные отказоустойчивые ETL-сервисы на Python.
- Интегрировать данные в векторные хранилища для обогащения LLM контекстной информацией.
- Оптимизировать работу с большими данными с использованием PySpark и анализировать эффективность приложений.
- Взаимодействовать с REST API и работать с реляционными базами данных (Oracle, PostgreSQL).
Требования
- Опыт работы в роли Data Engineer от 3-х лет.
- Отличное знание Python (асинхронное программирование, структуры данных, ООП).
- Глубокое знание SQL (CTE, оконные функции).
- Опыт работы с Apache Airflow, Argo Workflows и PySpark.
- Понимание OLAP-систем, колоночных форматов (Parquet, ORC) и хранилищ (Hadoop, S3, Iceberg).
Культура и преимущества
- Оформление по ТК РФ.
- ДМС со стоматологией и компенсация спорта.
- Прозрачная система Performance Review и менторство.
- Возможность выбора формата работы: удаленно, из офиса или гибридно.
- Корпоративное обучение, участие в митапах и конференциях.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →