Назад
3 часа назад

Senior Data Engineer (Python/Spark/Airflow)

300 000 - 340 000
Формат работы
remote (только Russia)
Тип работы
fulltime
Грейд
senior
Страна
Russia
vacancy_detail.hirify_telegram_tooltip Загружаем источник...

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

#вакансия #удаленка #remote #fulltime #senior #dataengineer #python #spark

Компания Centicore💙 находится в поисках Data Engineer. Наша компания занимается продуктовой разработкой проектов наших Заказчиков под ключ.

Вакансия: Data Engineer (Python/Spark/Airflow)
Формат работы: Удаленно по РФ
Вилка: 300-340к на руки (в зависимости от опыта и пожеланий кандидата)
Технический уровень: Middle+

🔷 Важно для нас:

- Python - уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП и ФП (Функциональное программирование), опыт написания модульных и интеграционных тестов, знание и опыт применения библиотек обработки и анализа данных - numpy, pandas;
- Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, xml, json) из внешних источников;
- Способность разобраться с API поставщиков данных, используя доступную документацию;
- SQL - умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, Postgres, Greenplum;
- Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных - Airflow;
- Опыт разработки сложных, высоконагруженных приложений обработки данных на основе PySpark, уверенное знание настроек Spark и их влияния на производительность приложений Spark

🔷 Задачи:

- Реализация высоконагруженных конвейеров обработки данных для обеспечения надежной и бесперебойной репликации данных из ИТ-систем Банка;
- Реализация комплексных задач по подготовке данных в целевых аналитических хранилищах (DataLake, SandBox, FeatureStore) для построения признаков, необходимых для разработки моделей машинного обучения;
- Создание и развитие ETL/ELT-проектов на стеке Python + PySpark + Airflow;
- Разработка и поддержание в актуальном состоянии технической документации по разработанному функционалу;
- Своевременное отражение статуса выполнения задач в Jira;
- Проверка качества кода (code review), написанного инженерами и младшими инженерами данных;
- Участие в развитии Feature Store и улучшении процессов работы с признаками для ML-моделей.

💌 Для вопросов и резюме - просьба обращаться в лс

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -