TL;DR
Data Engineer (Python): Разработка масштабируемых пайплайнов обработки данных для систем автономного вождения с акцентом на мультимодальные данные и оптимизацию под высокую нагрузку. Фокус на построении дата-платформы, интеграции с ML-сервисами и обеспечении стабильности обработки петабайтных объёмов информации.
Локация: Офис или гибрид (3/2) в Москве.
Компания
Navio — разработчик универсальной технологии автономного вождения для различных видов транспорта, объединяющий экспертизу автопрома и IT-индустрии.
Что делать
- Обрабатывать мультимодальные данные с беспилотных ТС: видео, облака точек и телеметрию.
- Создавать датасеты для обучения нейросетей и генерации синтетических сценариев.
- Строить и оптимизировать масштабируемые пайплайны обработки данных в Kubernetes.
- Разрабатывать внутренние библиотеки для DS/ML/Dev-команд.
- Проектировать схемы хранения для дата-платформы объёмом 25 Пб с интеграцией в ClickHouse и S3.
Требования
- Опыт разработки на Python.
- Уверенное знание SQL (оконные функции, JOINs).
- Опыт обработки данных с использованием pandas или polars.
- Опыт работы со Spark и Airflow.
Хорошо, если есть
- Опыт работы с ClickHouse.
- Опыт работы с Luigi или Dagster.
Культура и преимущества
- ДМС с первого дня (включая стоматологию после испытательного срока).
- Гибкий график и свободный дресс-код.
- Обеспечение офисных сотрудников питанием и наличие парковки.
- Корпоративная пенсионная программа и спорт.
- Доступ к обучающим курсам, профессиональным сообществам и внутренним карьерным трекам.
Процесс найма
- Подача заявки до 1 апреля.
- Прохождение онлайн-интервью до 2 апреля.
- Участие в мероприятии «Офер за один день» 4 апреля.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →