Назад
обновлено 25 минут назад

ML Engineer (PySpark)

Формат работы
remote (только USA)
Тип работы
parttime
Грейд
middle/senior
Английский
b2
Страна
US
Вакансия от Hirify. Размещена напрямую Вакансия размещена на Hirify напрямую от HR/нанимающего менеджера

Мэтч

Покажет вашу совместимость с вакансией

Описание вакансии

TL;DR
ML Engineer (PySpark): разработка production-системы кластеризации для 1 миллиона домов с акцентом на работу с разреженными данными. Фокус на построении масштабируемых ML-пайплайнов на PySpark и интеграции гео-данных для американского energy-tech сектора.

Вакансия: ML Engineer - Clustering (PySpark)

Компания: United Developers

Мы - United Developers, международная IT-компания с более чем 10-летним опытом в разработке и поддержке мобильных решений для клиентов из Европы и США. Наша ключевая экспертиза - создание сложных мобильных приложений для IoT (Internet of Things) и интеграция AI/ML в продукты для бизнеса и стартапов.

Ищем ML-инженера на проект для американской energy-tech компании (B2B SaaS, 35+ крупных энергокомпаний США в клиентах).

Задача:

Построить production-систему кластеризации ~1M домов на PySpark, которая группирует похожие дома для peer comparison в Home Energy Reports.

Стек:

Python, PySpark, sklearn, pandas. Production ML pipelines.

Что нужно делать:

  • Rule-based сегментация с адаптивным выбором фич под разреженные данные.
  • Similarity-based кластеризация внутри сегментов (target ~100 домов/кластер).
  • Обработка mixed-type данных (числовые + категориальные + булевы с 40% пропусков).
  • Framework валидации кластеров (29 quality checks по спеку клиента).
  • Интеграция с geo-данными (lat/lon, ZIP, county).

Требования:

  • Уверенный PySpark в production (не курсы, реальный опыт).
  • Опыт кластеризации - понимаешь tradeoffs между partitioning / hierarchical / density-based.
  • Работа с sparse mixed-type данными.
  • Английский от B2 (созвоны с клиентом)!

Условия:

  • Part-time, ~20ч/нед.
  • Удалённо.
  • Старт: конец апреля - начало мая 2026.
  • Оплата почасовая, обсуждается.
  • Длительность: 2-3 месяца (PoC + production build).

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Вакансия размещена на Hirify напрямую от HR/нанимающего менеджера