Мэтч
Покажет вашу совместимость с вакансией
Описание вакансии
Вакансия: ML Engineer - Clustering (PySpark)
Компания: United Developers
Мы - United Developers, международная IT-компания с более чем 10-летним опытом в разработке и поддержке мобильных решений для клиентов из Европы и США. Наша ключевая экспертиза - создание сложных мобильных приложений для IoT (Internet of Things) и интеграция AI/ML в продукты для бизнеса и стартапов.
Ищем ML-инженера на проект для американской energy-tech компании (B2B SaaS, 35+ крупных энергокомпаний США в клиентах).
Задача:
Построить production-систему кластеризации ~1M домов на PySpark, которая группирует похожие дома для peer comparison в Home Energy Reports.
Стек:
Python, PySpark, sklearn, pandas. Production ML pipelines.
Что нужно делать:
- Rule-based сегментация с адаптивным выбором фич под разреженные данные.
- Similarity-based кластеризация внутри сегментов (target ~100 домов/кластер).
- Обработка mixed-type данных (числовые + категориальные + булевы с 40% пропусков).
- Framework валидации кластеров (29 quality checks по спеку клиента).
- Интеграция с geo-данными (lat/lon, ZIP, county).
Требования:
- Уверенный PySpark в production (не курсы, реальный опыт).
- Опыт кластеризации - понимаешь tradeoffs между partitioning / hierarchical / density-based.
- Работа с sparse mixed-type данными.
- Английский от B2 (созвоны с клиентом)!
Условия:
- Part-time, ~20ч/нед.
- Удалённо.
- Старт: конец апреля - начало мая 2026.
- Оплата почасовая, обсуждается.
- Длительность: 2-3 месяца (PoC + production build).
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Вакансия размещена на Hirify напрямую от HR/нанимающего менеджера