Требования
- Опыт в Data Science / Machine Learning от 3-х лет
- Глубокое знание Python, SQL и PySpark
- Разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись)
- Оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными)
- Знание основных ML-фреймворков (Scikit-learn, TensorFlow/PyTorch)
- Опыт с данными: обработка, анализ, feature engineering
- Опыт продакшн-разработки (не только исследования)
- Понимание, как устроены процессы в бизнесе, а не только в Jupyter Notebook
- Умение запускать ML-модели в PySpark: использование Spark MLlib для распределенного обучения, работа с PySpark Pandas UDFs для эффективного применения ML-моделей к большим данным
Дополнительная информация
Локация: удалённо из РФ, РБ.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Текст вакансии взят без изменений
Источник - Telegram канал. Название доступно после авторизации