Work format
remote
Work type
fulltime
Grade
middle
1 month ago
Data Scientist
статистика
машинное обучение
python
sql
linux
docker
go
2 500-3 000
USD
#vacancy #job #relocation #вакансия #it #remote #middle #data #scientist
Data Scientist | Middle
ЗП: 2500 - 3000 USD
Remote
Цели и задачи:
• Строить модели скоринга клика на баннер / видимости баннера / целевого действия на сайте / фродового траффика
• Анализировать весь пайплайн моделей платформы и находить новые подходы к приоритезации баннеров, кампаний в рекламных аукционах, к ценообразованию в ставках
• Сопровождать процесс постановки на регламент процессов в Airflow, консультировать Data Engineer
• Сопровождать A/B-тесты моделей
• Разрабатывать пайплайны для препроцессинга и экстракции фичей (NLP, CV)
• Исследовать и составлять требования к наборам сырых данных для поиска нужных фичей для своих МЛ моделей
Требования:
• Глубокое понимание статистических подходов и методов (регрессия, свойства распределений, оценка максимального правдоподобия, проверка гипотез и их правильное использование) и опыт их применения
• Коммерческий опыт применения классических алгоритмов машинного обучения (LR, RF, XGBoost/LGBM/CatBoost), их калибровки, понимание их преимуществ, недостатков и ограничений
• Свободное владение основными ML библиотеками на Python (pandas, numpy, sklearn, seaborn и др.)
• Высокий уровень владения SQL, опыт работы в распределённых/параллельных вычислениях на Spark
• Опыт работы с Linux, Docker
• Опыт разработки на Go или желание его получить, готовность учиться новому
• Приветствуется опыт работы над задачами анализа текста и изображений. Знание базовых алгоритмов по направлениям: dimensionality reduction, object detection, text extraction. Готовность изучить подходы в ходе работы над задачами
• Достойный уровень инженерной культуры (Git, Jira, Confluence и т.д.)
CV to
Data Scientist | Middle
ЗП: 2500 - 3000 USD
Remote
Цели и задачи:
• Строить модели скоринга клика на баннер / видимости баннера / целевого действия на сайте / фродового траффика
• Анализировать весь пайплайн моделей платформы и находить новые подходы к приоритезации баннеров, кампаний в рекламных аукционах, к ценообразованию в ставках
• Сопровождать процесс постановки на регламент процессов в Airflow, консультировать Data Engineer
• Сопровождать A/B-тесты моделей
• Разрабатывать пайплайны для препроцессинга и экстракции фичей (NLP, CV)
• Исследовать и составлять требования к наборам сырых данных для поиска нужных фичей для своих МЛ моделей
Требования:
• Глубокое понимание статистических подходов и методов (регрессия, свойства распределений, оценка максимального правдоподобия, проверка гипотез и их правильное использование) и опыт их применения
• Коммерческий опыт применения классических алгоритмов машинного обучения (LR, RF, XGBoost/LGBM/CatBoost), их калибровки, понимание их преимуществ, недостатков и ограничений
• Свободное владение основными ML библиотеками на Python (pandas, numpy, sklearn, seaborn и др.)
• Высокий уровень владения SQL, опыт работы в распределённых/параллельных вычислениях на Spark
• Опыт работы с Linux, Docker
• Опыт разработки на Go или желание его получить, готовность учиться новому
• Приветствуется опыт работы над задачами анализа текста и изображений. Знание базовых алгоритмов по направлениям: dimensionality reduction, object detection, text extraction. Готовность изучить подходы в ходе работы над задачами
• Достойный уровень инженерной культуры (Git, Jira, Confluence и т.д.)
CV to