Data Scientist (LLM+Classic ML)

Python
«АльфаСтрахование» - крупнейшая российская частная страховая компания и технологический лидер отрасли - усиливает команду машинного обучения и работы с данными. Задача: создание и поддержка решений, в т.ч. ИИ агентов, с использованием машинного обучения, преимущественно LLM моделей и связанной инфраструктуры (RAG, MCP). Также возможны задачи Classic ML.
Мы ищем data scientist’а в команду, занимающуюся развитием ML-подходов в страховании. Если у вас хорошая математическая подготовка, вы любите анализировать большие объемы данных и хотите получить опыт участия в полном цикле разработки ML-решений, а также готовы внедрять эти решения и влиять на бизнес, то мы будем рады видеть вас в нашей команде.
Наши модели работают в online-режиме 24/7, решая задачи оценки риска, выявления фрода, ценообразования и формирования индивидуальных предложений. Мы оцениваем влияние нашей работы на бизнес-метрики с помощью A/B-тестов. Используем в работе open-source решения: Spark, MLFlow, DVC, Feast, CatBoost, Docker, данные готовим на Hadoop-кластере.
Обязанности:

Разработка решений (подготовка данных, выбор решения, обучение, тесты, запуск в production-среде) на основе больших языковых моделей (LLM)

Разработка ML-моделей (подготовка данных, выбор решения, обучение, тесты, запуск в production-среде)

Сопровождение ML и LLM решений (мониторинг сервисов и моделей, отслеживание дрейфа данных, работа над развитием). Оценка влияния на бизнес предложенных решений.

Подготовка признаков для feature store (используем Feast)

Взаимодействие с DA/DE/DevOps для улучшения и автоматизации процессов.

Требования:

Понимание работы LLM моделей, их использования в связке RAG, MCP

Понимание работы базовых ML-алгоритмов

Знание метрик машинного обучения и их интерпретации

Уверенное владение Python

Знание основных фреймворков для построения RAG: llamaindex, langchain и т.п.

Общее представление об A/B-тестах

Навыки работы с Git

Опыт самостоятельного обучения и вывода моделей в production

Желательно:

Навыки построения пайплайнов обработки данных с использованием pyspark

Опыт проведения A/B-экспериментов

Знакомство с MLFlow, dvc

Наличие представления о REST API (плюсом будет опыт работы с FastAPI)

Опыт работы с Docker

Представление о различных источниках данных: реляционные базы данных, Redis, Hive, Kafka.

Что мы предлагаем:

Работу в профессиональной команде, которая готова делиться знаниями и опытом;

Возможность внешнего обучения и прокачки твоих скиллов за счет Компании;

Заботу о сотрудниках: возможность прохождения медицинских chek-апов, безлимитные бесплатные консультации с финансовыми консультантами, юристами и психологом. В компании поддерживается и развивается культура ЗОЖ;

Отличный социальный пакет, включающий ДМС, скидки на страховые продукты компании, скидки от наших партнеров (туризм, фитнес и т.д.);

Обеспечение техникой для работы;

Гибридный график работы 5\2 (гибкое начало дня с 8 до 10)

Откликнуться

EditPublish