Назад

Data Scientist (LLM+Classic ML)

Формат работы
hybrid
Тип работы
fulltime
vacancy_detail.hirify_telegram_tooltipВакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Data Scientist (LLM+Classic ML)


Python
«АльфаСтрахование» - крупнейшая российская частная страховая компания и технологический лидер отрасли - усиливает команду машинного обучения и работы с данными. Задача: создание и поддержка решений, в т.ч. ИИ агентов, с использованием машинного обучения, преимущественно LLM моделей и связанной инфраструктуры (RAG, MCP). Также возможны задачи Classic ML.
Мы ищем data scientist’а в команду, занимающуюся развитием ML-подходов в страховании. Если у вас хорошая математическая подготовка, вы любите анализировать большие объемы данных и хотите получить опыт участия в полном цикле разработки ML-решений, а также готовы внедрять эти решения и влиять на бизнес, то мы будем рады видеть вас в нашей команде.
Наши модели работают в online-режиме 24/7, решая задачи оценки риска, выявления фрода, ценообразования и формирования индивидуальных предложений. Мы оцениваем влияние нашей работы на бизнес-метрики с помощью A/B-тестов. Используем в работе open-source решения: Spark, MLFlow, DVC, Feast, CatBoost, Docker, данные готовим на Hadoop-кластере.
Обязанности:



  • Разработка решений (подготовка данных, выбор решения, обучение, тесты, запуск в production-среде) на основе больших языковых моделей (LLM)

  • Разработка ML-моделей (подготовка данных, выбор решения, обучение, тесты, запуск в production-среде)

  • Сопровождение ML и LLM решений (мониторинг сервисов и моделей, отслеживание дрейфа данных, работа над развитием). Оценка влияния на бизнес предложенных решений.

  • Подготовка признаков для feature store (используем Feast)

  • Взаимодействие с DA/DE/DevOps для улучшения и автоматизации процессов.


Требования:



  • Понимание работы LLM моделей, их использования в связке RAG, MCP

  • Понимание работы базовых ML-алгоритмов

  • Знание метрик машинного обучения и их интерпретации

  • Уверенное владение Python

  • Знание основных фреймворков для построения RAG: llamaindex, langchain и т.п.

  • Общее представление об A/B-тестах

  • Навыки работы с Git

  • Опыт самостоятельного обучения и вывода моделей в production


Желательно:



  • Навыки построения пайплайнов обработки данных с использованием pyspark

  • Опыт проведения A/B-экспериментов

  • Знакомство с MLFlow, dvc

  • Наличие представления о REST API (плюсом будет опыт работы с FastAPI)

  • Опыт работы с Docker

  • Представление о различных источниках данных: реляционные базы данных, Redis, Hive, Kafka.


Что мы предлагаем:



  • Работу в профессиональной команде, которая готова делиться знаниями и опытом;

  • Возможность внешнего обучения и прокачки твоих скиллов за счет Компании;

  • Заботу о сотрудниках: возможность прохождения медицинских chek-апов, безлимитные бесплатные консультации с финансовыми консультантами, юристами и психологом. В компании поддерживается и развивается культура ЗОЖ;

  • Отличный социальный пакет, включающий ДМС, скидки на страховые продукты компании, скидки от наших партнеров (туризм, фитнес и т.д.);

  • Обеспечение техникой для работы;

  • Гибридный график работы 5\2 (гибкое начало дня с 8 до 10)


Откликнуться



EditPublish


Будьте осторожны: если вас просят войти в iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -