Назад
2 дня назад

Middle Data Scientist (Разработка AI-решений БСР)

300 000 - 450 000
Формат работы
remote (только Russia)
Тип работы
fulltime
Грейд
middle
vacancy_detail.hirify_telegram_tooltipВакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Middle+ Data Scientist (Разработка AI-решений БСР)

Локация: Удаленно в РФ
Компания: Сбер
ЗП: от 300 000 до 450 000 р. на руки
Занятость: Полная

Обязанности:
- Разработка и внедрение ML-моделей от этапа MVP до ПРОМ-решения (CRISP-DM).
- Решение задач NLP: Preprocessing, Classification, Summarization (Ext/Abst), Sentence Compression, Simplification, NER, Semantic Search, Clustering.
- Разработка прототипов на основе LLM с использованием фреймворков для работы с LLM, таких как LangChain/GigaChain.
- Адаптация и обучение языковых моделей (LLM) Сбера на основе внутренних и внешних данных, Prompt Tuning, RAG.
- Индексация и ранжирование текстовых документов разной длины.
- Взаимодействие с бизнес-заказчиком для выявления требований и самостоятельная постановка задач.
- Определение ML SysDes решения с учетом разрешенного технологического стека.
- Участие в валидации и автомониторинге моделей, проведение A/B тестирования.

Требования:
- Образование в техническом ВУЗе в сфере компьютерных наук, прикладной математики или статистики. Наиболее приоритетны: ВШЭ, МФТИ, МГУ, МИФИ.
- Опыт в разработке NLP моделей и рекомендательных систем (желательно).
- Понимание жизненного цикла моделей (CRISP-DM).
- Умение переводить бизнес-постановку задачи в ML-постановку, грамотная интерпретация полученных результатов.
- Высокий уровень владения ядром Python и SQL.
- Свободное владение базовыми библиотеками на Python, в том числе: pandas, numpy, matplotlib, seaborn.
- Знание фреймворков, библиотек, алгоритмов машинного обучения: Scikit-learn, PyTorch, XGBoost, CatBoost, TensorFlow, transformers.
- Опыт работы с NLP библиотеками: pymorphy2, NLTK, Gensim, spaCy, regexp.
- WEB-фреймворки: FastAPI (async methods), Flask и др.
- Знание архитектур нейронных сетей: RNN, LSTM, трансформеры (BERT, BART, T5).
- Знание фреймворков для работы с LLM (LangChain/GigaChain, LangServe/GigaServe, LlamaIndex и др.).
- Контейнеризация: Docker, OpenShift.

🌐 Резюме отправлять:

–––
Бесплатный постинг вакансий: @freeIT_job
Забирай 📚 Базу Знаний

Будьте осторожны: если вас просят войти в iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -