Требования:
Увереннное знание SQL и опыт работы с популярными СУБД или распределенных хранилищами данных. Владение Python и основным стэком для анализа и визулизации данных: pandas, numpy, polars, matplotlib, seaborn, altair. Очень желательно понимание основных концепций в рамках NLP и желания развиваться в этом направлении. Опыт разработки ETL и ELT пайплайнов. Базовые знания в Data Science будут большим плюсом. Работа с данными из HDFS и S3, из БД (GreenPlum, OracleDB, PostgreSQL), а также из файловых шар и сетевых дисков. Подготовка визуализаций данных на Superset и Streamlit. Разработка пайплайнов подготовки данных для обучения и тестирование моделей. Анализировать данные, cтроить и проверять гипотезы с помощью python (pandas, polars) и sql. Заниматься задачами разметки неструктурированных данных: от проектирования процесса разметки до валидации результатов. Анализировать работу существующих GenAI/NLP сервисов. Гражданство РФ.
Локация:📍РФ. Удалённо.
Контакт для отклика:Показать контакты
👉 Показать контакты
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Текст вакансии взят без изменений
Источник - Telegram канал. Название доступно после авторизации