Назад
1 час назад

Senior Data Scientist

Формат работы
remote (Global)
Тип работы
fulltime
Грейд
senior
vacancy_detail.hirify_telegram_tooltipВакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

ID 3031
Data Scientist
Senior

Кол-во специалистов
1
Длительность проекта
до 30.09.2026 (с пролонгацией)
Объем участия в проекте
Высокая нагрузка
~160 ч/мес
Формат взаимодействия
Удаленно
Требуемая локация специалиста
Любая
Доступность специалиста
по мск с 9 до 18, часовой пояс +-3 часа
Требуемое гражданство специалиста
любое

Обязательные требования
- Умение оценивать сложность алгоритмов;
- Знание алгоритмов и структур данных из стандартного курса;
- Знание оценки сложности структур из стандартной библиотеки;
- Знакомство с алгоритмами из расширенного набора: вероятностные, алгоритмы во внешней памяти, алгоритмы на графах ТВиМС;
- Предельные теоремы и умение их применять, проверка гипотез, бутстреп, A/B-тесты, условия сходимости, variance reduction, causal inference, байесовская оптимизация, графические модели, гауссовские процессы;
- Понимание ML-алгоритмов, включая SOTA-методы (в своей области). Эффективно адаптировать их для решения задач при необходимости;
- Строить модели из стандартных компонентов;
- Понимать шаги жизненного цикла ML-разработки и их взаимодействие в проекте, разрабатывать архитектуру для продукта;
- Понимать, какие бизнес-метрики для модели нужно мониторить;
- Способность предложить прокси-метрики и функцию потерь, связанные с бизнес-метриками;
- Умение докатить простую модель в пилот, имплементировать метод по статье, встроить компонент в существующий пайплайн;
- Знаком с менее распространенными методами МО (например: байесовские модели/PGM/VBI, RL и прочее);
- Умение выстраивать подход к прогнозированию, понимание ограничения методов, прокси-метрик и необходимости использования новых знаний SOTA в отдельных областях;
- Умение разово зафиттить модель, по запросу проверить, жива ли она, обновить, развернуть какое-либо необходимое ПО в кластере, версионирование моделей данных, мониторинг работы моделей, качества данных;
- Выстраивание инфраструктуры прогнозирования SQL;
- Простые запросы (select'ы/группировки и т.д.);
- Оптимизация запросов;
- Понимание принципов Транзакций, Индексов, Ролей;
- Переводить идеи в чистый код, который будут и исполнять, и читать;
- Пользоваться git'ом;
- Писать тесты;
- Способен разбираться в чужом коде и эффективно его дебажить;
- Способен разрабатывать архитектуру отдельных компонентов ПО с учетом простоты и поддерживаемости в хорошо очерченных сценариях;
- Глубокое понимание всех компонентов архитектуры и стека;
- Внедрение лучших практик разработки;
- Понимание ограничений инструментов и необходимость создания новых, разбираться с масштабным тех-долгом и рефакторингом DB&BD;
- Промышленный опыт работы с несколькими системами;
- Знание внутреннего устройства систем, используемых в работе, оптимизация вычислений/запросов, транзакции/ACID/Индексы, Other;
- Имея на входе непонятную задачу, исследовать возможные решения и предлагать варианты.

Задачи на проекте
- Разработка кода и тестов на python, участие в командной разработке, участие в код-ревью;
- Разрабатывать архитектуру систем, использующих машинное обучение;
- Подготовка данных для моделирования (получение, очистка);
- Расчет результатов АБ-тестов, дизайн АБ-тестов;
- Построение моделей машинного обучения;
- Разворачивание моделей и сервисов в контуре (hadoop/k8s/airflow);
- Написание запросов на SQL, оптимизация запросов (spark, в частности);
- Предлагать идеи для улучшения модели/подхода;
- Предлагать прокси-метрики и функции потерь, связанные с бизнес-метриками;
- Контроль соответствия результатов работы менеджеров по работе с большими данными в релизах продуктов больших данных;
- Техническая реализация data-science решений на продуктах департамента;
- Формирование требований к данным для разработки математических моделей в рамках релизов продуктов больших данных;
- Анализ предметной области с целью повышения качества моделей и формирования предложений по достижению целей проектов и продуктов больших данных

Этапы отбора
1. Техническое интервью
2. Интервью с ПО

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -