Назад
8 часов назад

Senior ML Engineer (NLP)

400 000 - 500 000
Формат работы
remote (только Russia)/hybrid
Тип работы
fulltime
Грейд
senior
Страна
Russia

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Текст:
/

TL;DR

Senior ML-инженер (NLP): Доработка и оптимизация классификатора товарных позиций на базе BERT-архитектур с акцентом на дообучение моделей и работу с данными. Фокус на проектировании архитектуры нейросетей, настройке ETL-пайплайнов в PostgreSQL и интеграции моделей в production через Docker.

Локация: Москва (гибрид) или удалённо на территории РФ

Зарплата: 400 000 — 500 000 ₽ на руки

Компания

IT-компания GNIVC — разработчик и системный интегратор крупнейших государственных информационных систем и коммерческих решений для налогового мониторинга.

Что делать

  • Разработка и доработка классификатора товарных позиций на базе BERT-архитектур (предобучение, дообучение и оптимизация).
  • Организация процесса разметки данных, постановка задач разметчикам и автоматизация пайплайнов.
  • Подготовка датасетов: очистка и нормализация данных с использованием pandas, datasets (Hugging Face) и regex.
  • Проектирование архитектуры моделей, эксперименты с DistilBERT, кастомными головами и ensemble-методами.
  • Мониторинг моделей в продакшене: метрики качества, drift-детекция и A/B-тестирование.
  • Работа с PostgreSQL: создание таблиц, написание хранимых процедур, оптимизация запросов и ETL-пайплайны.

Требования

  • Высшее образование в области компьютерных наук, математики или смежных дисциплин.
  • Опыт в NLP/ML от 2 лет, включая fine-tuning transformer-моделей (BERT/RoBERTa/DistilBERT).
  • Глубокий опыт работы с PyTorch, Hugging Face Transformers, pandas и datasets.
  • Опыт с PostgreSQL: SQL, оптимизация схем, хранимые функции и производительность запросов.
  • Знание техник оптимизации моделей: quantization, layer-wise LR, custom loss functions.
  • Навыки production ML: мониторинг, anomaly detection, model serving, Docker-контейнеризация.

Хорошо, если есть

  • Опыт с классификацией текстов (продуктовые каталоги, поиск или рекомендательные системы).
  • Навыки организации разметки данных и data pipeline engineering.
  • Опыт работы с ONNX для inference и multi-GPU training (DDP).

Культура и преимущества

  • Гибкие форматы работы: возможность работать в офисе, по гибридному графику или полностью дистанционно в РФ.
  • Официальное трудоустройство по ТК РФ, ДМС со стоматологией и компенсация больничного до 7 дней.
  • Развитие и обучение: сертификация за счет компании, доступ к библиотеке Alpina Digital и партнерским программам Skyeng/Skillbox.
  • Спортивные бонусы: возмещение до 50% затрат на занятия спортом.
  • Дополнительные 5 оплачиваемых ресурсных дней в году для сотрудников со стажем более 11 месяцев.
  • Наличие ИИ-песочницы для экспериментов и реализации собственных идей на базе современных LLM.

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →