Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Описание вакансии
TL;DR
Senior ML-инженер (NLP): Доработка и оптимизация классификатора товарных позиций на базе BERT-архитектур с акцентом на дообучение моделей и работу с данными. Фокус на проектировании архитектуры нейросетей, настройке ETL-пайплайнов в PostgreSQL и интеграции моделей в production через Docker.
Локация: Москва (гибрид) или удалённо на территории РФ
Зарплата: 400 000 — 500 000 ₽ на руки
Компания
IT-компания GNIVC — разработчик и системный интегратор крупнейших государственных информационных систем и коммерческих решений для налогового мониторинга.
Что делать
- Разработка и доработка классификатора товарных позиций на базе BERT-архитектур (предобучение, дообучение и оптимизация).
- Организация процесса разметки данных, постановка задач разметчикам и автоматизация пайплайнов.
- Подготовка датасетов: очистка и нормализация данных с использованием pandas, datasets (Hugging Face) и regex.
- Проектирование архитектуры моделей, эксперименты с DistilBERT, кастомными головами и ensemble-методами.
- Мониторинг моделей в продакшене: метрики качества, drift-детекция и A/B-тестирование.
- Работа с PostgreSQL: создание таблиц, написание хранимых процедур, оптимизация запросов и ETL-пайплайны.
Требования
- Высшее образование в области компьютерных наук, математики или смежных дисциплин.
- Опыт в NLP/ML от 2 лет, включая fine-tuning transformer-моделей (BERT/RoBERTa/DistilBERT).
- Глубокий опыт работы с PyTorch, Hugging Face Transformers, pandas и datasets.
- Опыт с PostgreSQL: SQL, оптимизация схем, хранимые функции и производительность запросов.
- Знание техник оптимизации моделей: quantization, layer-wise LR, custom loss functions.
- Навыки production ML: мониторинг, anomaly detection, model serving, Docker-контейнеризация.
Хорошо, если есть
- Опыт с классификацией текстов (продуктовые каталоги, поиск или рекомендательные системы).
- Навыки организации разметки данных и data pipeline engineering.
- Опыт работы с ONNX для inference и multi-GPU training (DDP).
Культура и преимущества
- Гибкие форматы работы: возможность работать в офисе, по гибридному графику или полностью дистанционно в РФ.
- Официальное трудоустройство по ТК РФ, ДМС со стоматологией и компенсация больничного до 7 дней.
- Развитие и обучение: сертификация за счет компании, доступ к библиотеке Alpina Digital и партнерским программам Skyeng/Skillbox.
- Спортивные бонусы: возмещение до 50% затрат на занятия спортом.
- Дополнительные 5 оплачиваемых ресурсных дней в году для сотрудников со стажем более 11 месяцев.
- Наличие ИИ-песочницы для экспериментов и реализации собственных идей на базе современных LLM.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →