Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Описание вакансии
TL;DR
ML-инженер (NLP): Разработка и доработка классификатора названий товарных позиций на базе BERT-архитектур с акцентом на предобучение, дообучение и оптимизацию моделей. Фокус на проектировании архитектуры моделей, организации процессов разметки данных и интеграции решений в production.
Локация: Гибкий формат: офис в Москве, гибрид или удалённо на территории РФ
Компания
ИТ-компания ГНИВЦ — партнер государственных компаний и разработчик крупнейших государственных информационных систем и решений для налогового мониторинга.
Что делать
- Разрабатывать и оптимизировать классификатор товарных позиций на базе BERT-архитектур (включая предобучение и дообучение).
- Организовывать и контролировать процесс разметки данных, автоматизировать пайплайны и ставить задачи разметчикам.
- Проектировать архитектуру моделей, проводя эксперименты с DistilBERT, кастомными головами и ensemble-методами.
- Осуществлять мониторинг моделей в продакшене: детекция дрифта, A/B-тестирование и автоматизированное дообучение.
- Работать с PostgreSQL: оптимизация запросов, создание хранимых процедур и построение ETL-пайплайнов.
- Интегрировать модели в production с использованием Docker-контейнеризации и мониторинга ресурсов GPU/CPU.
Требования
- Высшее техническое образование (компьютерные науки, математика или смежные дисциплины).
- Опыт от 2 лет в NLP/ML, включая fine-tuning трансформеров (BERT, RoBERTa, DistilBERT).
- Глубокие знания PyTorch, Hugging Face Transformers, pandas и datasets.
- Опыт работы с PostgreSQL: SQL, оптимизация схем и производительности запросов.
- Уверенное владение Python, Git, Linux/Shell scripting.
- Опыт в Production ML (monitoring, anomaly detection, model serving).
Хорошо, если есть
- Опыт классификации текстов для продуктовых каталогов или систем поиска и рекомендаций.
- Навыки data pipeline engineering и организации разметки данных.
- Опыт работы с ONNX для inference и multi-GPU training (DDP).
Культура и преимущества
- Официальное трудоустройство по ТК РФ, оплачиваемые отпуска и стабильные выплаты.
- ДМС со стоматологией по окончании испытательного срока.
- Компенсация до 50% затрат на занятия спортом.
- Профессиональное обучение, сертификация, партнерские программы с Skyeng и Skillbox.
- 5 дополнительных оплачиваемых ресурсных дней в году.
- Доступ к внутренней ИИ-песочнице для экспериментов с современными LLM.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →