🗺 Разработчик на Python в майнинг данных
Справочник — платформа, которая собирает данные об организациях. Наша система обрабатывает миллионы сигналов: пользовательский фидбек, обновления с сайтов, коррекции от владельцев бизнесов.
Если вы хотите работать на стыке Python, C++ и ML, решая задачи парсинга, NLP и Big Data, присоединяйтесь! Здесь ваши навыки превратятся в технологии, которыми каждый день пользуются миллионы людей.
Какие задачи вас ждут:
• Оптимизировать архитектуру для одновременной работы сотен парсеров, реализовывать изолированную среду выполнения парсеров и повышать эффективность взаимодействия с PostgreSQL
• Создавать пайплайн автоматического перевода контента и разметки данных с помощью языковых моделей, а также адаптировать и настраивать модели (YandexGPT и др.) под бизнес-задачи
• Адаптировать платформу для новых стран и языков, организовывать обработку данных через YTsaurus MapReduce и внутренний аналог AirFlow
• Разрабатывать методы сравнения и нормализации атрибутов организаций и ускорять критичные компоненты системы на C++
Мы ждём, что вы:
• Работали с C++ и Python (уровень middle+)
• Глубоко понимаете алгоритмы, структуры данных и SQL
• Умеете писать чистый, тестируемый код с документацией
📩 Откликайтесь на вакансию на нашем сайте
#карты #бэкенд #python #CPP #SQL #ML #гибрид #офис #москва
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →