Описание вакансии чрезмерно детализировано, но неясно, какая компания и какая у нее культура, что вызывает опасения по поводу рабочего окружения и возможной перегрузки.
Кликните для подробной информации
Неясная информация о компанииВысокий потенциал нагрузкиПроблемы с диапазоном зарплатыУдаленная работа
ЗАПРОС
Senior Python Automation / Computer Vision Engineer для создания screen-based RPA
Грейд Middle+/Senior.
Срок проекта от 1 года
Оформление: ИП/самозанятый
Локация и гражданство специалиста - Без ограничений
Формат работы - Удаленно
Компания-Заказчик: Литовская компания по покупке-продаже запчастей на ЕС.
Описание проекта
Нужно разработать бот, который будет работать с веб-сервисом только по картинке экрана и имитировать действия пользователя.
Требования
• практический опыт автоматизации UI по картинке, а не по DOM
• опыт работы через RDP/удалённый рабочий стол
• опыт с OpenCV, template matching, поиск элементов по шаблону
• опыт работы с OCR (Tesseract или аналог) и обработкой текстов
• умение строить конфигурируемые сценарии
• описывать шаги в YAML/JSON и писать движок, который их исполняет
Плюсом будет
• опыт разработки RPA решений но с реальной практикой кастомного кода (а не только drag-and-drop)
• опыт в computer vision и/или текстовых эмбеддингах (fuzzy search по названиям)
• любые проекты типа “бот, который играет/работает по скриншоту”
Что за проект: нужно разработать бот, который будет работать с веб-сервисом только по картинке экрана и имитировать действия пользователя.
Доступ к сервису реализован через браузер/удалённый сервер (RDP) VMware Horizon.
Кода страницы, DOM и API нет. При этом текст и картинки в интерфейсе можно выделять и копировать.
На практике задача "научить" бот проходить по заранее заданным путям (последовательностям экранов) с совершением заданных действий
захват экрана/окна
управление мышью и клавиатурой (клики, скролл, ввод, сочетания клавиш)
работа с буфером обмена (чтение скопированного текста)
распознавание экрана/состояния интерфейса
находить элементы по картинке (кнопки, иконки) и по тексту. при необходимости использовать OCR
хранить сценарии в YAML/JSON (я задаю путь словами, бот исполняет)
уметь описывать: ожидаемый тип экрана, что искать (текст/номер схемы/синонимы), что делать (клик, скролл, ввод данных, копирование)
проверка, что бот на правильном экране
обработка таймаутов, ошибок, всплывающих окон
реализовать механизм “обучения на опыте”: логировать успешные/неуспешные шаги, расширять списки допустимых вариантов, оптимизировать маршрут (кэшировать удачные действия, уменьшать число поисков). формат “обучения” не должен быть оверинжинирингом: достаточно разумной системы логов + обновляемых словарей/паттернов. если есть опыт с ML (эмбеддинги, fuzzy matching), это плюс. Удаленный сервер предоставляет доступ к каталогам автозапчастей.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Текст вакансии взят без изменений
Источник - Telegram канал. Название доступно после авторизации