Назад
18 часов назад

ML Engineer (AI)

Формат работы
remote (Global)
Тип работы
fulltime
Английский
b2
Вакансия от Hirify. Размещена напрямую Вакансия размещена на Hirify напрямую от HR/нанимающего менеджера

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

TL;DR
ML Engineer (AI): Разработка и оптимизация CUA-агентов на базе LLM и vision-моделей с акцентом на повышение точности прохождения сценариев. Фокус на проектировании агентных пайплайнов и масштабировании инфраструктуры для работы с AI-системами в продакшн-окружении.

Вакансия: ML Engineer (AI)

Компания: Excdev

Стек проекта

Бэкенд:

  • Python, FastAPI, SQLAlchemy, asyncpg, PostgreSQL, Alembic

ML / AI:

  • GUI-OWL (UI-TARS), GPT-5-mini, Claude (Anthropic Computer Use API), vLLM, OpenAI-совместимые API

Агенты:

  • собственные CUA-пайплайны (GUI-Owl, UI-TARS agent loop, Anthropic computer-use)

Инфраструктура:

  • Docker, Docker Compose, S3 (логи и скриншоты), VNC, управление виртуальными машинами через Docker API

Обязанности:

  • Развивать и оптимизировать CUA-агентов: повышать accuracy прохождения сценариев, уменьшать количество шагов, улучшать обработку edge-кейсов (капчи, нестандартные UI, динамический контент).
  • Проектировать и внедрять новые агентные пайплайны (multi-agent, judge-based архитектуры).
  • Работать с vision-language моделями (UI-TARS, Claude Vision): подбор, fine-tuning, prompt engineering, оценка качества.
  • Интегрировать и деплоить LLM-сервисы (vLLM, OpenAI API, Anthropic API), оптимизировать инференс (tensor parallelism, batching).
  • Участвовать в масштабировании системы: увеличение количества одновременно обрабатываемых задач, параллелизация задач, управление ресурсами виртуальных машин.
  • Работать с данными: парсинг, структурирование результатов, интеграция с PostgreSQL и S3.

Требования:

Обязательно:

  • Опыт работы с LLM в продакшн-окружении (prompt engineering, function calling, structured output).
  • Опыт построения AI-агентов (LangChain / LangGraph / ReAct / Tools).
  • Понимание архитектуры и принципов работы CUA / GUI-агентов (Anthropic Computer Use, UI-TARS или аналоги).
  • Уверенное владение Python (asyncio, FastAPI или аналогичные фреймворки).
  • Опыт работы с Docker (сборка образов, docker-compose, управление контейнерами).
  • Умение читать и воспроизводить результаты ML-research (статьи, бенчмарки, open-source модели).

Будет плюсом:

  • Опыт деплоя и оптимизации LLM-инференса (vLLM, TGI, tensor parallelism).
  • Опыт fine-tuning vision-language моделей.
  • Знакомство с multi-agent системами и оркестрацией агентов.
  • Опыт работы с Anthropic API (в т.ч. Computer Use).
  • Понимание веб-автоматизации (Selenium, Playwright, pyautogui).
  • Опыт работы с PostgreSQL, SQLAlchemy, Alembic.

Условия:

  • Работа над R&D-проектом в области AI-агентов и LLM-систем.
  • Современный стек: Python, LLM-сервисы, vision-language модели, агентные архитектуры.
  • Возможность работать с передовыми решениями в области Computer Use Agents.
  • Удаленный формат работы из любого города или страны
  • График работы 5/2
  • Отпуск - 28 календарных дней.

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Вакансия размещена на Hirify напрямую от HR/нанимающего менеджера