Вакансия размещена на Hirify напрямую от HR/нанимающего менеджера
Пожаловаться
Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Создать профиль и узнать мэтч
Описание вакансии
LLM Application Engineer
Unimatch Lab — венчурная AI‑студия из Кремниевой долины, которая за 24 месяца строит линейку из 100 вертикальных AI‑продуктов (HealthTech, LegalTech, HRTech, PropTech и др.). Ищем A‑Player LLM Application Engineer с опытом продакшн‑разработки AI‑приложений, кто умеет автономно принимать архитектурные решения, оптимизировать качество/стоимость LLM и использовать AI‑инструменты как часть рабочего процесса, а не «игрушку».
Технический профиль
- 5+ лет в Python/Node.js (FastAPI, NestJS), уверенная работа с PostgreSQL, Redis, брокерами сообщений (Redis Streams/RabbitMQ/Kafka).
- Глубокий опыт с LangChain/LlamaIndex/AutoGen, RAG‑системами, векторными БД (ChromaDB, Pinecone, Weaviate, Qdrant), OpenAI/Anthropic/Azure OpenAI и on‑prem моделями.
- Настройка RAG‑пайтлайнов и hybrid search, промпт‑инжиниринг (Chain-of-Thought, Few‑Shot и др.), fine‑tuning через LoRA/QLoRA, работа с embeddings и интеграциями внешних API/инструментов.
Продакшн и качество
- Продакшн‑деплой LLM (vLLM, TGI, Ollama, AWS/GCP), Docker/Kubernetes, CI/CD, MLOps (логирование, мониторинг, drift, версионирование моделей), observability (Prometheus, Grafana, Sentry).
- Unit/integration‑тесты (pytest/unittest, Jest/Supertest), валидация через Pydantic, code review и статический анализ (ESLint, Prettier, Black, Pylint).
Желательны: Notion/Slack API, Linux/SSH, serverless (Lambda/Workers/Vercel), оптимизация стоимости и latency LLM, опыт high‑load (от ~1k RPS).
Зона ответственности
- Архитектура и разработка RAG‑систем и многошаговых AI‑агентов, интеграция LLM в продакшн‑сервисы (API‑слой, роутинг, fault‑tolerance, наблюдаемость).
- Fine‑tuning под домены, разработка и A/B‑тестирование промптов, оптимизация производительности и стоимости, сопровождение тестов.
- Участие в продуктовой и технической архитектуре, документация (API, релизы, инструкции по интеграции).
Условия
- Доход от 4 500+ USD/мес без жёсткого потолка, рост вместе с количеством продуктов и перформансом.
- Быстрый трек до Tech Lead и лидера продуктовой ветки из 3–5 AI‑продуктов с опционами/долей, команда A‑Players и минимальная бюрократия.
- Полностью удалённо и гибко по времени, фокус на результате и доступ к сильному AI/венчур‑нетворку.
Для отклика оставляй заявку -
Показать контакты
Будьте осторожны: если вас просят войти в iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →