Назад
обновлено 5 дней назад

Senior AI Integration Engineer (LLM)

Формат работы
remote (Global)
Тип работы
project
Грейд
senior
Английский
b2
Страна
Russia
vacancy_detail.hirify_telegram_tooltipВакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

Senior AI/LLM Integration Engineer — SilentRoom

О проекте
SilentRoom — профессиональная цифровая среда для авторов (сценаристов, писателей, учёных), построенная на философии «Silent AI»: инструмент не генерирует текст за автора, а работает как аналитик и ассистент с бесконечной памятью. Это «экзоскелет для автора», объединяющий структуру классических редакторов (Scrivener) с мощью Gemini 3.1 Pro. Приложение работает в 4 режимах — BUILD (сбор материалов), THINK (чат с данными / RAG), WRITE (текстовый редактор), CHECK (валидация). Стек: Next.js + Supabase + Tiptap + Google Vertex AI; три режима ИИ: Project (RAG с кэшированием контекста), Global (stateless), Search (веб-поиск с источниками).

Задача
Нам нужен человек, который возьмёт на себя полную ответственность за все LLM-интеграции в SilentRoom по трём режимам:
Project (RAG) — stateful-контекст, послойная сборка payload (system prompt sandwich, vector DB, фоновая экстракция через дешёвую модель типа Gemini Flash), context caching.
Global — stateless, минимальный контекст, быстрый ответ через все основные модели.
Search — веб-поиск через Tavily / Google Search API + grounding, ответ с proof-ссылками.
Подключение и поддержка интеграций со всеми ведущими моделями:
Западные: Gemini (приоритет, context caching), OpenAI (GPT), Anthropic (Claude), Mistral, Llama.
Китайские: DeepSeek, Qwen (Alibaba), Kimi (Moonshot).

Формат работы
• Проектная работа + последующая поддержка
• 100% удалёнка, локация — любая
• Язык общения — русский; технический английский на высоком уровне
• Оплата — любая форма и валюта, включая рубли

Что важно
• Топ-сеньор уровень, не middle
• Опыт работы с LLM API (Gemini, OpenAI, Anthropic) в продакшене
• RAG, векторные БД (Pinecone / Weaviate / pgvector), embeddings
• Python или Node.js backend (FastAPI / Express)
• Понимание prompt engineering, context management, async-архитектуры
• Опыт с context caching (Google Vertex AI — большой плюс)

Будет плюсом
• Опыт с browser extensions
• Понимание архитектуры мультимодельных продуктов
• Работа в AI-first стартапах

Как откликнуться
Написать напрямую в Telegram ( ) / с кратким описанием релевантного опыта и примерами работы с LLM в продакшене.

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -