Вакансия из Telegram канала - Название доступно после авторизации
Пожаловаться
85
Хорошая вакансия
развернуть
Роль четко определена с ясным акцентом на интеграции LLM, а стек технологий современный, но отсутствие информации о зарплате является недостатком.
Кликните для подробной информации
Четкая рольСовременный стекЗарплата не указана
Оценка от Hirify AI
Мэтч & Сопровод
Покажет вашу совместимость и напишет письмо
Создать профиль и узнать мэтч
Описание вакансии
Senior AI/LLM Integration Engineer — SilentRoom
О проекте
SilentRoom — профессиональная цифровая среда для авторов (сценаристов, писателей, учёных), построенная на философии «Silent AI»: инструмент не генерирует текст за автора, а работает как аналитик и ассистент с бесконечной памятью. Это «экзоскелет для автора», объединяющий структуру классических редакторов (Scrivener) с мощью Gemini 3.1 Pro. Приложение работает в 4 режимах — BUILD (сбор материалов), THINK (чат с данными / RAG), WRITE (текстовый редактор), CHECK (валидация). Стек: Next.js + Supabase + Tiptap + Google Vertex AI; три режима ИИ: Project (RAG с кэшированием контекста), Global (stateless), Search (веб-поиск с источниками).
Задача
Нам нужен человек, который возьмёт на себя полную ответственность за все LLM-интеграции в SilentRoom по трём режимам:
• Project (RAG) — stateful-контекст, послойная сборка payload (system prompt sandwich, vector DB, фоновая экстракция через дешёвую модель типа Gemini Flash), context caching.
• Global — stateless, минимальный контекст, быстрый ответ через все основные модели.
• Search — веб-поиск через Tavily / Google Search API + grounding, ответ с proof-ссылками.
Подключение и поддержка интеграций со всеми ведущими моделями:
• Западные: Gemini (приоритет, context caching), OpenAI (GPT), Anthropic (Claude), Mistral, Llama.
• Китайские: DeepSeek, Qwen (Alibaba), Kimi (Moonshot).
Формат работы
• Проектная работа + последующая поддержка
• 100% удалёнка, локация — любая
• Язык общения — русский; технический английский на высоком уровне
• Оплата — любая форма и валюта, включая рубли
Что важно
• Топ-сеньор уровень, не middle
• Опыт работы с LLM API (Gemini, OpenAI, Anthropic) в продакшене
• RAG, векторные БД (Pinecone / Weaviate / pgvector), embeddings
• Python или Node.js backend (FastAPI / Express)
• Понимание prompt engineering, context management, async-архитектуры
• Опыт с context caching (Google Vertex AI — большой плюс)
Будет плюсом
• Опыт с browser extensions
• Понимание архитектуры мультимодельных продуктов
• Работа в AI-first стартапах
Как откликнуться
Написать напрямую в Telegram (Показать контакты ) / Показать контакты с кратким описанием релевантного опыта и примерами работы с LLM в продакшене.
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Текст вакансии взят без изменений
Источник - Telegram канал. Название доступно после авторизации