Назад
12 часов назад

Senior Data Scientist (GenAI/RAG)

Формат работы
remote (Global)
Тип работы
fulltime
Грейд
senior
vacancy_detail.hirify_telegram_tooltipВакансия из Telegram канала -

Мэтч & Сопровод

Покажет вашу совместимость и напишет письмо

Описание вакансии

FULL_TIME

Remote | Senior | Full time | Machine Learning & AI

4 applications

Replies between 3 and 11 days

Last checked today Buscamos incorporar un profesional para participar en una iniciativa estratégica de Inteligencia Artificial Generativa enfocada en el desarrollo de capacidades de análisis semántico y agentes conversacionales.

El proyecto tiene como objetivo transformar grandes volúmenes de información no estructurada proveniente de diversas fuentes, como chats, transcripciones de llamadas y registros CRM, en conocimiento accionable mediante el uso de tecnologías de IA Generativa, Large Language Models (LLMs), embeddings y arquitecturas RAG (Retrieval-Augmented Generation).

La persona seleccionada participará en el diseño e implementación de soluciones que permitan mejorar la recuperación inteligente de información, la trazabilidad de respuestas y la experiencia de interacción conversacional.

Apply from getonbrd.com.

Diseñar e implementar soluciones de Ciencia de Datos e Inteligencia Artificial.

Procesar, limpiar y transformar grandes volúmenes de datos provenientes de distintas fuentes.

Desarrollar pipelines de datos para la automatización de procesos analíticos.

Construir modelos predictivos, analíticos y de IA Generativa según las necesidades del negocio.

Implementar soluciones basadas en Large Language Models (LLMs).

Generar embeddings y trabajar con bases de datos vectoriales.

Participar en la definición de arquitecturas de datos y analítica avanzada.

Integrar distintas fuentes de información para generar modelos y automatizaciones.

Colaborar con equipos de negocio para identificar oportunidades de uso de datos e inteligencia artificial.

Documentar procesos, modelos y soluciones implementadas.

Curado y limpieza de texto no estructurado proveniente de múltiples fuentes (chats, llamadas transcritas, registros CRM).

Diseño de curado y limpieza de texto no estructurado para preparación de contenido destinado a modelos de lenguaje.

Generación, gestión y versionado de embeddings.

Implementación y administración de bases de datos vectoriales (ej. pgvector, Qdrant, Chroma, Weaviate, Pinecone, Milvus) y búsqueda híbrida.

Construcción de pipelines RAG (Retrieval-Augmented Generation) completos, incluyendo evaluación y trazabilidad de respuestas.

Integración con APIs de modelos de lenguaje (LLM), tanto en servidores propios/internos como proveedores externos (Anthropic, OpenAI, Azure OpenAI, Google Gemini), con diseño agnóstico al proveedor.

Python. SQL. PySpark. Apache Spark. Big Data. Desarrollo de procesos ETL/ELT. Manipulación y análisis de grandes volúmenes de datos.

Análisis exploratorio de datos. Feature Engineering. Evaluación y optimización de modelos.

Bases de datos vectoriales (Pinecone, Weaviate, Chroma, Qdrant, Milvus o similares). Git.

Azure. Servicios de almacenamiento y procesamiento de datos.

(No excluyentes, ya que contamos con apoyo interno para esta parte)

Experiencia en Microsoft Fabric.

GETONBRD Job ID: 61821

Fully remote

Candidates can reside anywhere in the world.

Somos una consultora de TI con personal experto en diferentes áreas de tecnología. — BC Tecnología's full profile

Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →

Текст вакансии взят без изменений

Источник -