Factory · Demo RAG

RAG con frontend Next.js y backend FastAPI

Demo técnica de un flujo RAG: consulta, recuperación de contexto, respuesta con fuentes y fallback controlado. Puede integrarse con FastAPI mediante NEXT_PUBLIC_RAG_API_URL.

Modo actual: demo-rag-local. Demo frontend activa · Backend productivo integrable vía API.

Esta versión muestra la experiencia de usuario, el flujo de recuperación y la estructura de respuesta con fuentes. La arquitectura productiva está pensada para FastAPI, PostgreSQL/pgvector, embeddings y despliegue containerizado.

Pregunta

Edita la pregunta o usa un ejemplo. Luego presiona el botón para ejecutar el pipeline.

Pipeline ejecutado 1 vez/veces

1. Next.js recibe la query del usuario
2. Retrieval recupera contexto relevante
3. El sistema construye respuesta basada en fuentes
4. La UI muestra respuesta, scores y citas

Respuesta generada

Última consulta ejecutada: ¿Cómo reduce RAG las alucinaciones?

Respuesta en modo demo: para la pregunta "¿Cómo reduce RAG las alucinaciones?", recuperé contexto sobre Arquitectura RAG, MLOps para modelos IA, Recomendadores. El flujo limita la respuesta a fuentes recuperadas para reducir alucinaciones y mantener trazabilidad. Fuentes: [rag-01] [rag-02] [rag-03]

Contexto recuperado

Arquitectura RAG

score 4

Un sistema RAG combina retrieval y generación. Primero recupera fragmentos relevantes desde una base documental y luego genera una respuesta usando solo ese contexto para reducir alucinaciones.

Fuente: rag-01

MLOps para modelos IA

score 4

MLOps permite desplegar modelos de machine learning con monitoreo, versionado, evaluación continua y pipelines reproducibles. Es clave para pasar de prototipo a producción.

Fuente: rag-02