Factory · Demo RAG

RAG con frontend Next.js y backend FastAPI

Demo técnica de un flujo RAG: consulta, recuperación de contexto, respuesta con fuentes y fallback controlado. Puede integrarse con FastAPI mediante NEXT_PUBLIC_RAG_API_URL.

Modo actual: demo-rag-local. Demo frontend activa · Backend productivo integrable vía API.
Esta versión muestra la experiencia de usuario, el flujo de recuperación y la estructura de respuesta con fuentes. La arquitectura productiva está pensada para FastAPI, PostgreSQL/pgvector, embeddings y despliegue containerizado.

Pregunta

Edita la pregunta o usa un ejemplo. Luego presiona el botón para ejecutar el pipeline.

Pipeline ejecutado 1 vez/veces

  1. 1. Next.js recibe la query del usuario
  2. 2. Retrieval recupera contexto relevante
  3. 3. El sistema construye respuesta basada en fuentes
  4. 4. La UI muestra respuesta, scores y citas

Respuesta generada

Última consulta ejecutada: ¿Cómo reduce RAG las alucinaciones?

Respuesta en modo demo: para la pregunta "¿Cómo reduce RAG las alucinaciones?", recuperé contexto sobre Arquitectura RAG, MLOps para modelos IA, Recomendadores. El flujo limita la respuesta a fuentes recuperadas para reducir alucinaciones y mantener trazabilidad. Fuentes: [rag-01] [rag-02] [rag-03]

Contexto recuperado

Arquitectura RAG

score 4

Un sistema RAG combina retrieval y generación. Primero recupera fragmentos relevantes desde una base documental y luego genera una respuesta usando solo ese contexto para reducir alucinaciones.

Fuente: rag-01

MLOps para modelos IA

score 4

MLOps permite desplegar modelos de machine learning con monitoreo, versionado, evaluación continua y pipelines reproducibles. Es clave para pasar de prototipo a producción.

Fuente: rag-02

Recomendadores

score 3

Un sistema de recomendación puede aumentar CTR y conversión usando señales de comportamiento, embeddings, ranking y pruebas A/B para validar impacto real en negocio.

Fuente: rag-03