RAG

Cómo construir un sistema RAG multi-tenant con FastAPI y pgvector

Arquitectura SaaS real para consultar documentos con embeddings, pgvector y aislamiento por tenant.

Tiempo de lectura: 8 min

Problema real

Las empresas tienen manuales, contratos, reportes técnicos y documentos internos. El desafío no es solo buscarlos, sino evitar que la información de un cliente se mezcle con la de otro. En un SaaS, el aislamiento de datos es tan importante como la calidad del modelo.

Error típico

Muchas implementaciones RAG guardan todos los embeddings en una sola tabla y consultan sin filtrar por cliente. Eso puede provocar fugas de datos y destruye la confianza del producto.

Solución técnica

La base es agregar tenant_id a cada documento, chunk y consulta. Cada búsqueda vectorial debe incluir WHERE tenant_id = ? antes de ordenar por similitud.

Arquitectura

Frontend Next.js → API FastAPI → OpenAI embeddings → PostgreSQL + pgvector → respuesta con contexto y fuentes.

Implementación clave

La consulta segura usa tenant_id y pgvector: SELECT id, title, content FROM rag_documents WHERE tenant_id = $1 ORDER BY embedding <=> $2 LIMIT 5.

Impacto negocio

Esta arquitectura permite vender el mismo producto a múltiples empresas con aislamiento de datos, escalabilidad y trazabilidad.

¿Quieres implementar un RAG multi-tenant en tu empresa? Contáctame y lo desplegamos en producción.