RAG
Cómo construir un sistema RAG multi-tenant con FastAPI y pgvector
Arquitectura SaaS real para consultar documentos con embeddings, pgvector y aislamiento por tenant.
Tiempo de lectura: 8 min
Problema real
Las empresas tienen manuales, contratos, reportes técnicos y documentos internos. El desafío no es solo buscarlos, sino evitar que la información de un cliente se mezcle con la de otro. En un SaaS, el aislamiento de datos es tan importante como la calidad del modelo.
Error típico
Muchas implementaciones RAG guardan todos los embeddings en una sola tabla y consultan sin filtrar por cliente. Eso puede provocar fugas de datos y destruye la confianza del producto.
Solución técnica
La base es agregar tenant_id a cada documento, chunk y consulta. Cada búsqueda vectorial debe incluir WHERE tenant_id = ? antes de ordenar por similitud.
Arquitectura
Frontend Next.js → API FastAPI → OpenAI embeddings → PostgreSQL + pgvector → respuesta con contexto y fuentes.
Implementación clave
La consulta segura usa tenant_id y pgvector: SELECT id, title, content FROM rag_documents WHERE tenant_id = $1 ORDER BY embedding <=> $2 LIMIT 5.
Impacto negocio
Esta arquitectura permite vender el mismo producto a múltiples empresas con aislamiento de datos, escalabilidad y trazabilidad.
¿Quieres implementar un RAG multi-tenant en tu empresa? Contáctame y lo desplegamos en producción.