RAG explicado para no técnicos: la pieza que convierte un modelo en un agente útil
Llevas meses oyendo hablar de agentes de IA. RAG es la pieza técnica que los hace pasar de demo a herramienta útil para tu empresa. Aquí va qué es, en lenguaje normal.
Llevas meses oyendo hablar de agentes de IA. Que van a cambiar cómo trabajan los despachos, que van a sustituir herramientas enteras, que las empresas van a ser AI-first. Mucha gente con muchas opiniones.
La pieza técnica que hace que esto pase de presentación de PowerPoint a herramienta útil se llama RAG. Es lo que convierte un modelo generalista que sabe muchísimo de internet en un agente que sabe lo de TU empresa. Aquí va qué es, cómo funciona y cuándo le interesa a un negocio real.
El problema que resuelve
Pídele a ChatGPT que te ayude con una pregunta concreta de tu empresa. Suele pasar una de tres cosas. O se inventa la respuesta con seguridad. O te suelta algo genérico que no aplica. O te dice directamente que no sabe. El problema no es ChatGPT, el problema es que ChatGPT no conoce tu empresa.
Sabe muchísimo de la web hasta una fecha de corte. No sabe nada de tus expedientes, tus contratos, tus normativas internas, tus emails, tus PDFs en una carpeta del despacho. Y para que te sirva de verdad, necesita conocer eso, no más historia general de la humanidad. RAG es lo que cierra ese hueco.
Qué es RAG en una frase
RAG son las siglas de retrieval-augmented generation. Traducción honesta: en lugar de pedirle a la IA que conteste de memoria, le damos primero los fragmentos relevantes de tus documentos y le pedimos que conteste basándose en eso. La IA deja de inventar y empieza a citar.
Cómo funciona, en lenguaje normal
Tres pasos, ninguno necesita matemáticas avanzadas para captarlo.
- Indexar tus archivos. Coges los documentos que quieres que la IA conozca (PDFs, Word, Excel, notas, emails archivados) y los partes en trozos pequeños. Cada trozo se etiqueta de forma que sea fácil encontrarlo después por similitud con una pregunta.
- Buscar lo relevante. Cuando alguien hace una pregunta, el sistema encuentra los 3-5 trozos más relacionados con esa pregunta concreta. No envía toda tu información a la IA, solo lo que toca.
- Generar la respuesta. La IA recibe la pregunta junto con esos trozos y redacta una respuesta basada en ellos. Y, lo importante, te dice de qué documento viene cada cosa.
El resultado: respuestas atadas a tu información, con cita exacta de dónde sale cada dato.
Un caso real: 10 GB de normativa en local
Hay un despacho de cálculo estructural en Madrid con el que trabajo. Cada vez que necesitaban una respuesta concreta de normativa CTE, Eurocódigos o autonómica, alguien del despacho dedicaba entre 20 y 40 minutos abriendo varios PDFs y buscando con Ctrl+F. Varias veces al día. Cada interrupción cortaba el cálculo en curso.
Tenían toda la información, en 10 GB de PDFs y documentos en el ordenador del despacho. El problema era la velocidad de recuperación. Y había una restricción importante: los expedientes contienen información confidencial de proyectos de sus clientes, así que no podían meterlos en ChatGPT ni en herramientas online.
Le monté una IA personal que conoce toda su normativa. Funciona en el ordenador del despacho, sin que la información salga de ahí. Le preguntan por correo electrónico, como si fuera un colega del despacho, y responde en menos de un minuto con la cita exacta de la norma.
Eso es RAG aplicado a un caso concreto. La técnica es la misma para un despacho de abogados, una asesoría fiscal, una clínica con historiales o cualquier negocio con conocimiento atrapado en archivos. Si quieres el caso completo, lo tienes aquí: Cómo le montamos a un calculista estructural una IA personal que conoce su normativa.
Cuándo te interesa RAG (y cuándo no)
RAG compensa cuando:
- Tienes volumen real de documentación. Decenas o cientos de archivos, no tres folios.
- Hay consultas repetidas que cuestan tiempo cada día.
- Importa la cita exacta y no vale una respuesta plausible pero genérica. Pasa en normativa, legal, técnico, médico, fiscal.
- La información es confidencial y no puede salir de tu casa, despacho u oficina.
RAG NO compensa cuando:
- Lo que necesitas es generar texto creativo o asistencia generalista. Para eso ya está ChatGPT y similares.
- Tu documentación cabe en un par de páginas. Pegas los folios al chat y listo.
- No hay frecuencia de uso. Si vas a hacer una consulta al mes, el retorno no aparece.
Lo que viene encima de esto
RAG es la pieza base. Por sí sola ya vale para que un agente conteste con criterio. Pero cuando se combina con un sistema de memoria estructurado (un wiki por dominio, un journal de decisiones, status por área), el agente deja de ser un buscador inteligente y empieza a ser algo parecido al sistema operativo de tu empresa. Lo cuento en el siguiente post.
Si quieres explorar si te encaja
Identificar si tu caso necesita RAG no se hace por intuición, se hace mirando dos cosas: cuánto tiempo se pierde hoy buscando información, y cuántas veces a la semana ocurre. Con esos dos datos y un mapa de qué documentación tienes, en 30 minutos se ve si compensa.
Hay dos formas de seguir:
- Diagnóstico rápido (5 minutos, sin llamada). Te pregunto cuatro cosas y te digo si tu caso encaja con RAG o conviene plantearlo distinto. Empezar el diagnóstico →
- Discovery (30 minutos por videollamada). Charla a fondo: estimamos tiempo perdido actual, evaluamos qué documentación es indexable y cómo se montaría. Reservar discovery →