Build in public 26 de mayo de 2026

RAG y memoria estructurada: cómo se está montando el cerebro de las empresas AI-first

AI-first deja de ser un slogan cuando le pones detrás un agente que conoce toda tu información y mejora con el uso. Aquí va la fórmula que está emergiendo y por qué importa.

Llevamos meses oyendo “AI-first” como bandera estratégica. La pregunta honesta es cuándo deja de ser un slogan de keynote y se convierte en algo concreto que tu empresa puede tocar. Mi lectura: cuando le pones detrás un agente que conoce TODA tu información, contesta con criterio y mejora con el uso. Esa fórmula está empezando a tomar forma, y son dos piezas con una idea sencilla.

El problema real de meter IA en una empresa

El cuello de botella no es el modelo. Hoy los modelos generalistas ya son lo bastante buenos para la mayoría de tareas. El cuello de botella es que un modelo de fábrica no conoce nada específico de tu empresa.

Pídele al mejor modelo del mundo que te diga cuándo expira el contrato con tu proveedor crítico, o qué dijo el cliente en la reunión de hace tres semanas, o cómo decidisteis abordar X en el último proyecto. No tiene ni idea, y mientras no lo sepa, sigue siendo un asistente externo, no parte de tu empresa.

El conocimiento real de cualquier organización vive en silos: emails, drives compartidos, mensajes de Slack, expedientes en local y la cabeza de personas concretas. Cada nuevo empleado pasa meses descubriendo lo mismo que el anterior. Cada decisión se vuelve a discutir porque nadie recuerda el porqué original. Eso es lo que rompe que tu empresa sea AI-first de verdad: no la IA, la falta de un cerebro común al que la IA pueda enchufarse.

La fórmula que está emergiendo: RAG + memoria estructurada

Dos piezas, una sobre la otra. RAG (búsqueda inteligente sobre tu información) le da al agente acceso a tus archivos: PDFs, contratos, normativas, emails, transcripciones. El agente busca, encuentra los fragmentos relevantes para cada pregunta y contesta citando. La pieza ya la conté en detalle en este post por si quieres entender exactamente qué es.

Memoria estructurada es la capa de arriba. No es buscar en archivos, es organizar el conocimiento vivo de la empresa: quién es cada cliente, qué se decidió en cada proyecto, qué pasos van con qué proceso, qué reglas operativas se aplican. Un wiki por dominio, un journal con decisiones del día, un status por cada frente activo. Cuando lo monté para mi propio Claude Code lo conté con la arquitectura completa, aquí está.

Juntas, las dos piezas dan algo nuevo. El agente no solo busca información estática (RAG) sino que también entiende el contexto y la historia de tu empresa (memoria). Y a cada conversación que pasa, el sistema aprende y se afina.

Dos modelos según el tamaño

Empresas muy grandes irán a agentes especializados por departamento o por sector. El agente de operaciones conoce las operaciones, el de legal conoce los contratos y la jurisprudencia interna, el de soporte conoce el histórico de tickets. Cada uno con su RAG local y su memoria, conectados entre sí para los casos que cruzan áreas.

Empresas medianas y pequeñas no necesitan tanto. Lo que les vale es un agente único para toda la empresa, alimentado por un RAG común y una memoria compartida. Más simple, más práctico, mismo principio. Lo importante no es elegir un modelo u otro, lo importante es entender que cualquiera de los dos descansa sobre las mismas dos piezas.

Por qué esto cambia el juego

Cuando una empresa tiene un agente así, pasan cuatro cosas que hoy no pasan.

Onboarding instantáneo. Un empleado nuevo no pasa tres meses descubriendo el contexto. Le pregunta al agente y el agente le cuenta cómo está montado todo, con cita a las fuentes.
Decisiones con contexto completo. Antes de cerrar nada, le preguntas al agente qué se decidió la última vez sobre algo parecido, qué pasó, qué hay registrado. No reinventas.
Conocimiento que no se evapora. Cuando alguien se va, su contexto operativo no se va con él. Está en el wiki, en el journal, en el RAG. El agente lo conserva.
Calidad de respuesta. Las respuestas están atadas a tu información real, no a la memoria del modelo. No hay alucinación, hay cita.

Eso es lo que diferencia una empresa AI-first sobre el papel de una empresa AI-first en serio.

Un caso vivo, ahora mismo

Estoy montando algo así para un despacho de cálculo estructural en Madrid. Tienen 10 GB de normativa (CTE, Eurocódigos, autonómica) y necesitan respuestas con cita exacta varias veces al día. La primera capa, la de RAG sobre la normativa, ya está: responde por correo en menos de un minuto.

El siguiente paso es la capa de memoria. Que el agente conozca el histórico de proyectos del despacho, las decisiones de cálculo que se tomaron antes, los criterios que el dueño quiere mantener. Cuando esa capa esté madura, el agente no solo contesta consultas: conoce cómo el despacho piensa. Eso a escala de empresa entera es lo que viene, y no para 2030, para los próximos meses.

Si crees que tu empresa va por ahí

La conversación interesante no es “queremos IA”. La conversación interesante es qué información tienes, dónde vive hoy, qué consultas repetidas hace tu equipo y qué pasos se tomarían para conectarlo todo al agente. En 30 minutos se ve por dónde empezar.

Diagnóstico rápido (5 minutos, sin llamada). Cuatro preguntas y te digo si tu empresa está en condiciones de empezar a montar esto o conviene resolver otras cosas antes. Empezar el diagnóstico →
Discovery (30 minutos por videollamada). Charla a fondo sobre qué tienes hoy, qué cuello de botella resolver primero, y un plan de arranque realista. Reservar discovery →