C
Contextología
Glosario

RAG

Retrieval-Augmented Generation: técnica que combina búsqueda de información en una base de conocimiento con generación de texto para producir respuestas precisas y verificables.

Qué es

RAG (Retrieval-Augmented Generation) es una arquitectura de sistema de IA que antes de generar una respuesta, busca información relevante en una base de conocimiento y la incluye en el contexto del modelo.

Por qué importa

Resuelve dos problemas fundamentales de los LLMs:

  1. El conocimiento del modelo está congelado en el tiempo (no sabe nada de después de su entrenamiento)
  2. El modelo no tiene acceso a tu información privada o específica del dominio

Con RAG, el modelo puede responder con información actualizada y específica sin necesidad de reentrenamiento.

Cómo funciona

  1. Tus documentos se indexan como embeddings en una vector database
  2. Cuando llega una pregunta, se convierte también en un embedding
  3. Se recuperan los fragmentos del documento más similares a la pregunta
  4. El modelo genera la respuesta usando esos fragmentos como contexto

Cuándo usar RAG

  • Cuando necesitas respuestas basadas en documentación propia o privada
  • Cuando la información cambia frecuentemente
  • Cuando necesitas que las respuestas sean verificables con fuentes concretas
  • Para reducir alucinaciones en dominios especializados

Componentes técnicos

  • Documentos fuente (PDFs, webs, bases de datos)
  • Modelo de embeddings
  • Vector database
  • Retriever (lógica de búsqueda)
  • LLM (generación final)

Términos relacionados

Pon en práctica lo que has aprendido

Tenemos una herramienta gratuita directamente relacionada con este concepto.

Checklist de RAG

Artículo relacionado

Qué es RAG

Recibe lo mejor de Contextología

Diseño de contexto, agentes y workflows de IA directamente en tu correo.