C
Contextología
Guía pilar

Qué es Context Engineering

Context Engineering es la práctica de diseñar, seleccionar y organizar toda la información que recibe un sistema de IA. Va mucho más allá de escribir buenos prompts: abarca la memoria, los documentos, las herramientas, los ejemplos y el estado de la tarea.

Por qué el contexto lo es todo

Los modelos de lenguaje funcionan como expertos con amnesia. Cada vez que los invocas, empiezan desde cero. Todo lo que saben en ese momento — sobre ti, sobre la tarea, sobre el estado del mundo — viene del contexto que les proporcionas.

La implicación directa: un modelo mediocre con un contexto excelente supera a un modelo frontier con contexto deficiente. El contexto es la palanca de mayor impacto en la calidad de cualquier sistema de IA, y paradójicamente, es donde la mayoría de equipos invierte menos tiempo.

Context Engineering vs Prompt Engineering

Prompt Engineering

  • Diseñar instrucciones efectivas
  • Una sola llamada al modelo
  • Técnicas: CoT, few-shot, role...
  • Foco: el texto del prompt

Context Engineering

  • Diseñar el sistema de contexto completo
  • Bucles, agentes, pipelines
  • Memoria, RAG, tools, evals...
  • Foco: el sistema completo

La ventana de contexto como presupuesto

La ventana de contexto es finita. Claude maneja hasta 200K tokens; GPT-4o, 128K; Gemini 2.0 Flash, 1M tokens. Pero tener ventana grande no equivale a llenarlo todo. La calidad del contexto importa más que la cantidad.

Piensa en la ventana de contexto como un presupuesto. Cada elemento que añades tiene un coste (tokens) y debe justificarlo con valor aportado. El contexto ruidoso — información irrelevante, redundante o mal estructurada — degrada la calidad de las respuestas incluso si no supera el límite.

Regla práctica:Antes de añadir algo al contexto, pregunta: “¿Mejoraría la respuesta si el modelo no tuviera esto?” Si la respuesta es no, no lo incluyas.

Los 6 componentes del contexto

Un sistema de contexto bien diseñado combina estos elementos según la tarea.

📋

Instrucciones (System Prompt)

El conjunto de directivas que definen el rol, comportamiento, límites y formato del sistema. Es la base de todo contexto.

Rol explícito + tarea + restricciones + formatoMáximo 2.000 tokens para instrucciones baseSepara por secciones con headers claros
💾

Memoria

La información del pasado que se incluye en el contexto: historial de conversación, resúmenes, preferencias del usuario, estado de la tarea.

In-context: historial directo en el promptExterna: base de datos que se consultaSemántica: búsqueda vectorial por similitud
📚

Conocimiento (RAG)

Documentos, bases de conocimiento y datos que el modelo no tiene en su entrenamiento pero necesita para responder con precisión.

Chunking semántico > chunking por caracteresRetrieval híbrido (vectorial + BM25)Incluye siempre metadata y fuente
🔧

Herramientas (Tools)

Las funciones que el modelo puede llamar: búsqueda web, APIs, bases de datos, ejecución de código. Amplían lo que puede hacer.

Describe cada tool con precisión: nombre, cuándo usarla, parámetrosMenos tools bien descritas > más tools mal descritasSiempre valida el output de las tools antes de devolverlo al modelo
💡

Ejemplos (Few-shot)

Pares input/output que muestran al modelo cómo debe comportarse. Son el contexto de mayor densidad informativa.

3-5 ejemplos bien elegidos valen más que párrafos de instruccionesCubre el caso común, un edge case y uno negativoLos ejemplos deben ser representativos, no excepcionales
📊

Estado (State)

La información sobre el progreso de la tarea actual: pasos completados, decisiones tomadas, resultados intermedios. Crítico en agentes.

En agentes: serializa el estado entre iteracionesMantén el estado lo más compacto posibleIncluye solo lo relevante para los próximos pasos

Cómo diseñar un sistema de contexto

El proceso tiene cuatro fases iterativas:

  1. 1

    Define el objetivo y el usuario

    ¿Qué tarea debe completar el sistema? ¿Quién lo va a usar? ¿Cuál es el output esperado? Sin esto, el contexto no tiene dirección.

  2. 2

    Identifica qué información necesita el modelo

    Para completar la tarea, ¿qué debe saber el modelo que no tiene por defecto? Esto determina qué componentes necesitas.

  3. 3

    Diseña e implementa los componentes

    System prompt, memoria, RAG, tools, ejemplos — solo los que justifican su coste en tokens y complejidad.

  4. 4

    Evalúa y mejora con datos reales

    Define métricas antes de lanzar (faithfulness, task completion rate, latencia). Sin evals, mejoras a ciegas.

Errores más comunes

System prompt demasiado largo y genérico

Instrucciones que intentan cubrir todos los casos posibles en lugar de optimizar para el caso principal.

No incluir ejemplos

El few-shot learning es la técnica de mayor densidad informativa. Tres buenos ejemplos valen más que un párrafo de instrucciones.

RAG sin reranking

Recuperar los chunks más similares semánticamente no garantiza que sean los más relevantes. El reranking es el paso con mayor ROI.

Ignorar el estado en agentes

En pipelines multi-step, no serializar el estado entre pasos produce loops, pérdida de progreso y respuestas incoherentes.

Sin evals desde el día 1

No puedes mejorar lo que no mides. Los evals no son un lujo: son la única forma de saber si un cambio en el contexto mejoró o empeoró el sistema.

Herramientas para practicar

Profundizar más

Preguntas frecuentes

¿Qué es Context Engineering?+

Context Engineering es la práctica de diseñar, seleccionar y organizar toda la información que recibe un sistema de IA — instrucciones, memoria, herramientas, documentos, ejemplos — para que pueda responder y actuar mejor.

¿En qué se diferencia del Prompt Engineering?+

El Prompt Engineering se centra en escribir buenas instrucciones. El Context Engineering abarca el sistema completo: qué información llega al modelo, cuándo, cómo está estructurada, qué herramientas tiene y cómo se evalúa. El prompt es un componente del contexto, no todo el contexto.

¿Por qué es importante el Context Engineering?+

Porque los modelos de IA son tan buenos como el contexto que reciben. Un modelo mediocre con un excelente sistema de contexto supera a un modelo frontier con contexto deficiente. El contexto es la palanca de mayor impacto en la calidad de un sistema de IA.

¿Cuánto contexto puede manejar un LLM?+

Depende del modelo. Claude puede manejar hasta 200.000 tokens (~150.000 palabras). GPT-4o, hasta 128K tokens. Gemini 2.0 Flash llega a 1M tokens. Pero tener ventana grande no significa usarla toda: más contexto relevante es mejor que más contexto ruidoso.

¿Necesito saber programar para aplicar Context Engineering?+

Para diseñar el sistema sí es necesario entender los componentes. Para implementarlo en producción, se necesita algo de código. Pero muchos conceptos — cómo estructurar un system prompt, qué memorizar, qué recuperar — se pueden aplicar incluso en herramientas no-code.

Recibe lo mejor de Contextología

Diseño de contexto, agentes y workflows de IA directamente en tu correo.