Context Window
La cantidad máxima de texto (medida en tokens) que un modelo de lenguaje puede procesar en una sola llamada.
Qué es
La context window es el límite de cuánto texto puede "ver" y procesar un modelo de IA en una sola interacción. Todo lo que ocurre en una conversación — system prompt, mensajes, documentos, resultados de herramientas — consume espacio de la context window.
Por qué importa
Si el texto supera el límite de la context window, el modelo no puede procesar todo a la vez. Hay que decidir qué cabe y qué no, o usar técnicas como RAG para recuperar solo lo relevante en lugar de cargar todo el documento.
Cómo se mide
Se mide en tokens. Aproximadamente:
- 1 token ≈ 0.75 palabras en inglés
- 1 token ≈ 0.5-0.6 palabras en español
- 100 tokens ≈ 75 palabras en inglés
Context windows actuales (2026)
| Modelo | Context window | |---|---| | Claude Sonnet/Opus | 200,000 tokens (~150,000 palabras) | | GPT-4o | 128,000 tokens (~96,000 palabras) | | Gemini 1.5 Pro | 1,000,000 tokens |
Implicaciones para el diseño
Una context window grande no significa que todo quepa bien. Los modelos procesan mejor la información al principio y al final del contexto. Información crítica en el medio tiende a ser "olvidada" en práctica.
Por eso RAG sigue siendo útil aunque la context window sea grande: es mejor recuperar los 5 fragmentos más relevantes que cargar 500 páginas de documentación.
Errores comunes
- Asumir que más contexto siempre es mejor
- No calcular cuántos tokens consumen el system prompt, el historial y los documentos
- Sorprenderse cuando el modelo no recuerda algo que estaba al principio de una conversación muy larga
Términos relacionados
Pon en práctica lo que has aprendido
Tenemos una herramienta gratuita directamente relacionada con este concepto.
Analizador de context window →Artículo relacionado
→ Qué es Context EngineeringTérminos relacionados
Context Engineering
La práctica de diseñar, seleccionar y organizar la información que recibe un sistema de IA para que pueda responder o actuar mejor.
LLM
Large Language Model: modelo de lenguaje de gran escala entrenado con enormes cantidades de texto para entender y generar lenguaje natural.
Memory
Capacidad de un sistema de IA para recordar información de conversaciones o sesiones anteriores, permitiendo continuidad y personalización.
Tokens
Unidades básicas de texto que usan los modelos de lenguaje para procesar información. Los costes de API y los límites de context window se miden en tokens.
Recibe lo mejor de Contextología
Diseño de contexto, agentes y workflows de IA directamente en tu correo.