Sistemas multi-agente: cuándo usarlos y cómo diseñarlos
2 de mayo de 2025· 5 min read
La mayoría de los problemas no necesitan múltiples agentes. Pero los que sí los necesitan, los necesitan de verdad.
Un sistema multi-agente bien diseñado puede hacer cosas que un único agente no puede: ejecutar tareas en paralelo, especializar el conocimiento, superar el límite de la context window, y añadir capas de verificación.
Cuándo tiene sentido un sistema multi-agente
Un solo agente es suficiente si la tarea:
- Cabe en una sola context window
- Tiene pasos secuenciales sin paralelismo útil
- No requiere conocimiento altamente especializado en dominios diferentes
Necesitas múltiples agentes cuando:
La tarea es demasiado larga para una sola ventana — Analizar 50 documentos, procesar un repositorio de código entero, investigar un tema desde múltiples fuentes.
Partes de la tarea se pueden hacer en paralelo — Mientras un agente busca en base de datos, otro consulta una API externa, otro genera el borrador.
Requiere conocimiento especializado diferente — Un agente experto en código, otro en redacción, otro en verificación de datos.
Quieres verificación independiente — Un agente genera, otro crítica. El resultado es mejor que si el mismo agente hace las dos cosas.
Los 4 patrones principales
1. Orquestador + Subagentes
Un agente central recibe la tarea, la divide, delega a subagentes especializados y consolida resultados.
Usuario → Orquestador → [Agente investigación]
→ [Agente redacción]
→ [Agente verificación]
↓
Respuesta consolidada
Es el patrón más común. El orquestador no necesita saber hacer las tareas; solo necesita saber a quién delegarlas.
2. Pipeline secuencial
Los agentes se encadenan: la salida de uno es la entrada del siguiente.
[Extracción] → [Análisis] → [Síntesis] → [Formato] → Resultado
Útil cuando hay etapas claras con transformaciones sucesivas. Fácil de debuggear porque puedes inspeccionar el estado entre cada agente.
3. Paralelo + Agregador
Varios agentes trabajan simultáneamente sobre el mismo problema o partes diferentes, y un agente agrega los resultados.
Input → [Agente 1] ↘
→ [Agente 2] → Agregador → Output
→ [Agente 3] ↗
Útil para: análisis de múltiples documentos, consultas a múltiples fuentes, generación de múltiples propuestas para elegir la mejor.
4. Debate / Crítica
Un agente genera, otro critica, el primero refina. Puede haber varias rondas.
[Generador] → borrador → [Crítico] → feedback → [Generador] → versión final
Produce resultados de mayor calidad a cambio de más latencia y costo. Vale la pena para tareas donde la calidad importa más que la velocidad.
Coordinación: cómo los agentes se comunican
Por mensajes (message passing)
Los agentes se comunican enviando mensajes estructurados. Cada agente tiene una cola de entrada y salida.
Por estado compartido
Los agentes leen y escriben en un estado compartido (un objeto, una base de datos):
estado = {
"tarea_original": "...",
"subtareas": [...],
"resultados": {},
"estado_actual": "investigando"
}
Cada agente actualiza su parte del estado. El orquestador lee el estado para decidir qué sigue.
Por herramientas
Un agente "llama" a otro como si fuera una herramienta:
tools = [
{
"name": "agente_investigacion",
"description": "Busca información sobre un tema",
"parameters": {"query": "string"}
}
]
Esta abstracción es limpia: desde el punto de vista del agente orquestador, no importa si es una función, una API o otro LLM.
Gestión del contexto en sistemas multi-agente
El problema central: ¿qué sabe cada agente?
Contexto mínimo: Cada agente recibe solo lo necesario para su subtarea. Más eficiente, menos riesgo de confusión.
Contexto completo: Todos los agentes ven todo. Más coherencia, más tokens, más caro.
Contexto jerárquico: El orquestador tiene el contexto completo. Los subagentes solo reciben lo relevante para ellos.
La regla práctica: dale a cada agente el contexto mínimo necesario para hacer bien su trabajo.
Fallos comunes
El orquestador sobrecomplex — Si el agente orquestador tiene que tomar demasiadas decisiones complejas, simplifica la arquitectura o añade un subagente para la lógica de decisión.
Loops infinitos — Sin límites de iteraciones, los agentes pueden seguir pasándose la tarea. Siempre pon un máximo de rondas.
Estado inconsistente — Si varios agentes modifican el mismo estado sin coordinación, pierdes coherencia. Usa escrituras atómicas o un agente coordinador de estado.
Sin mecanismo de fallo — Define qué pasa cuando un subagente falla. ¿Reintenta? ¿El orquestador maneja el error? ¿Se para todo?
Costo descontrolado — Los sistemas multi-agente multiplican el costo por número de agentes y rondas. Mide antes de poner en producción.
Herramientas
- LangGraph — framework de grafos para agentes, bueno para flujos con estado
- CrewAI — abstracción de alto nivel para equipos de agentes
- AutoGen (Microsoft) — sistema de conversaciones entre agentes
- Claude con tool use — puedes implementar multi-agente directamente con la API de Anthropic usando herramientas
¿Empezar con multi-agente o con un solo agente?
Siempre empieza con el sistema más simple posible.
Un solo agente bien construido supera a un sistema multi-agente mal diseñado. La complejidad de coordinar agentes introduce puntos de fallo, latencia y costo.
Añade agentes cuando tengas evidencia de que el sistema simple no puede hacer el trabajo, no como arquitectura de partida.
Recursos relacionados:
- Canvas de diseño de agente — diseña tu arquitectura multi-agente
- Checklist de Agente de IA — 35 puntos antes de ir a producción
- Qué es un agente de IA — los fundamentos
- Qué es tool calling — cómo los agentes usan herramientas
Pon en práctica lo que has aprendido
Canvas de diseño de agente
Diseña sistemas multi-agente con el canvas interactivo.
Abrir herramienta gratuita →Artículos relacionados
Qué es MCP y por qué importa
MCP (Model Context Protocol) es el estándar abierto para conectar modelos de IA con herramientas y fuentes de datos. Aprende qué es, cómo funciona y por qué está cambiando la forma en que se construyen agentes.
Qué es tool calling o function calling
Tool calling es la capacidad de un modelo de IA para invocar herramientas externas durante la generación. Aprende cómo funciona, para qué sirve y cuál es la diferencia con function calling.
Qué es un agente de IA y cómo funciona
Un agente de IA es un sistema que percibe su entorno, toma decisiones y actúa de forma autónoma. Aprende qué es, cómo funciona por dentro y cuándo usarlo.
Recibe lo mejor de Contextología
Diseño de contexto, agentes y workflows de IA directamente en tu correo.