Cómo diseñar un agente de IA paso a paso

Antes de empezar: la pregunta más importante

¿Necesitas realmente un agente?

Un agente añade complejidad. Si una sola llamada al modelo resuelve tu problema, no necesitas un agente. Si el proceso tiene pasos predecibles y fijos, un workflow simple es mejor.

Usa un agente cuando la tarea requiera adaptación dinámica, herramientas externas o decisiones que no se pueden predecir de antemano.

Paso 1: Define el objetivo con precisión

Un agente mal definido es un agente que falla. Antes de escribir código o prompts, responde:

¿Qué tarea concreta debe completar? (no "ayudar con ventas" — "calificar leads entrantes según estos 5 criterios")
¿Cuál es el output esperado? (formato, longitud, estructura)
¿Qué significa que el agente haya tenido éxito? (esto se convierte en tus evals)
¿Qué no debe hacer nunca? (esto se convierte en tus guardrails)

Paso 2: Diseña el system prompt

El system prompt es la base del agente. Incluye:

# Rol
Eres [nombre del agente], un asistente especializado en [dominio].
Tu objetivo es [tarea específica].

# Contexto
[Información relevante del dominio que necesita el agente]

# Herramientas disponibles
Tienes acceso a: [lista de herramientas y para qué sirven]

# Proceso
Para completar cada tarea:
1. [Paso 1]
2. [Paso 2]
3. [Paso 3]

# Límites
- Nunca [límite 1]
- Si ocurre [situación], [acción a tomar]

# Formato de output
[Cómo debe presentar los resultados]

Paso 3: Define las herramientas

Cada herramienta debe tener:

Nombre descriptivo: search_knowledge_base, no tool_1
Descripción clara: el modelo la usa para decidir cuándo usarla
Parámetros bien tipados: nombres, tipos y descripciones de cada parámetro
Output predecible: el modelo debe poder interpretar la respuesta

Define solo las herramientas necesarias. Más herramientas = más complejidad = más errores potenciales.

Paso 4: Diseña la memoria

¿Qué necesita recordar el agente?

Memoria de conversación: los últimos N mensajes (la mayoría de frameworks lo hacen automáticamente)
Memoria de sesión: estado del progreso en una tarea larga
Memoria persistente: información sobre el usuario o contexto que sobrevive entre sesiones
Memoria semántica: base de conocimiento consultable vía RAG

Empieza simple: solo memoria de conversación. Añade más capas cuando la necesites.

Paso 5: Implementa los guardrails

Los guardrails van en dos niveles:

En el system prompt: instrucciones explícitas sobre comportamiento En el código: validación programática que no depende del modelo

Mínimo indispensable:

Límite de pasos/iteraciones (evitar bucles infinitos)
Validación de herramientas antes de ejecutarlas
Manejo de errores cuando una herramienta falla
Timeout para tareas largas

Paso 6: Define tus evals

¿Cómo sabes si el agente funciona bien? Necesitas casos de prueba concretos:

10 ejemplos de casos normales esperados
5 casos extremos o difíciles
5 casos donde el agente debería negarse o escalar

Para cada caso: input → output esperado → criterio de evaluación.

Paso 7: Itera

Un agente nunca está terminado en el primer intento. El proceso real es:

Prototipo rápido con system prompt básico
Prueba con casos reales
Identifica fallos específicos
Mejora el system prompt, las herramientas o los guardrails
Vuelve al paso 2

La mayoría de mejoras vienen de observar fallos reales, no de teorizar.

Checklist de diseño

[ ] Objetivo definido con precisión
[ ] Output esperado especificado
[ ] Criterios de éxito claros (evals)
[ ] System prompt con rol, contexto, proceso y límites
[ ] Herramientas con nombres, descripciones y parámetros bien definidos
[ ] Memoria adecuada al caso de uso
[ ] Guardrails en system prompt Y en código
[ ] Casos de prueba antes del lanzamiento
[ ] Plan de monitorización en producción

Siguiente: Cómo crear una base de conocimiento para IA