Multi-Agent Systems

¿Qué es?

Un sistema multi-agente es una arquitectura donde múltiples agentes de IA especializados trabajan juntos para resolver problemas complejos. Cada agente tiene un rol, herramientas y conocimiento específico, y se coordinan mediante patrones de comunicación definidos.

La idea no es nueva — viene de la investigación en sistemas distribuidos de los 90s — pero los LLMs la han revitalizado al hacer posible agentes que se comunican en lenguaje natural.

Topologías de coordinación

Orquestador centralizado

Un agente principal delega tareas a agentes especializados:

Orquestador
├── Agente de investigación
├── Agente de código
└── Agente de revisión

Ventaja: control claro. Desventaja: cuello de botella en el orquestador.

Swarm (enjambre)

Agentes autónomos que se pasan el control entre sí según reglas:

Agente A → (condición) → Agente B → (condición) → Agente C

Ventaja: flexible, descentralizado. Desventaja: difícil de debuggear.

Debate/Competencia

Múltiples agentes proponen soluciones y un juez selecciona la mejor:

Agente 1 → Propuesta
Agente 2 → Propuesta    → Juez → Mejor solución
Agente 3 → Propuesta

Grafo de agentes

Agentes conectados en un grafo dirigido con flujos condicionales:

Entrada → Clasificador → [Ruta A: Agente 1 → Agente 2]
                        → [Ruta B: Agente 3]
                        → Sintetizador → Salida

Ejemplo: agents-as-tools con Strands

El patrón agents-as-tools convierte cada agente especializado en una herramienta que el orquestador puede invocar. Con Strands Agents:

from strands import Agent
from strands.models.bedrock import BedrockModel
 
# Agentes especializados
researcher = Agent(
    model=BedrockModel(model_id="anthropic.claude-sonnet-4-20250514"),
    system_prompt="Eres un investigador. Busca información técnica precisa.",
    tools=[web_search, arxiv_search],
)
 
reviewer = Agent(
    model=BedrockModel(model_id="anthropic.claude-sonnet-4-20250514"),
    system_prompt="Eres un revisor técnico. Verifica claims y detecta errores.",
    tools=[fact_check],
)
 
# Orquestador que usa agentes como herramientas
orchestrator = Agent(
    model=BedrockModel(model_id="anthropic.claude-sonnet-4-20250514"),
    system_prompt=(
        "Coordinas un equipo de agentes. "
        "Usa 'researcher' para buscar información y 'reviewer' para verificarla."
    ),
    tools=[researcher.as_tool(), reviewer.as_tool()],
)
 
result = orchestrator("Investiga las mejores prácticas de prompt caching y verifica los datos")

Cada agente mantiene su propio contexto y herramientas. El orquestador decide cuándo invocar a cada uno basándose en la tarea.

Frameworks

Framework	Enfoque	Topología principal
Strands Agents	Agents-as-tools, graph, swarm	Orquestador + grafo
CrewAI	Roles y tareas estructuradas	Orquestador
AutoGen	Conversaciones multi-agente	Swarm
LangGraph	Grafos de estado con agentes	Grafo

Modos de fallo y recuperación

Los sistemas multi-agente introducen modos de fallo que no existen en agentes individuales:

Fallo	Causa	Recuperación
Cascada de errores	Un agente falla y los dependientes también	Circuit breaker por agente, fallback a respuesta parcial
Deadlock	Dos agentes esperan la respuesta del otro	Timeouts por interacción, detección de ciclos
Divergencia	Agentes producen resultados contradictorios	Agente juez que resuelve conflictos, votación por mayoría
Explosión de costos	Agentes que se invocan recursivamente	Límite de profundidad, presupuesto de tokens por tarea
Context drift	El contexto compartido se degrada entre iteraciones	Resumen periódico del estado, checkpoints

Análisis de costos

El costo de un sistema multi-agente crece multiplicativamente:

Costo ≈ N_agentes × promedio_tokens_por_agente × precio_por_token × iteraciones

Un orquestador con 3 agentes especializados que hacen 2 iteraciones cada uno consume aproximadamente 6-8x más tokens que un solo agente resolviendo la misma tarea. La pregunta clave: ¿la mejora en calidad justifica el costo adicional?

Estrategias para controlar costos:

Usar modelos más pequeños para agentes de tareas simples (clasificación, extracción)
Limitar el contexto que se pasa entre agentes (solo lo relevante, no toda la conversación)
Establecer presupuestos de tokens por tarea con circuit breakers

¿Cuándo usar multi-agente vs. agente único?

Criterio	Agente único	Multi-agente
Tarea homogénea	✓	Overkill
Múltiples dominios de expertise	Contexto insuficiente	✓
Necesidad de verificación cruzada	No posible	✓
Presupuesto limitado de tokens	✓	Costoso
Subtareas independientes	Secuencial	✓ (paralelo)

¿Por qué importa?

Los sistemas multi-agente permiten descomponer tareas complejas en subtareas especializadas, donde cada agente tiene su propio contexto, herramientas y modelo. Pero no son la solución por defecto — un solo agente bien configurado resuelve la mayoría de problemas. Multi-agente se justifica cuando la tarea genuinamente requiere expertise diverso, verificación cruzada o procesamiento paralelo de subtareas independientes.

Referencias

Large Language Model based Multi-Agents: A Survey of Progress and Challenges — Tao et al., 2024. Survey completo de sistemas multi-agente basados en LLMs.
Communicative Agents for Software Development — Qian et al., 2023. ChatDev: agentes que colaboran para desarrollar software.
Agent-to-Agent Protocol — Google, 2025. Protocolo abierto para comunicación entre agentes.
AutoGen: Enabling Next-Gen LLM Applications — Wu et al., 2023. Framework de Microsoft para sistemas multi-agente.
Strands Agents — AWS, 2025. SDK de agentes con soporte nativo para agents-as-tools, graph y swarm.

¿Qué es?

La idea no es nueva — viene de la investigación en sistemas distribuidos de los 90s — pero los LLMs la han revitalizado al hacer posible agentes que se comunican en lenguaje natural.

Topologías de coordinación

Orquestador centralizado

Un agente principal delega tareas a agentes especializados:

Orquestador
├── Agente de investigación
├── Agente de código
└── Agente de revisión

Ventaja: control claro. Desventaja: cuello de botella en el orquestador.

Swarm (enjambre)

Agentes autónomos que se pasan el control entre sí según reglas:

Agente A → (condición) → Agente B → (condición) → Agente C

Ventaja: flexible, descentralizado. Desventaja: difícil de debuggear.

Debate/Competencia

Múltiples agentes proponen soluciones y un juez selecciona la mejor:

Agente 1 → Propuesta
Agente 2 → Propuesta    → Juez → Mejor solución
Agente 3 → Propuesta

Grafo de agentes

Agentes conectados en un grafo dirigido con flujos condicionales:

Entrada → Clasificador → [Ruta A: Agente 1 → Agente 2]
                        → [Ruta B: Agente 3]
                        → Sintetizador → Salida

Ejemplo: agents-as-tools con Strands

El patrón agents-as-tools convierte cada agente especializado en una herramienta que el orquestador puede invocar. Con Strands Agents:

from strands import Agent
from strands.models.bedrock import BedrockModel
 
# Agentes especializados
researcher = Agent(
    model=BedrockModel(model_id="anthropic.claude-sonnet-4-20250514"),
    system_prompt="Eres un investigador. Busca información técnica precisa.",
    tools=[web_search, arxiv_search],
)
 
reviewer = Agent(
    model=BedrockModel(model_id="anthropic.claude-sonnet-4-20250514"),
    system_prompt="Eres un revisor técnico. Verifica claims y detecta errores.",
    tools=[fact_check],
)
 
# Orquestador que usa agentes como herramientas
orchestrator = Agent(
    model=BedrockModel(model_id="anthropic.claude-sonnet-4-20250514"),
    system_prompt=(
        "Coordinas un equipo de agentes. "
        "Usa 'researcher' para buscar información y 'reviewer' para verificarla."
    ),
    tools=[researcher.as_tool(), reviewer.as_tool()],
)
 
result = orchestrator("Investiga las mejores prácticas de prompt caching y verifica los datos")

Cada agente mantiene su propio contexto y herramientas. El orquestador decide cuándo invocar a cada uno basándose en la tarea.

Frameworks

Framework	Enfoque	Topología principal
Strands Agents	Agents-as-tools, graph, swarm	Orquestador + grafo
CrewAI	Roles y tareas estructuradas	Orquestador
AutoGen	Conversaciones multi-agente	Swarm
LangGraph	Grafos de estado con agentes	Grafo

Modos de fallo y recuperación

Los sistemas multi-agente introducen modos de fallo que no existen en agentes individuales:

Fallo	Causa	Recuperación
Cascada de errores	Un agente falla y los dependientes también	Circuit breaker por agente, fallback a respuesta parcial
Deadlock	Dos agentes esperan la respuesta del otro	Timeouts por interacción, detección de ciclos
Divergencia	Agentes producen resultados contradictorios	Agente juez que resuelve conflictos, votación por mayoría
Explosión de costos	Agentes que se invocan recursivamente	Límite de profundidad, presupuesto de tokens por tarea
Context drift	El contexto compartido se degrada entre iteraciones	Resumen periódico del estado, checkpoints

Análisis de costos

El costo de un sistema multi-agente crece multiplicativamente:

Costo ≈ N_agentes × promedio_tokens_por_agente × precio_por_token × iteraciones

Estrategias para controlar costos:

Usar modelos más pequeños para agentes de tareas simples (clasificación, extracción)
Limitar el contexto que se pasa entre agentes (solo lo relevante, no toda la conversación)
Establecer presupuestos de tokens por tarea con circuit breakers

¿Cuándo usar multi-agente vs. agente único?

Criterio	Agente único	Multi-agente
Tarea homogénea	✓	Overkill
Múltiples dominios de expertise	Contexto insuficiente	✓
Necesidad de verificación cruzada	No posible	✓
Presupuesto limitado de tokens	✓	Costoso
Subtareas independientes	Secuencial	✓ (paralelo)

¿Por qué importa?

Referencias

Large Language Model based Multi-Agents: A Survey of Progress and Challenges — Tao et al., 2024. Survey completo de sistemas multi-agente basados en LLMs.
Communicative Agents for Software Development — Qian et al., 2023. ChatDev: agentes que colaboran para desarrollar software.
Agent-to-Agent Protocol — Google, 2025. Protocolo abierto para comunicación entre agentes.
AutoGen: Enabling Next-Gen LLM Applications — Wu et al., 2023. Framework de Microsoft para sistemas multi-agente.
Strands Agents — AWS, 2025. SDK de agentes con soporte nativo para agents-as-tools, graph y swarm.

Sistemas Multi-Agente

¿Qué es?

Topologías de coordinación

Orquestador centralizado

Swarm (enjambre)

Debate/Competencia

Grafo de agentes

Ejemplo: agents-as-tools con Strands

Frameworks

Modos de fallo y recuperación

Análisis de costos

¿Cuándo usar multi-agente vs. agente único?

¿Por qué importa?

Referencias

Contenido relacionado

Sistemas Multi-Agente

¿Qué es?

Topologías de coordinación

Orquestador centralizado

Swarm (enjambre)

Debate/Competencia

Grafo de agentes

Ejemplo: agents-as-tools con Strands

Frameworks

Modos de fallo y recuperación

Análisis de costos

¿Cuándo usar multi-agente vs. agente único?

¿Por qué importa?

Referencias

Contenido relacionado