Jonatan Matajonmatum.com
conceptosnotasexperimentosensayos
© 2026 Jonatan Mata. All rights reserved.v2.1.1
Conceptos

Sistemas Multi-Agente

Arquitecturas donde múltiples agentes de IA especializados colaboran, compiten o se coordinan para resolver problemas complejos que exceden la capacidad de un solo agente.

evergreen#multi-agent#ai-agents#orchestration#collaboration#swarm#a2a

¿Qué es?

Un sistema multi-agente es una arquitectura donde múltiples agentes de IA especializados trabajan juntos para resolver problemas complejos. Cada agente tiene un rol, herramientas y conocimiento específico, y se coordinan mediante patrones de comunicación definidos.

La idea no es nueva — viene de la investigación en sistemas distribuidos de los 90s — pero los LLMs la han revitalizado al hacer posible agentes que se comunican en lenguaje natural.

Topologías de coordinación

Orquestador centralizado

Un agente principal delega tareas a agentes especializados:

Orquestador
├── Agente de investigación
├── Agente de código
└── Agente de revisión

Ventaja: control claro. Desventaja: cuello de botella en el orquestador.

Swarm (enjambre)

Agentes autónomos que se pasan el control entre sí según reglas:

Agente A → (condición) → Agente B → (condición) → Agente C

Ventaja: flexible, descentralizado. Desventaja: difícil de debuggear.

Debate/Competencia

Múltiples agentes proponen soluciones y un juez selecciona la mejor:

Agente 1 → Propuesta
Agente 2 → Propuesta    → Juez → Mejor solución
Agente 3 → Propuesta

Grafo de agentes

Agentes conectados en un grafo dirigido con flujos condicionales:

Entrada → Clasificador → [Ruta A: Agente 1 → Agente 2]
                        → [Ruta B: Agente 3]
                        → Sintetizador → Salida

Ejemplo: agents-as-tools con Strands

El patrón agents-as-tools convierte cada agente especializado en una herramienta que el orquestador puede invocar. Con Strands Agents:

from strands import Agent
from strands.models.bedrock import BedrockModel
 
# Agentes especializados
researcher = Agent(
    model=BedrockModel(model_id="anthropic.claude-sonnet-4-20250514"),
    system_prompt="Eres un investigador. Busca información técnica precisa.",
    tools=[web_search, arxiv_search],
)
 
reviewer = Agent(
    model=BedrockModel(model_id="anthropic.claude-sonnet-4-20250514"),
    system_prompt="Eres un revisor técnico. Verifica claims y detecta errores.",
    tools=[fact_check],
)
 
# Orquestador que usa agentes como herramientas
orchestrator = Agent(
    model=BedrockModel(model_id="anthropic.claude-sonnet-4-20250514"),
    system_prompt=(
        "Coordinas un equipo de agentes. "
        "Usa 'researcher' para buscar información y 'reviewer' para verificarla."
    ),
    tools=[researcher.as_tool(), reviewer.as_tool()],
)
 
result = orchestrator("Investiga las mejores prácticas de prompt caching y verifica los datos")

Cada agente mantiene su propio contexto y herramientas. El orquestador decide cuándo invocar a cada uno basándose en la tarea.

Frameworks

FrameworkEnfoqueTopología principal
Strands AgentsAgents-as-tools, graph, swarmOrquestador + grafo
CrewAIRoles y tareas estructuradasOrquestador
AutoGenConversaciones multi-agenteSwarm
LangGraphGrafos de estado con agentesGrafo

Modos de fallo y recuperación

Los sistemas multi-agente introducen modos de fallo que no existen en agentes individuales:

FalloCausaRecuperación
Cascada de erroresUn agente falla y los dependientes tambiénCircuit breaker por agente, fallback a respuesta parcial
DeadlockDos agentes esperan la respuesta del otroTimeouts por interacción, detección de ciclos
DivergenciaAgentes producen resultados contradictoriosAgente juez que resuelve conflictos, votación por mayoría
Explosión de costosAgentes que se invocan recursivamenteLímite de profundidad, presupuesto de tokens por tarea
Context driftEl contexto compartido se degrada entre iteracionesResumen periódico del estado, checkpoints

Análisis de costos

El costo de un sistema multi-agente crece multiplicativamente:

Costo ≈ N_agentes × promedio_tokens_por_agente × precio_por_token × iteraciones

Un orquestador con 3 agentes especializados que hacen 2 iteraciones cada uno consume aproximadamente 6-8x más tokens que un solo agente resolviendo la misma tarea. La pregunta clave: ¿la mejora en calidad justifica el costo adicional?

Estrategias para controlar costos:

  • Usar modelos más pequeños para agentes de tareas simples (clasificación, extracción)
  • Limitar el contexto que se pasa entre agentes (solo lo relevante, no toda la conversación)
  • Establecer presupuestos de tokens por tarea con circuit breakers

¿Cuándo usar multi-agente vs. agente único?

CriterioAgente únicoMulti-agente
Tarea homogénea✓Overkill
Múltiples dominios de expertiseContexto insuficiente✓
Necesidad de verificación cruzadaNo posible✓
Presupuesto limitado de tokens✓Costoso
Subtareas independientesSecuencial✓ (paralelo)

¿Por qué importa?

Los sistemas multi-agente permiten descomponer tareas complejas en subtareas especializadas, donde cada agente tiene su propio contexto, herramientas y modelo. Pero no son la solución por defecto — un solo agente bien configurado resuelve la mayoría de problemas. Multi-agente se justifica cuando la tarea genuinamente requiere expertise diverso, verificación cruzada o procesamiento paralelo de subtareas independientes.

Referencias

  • Large Language Model based Multi-Agents: A Survey of Progress and Challenges — Tao et al., 2024. Survey completo de sistemas multi-agente basados en LLMs.
  • Communicative Agents for Software Development — Qian et al., 2023. ChatDev: agentes que colaboran para desarrollar software.
  • Agent-to-Agent Protocol — Google, 2025. Protocolo abierto para comunicación entre agentes.
  • AutoGen: Enabling Next-Gen LLM Applications — Wu et al., 2023. Framework de Microsoft para sistemas multi-agente.
  • Strands Agents — AWS, 2025. SDK de agentes con soporte nativo para agents-as-tools, graph y swarm.

Contenido relacionado

  • Agentes de IA

    Sistemas autónomos que combinan modelos de lenguaje con razonamiento, memoria y uso de herramientas para ejecutar tareas complejas de múltiples pasos con mínima intervención humana.

  • Strands Agents

    SDK open source de AWS para construir agentes de IA con un enfoque model-driven. Agentes funcionales en pocas líneas de código, con soporte multi-modelo, herramientas personalizadas, MCP, multi-agente y observabilidad integrada.

  • Flujos de Trabajo Agénticos

    Patrones de diseño donde agentes de IA ejecutan tareas complejas de múltiples pasos de forma autónoma, combinando razonamiento, uso de herramientas y toma de decisiones iterativa.

  • Orquestación de IA

    Patrones y frameworks para coordinar múltiples modelos de IA, herramientas y fuentes de datos en pipelines de producción, gestionando el flujo entre componentes, la memoria y la recuperación de errores.

  • Agente de Contenido con Strands y Bedrock

    Sistema de tres agentes que automatiza el ciclo de vida de contenido MDX bilingüe: auditoría QA determinística, correcciones quirúrgicas y upgrades completos — todo orquestado con Strands Agents, Claude Sonnet 4 en Amazon Bedrock y GitHub Actions con patrón diamante.

Conceptos