AI Agents

¿Qué son?

Un agente de IA es un sistema que utiliza un modelo de lenguaje como núcleo de razonamiento, pero va más allá de responder preguntas: puede planificar, ejecutar acciones, observar resultados y ajustar su comportamiento en un ciclo cerrado.

La diferencia fundamental entre un chatbot y un agente es la autonomía. Un chatbot responde a una pregunta y espera la siguiente. Un agente recibe un objetivo, descompone el problema, decide qué herramientas usar, ejecuta pasos intermedios y entrega un resultado — todo con mínima intervención humana.

Componentes de un agente

Un agente típico tiene cuatro componentes:

Modelo de lenguaje (LLM): el cerebro que razona, planifica y genera texto. Decide qué hacer en cada paso.
Memoria: almacena el contexto de la conversación, resultados previos y conocimiento acumulado. Puede ser de corto plazo (ventana de contexto) o largo plazo (bases de datos vectoriales, archivos).
Herramientas (Tools): funciones externas que el agente puede invocar — APIs, bases de datos, sistemas de archivos, navegadores, terminales. El Model Context Protocol (MCP) estandariza cómo los agentes acceden a estas herramientas.
Bucle de ejecución: el ciclo de razonamiento-acción-observación que el agente repite hasta completar la tarea.

Patrones de ejecución

ReAct (Reason + Act)

El patrón más común. El agente alterna entre razonar sobre qué hacer y ejecutar acciones:

Pensamiento: Necesito buscar el precio actual de AAPL
Acción: buscar_precio(ticker="AAPL")
Observación: $187.50
Pensamiento: Ahora puedo responder al usuario
Respuesta: El precio actual de AAPL es $187.50

Planificación y ejecución

El agente primero crea un plan completo y luego ejecuta cada paso. Útil para tareas complejas donde el orden importa.

Multi-agente

Múltiples agentes especializados colaboran para resolver un problema. Cada agente tiene un rol específico (investigador, escritor, revisor) y se comunican entre sí.

Frameworks actuales

Framework	Lenguaje	Enfoque
LangGraph	Python	Grafos de estado para flujos agenticos
CrewAI	Python	Equipos de agentes con roles
Strands Agents	Python	Agentes modulares de AWS
AutoGen	Python	Conversaciones multi-agente
Vercel AI SDK	TypeScript	Agentes en aplicaciones web

Limitaciones actuales

Fiabilidad: los agentes pueden entrar en bucles, tomar decisiones incorrectas o alucinar sobre el estado del mundo.
Costo: cada paso del bucle consume tokens. Una tarea compleja puede requerir decenas de llamadas al modelo.
Seguridad: un agente con acceso a herramientas puede ejecutar acciones destructivas si no se limita adecuadamente.
Observabilidad: depurar por qué un agente tomó una decisión específica es difícil. Los traces y logs son esenciales.

Referencias

LLM Powered Autonomous Agents — Lilian Weng (OpenAI), 2023. Referencia fundacional sobre arquitectura de agentes.
ReAct: Synergizing Reasoning and Acting in Language Models — Yao et al., 2022. El paper que formalizó el patrón ReAct.
The Landscape of Emerging AI Agent Architectures — Masterman et al., 2024. Survey de arquitecturas de agentes.
LangGraph Documentation — Framework de referencia para agentes basados en grafos.