Module 5: Agent Architecture

Ruta de aprendizaje de sistemas agentic AI

Un mapa conciso para aprender agentes: loop, herramientas, memoria, planificación, aprobación, fiabilidad, routing y coordinación.

Notas del tema

Descripción general

Idea central

Agentic AI es un sistema de trabajo con límites, no un trabajador autónomo mágico.

Un agente observa, decide, actúa, revisa el resultado y después sigue, se detiene o pregunta a una persona.

Aprendé las capas en orden para que la autonomía siga siendo visible, testeable y responsable.

Escalera de aprendizaje

  1. Loop: objetivo, estado, acción, resultado.
  2. Herramientas: buscar, leer, escribir y llamar APIs con permisos claros.
  3. Memoria y estado: separar contexto actual, memoria durable, estado de tarea y ruido.
  4. Planificación: dividir trabajo en pasos sin tratar el plan como prueba.
  5. Aprobación: pedir revisión para acciones públicas, financieras, de cuentas, datos, reputación o irreversibles.
  6. Fiabilidad: testear comportamiento, inspeccionar fallas y detectar errores que suenan fluidos.
  7. Routing: elegir modelos según dificultad, riesgo, latencia y costo.
  8. Handoffs: usar varios agentes solo cuando la coordinación se pague sola.
  9. Artefactos: convertir aprendizaje privado en notas, diagramas, repos o reportes de fallas.

Ejemplo simple

Un asistente de investigación que crea una lista pública de lectura empieza con un objetivo y un loop: encontrar fuentes, leerlas, resumirlas, revisar si sirven y pedir revisión antes de publicar.

Las herramientas le permiten buscar y guardar notas. La memoria guarda el nivel del estudiante y los criterios de fuentes. La planificación separa descubrimiento, evaluación, borrador y revisión.

Cada capacidad nueva agrega una responsabilidad de verificación.

Guardrails

Esta ruta no defiende correr agentes por defecto. No es un atajo para saltarse revisión, permiso o responsabilidad. No es un manual interno de operaciones.

Mantené los ejemplos genéricos, reversibles y seguros para discutir en público.

Checkpoint de teach-back

Respondé con tus propias palabras:

  1. ¿Por qué el loop viene antes que las herramientas?
  2. ¿Qué cambia cuando un agente obtiene memoria o estado?
  3. ¿Qué acciones necesitan aprobación humana primero?
  4. ¿Cuándo varios agentes crean más costo de coordinación que valor?

Interpretación de Turtleand

Enseñá agentes como sistemas de trabajo con límites, no como personalidades autónomas. Agregá autonomía solo cuando la superficie de control esté clara.

Las futuras lecciones deberían volver a esta página cuando cubran loops, herramientas, memoria, planificación, evaluación, routing y coordinación.