Idea central
Agentic AI es un sistema de trabajo con límites, no un trabajador autónomo mágico.
Un agente observa, decide, actúa, revisa el resultado y después sigue, se detiene o pregunta a una persona.
Aprendé las capas en orden para que la autonomía siga siendo visible, testeable y responsable.
Escalera de aprendizaje
- Loop: objetivo, estado, acción, resultado.
- Herramientas: buscar, leer, escribir y llamar APIs con permisos claros.
- Memoria y estado: separar contexto actual, memoria durable, estado de tarea y ruido.
- Planificación: dividir trabajo en pasos sin tratar el plan como prueba.
- Aprobación: pedir revisión para acciones públicas, financieras, de cuentas, datos, reputación o irreversibles.
- Fiabilidad: testear comportamiento, inspeccionar fallas y detectar errores que suenan fluidos.
- Routing: elegir modelos según dificultad, riesgo, latencia y costo.
- Handoffs: usar varios agentes solo cuando la coordinación se pague sola.
- Artefactos: convertir aprendizaje privado en notas, diagramas, repos o reportes de fallas.
Ejemplo simple
Un asistente de investigación que crea una lista pública de lectura empieza con un objetivo y un loop: encontrar fuentes, leerlas, resumirlas, revisar si sirven y pedir revisión antes de publicar.
Las herramientas le permiten buscar y guardar notas. La memoria guarda el nivel del estudiante y los criterios de fuentes. La planificación separa descubrimiento, evaluación, borrador y revisión.
Cada capacidad nueva agrega una responsabilidad de verificación.
Guardrails
Esta ruta no defiende correr agentes por defecto. No es un atajo para saltarse revisión, permiso o responsabilidad. No es un manual interno de operaciones.
Mantené los ejemplos genéricos, reversibles y seguros para discutir en público.
Checkpoint de teach-back
Respondé con tus propias palabras:
- ¿Por qué el loop viene antes que las herramientas?
- ¿Qué cambia cuando un agente obtiene memoria o estado?
- ¿Qué acciones necesitan aprobación humana primero?
- ¿Cuándo varios agentes crean más costo de coordinación que valor?
Interpretación de Turtleand
Enseñá agentes como sistemas de trabajo con límites, no como personalidades autónomas. Agregá autonomía solo cuando la superficie de control esté clara.
Las futuras lecciones deberían volver a esta página cuando cubran loops, herramientas, memoria, planificación, evaluación, routing y coordinación.