Juan Guzman retweetledi

Llevo meses escribiendo Agent Skills. Y encontré un formato que me da mejores resultados un 90% de los casos.
La clave: apretar las riendas del agente (harness optimization).
Restringir lo que el agente puede hacer para que lo que haga, lo haga bien. Un agente mediocre dentro de un harness fuerte supera a un agente más capaz dentro de uno desordenado.
Esto no es prompting. Es diseño de sistemas.
Qué he aprendido:
1. Metadata
Name, description, triggers. Los LLMs son buenos detectando estas secciones; no necesitan ser elaboradas. Funcionales y al punto.
2. Skill Purpose
Un párrafo corto. Un pitch. Solo quiero que el agente entienda la idea principal. El detalle va después.
3. Instructions
Cada paso con instrucciones claras y precisas. Si tiene que ejecutar un script, le digo exactamente dónde:
Execute: ~/Documents/script/run.py
Regla personal: si una Skill necesita más de 3 pasos, la divido en Skills más pequeñas. Más restricción → mejores resultados (especializo al agente en tareas puntuales = aprieto aún más las riendas del agente).
4. Non-Negotiable Acceptance Criteria
La sección más importante. Aquí defines qué NO es negociable. El agente no entrega nada si no cumple todos los criterios.
Muchos usan “Rules” o “Objectives”. Yo prefiero “Non-Negotiable” porque genera obligación.
La palabra “Rules” suaviza; le abre la puerta al agente para decidir qué cumplir y qué ignorar.
5. Output
Defino exactamente el formato de salida. Si lo dejas a criterio del modelo, pierdes consistencia. Y sin consistencia, no puedes encadenar Skills.
---
Este es el principio fundamental:
Tareas atómicas, granulares, específicas. Cada Skill hace UNA cosa. La suma de todas resuelve el problema completo.
Si estás escribiendo Skills y el agente te da resultados inconsistentes, probablemente el harness está flojo. Aprieta las riendas.

Español





























