
Alex
558 posts





hoy le estoy echando un rato a construirme un protocolo para trabajar con agentes la idea es la siguiente: tener un espacio donde tanto yo como el agente podamos añadir y ejecutar tareas dentro de un proyecto. también me interesa que tenga en cuenta dependencias y jerarquías entre las distintas tareas de momento estoy construyendo un set-up SENCILLO y FÁCIL de usar he elegido como base para trabajar un documento CANVAS de Obsidian que Claude Code pueda editar y un archivo rules .md con la descripción del protocolo y reglas tanto para mí como para el agente por ejemplo, una regla es que el agente puede proponer tareas (en MORADO) pero yo soy quien las aprueba poniéndolas en ROJO o que yo soy el que decide cuando una tarea está completa cambiando el color a VERDE cuando un agente empieza una tarea esta se pone en NARANJA así puedo ir siguiendo visualmente el progreso del proyecto qué opináis? si os interesa cuando tenga algo sólido puedo compartir el protocolo de forma más formal







People were doing incomprehensible things with RPG Maker 2000 back in 2008









LisanBench results for DeepSeek-V3.2 DeepSeek-V3.2 and V3.2 Speciale are affordable frontier models* *the caveat is that they are pretty slow at ~30-40tks/s and produce by far the longest reasoning chains at 20k and 47k average output tokens (incl. reasoning) - which results in extremely long waiting times per request but pricing is incredible for example, Sonnet 4.5 Thinking costs 10x ($35) as much and scores much lower than DeepSeek-V3.2 Speciale ($3) DeepSeek V3.2 Speciale also scored 13 new high scores Validity ratio is super high, which means when it does produce one wrong word transition it doesn't fall into some kind of doom loop of errors

28 months in to 6 months from AI taking your jobs * 4 months into 24 months until cursor is obsolete * 6 months into 6 months until ai writes 90% of your code (part 2, the codening)














