
StefanoDoDev
3.7K posts

StefanoDoDev
@StefanoDO
#FrontEndDeveloper #CSS #Angular #Design #Illustration #TechTrends #nft #nftartist








Hace poco Anthropic lanzó una nueva forma de testear Skills en Claude Code: Evals. Por ejemplo: creaste una skill para que Claude Code resuma transcripciones de Google Meet. Y siempre querés que siga esta estructura: decisiones → próximos pasos → responsables Llamás a /skill-creator (skill oficial de Anthropic) y le decís: “quiero testear mi skill”. Entonces: 1) Lee tu skill y entiende qué tiene que hacer. 2) Te propone casos de prueba. 3) Lanza dos agentes en paralelo: uno con la skill y otro sin. Ambos reciben la misma transcripción de Google Meet. 4) Califica los resultados: ¿tiene las 3 secciones? ¿menciona decisiones, próximos pasos y responsables? 5) Genera un HTML con los resultados. Comparás output con skill vs sin skill y dejás feedback. 6) Mejora y repite: reescribe las instrucciones con tu feedback y vuelve a correr. Muy útil cuando querés que una skill devuelva siempre el mismo tipo de output.













Introducing Claude Code Security, now in limited research preview. It scans codebases for vulnerabilities and suggests targeted software patches for human review, allowing teams to find and fix issues that traditional tools often miss. Learn more: anthropic.com/news/claude-co…











