nifengfei
163 posts

nifengfei
@nifengxiaofei
🚀 前大厂软件算法/产品 ✈️ All in AI出海,日常挖掘需求,开发AI产品,总结技术分享 ❤️ 坚定的理想主义者





damn dario walking his walk — word is anthro stopped hiring below L6

Claude code source code has been leaked via a map file in their npm registry! Code: …a8527898604c1bbb12468b1581d95e.r2.dev/src.zip


今天Anthropic对skill-creator()进行的了更新,代表了他们对最近agent skills的观察和未来演进的方向。 1、将Skills分为两类,代表了它们各自的测试重点 能力提升型 (Capability uplift): 赋予 Claude 原生模型不具备或不稳定的能力(如复杂的文档创建)。测试重点在于观察原生模型进步后,该技能是否仍有必要。 偏好编码型 (Encoded preference): 将特定团队的工作流(如 NDA 审核)标准化。测试重点在于验证其是否严格遵循了既定流程。 2、Skill-creator主要更新 2.1. 引入Evals(评估测试): 作者可以定义测试提示词和预期结果,检查技能在模型更迭后是否出现“质量退化”(Regression)。 2.2. 基准测试模式 (Benchmark mode): 自动运行标准化评估,追踪通过率、耗时和 Token 消耗。 3、未来展望 随着模型能力的提升,未来的skills可能只需一段自然语言描述“做什么”,而无需详细说明“怎么做”。这里的意思是模型能力的提高,它知道“某个技能”是什么 claude.com/blog/improving… agentskills.so/skills/anthrop…



Trend I'm seeing in the Valley: the latest AI-native startup teams are all building their own internal tools, 100% customized for their needs, instead of buying SaaS. Do not dismiss these as vibe coded slop. They are built by professional internal developers dedicated to building internal tools, sped up 10x by AI.














