Pinkpig

719 posts

Pinkpig

@pinkping06

Katılım Aralık 2016

3.7K Takip Edilen247 Takipçiler

Pinkpig retweetledi

陈成@chenchengpro·25 Mar

Anthropic 工程博客最新一篇，揭示了一个做 AI Agent 的反直觉事实：让 Agent 自评自己的产出，它会自信地给平庸作品打高分。任务越主观（比如 UI 设计），这个偏差越致命。他们的解法借鉴了 GAN 的对抗思想——把生成和评估拆成独立 Agent，让它们互相制衡。最终架构是三个专职 Agent： • Planner：一句话需求 → 完整产品规格（会主动把 AI 能力编织进去） • Generator：React + Vite + FastAPI + PostgreSQL 增量实现 • Evaluator：通过 Playwright 真实操作界面打分——点按钮、调 API、查数据库，不是看截图效果对比（同一个任务：做一个 2D 游戏编辑器）： → 单 Agent：20分钟 / $9 / 界面能看但游戏逻辑全断 → 三 Agent Harness：6小时 / $200 / 有物理引擎、可用编辑器、AI 内容生成其中评估者的调校是最难的部分。初版评估者能发现 bug，但会自己合理化——"虽然有问题，但整体还不错"。作者的迭代方法：读评估日志 → 找判断偏差点 → 更新 prompt 纠正偏差模式。本质是在训练 prompt，而不是训练模型。他们还设计了"冲刺合约"：评估者在实现前和生成者协商验收标准。做一个音乐 DAW 时，仅关卡编辑器一项就定了 27 条验收标准，精确到能抓出"矩形填充工具只在拖拽端点放图块，而非填满整个区域"这种粒度的缺陷。模型演进也在改变 Harness 设计。Sonnet 4.5 有严重的"上下文焦虑"——感知到上下文快满，就草草收尾。必须手动重置上下文才能继续。但 Opus 4.6 自带自动压缩机制，连续跑长会话不再焦虑，直接省掉了这层复杂度。于是作者开始系统性删减 Harness：去掉冲刺合约，改单轮评估。简化后的 V2 架构做音乐 DAW，$124.70、3小时50分钟，多轮 QA 仍能抓到真实缺陷——缺拖拽排序动画、未实现音频录制、缺效果可视化。文章最核心的五条教训： - 持续实验，你对模型的假设会过期 - 拆解任务，用专职 Agent 攻子问题 - 新模型发布时重新审视 Harness，删掉不承重的复杂性 - 生成与评估分离，比让生成者自我批判更容易校准 - 用具体标准让主观判断可打分——"好看"不是标准，"对比度是否足够"才是最后一个洞察：模型变强后，解决方案空间不会缩小，而是位移。有趣的 Harness 组合会转向更高能力目标，而非消失。Harness 设计是一场和模型共同进化的军备竞赛。 anthropic.com/engineering/ha…

中文

169

26.8K

Pinkpig retweetledi

看不懂的SOL@DtDt666·24 Mar

vibe coding，以后是每个人都必须要掌握的技能。不是说程序员要掌握，是普通人都要掌握。就像办公软件一样，人人都得会，否则你将来的竞争力要大打折扣。斯坦福大学推出了一个免费的vibe coding课程，CS146S，讲的还是挺全的。 ppt什么的也都有。推荐大家有时间，可以看一看。地址：themodernsoftware.dev

中文

468

1.7K

126.5K

Pinkpig@pinkping06·22 Mar

@Ri_Blockchain 这是好事

中文

163

Fan｜1000X GEM@Ri_Blockchain·22 Mar

破案了，为什么一姐最近不活跃

中文

19.5K

Pinkpig retweetledi

娜美知识库@fhwofjow51260·15 Mar

推荐一个开源项目 WeChatDataAnalysis，一款用于微信聊天记录解密与分析的工具。它可以解析本地微信数据库，支持导出聊天记录、统计数据、生成年度聊天报告等功能；同时还能查看本地缓存过的朋友圈内容。适合做聊天数据整理或个人年度回顾。 github.com/LifeArchivePro…

中文

278

25.4K

Pinkpig retweetledi

Berryxia.AI@berryxia·14 Mar

🔥 兄弟们快来看！GitHub 今天直接杀疯的 OpenViking 来啦！今日直接斩获1500+ Star ⭐️ 🧠 他是由字节火山引擎团队开源的 AI Agents 专属上下文数据库！终于有人把 Agent 的记忆、资源、技能全部按“文件系统范式”统一管起来了，彻底告别以前那堆乱七八糟的向量碎片！我看完 README 直接惊呼“真的太聪明了”： ✅ L0/L1/L2 三层分层上下文，按需加载，Token 消耗直接砍一大半 ✅ 支持目录递归检索 + 可视化轨迹，Agent 到底怎么找东西一目了然 ✅ 自动会话压缩 + 长期记忆提取，Agent 用着用着自己就进化了 ✅ 特别适配 openclaw 等框架，我看别人实测任务完成率暴涨40%+，输入 token 省到离谱！ Python 主力项目，今天单日狂揽 +1,557 stars，趋势直接冲上第一梯队！正在搞 AI Agent、RAG、长上下文工具的兄弟们，这项目我强烈建议马上去 star + fork 研究一下，绝对是2026年开年神器！我准备马上 Clone 一个试试了，你们有已经在玩的吗？快来聊聊感受！👀✨

中文

405

42.3K

Pinkpig retweetledi

爱丽丝呀！@BTCqzy1·15 Mar

AI 编程的范式转移！💥 SuperPowers 已在 GitHub 狂揽 84k+ Star ，Fork 6.6k 次，还在飙升中！一句话概括：它给 AI 编程助手装上了一整套真正的软件工程流程。大多数 AI 编程助手是你说一句需求，它直接开始写代码。结果代码能跑，但项目很快乱成一团。SuperPowers 做了一件狠狠的事——强制 AI 按照真正的软件工程军规来工作。核心逻辑极其优雅：7 阶段强制流水线，缺一不可。脑暴+设计验证 → git worktree → 计划拆分 → 子Agent执行+TDD → 审查 → 完成分支/PR 先用苏格拉底式追问逼你把需求说清楚，再自动生成设计文档；设计通过后才开始拆任务，每个任务精确到文件路径和代码片段；然后严格执行 TDD（红绿重构），先写测试、看它失败、再写代码、看它通过——跳过测试的代码直接删掉重来；每个任务完成后触发双阶段代码审查，先查规格符合度，再查代码质量，Critical 问题不解决不许前进；最后多 Agent 并行协作，主 Agent 调度子 Agent 分头执行，跑完自动开 PR。已支持 Claude Code、Cursor、Codex、Gemini CLI 全平台，零配置安装，技能自动触发，你什么都不用做，AI 就已经有了 Superpowers。今天的 AI 只是你的副驾驶，SuperPowers 要让它成为整个工程团队。#AI编程 #Cursor 传送门 👉 github.com/obra/superpowe…

中文

233

1.1K

138.2K

Pinkpig retweetledi

0xMarioNawfal@RoundtableSpace·12 Mar

OPENCLAW AGENTS NOW JOIN SCRUM MEETINGS AND REPORT THEIR PROGRESS IN REAL TIME. STANDUPS WITH YOUR AI ENGINEERS.

English

204

283

3.8K

814.2K

Pinkpig retweetledi

0xWizard@0xcryptowizard·14 Mar

用 @karpathy 的自进化框架，开始跑策略，ai自己每天研究交易策略，不断测试，自我演进/留存/淘汰。核心思想： 1️⃣evolutionary search（进化搜索） 2️⃣trajectory improvement（记录历史尝试） 3️⃣context engineering

中文

452

45.5K

Pinkpig retweetledi

独立开发者William@DLKFZWilliam2·12 Mar

因为像素游戏缺大量的sprite动画，一直找不到好的工作流，我昨天都用ComfyUI自己搭了被推油推荐了这个，雪中送炭啊！好东西也分享给大家。这个尝试的核心思想是create a whole animation strip around that frame。直接生成strip而不是单个frame。脑洞大开🤯

Chong-U@chongdashu

x.com/i/article/2031…

中文

104

16.3K

Pinkpig retweetledi

KK.aWSB@KKaWSB·12 Mar

🔥华尔街版AI代理来了：用于深度金融研究的自主代理有人开发了一款自主AI金融分析师，GitHub超级热门项目：Dexter，17.7 k stars。你问："NVIDIA基于DCF分析是否被低估？" 它自动拆成6个子任务：获取当前价格、拉取历史P/E、获取行业均值、计算估值指标、验证数据一致性、合成论文。一个代理规划，一个代理执行，第三个代理检查数据是否合理，第四个代理写报告。它读SEC文件（10-K、10-Q、8-K），拉实时财务数据，内置DCF估值模型。整个过程自主完成，全部在你的终端里跑。开源、TypeScript、本地运行。华尔街金融分析师的工作流，被压缩成一行命令。

KK.aWSB@KKaWSB

x.com/i/article/2031…

中文

212

42.6K

Pinkpig retweetledi

老张来了@laozhang2579·10 Mar

全网最酷炫AI粒子模拟器？👑 一位叫Eswar prasaath的Geek 开发了一款 AI 驱动的粒子模拟器这是我见过最酷炫的没有之一网址分享给大家👇

中文

216

23.4K

Pinkpig retweetledi

阿绎 AYi@AYi_AInotes·10 Mar

解决你的 OpenClaw 龙虾的爬虫痛点智能算法突破防爬，狂揽 github2.3万星🤩 最近很多铁汁问我有没有好用的爬虫插件给自己的龙虾爬数据，这个Scrapling 简直就是 OpenClaw 的超强外挂，真的好用，强推！它能智能绕过验证码和网页改版，实现24小时稳定数据采集，内置MCP模式精简内容，大幅降低API成本，支持断点续传，开箱即用，作者正将其做成Skill，让普通用户也能轻松武装AI抓取能力。地址放评论区老规矩自取😎 #AI #人工智能 #科技 #数据采集 #爬虫 #OpenClaw #GitHub #编程 #自动化 #工具推荐

中文

406

35.9K

Pinkpig retweetledi

Jason Zuo@xxxjzuo·10 Mar

🆘xhs限流自检update: 做成开源 Chrome 扩展了很多人问怎么查自己的账号 — 现在可以了不用抓包，不用看后台console，不用折腾🦞 CDP。装上扩展，打开你的小红书创作者后台，每篇笔记旁边自动显示 level 状态。绿色正常，红色限流，一眼看完两种安装方式： 1. GitHub 下载手动装（现在就能用） github.com/jzOcb/xhs-note… 2. Chrome Web Store 审核中，1-3天上线完全本地运行，不碰你任何数据。MIT 开源，代码随便翻看了下自己的账号真是惨不忍睹🤣

Jason Zuo@xxxjzuo

今天 🦞 在自动生成小红书内容的时候，意外发现了一个隐藏字段 🤯 让 🦞 用 CDP 拦截 creator 后台的 API 响应，发现每篇笔记都有一个隐藏的 level 字段，代表笔记的推荐状态： Level 4 → 正常推荐 Level 2 → 基本正常 Level -1 → 轻度限流 Level -102 → 严重限流（不可逆）笔记管理页面里完全看不到这个字段。笔记可能早就被限流了，结果还在那傻傻等流量苦 XHS 限流久矣，居然今天才知道有这么个隐藏标记之前市面上各种小红书检测工具，都是从敏感词、关键词方向去猜你是不是被限流了。现在直接从 API 拿到确切的 level 值，完全不一样了。不用猜了，直接看最后吐槽一句：真搞不懂小红书为什么把限流搞得这么遮遮掩掩。笔记状态显示正常，背后给你打个 -1 的标记。你自己不知道，你的读者也看不到你的内容。这种隐形违规标记的意义到底是啥马上扫了一下我自己的账号和老婆的两个账号，如图👇

中文

313

72.1K

Pinkpig retweetledi

岚叔@LufzzLiz·9 Mar

拖了很久的news-aggregator-skill 重磅更新！！试了几个，感觉还是岚叔的新闻源好用，完美适配龙虾，测试了好几轮，品质保证！不需要任何key！欢迎Star～还可以设定cron 让龙虾定时发给你：核心升级：数据源从 8 个扩展到 28 个！（感谢 @bozhou_ai 推荐）新增三大类别： • AI/Tech 专栏：Hugging Face Daily Papers、Ben's Bites、Interconnects、One Useful Thing、ChinAI、KDnuggets 等 8 个 AI 资讯源 • 播客：Lex Fridman、Latent Space、80,000 Hours 等 • 博客/文章：Paul Graham、Wait But Why、Farnam Street、James Clear 等长文来源加上之前的： HN、GitHub、Product Hunt、36Kr、腾讯新闻、华尔街见闻、V2EX、微博热搜，这回吃饱饱了！龙虾安装方式：将这个 github.com/cclank/news-ag… 安装至openclaw skill里龙虾配置定时任务方式：帮我做一个定时任务：每天早上7.30点发送今日综合早报！咒语：如意如意-可以方便看菜单，便于你配置定时任务推荐配置多个topic，便于你获取信息，不怕没有选题了！推荐： 1 🦄 硅谷热点 (Hacker News) 2 🐙 开源趋势 (GitHub Trending) 7 📈 华尔街见闻 (WallStreetCN) 9 🤗 HF 每日论文 (Hugging Face) 10 🧪 Latent Space AINews (swyx)

中文

164

842

66.1K

Pinkpig retweetledi

Kai@real_kai42·9 Mar

真正的 vibe coding 装备果然人想象不出自己没见过的东西，之前大家觉得 ai 键盘的只有 “tab”，现在是完全不需要键盘定向麦可以解决在工位上小声说话的识别率，外加 typeless 解决 ai 输入的问题如果你还没用过 typeless，那我觉得你的生产力已经下降了一半以上 llm-based 高质量语音输入 + llm-based语音自动翻译 + llm 语音提问，这才是新时代的用法用 kk 的链接注册，送一个月 pro 会员，给 kk 省点会员费

中文

173

75.8K

Pinkpig retweetledi

出海去孵化器@chuhaiqu·9 Mar

今天发现了一个 claude code（同时也支持 OpenAI Codex 和 OpenClaw） skills 仓库，目前已经有 169 个开箱即用的生产级插件。涵盖 9 大领域，简直是一个全能的业务团队了： - 工程研发 (48+个)：前后端全栈和 DevOps，RAG 架构师、CI/CD 构建器，甚至还有能自我优化的自进化 Agent。 - 市场增长 (42个)： SEO、内容创作、转化率优化（CRO）和增长策略等等 - 高管智囊 (28个)：从战略规划、文化建设到模拟董事会会议都能参谋。 - 其他辅助：产品设计、项目管理、财务分析，甚至连最让人头疼的合规审查（医疗 MDR、GDPR、ISO）都有专门的插件。不知道 skill 怎么写的朋友可以关注试试 🔗 github.com/alirezarezvani… 2.7k Star

中文

192

16.1K

Pinkpig retweetledi

纯洁的微笑@ityouknows·9 Mar

腾讯今天彻底杀疯了！着急了真的会自己干自己，QClaw 还在内测， WorkBuddy 就发布了。为了抓住这一波热点，各个团队都拼了，还是腾讯以往的内部默认规则，谁赢谁上？ 1️⃣ WorkBuddy（社区戏称“小龙虾” 🦞）正式上线：真正的 AI 原生桌面助手，完全兼容 OpenClaw 技能！网址：codebuddy.cn/work/ 这是一款真正的 AI 原生桌面助手，而且完全兼容 OpenClaw 技能！主攻高价值办公场景：写代码、撸文档、深度调研、数据分析……不需要你从零捏 prompt，内置现成模板，直接套用开干。 2️⃣ QClaw（内部秘测）：据 TechNode 独家披露，这玩意能让普通人一键跑起 OpenClaw 环境，更恐怖的是直接集成了个人微信和 QQ！官网：claw.guanjia.qq.com 从企微到个人社交，国内最具统治力的生态全被打通。以后的核心竞争力不再是懂不懂代码，而是谁能最快把这批“硅基员工”嵌进自己的业务流里。大家觉得这一波，腾讯能赢吗？

纯洁的微笑@ityouknows

QClaw 的官网都出来了。腾讯果然在搞大动作，不过以腾讯的产品能力来，应该会大大降低实用门槛。腾讯做 QClaw，其实是一个非常典型的腾讯打法：技术未必第一个，入口一定要拿住。因为微信有几个恐怖的优势： 1 用户规模，微信接近 13 亿用户。 2 高频使用，很多人每天打开微信几十次。 3 关系链，工作朋友客户交易全部在这里。看来在 AI 极速的时代，谁都不想落后，连巨头也要争先。

中文

140

428

127.9K

Pinkpig retweetledi

卡比卡比@jakevin7·9 Mar

twitter-cli 重大升级!！逆向了几乎所有的接口, 而不仅仅是之前只有读接口. 现在实现了发帖子、点赞、引用回复等基本上所有的写请求！包括搜索等也都实现了！ github.com/jackwener/twit…

中文

339

2.4K

462.3K

Pinkpig retweetledi

WY@akokoi1·9 Mar

国内还在卷OpenClaw的各种喂饭教程，国外已经有人通过出售SOUL、skills变现了。本质上是出售你训练好的OpenClaw，最终交付的内容包括SOUL、MEMORY、skills等文件。两个思路： 1️⃣针对某个细分场景打磨一个OpenClaw，比如小红书运营助手，设计师、仓库管理员等等，甚至有人直接克隆了 Dan Koe 的思维框架做成 agent。 2️⃣ 根据企业的具体需求定制开发OpenClaw，尤其是有存量 SaaS 的，把现有工具接进 OpenClaw，直接降维打击。

中文

272

1.4K

183.7K

Pinkpig retweetledi

meng shao@shao__meng·8 Mar

Lossless Claw : OpenClaw 的「无损上下文管理」开源插件，基于 Voltropy 团队 LCM 论文，取代 OpenClaw 默认的滑动窗口压缩机制，通过 DAG 层次化摘要系统实现真正无损的长时记忆管理，来自 @MartianEng 作者 @jlehman_ 工作原理 1. 持久化与压缩：每条消息（含工具调用、文件）均存入 SQLite。当原始消息超出“freshTail”（默认 32 条）且达到 chunk 阈值时，触发增量压缩（异步 Leaf 摘要）；积累足够同层节点后进行凝练。 2. 深度感知提示：不同层级使用专属提示策略——d0 保留时间戳、决策、文件操作细节；d1+ 聚焦叙事弧线、持久状态、时间线；每条摘要末尾均附加“Expand for details about:” 引导词。 3. 上下文组装：每轮动态构建——保护最新消息 + 从旧到新填充摘要节点（XML 包装，含 id、depth、descendant_count、时间范围等元数据）。大文件（>25k token）自动外部存储并替换为探索摘要。 4. 收敛保障：总结失败时三层升级（详细 LLM → 要点模式 → 确定性截断），确保压缩必然成功。 5. 触发机制：主动（每轮后）+ 反应式（上下文达阈值，如 75%），支持无限深度凝练。 Agent 工具与交互插件向 Agent 暴露四个工具，实现全保真回忆： · lcm_grep：全文/正则搜索消息与摘要，支持时间、会话范围过滤。 · lcm_describe：查看任意摘要/文件节点的完整内容、元数据、父子关系。 · lcm_expand_query：委托 Sub-Agent 定向展开 DAG 子树并回答具体问题（带 token 预算与授权范围控制）。 · lcm_expand：底层展开原语（仅供 Sub-Agent 使用）。这些工具让 Agent “按需钻取”历史，感受“永不遗忘”。开源项目 github.com/Martian-Engine…

中文

142

13K

Keşfet

@Ri_Blockchain @karpathy @bozhou_ai @elonmusk @BarackObama @taylorswift13 @cristiano @BillGates