Pinkpig

719 posts

Pinkpig banner
Pinkpig

Pinkpig

@pinkping06

Katılım Aralık 2016
3.7K Takip Edilen247 Takipçiler
Pinkpig retweetledi
陈成
陈成@chenchengpro·
Anthropic 工程博客最新一篇,揭示了一个做 AI Agent 的反直觉事实: 让 Agent 自评自己的产出,它会自信地给平庸作品打高分。任务越主观(比如 UI 设计),这个偏差越致命。 他们的解法借鉴了 GAN 的对抗思想——把生成和评估拆成独立 Agent,让它们互相制衡。 最终架构是三个专职 Agent: • Planner:一句话需求 → 完整产品规格(会主动把 AI 能力编织进去) • Generator:React + Vite + FastAPI + PostgreSQL 增量实现 • Evaluator:通过 Playwright 真实操作界面打分——点按钮、调 API、查数据库,不是看截图 效果对比(同一个任务:做一个 2D 游戏编辑器): → 单 Agent:20分钟 / $9 / 界面能看但游戏逻辑全断 → 三 Agent Harness:6小时 / $200 / 有物理引擎、可用编辑器、AI 内容生成 其中评估者的调校是最难的部分。初版评估者能发现 bug,但会自己合理化——"虽然有问题,但整体还不错"。作者的迭代方法:读评估日志 → 找判断偏差点 → 更新 prompt 纠正偏差模式。本质是在训练 prompt,而不是训练模型。 他们还设计了"冲刺合约":评估者在实现前和生成者协商验收标准。做一个音乐 DAW 时,仅关卡编辑器一项就定了 27 条验收标准,精确到能抓出"矩形填充工具只在拖拽端点放图块,而非填满整个区域"这种粒度的缺陷。 模型演进也在改变 Harness 设计。Sonnet 4.5 有严重的"上下文焦虑"——感知到上下文快满,就草草收尾。必须手动重置上下文才能继续。但 Opus 4.6 自带自动压缩机制,连续跑长会话不再焦虑,直接省掉了这层复杂度。 于是作者开始系统性删减 Harness:去掉冲刺合约,改单轮评估。简化后的 V2 架构做音乐 DAW,$124.70、3小时50分钟,多轮 QA 仍能抓到真实缺陷——缺拖拽排序动画、未实现音频录制、缺效果可视化。 文章最核心的五条教训: - 持续实验,你对模型的假设会过期 - 拆解任务,用专职 Agent 攻子问题 - 新模型发布时重新审视 Harness,删掉不承重的复杂性 - 生成与评估分离,比让生成者自我批判更容易校准 - 用具体标准让主观判断可打分——"好看"不是标准,"对比度是否足够"才是 最后一个洞察:模型变强后,解决方案空间不会缩小,而是位移。有趣的 Harness 组合会转向更高能力目标,而非消失。Harness 设计是一场和模型共同进化的军备竞赛。 anthropic.com/engineering/ha…
中文
5
14
169
26.8K
Pinkpig retweetledi
看不懂的SOL
看不懂的SOL@DtDt666·
vibe coding,以后是每个人都必须要掌握的技能。 不是说程序员要掌握,是普通人都要掌握。 就像办公软件一样,人人都得会,否则你将来的竞争力要大打折扣。 斯坦福大学推出了一个免费的vibe coding课程,CS146S,讲的还是挺全的。 ppt什么的也都有。 推荐大家有时间,可以看一看。 地址:themodernsoftware.dev
看不懂的SOL tweet media
中文
28
468
1.7K
126.5K
Fan|1000X GEM
Fan|1000X GEM@Ri_Blockchain·
破案了,为什么一姐最近不活跃
Fan|1000X GEM tweet media
中文
18
0
14
19.5K
Pinkpig retweetledi
娜美知识库
娜美知识库@fhwofjow51260·
推荐一个开源项目 WeChatDataAnalysis,一款用于 微信聊天记录解密与分析 的工具。 它可以解析本地微信数据库,支持 导出聊天记录、统计数据、生成年度聊天报告 等功能;同时还能查看本地缓存过的朋友圈内容。适合做聊天数据整理或个人年度回顾。 github.com/LifeArchivePro…
娜美知识库 tweet media
中文
8
50
278
25.4K
Pinkpig retweetledi
Berryxia.AI
Berryxia.AI@berryxia·
🔥 兄弟们快来看!GitHub 今天直接杀疯的 OpenViking 来啦!今日直接斩获1500+ Star ⭐️ 🧠 他是由字节火山引擎团队开源的 AI Agents 专属上下文数据库! 终于有人把 Agent 的记忆、资源、技能全部按“文件系统范式”统一管起来了,彻底告别以前那堆乱七八糟的向量碎片! 我看完 README 直接惊呼“真的太聪明了”: ✅ L0/L1/L2 三层分层上下文,按需加载,Token 消耗直接砍一大半 ✅ 支持目录递归检索 + 可视化轨迹,Agent 到底怎么找东西一目了然 ✅ 自动会话压缩 + 长期记忆提取,Agent 用着用着自己就进化了 ✅ 特别适配 openclaw 等框架,我看别人实测任务完成率暴涨40%+,输入 token 省到离谱! Python 主力项目,今天单日狂揽 +1,557 stars,趋势直接冲上第一梯队! 正在搞 AI Agent、RAG、长上下文工具的兄弟们,这项目我强烈建议马上去 star + fork 研究一下,绝对是2026年开年神器! 我准备马上 Clone 一个试试了,你们有已经在玩的吗?快来聊聊感受!👀✨
Berryxia.AI tweet media
中文
14
95
405
42.3K
Pinkpig retweetledi
爱丽丝呀!
爱丽丝呀!@BTCqzy1·
AI 编程的范式转移!💥 SuperPowers 已在 GitHub 狂揽 84k+ Star ,Fork 6.6k 次,还在飙升中! 一句话概括:它给 AI 编程助手装上了一整套真正的软件工程流程。 大多数 AI 编程助手是你说一句需求,它直接开始写代码。结果代码能跑,但项目很快乱成一团。SuperPowers 做了一件狠狠的事——强制 AI 按照真正的软件工程军规来工作。 核心逻辑极其优雅:7 阶段强制流水线,缺一不可。 脑暴+设计验证 → git worktree → 计划拆分 → 子Agent执行+TDD → 审查 → 完成分支/PR 先用苏格拉底式追问逼你把需求说清楚,再自动生成设计文档;设计通过后才开始拆任务,每个任务精确到文件路径和代码片段; 然后严格执行 TDD(红绿重构),先写测试、看它失败、再写代码、看它通过——跳过测试的代码直接删掉重来; 每个任务完成后触发双阶段代码审查,先查规格符合度,再查代码质量,Critical 问题不解决不许前进; 最后多 Agent 并行协作,主 Agent 调度子 Agent 分头执行,跑完自动开 PR。 已支持 Claude Code、Cursor、Codex、Gemini CLI 全平台,零配置安装,技能自动触发,你什么都不用做,AI 就已经有了 Superpowers。 今天的 AI 只是你的副驾驶,SuperPowers 要让它成为整个工程团队。#AI编程 #Cursor 传送门 👉 github.com/obra/superpowe…
中文
65
233
1.1K
138.2K
Pinkpig retweetledi
0xMarioNawfal
0xMarioNawfal@RoundtableSpace·
OPENCLAW AGENTS NOW JOIN SCRUM MEETINGS AND REPORT THEIR PROGRESS IN REAL TIME. STANDUPS WITH YOUR AI ENGINEERS.
English
204
283
3.8K
814.2K
Pinkpig retweetledi
0xWizard
0xWizard@0xcryptowizard·
@karpathy 的自进化框架,开始跑策略,ai自己每天研究交易策略,不断测试,自我演进/留存/淘汰。 核心思想: 1️⃣evolutionary search(进化搜索) 2️⃣trajectory improvement(记录历史尝试) 3️⃣context engineering
0xWizard tweet media
中文
31
67
452
45.5K
Pinkpig retweetledi
独立开发者William
独立开发者William@DLKFZWilliam2·
因为像素游戏缺大量的sprite动画,一直找不到好的工作流,我昨天都用ComfyUI自己搭了 被推油推荐了这个,雪中送炭啊! 好东西也分享给大家。 这个尝试的核心思想是create a whole animation strip around that frame。 直接生成strip而不是单个frame。脑洞大开🤯
Chong-U@chongdashu

x.com/i/article/2031…

中文
4
18
104
16.3K
Pinkpig retweetledi
KK.aWSB
KK.aWSB@KKaWSB·
🔥华尔街版AI代理来了:用于深度金融研究的自主代理 有人开发了一款自主AI金融分析师,GitHub超级热门项目:Dexter,17.7 k stars。 你问:"NVIDIA基于DCF分析是否被低估?" 它自动拆成6个子任务:获取当前价格、拉取历史P/E、获取行业均值、计算估值指标、验证数据一致性、合成论文。 一个代理规划,一个代理执行,第三个代理检查数据是否合理,第四个代理写报告。 它读SEC文件(10-K、10-Q、8-K),拉实时财务数据,内置DCF估值模型。 整个过程自主完成,全部在你的终端里跑。 开源、TypeScript、本地运行。 华尔街金融分析师的工作流,被压缩成一行命令。
KK.aWSB tweet media
KK.aWSB@KKaWSB

x.com/i/article/2031…

中文
9
49
212
42.6K
Pinkpig retweetledi
老张来了
老张来了@laozhang2579·
全网最酷炫AI粒子模拟器?👑 一位叫Eswar prasaath的Geek 开发了一款 AI 驱动的粒子模拟器 这是我见过最酷炫的 没有之一 网址分享给大家👇
中文
12
27
216
23.4K
Pinkpig retweetledi
阿绎 AYi
阿绎 AYi@AYi_AInotes·
解决你的 OpenClaw 龙虾的爬虫痛点 智能算法突破防爬,狂揽 github2.3万星🤩 最近很多铁汁问我有没有好用的爬虫插件给自己的龙虾爬数据, 这个Scrapling 简直就是 OpenClaw 的超强外挂,真的好用,强推! 它能智能绕过验证码和网页改版,实现24小时稳定数据采集, 内置MCP模式精简内容, 大幅降低API成本,支持断点续传, 开箱即用,作者正将其做成Skill,让普通用户也能轻松武装AI抓取能力。 地址放评论区老规矩自取😎 #AI #人工智能 #科技 #数据采集 #爬虫 #OpenClaw #GitHub #编程 #自动化 #工具推荐
阿绎 AYi tweet media
中文
9
95
406
35.9K
Pinkpig retweetledi
Jason Zuo
Jason Zuo@xxxjzuo·
🆘xhs限流自检update: 做成开源 Chrome 扩展了 很多人问怎么查自己的账号 — 现在可以了 不用抓包,不用看后台console,不用折腾🦞 CDP。装上扩展,打开你的小红书创作者后台,每篇笔记旁边自动显示 level 状态。绿色正常,红色限流,一眼看完 两种安装方式: 1. GitHub 下载手动装(现在就能用) github.com/jzOcb/xhs-note… 2. Chrome Web Store 审核中,1-3天上线 完全本地运行,不碰你任何数据。MIT 开源,代码随便翻 看了下自己的账号真是惨不忍睹🤣
Jason Zuo tweet media
Jason Zuo@xxxjzuo

今天 🦞 在自动生成小红书内容的时候,意外发现了一个隐藏字段 🤯 让 🦞 用 CDP 拦截 creator 后台的 API 响应,发现每篇笔记都有一个隐藏的 level 字段,代表笔记的推荐状态: Level 4 → 正常推荐 Level 2 → 基本正常 Level -1 → 轻度限流 Level -102 → 严重限流(不可逆) 笔记管理页面里完全看不到这个字段。笔记可能早就被限流了,结果还在那傻傻等流量 苦 XHS 限流久矣,居然今天才知道有这么个隐藏标记 之前市面上各种小红书检测工具,都是从敏感词、关键词方向去猜你是不是被限流了。现在直接从 API 拿到确切的 level 值,完全不一样了。不用猜了,直接看 最后吐槽一句:真搞不懂小红书为什么把限流搞得这么遮遮掩掩。笔记状态显示正常,背后给你打个 -1 的标记。你自己不知道,你的读者也看不到你的内容。这种隐形违规标记的意义到底是啥 马上扫了一下我自己的账号和老婆的两个账号,如图👇

中文
36
48
313
72.1K
Pinkpig retweetledi
岚叔
岚叔@LufzzLiz·
拖了很久的news-aggregator-skill 重磅更新 !! 试了几个,感觉还是岚叔的新闻源好用,完美适配龙虾,测试了好几轮,品质保证!不需要任何key! 欢迎Star~ 还可以设定cron 让龙虾定时发给你: 核心升级:数据源从 8 个扩展到 28 个 !(感谢 @bozhou_ai 推荐 ) 新增三大类别: • AI/Tech 专栏:Hugging Face Daily Papers、Ben's Bites、Interconnects、One Useful Thing、ChinAI、KDnuggets 等 8 个 AI 资讯源 • 播客:Lex Fridman、Latent Space、80,000 Hours 等 • 博客/文章:Paul Graham、Wait But Why、Farnam Street、James Clear 等长文来源 加上之前的: HN、GitHub、Product Hunt、36Kr、腾讯新闻、华尔街见闻、V2EX、微博热搜 ,这回吃饱饱了! 龙虾安装方式: 将这个 github.com/cclank/news-ag… 安装至openclaw skill里 龙虾配置定时任务方式: 帮我做一个定时任务:每天早上7.30点发送今日综合早报! 咒语:如意如意-可以方便看菜单,便于你配置定时任务 推荐配置多个topic,便于你获取信息,不怕没有选题了! 推荐: 1 🦄 硅谷热点 (Hacker News) 2 🐙 开源趋势 (GitHub Trending) 7 📈 华尔街见闻 (WallStreetCN) 9 🤗 HF 每日论文 (Hugging Face) 10 🧪 Latent Space AINews (swyx)
岚叔 tweet media岚叔 tweet media岚叔 tweet media岚叔 tweet media
中文
38
164
842
66.1K
Pinkpig retweetledi
Kai
Kai@real_kai42·
真正的 vibe coding 装备 果然人想象不出自己没见过的东西,之前大家觉得 ai 键盘的只有 “tab”,现在是完全不需要键盘 定向麦可以解决在工位上小声说话的识别率,外加 typeless 解决 ai 输入的问题 如果你还没用过 typeless,那我觉得你的生产力已经下降了一半以上 llm-based 高质量语音输入 + llm-based语音自动翻译 + llm 语音提问,这才是新时代的用法 用 kk 的链接注册,送一个月 pro 会员,给 kk 省点会员费
Kai tweet media
中文
36
14
173
75.8K
Pinkpig retweetledi
出海去孵化器
出海去孵化器@chuhaiqu·
今天发现了一个 claude code(同时也支持 OpenAI Codex 和 OpenClaw) skills 仓库,目前已经有 169 个开箱即用的生产级插件。 涵盖 9 大领域,简直是一个全能的业务团队了: - 工程研发 (48+个):前后端全栈和 DevOps,RAG 架构师、CI/CD 构建器,甚至还有能自我优化的自进化 Agent。 - 市场增长 (42个): SEO、内容创作、转化率优化(CRO)和增长策略等等 - 高管智囊 (28个):从战略规划、文化建设到模拟董事会会议都能参谋。 - 其他辅助:产品设计、项目管理、财务分析,甚至连最让人头疼的合规审查(医疗 MDR、GDPR、ISO)都有专门的插件。 不知道 skill 怎么写的朋友可以关注试试 🔗 github.com/alirezarezvani… 2.7k Star
出海去孵化器 tweet media出海去孵化器 tweet media
中文
5
43
192
16.1K
Pinkpig retweetledi
纯洁的微笑
纯洁的微笑@ityouknows·
腾讯今天彻底杀疯了! 着急了真的会自己干自己,QClaw 还在内测, WorkBuddy 就发布了。 为了抓住这一波热点,各个团队都拼了,还是腾讯以往的内部默认规则,谁赢谁上? 1️⃣ WorkBuddy(社区戏称“小龙虾” 🦞)正式上线:真正的 AI 原生桌面助手,完全兼容 OpenClaw 技能! 网址:codebuddy.cn/work/ 这是一款真正的 AI 原生桌面助手,而且完全兼容 OpenClaw 技能! 主攻高价值办公场景:写代码、撸文档、深度调研、数据分析……不需要你从零捏 prompt,内置现成模板,直接套用开干。 2️⃣ QClaw(内部秘测):据 TechNode 独家披露,这玩意能让普通人一键跑起 OpenClaw 环境,更恐怖的是直接集成了个人微信和 QQ! 官网:claw.guanjia.qq.com 从企微到个人社交,国内最具统治力的生态全被打通。 以后的核心竞争力不再是懂不懂代码,而是谁能最快把这批“硅基员工”嵌进自己的业务流里。 大家觉得这一波,腾讯能赢吗?
纯洁的微笑 tweet media
纯洁的微笑@ityouknows

QClaw 的官网都出来了。 腾讯果然在搞大动作,不过以腾讯的产品能力来,应该会大大降低实用门槛。 腾讯做 QClaw,其实是一个非常典型的腾讯打法:技术未必第一个,入口一定要拿住。 因为微信有几个恐怖的优势: 1 用户规模,微信接近 13 亿用户。 2 高频使用,很多人每天打开微信几十次。 3 关系链,工作朋友客户交易全部在这里。 看来在 AI 极速的时代,谁都不想落后,连巨头也要争先。

中文
41
140
428
127.9K
Pinkpig retweetledi
卡比卡比
卡比卡比@jakevin7·
twitter-cli 重大升级!! 逆向了几乎所有的接口, 而不仅仅是之前只有读接口. 现在实现了发帖子、点赞、引用 回复 等基本上所有的写请求!包括搜索等也都实现了! github.com/jackwener/twit…
中文
72
339
2.4K
462.3K
Pinkpig retweetledi
WY
WY@akokoi1·
国内还在卷OpenClaw的各种喂饭教程,国外已经有人通过出售SOUL、skills变现了。 本质上是出售你训练好的OpenClaw,最终交付的内容包括SOUL、MEMORY、skills等文件。 两个思路: 1️⃣针对某个细分场景打磨一个OpenClaw,比如小红书运营助手,设计师、仓库管理员等等,甚至有人直接克隆了 Dan Koe 的思维框架做成 agent。 2️⃣ 根据企业的具体需求定制开发OpenClaw,尤其是有存量 SaaS 的,把现有工具接进 OpenClaw,直接降维打击。
WY tweet mediaWY tweet media
中文
79
272
1.4K
183.7K
Pinkpig retweetledi
meng shao
meng shao@shao__meng·
Lossless Claw : OpenClaw 的「无损上下文管理」开源插件,基于 Voltropy 团队 LCM 论文,取代 OpenClaw 默认的滑动窗口压缩机制,通过 DAG 层次化摘要系统实现真正无损的长时记忆管理,来自 @MartianEng 作者 @jlehman_ 工作原理 1. 持久化与压缩:每条消息(含工具调用、文件)均存入 SQLite。当原始消息超出“freshTail”(默认 32 条)且达到 chunk 阈值时,触发增量压缩(异步 Leaf 摘要);积累足够同层节点后进行凝练。 2. 深度感知提示:不同层级使用专属提示策略——d0 保留时间戳、决策、文件操作细节;d1+ 聚焦叙事弧线、持久状态、时间线;每条摘要末尾均附加“Expand for details about:” 引导词。 3. 上下文组装:每轮动态构建——保护最新消息 + 从旧到新填充摘要节点(XML 包装,含 id、depth、descendant_count、时间范围等元数据)。大文件(>25k token)自动外部存储并替换为探索摘要。 4. 收敛保障:总结失败时三层升级(详细 LLM → 要点模式 → 确定性截断),确保压缩必然成功。 5. 触发机制:主动(每轮后)+ 反应式(上下文达阈值,如 75%),支持无限深度凝练。 Agent 工具与交互 插件向 Agent 暴露四个工具,实现全保真回忆: · lcm_grep:全文/正则搜索消息与摘要,支持时间、会话范围过滤。 · lcm_describe:查看任意摘要/文件节点的完整内容、元数据、父子关系。 · lcm_expand_query:委托 Sub-Agent 定向展开 DAG 子树并回答具体问题(带 token 预算与授权范围控制)。 · lcm_expand:底层展开原语(仅供 Sub-Agent 使用)。 这些工具让 Agent “按需钻取”历史,感受“永不遗忘”。 开源项目 github.com/Martian-Engine…
meng shao tweet media
中文
5
36
142
13K