壬丑人不丑
262 posts

壬丑人不丑
@alexbu512
辛金日主|INTP 10年金融 × 6年易经与八字 × 2年AI应用 不做预测,只做工具 反者道之动,游戏人生。
Katılım Kasım 2025
111 Takip Edilen127 Takipçiler
Sabitlenmiş Tweet

@wangdefou 有一句话原帖还没引用:We are all having to keep revising upwards our assessments。
一个菲尔兹奖得主在说,他对 AI 数学能力的判断一直在被迫向上修正。最可怕的不是 AI 解了题,而是连最顶尖的人,预测能力也开始跟不上了
中文

Living this on Hermes Agent. Started with one skill — first output was garbage. 3 months in it catches things I'd forget.
The part people miss: you don't need 100k pages. You need one workflow you hate repeating. Skillify that. Day 1 done.
The labor cost flip makes this inevitable for solo operators too — when agent infra < one junior hire's monthly pay, everyone gets to build their own nervous system.
Garry Tan@garrytan
English

@AYi_AInotes 500个创作者,同一套fMRI训练数据,同一套打分逻辑
投出去的,都是同一种"高人脑响应"内容。这个工具优化的是过去的神经反应规律。但真正的病毒内容,从来是第一个打破当前模式的那个
中文

Damn,刷到这个帖子我瞬间愣了,AI迭代速度已经疯了,有点跟不上节奏了🤯
我一开始以为这又是一个生成视频的新工具,点进去发现根本不是一回事。
Higgsfield昨天刚发的Virality Predictor,直接把脑科学塞进了内容创作流程。
上传一段15秒以内的视频,
几秒就能给你出完整的人脑反应报告。
整体病毒潜力,
前3秒钩子得分,
全程注意力保持曲线,
还有彩色的脑区激活热图,
告诉你观众的大脑哪部分被点亮了。
最狠的是它和Claude的打通,
可以一句话生成500个产品视频变体,
然后全部丢进预测器自动筛掉垃圾,
只放大高分版本直接投流,
从0到已验证高潜力广告,全程自动化。
它不是看你视频过去像不像爆款。
而是用AI模拟700多个人、500多小时fMRI数据训练出来的人脑,预测你看到这段视频时的真实神经反应。
我们以前做电商短视频,
拍,剪,烧钱测,看数据,迭代,
测试成本是真金白银的广告费。
现在做电商短视频,
生成,预测,只投高分,
测试成本只是一点token费。
最牛逼的地方在于
大脑亮不等于一定爆,
一些高认知负荷的内容会让大脑很活跃,但普通人刷到就会直接滑走。
真正的病毒性,只看前3秒钩子得分和视觉拉力。
和你有没有深度,有没有道理,一点关系都没有。
也就是说以前爆款靠灵感,
现在爆款靠系统。
所以当别人还在熬夜想创意的时候,
你已经用AI筛完了500个版本,
知道哪10个能爆。
而且工具越强,越考验人的判断,
它能帮你砍掉80%的无效创意,
但选什么方向,解读什么结果,
永远是人说了算。
我感觉2026年的电商短视频战场,
已经不是比谁创意好,
而是比谁能用AI先把非爆款干掉,
所有还在靠感觉做内容的人可真的要跟不上了。
#AI工具 #短视频创业
Higgsfield AI 🧩@higgsfield
Higgsfield releases Virality Predictor What does it mean: > Upload any clip up to 15s > Get viral potential, hook score & hold rate > See a heatmap of brain regions your clip activates > Pair with Ad Reference for recreated videos Available via MCP/CLI and on the platform.
中文

马斯克儿子捅破了窗户纸。
一个自闭症天才的直觉,让全球AI巨头集体背脊发凉。
埃隆·马斯克的儿子萨克森,曾长期无法理解人类去餐厅的行为。
在逻辑的世界里,去餐厅是最不划算的生存方案。
同样的食物可以外卖到家,价格甚至只要餐厅的一半。
想见朋友可以直接约在家里,环境比公共场所更私密、更自在。
直到萨克森在某一天突然悟出了那个终极真相。
人们冒着低效和高价去餐厅,唯一的刚需是与陌生人待在一起。
这是AI和算法永远算不出来的底层变量。
数字技术一直在追求极致的效率,试图让人足不出户就解决所有需求。
但人类这种生物,本质上依然需要那种“处在人群中”的物理感受。
AI可以模拟最完美的语音,却给不了邻桌那一点点无法预知的、真实的人间烟火气。
当科技试图把每个人关进精准计算的信息茧房,这种原始的群体本能成了人类最后的护城河。
硅谷的算力可以抹平地理距离,但无法消除这种源于进化深处的、对同类气息的渴求。
中文

Stripe和谷歌老大的聊天:
1. 美国大模型卡脖子的不是钱和GPU,是内存和电
2. 耗费巨大的大模型,文件居然能塞进一个普通 U 盘里
3. AI 模型已经能够攻破目前市面上几乎所有的软件,黑客和零日漏洞都贬值了
4. 所有的东西都会扩大 10 倍,整个(软件和编程)需求和市场都会猛增
5. 搜索将从查信息变成帮你办事儿,你的智能大管家
6. 预计 2027 年将是大年,AI对非开发类工作的转变将非常深刻,大家都活在智能大管家的世界里
坤海@KunhaiY
昨晚熬夜看完 Stripe 老板跟 Google CEO 劈柴哥(Sundar Pichai)70多分钟的闭门聊天。看完真是倒吸一口凉气。 大家天天在群里发大模型跑分,但其实顶级大佬们早就不玩这个了。我从一万多字的实录里,拎出 6 个大多数人没看透的残酷真相。大白话给你讲清楚。不管你是干啥的,建议先马后看! x.com/collision/stat…
中文

@dashen9999 一般人不知道的信息,为什么能通过某些渠道获取?那也是渠道故意放给你看的,真正不想给你看的,怎么都看不了。目的都有,只需要区分对自己是否获益就行。
中文

@fankaishuoai 走的是不同的道路。美国主要是走通用人工智能,国内聚焦在了具体事务的agent。5月8号工信部就发了智能体的规范建议。道路选择不同,时间拉长了来看吧
中文

一个反常识的判断:这两年 AI 发展,中美之间的差距拉大了,不是缩小了。
很多人看到国内模型追上了 GPT-4 的水平,以为差距在缩小。但模型只是基础,真正决定实际生产力的是上面跑的工具和生态。
在智能体工具层面:Claude Code、Codex、Open Cloud 全是美国产品,国内目前没有可以平替的东西。国内工程师也在用,但用的是人家的工具。
更深层的问题是信息流动。在美国,一个工程师可以把 ChatGPT 的对话导出来、交给 Claude 分析、用 API 自动整理到任何地方——全链路打通,信息自由流动,Agent 可以触达几乎所有平台。
国内是什么状态?每个平台都是孤岛,数据不互通,Agent 能触达的范围极其有限。
模型分数接近了,但实际使用的基础设施差距,其实在扩大。
中文

今天 Hermes Agent 登上全球榜单第一
这不仅仅是一份排名,它代表着开源社区、开发者、贡献者和每一个真实用户共同推动出来的结果
同时也很开心看到 @OpenRouter 上越来越多 AI Agent 项目被更多人看见。
CLI、Personal Agents、自动化工作流,整个生态正在进入真正爆发阶段。
恭喜 @NousResearch @Teknium 也恭喜所有还在坚持做产品、做开源、做创新的人。
未来才刚刚开始

中文

Tianfu Agent 在全球算命师大赛上跑到 50% 截尾准确率(人类 Top-20 选手平均 53.5%)
比赛 3069 名参赛者
人类 Top-20 选手平均 53.5%
最强通用大模型基线(Claude Opus 4.6)40%,这中间差了 10 个百分点
1️⃣ 一句话讲清楚
一个为命理术数专门设计的 agent 系统,在中国传统文化领域里,第一次真正贴近顶尖人类选手的水平
2️⃣ 它是什么?
给 LLM 造了一整套命理专用工具环境
200+ 原子工具 / Agentic 端到端推理
让 AI 真正学会怎么「做命理」 跳出「把命盘数据塞进 Prompt 让通用大模型硬猜」这条老路子
3️⃣ 以前的解决方案
「排盘数据 + 通用大模型」 听起来够用了,实际上有三个结构性硬伤:
1)衍生数据会组合爆炸
大限 / 流年 / 飞宫 层层展开 没法穷举塞进 Prompt
2)空间关系序列化造成幻觉
三方四正 / 能量流通 全是拓扑结构 翻译成文字就面目全非
3)推理链越长越飘
每一步都依赖上一步 错误逐步放大
专业训练语料几乎为零 模型压根不懂这些规则
4️⃣ Tianfu Agent 的思路换了一套
第一 确定性优先
200+ 专用原子工具
排盘 / 飞宫 / 取用神推演 全部精确计算
模型不用「回忆」知识
第二 推理规则工具化
行业内部的推理技法 也写成可调用函数
该用哪条 / 什么时候用 模型按需精准触发
绕开了「让模型记住并遵守专业规则」这条永远跑不通的路
第三 量化「直觉」
从工具输出量化指标 / Sub-Agent 的自评 / 多流派合参的调和
层层量化 模拟人类专家的隐式判断直觉
5️⃣ 技术报告
1)技术报告 + 原始答案:destinylinker.github.io/MingLi-Bench/
2)Benchmark 数据 + 评测代码:github.com/DestinyLinker/…
做 agent 或者做传统文化 AI 的,可以麻烦仓库点颗星支持一下🌟
下一条把「200+ 原子工具」这套工具栈具体长什么样拆出来

中文
















