
Tianfu Agent 在全球算命师大赛上跑到 50% 截尾准确率(人类 Top-20 选手平均 53.5%) 比赛 3069 名参赛者 人类 Top-20 选手平均 53.5% 最强通用大模型基线(Claude Opus 4.6)40%,这中间差了 10 个百分点 1️⃣ 一句话讲清楚 一个为命理术数专门设计的 agent 系统,在中国传统文化领域里,第一次真正贴近顶尖人类选手的水平 2️⃣ 它是什么? 给 LLM 造了一整套命理专用工具环境 200+ 原子工具 / Agentic 端到端推理 让 AI 真正学会怎么「做命理」 跳出「把命盘数据塞进 Prompt 让通用大模型硬猜」这条老路子 3️⃣ 以前的解决方案 「排盘数据 + 通用大模型」 听起来够用了,实际上有三个结构性硬伤: 1)衍生数据会组合爆炸 大限 / 流年 / 飞宫 层层展开 没法穷举塞进 Prompt 2)空间关系序列化造成幻觉 三方四正 / 能量流通 全是拓扑结构 翻译成文字就面目全非 3)推理链越长越飘 每一步都依赖上一步 错误逐步放大 专业训练语料几乎为零 模型压根不懂这些规则 4️⃣ Tianfu Agent 的思路换了一套 第一 确定性优先 200+ 专用原子工具 排盘 / 飞宫 / 取用神推演 全部精确计算 模型不用「回忆」知识 第二 推理规则工具化 行业内部的推理技法 也写成可调用函数 该用哪条 / 什么时候用 模型按需精准触发 绕开了「让模型记住并遵守专业规则」这条永远跑不通的路 第三 量化「直觉」 从工具输出量化指标 / Sub-Agent 的自评 / 多流派合参的调和 层层量化 模拟人类专家的隐式判断直觉 5️⃣ 技术报告 1)技术报告 + 原始答案:destinylinker.github.io/MingLi-Bench/ 2)Benchmark 数据 + 评测代码:github.com/DestinyLinker/… 做 agent 或者做传统文化 AI 的,可以麻烦仓库点颗星支持一下🌟 下一条把「200+ 原子工具」这套工具栈具体长什么样拆出来























