Fermi

246 posts

Fermi banner
Fermi

Fermi

@fermi_lee

AI Developer / Claude Certificated Architect / EPAM 踩坑 / 后端 / 架构 / 吐槽 / 低保

Delaware, USA Katılım Ağustos 2016
666 Takip Edilen146 Takipçiler
Fermi
Fermi@fermi_lee·
楼下卖卤味的朋友圈吓我一跳,还以为是真裸🐔呢
Fermi tweet media
中文
0
0
0
10
Fermi
Fermi@fermi_lee·
@435hz 确实,周末睡个大懒觉什么都恢复了
中文
0
0
0
14
章工
章工@435hz·
排第一的永远是睡觉,第二才是好好吃饭,第三是坚持运动,第四才是工作。 这个顺序千万不能搞反了。你要是天天工作顶在最前面,挤掉睡觉,糊弄吃饭,懒得运动,最后赚的钱还不够看病的,身体不是透支了还能分期付款还得东西。记住了: 睡够,吃好,动起来,再谈工作。 顺序对了,健康才不会跟你翻脸。
中文
30
133
784
22.1K
nini
nini@nini_incrypto_·
刚开始:按我说计划执行 最后:就照你说的做,全交给你了
nini tweet media
中文
11
0
21
1.2K
Fermi
Fermi@fermi_lee·
关注的rate limit大概是15 per 5 minutes?不开Premium还不知道有限流,没有回关的宝宝们别着急
中文
0
0
1
14
Fermi
Fermi@fermi_lee·
@jedeeai X上什么情况会封号?
中文
0
0
0
2
琳小航
琳小航@jedeeai·
账号被封不可怕 做自媒体没被封过几个号都不算入门 能快速重新起号 也是你的硬实力之一
中文
5
0
4
307
搬砖的小明
搬砖的小明@xiaoming_io·
感谢兄弟姐妹们,已经有200多粉丝了,距离500更近了。X关注有限流,等限流解除了,我会第一时间回关 #蓝v互关
GIF
中文
42
1
32
1.5K
Fermi
Fermi@fermi_lee·
@gdb Will OpenAI put it into Robot as the foundation of physical AI?
English
0
0
0
35
Eason Mao☢
Eason Mao☢@KELMAND1·
我的评价是 GLM 实测表现对得起它这个排名
Eason Mao☢ tweet media
Eason Mao☢@KELMAND1

GLM-5.2长session评测:连续跑完一个完整迁移任务 前面做的都是短任务对比,修一批 defect、跑个 TDD。这次给 GLM-5.2 一个完整的:一个模板迁移任务,从 CP1 迁到 CP3,模型连续跑了 1 小时 11 分、306 个 turn,中途零人工接管。讲讲它在完整工程任务里表现怎么样。 任务是个标准的交接执行:开篇加载 executing-plans 这个 skill,读 tasks/todo.md 拿到计划,然后开始执行。从里程碑看脉络清楚:turn 50 在做模板转换,turn 100 在重建 npm 依赖(从 0 恢复到 115 个包,包括 vite 和 vitest),turn 200 在配 entry 和 vite config,turn 300 在跑最终的全量 pytest 门禁,turn 303 加载 finishing-a-development-branch 这个 skill 做收尾,turn 305 主动停下来用 AskUserQuestion 问我要不要 push,因为分支上叠了别人早先的很多 commit、它只动了顶部 8 个。整个生命周期干净:执行计划、干活、收尾分支、等授权。306 个 turn 一口气跑完,工具执行几乎零等待,模型全程连续工作没断档。 效率数字:306 个 main turn,纯模型推理 66.4 分钟,平均单 turn 13 秒。这个比我之前在短任务 head-to-head 里测到的 19.8 秒快不少。最慢单 turn 66.1 秒,是改一个 Edit,全程只有 13 个 turn 超过 30 秒,占比 4%。吞吐 26.8 token 每秒,比修 defect 那段的 14.1 高出将近一倍。这个反差正好验证之前根因分析的结论:GLM 慢大头是推理吞吐,但吞吐不是恒定的,跟任务里 output 结构有关,长任务里大量是短促的 Edit 和 Bash,output token 少,反而把吞吐拉高了。而且非高峰时间GLM确实也会快一点(我的是max plan)。 工具调用 305 次,结构是这个 session 最有意思的点。Bash 116 次、Read 66 次、Edit 59 次、Write 51 次、TodoWrite 只有 10 次。Write 高达 51 次说明它新建了大量文件,符合模板迁移这种生成型任务。但 TodoWrite 只有 10 次,平摊到 306 turn,平均每 30 个 turn 才更新一次计划。这跟修 defect 那段完全相反,那段 GLM 14 turn 里 TodoWrite 用了 5 次,碎得要命。长任务里它反而收敛了,大段大段连续 Edit 和 Write 不打断自己。这个发现重要:GLM-5.2 的"流程碎"不是固有属性,是任务规模决定的,长任务里它会自动切到更紧凑的节奏。 token 这块印证了之前的判断。总 input 4985 万 token,cache read 4906 万,命中率 49.6%,净新输入 79 万。cache 命中率跟之前所有 session 一样卡在 49% 附近,是 harness 层面的常数。但净新输入 79 万平摊到 306 turn,平均每 turn 2582 token,比修 defect 那段 GLM 的每 turn 3.7 万小了一个量级。这解释了为什么长任务反而快:它没有每 turn 重新啃一大段没缓存的上下文,prompt 结构稳定、缓存复用率高。 几个体现能力的细节。一个是信号噪声判断。turn 100 重建依赖后 npm 报了 vulnerabilities,它没慌着去修,而是判断这些是 echarts 和 vitest 的传递依赖、pre-existing,继续验证 build 能不能用。长任务里这种"区分信号和噪声"的判断很关键,能避免在无关告警上空转。另一个是收尾纪律。turn 303 主动加载 finishing-a-development-branch 这个 skill,turn 305 用 AskUserQuestion 把 4 个标准选项摆出来,而且特别说明边界:分支上叠了很多别人早先的 commit、它只动了顶部 8 个,所以没有擅自 push。授权边界守了全程没破。 慢 turn 分布也值得说说。4 个超过 45 秒的,分别在 turn 46(改 Edit 55 秒)、65(读文件 50 秒)、76(写文件 55 秒)、210(改 Edit 66 秒)。清一色大文件的读写,没有一个是"卡住想不出来"的慢。坐实了之前分析里"慢 turn 主要由大文件 IO 决定、跟模型关系小"的判断。 所以结论可以更新了。GLM-5.2 用 1 小时 11 分连续跑完了一个完整的模板迁移任务,306 turn、305 次工具调用、零人工接管(除了最后那个该不该 push 的确认)。能力上模板转换、依赖重建、构建配置、全量测试、分支收尾这一整条链路它自己走完,中途不崩不乱不越权。效率上长任务反而是它的舒适区,吞吐升到 26.8 token 每秒,流程收敛、TodoWrite 不再碎。这跟之前短任务里"慢在流程碎、每 turn 净处理量大"的发现不矛盾,反而说明:GLM 的慢有一部分是短任务里过度自检造成的,任务一长、它自动优化节奏,这部分慢就消失了,真正剩下的是推理吞吐这个硬指标。 局限照旧:单个 session、模板迁移这一类任务。但作为"GLM-5.2 能不能独立连续跑完一个完整工程任务"的回答,这个 session 的答案是能,而且 1 小时 11 分一口气跑完,效率比短任务场景还高。

中文
4
3
21
3.1K
🍭吃货不怕胖🐬TermMax
粉丝正式突破8800 这次作死也要冲到10000 是蓝V就来留言,我是个很没架子的人 来的都是朋友,不管你账号的大小 吃货也是慢慢做起来的,共赢才是真正的赢💪 #蓝V互关
🍭吃货不怕胖🐬TermMax tweet media
中文
69
1
40
3.2K
zhao
zhao@apivixtls·
我发现自从开了x premium之后推荐的画风就变了,很多互关帖子 so 我也发一个 蓝V互关最快的方式,不是只发帖等人来。 而是去看别人的蓝V互关帖,再顺着他们的关注列表一个个点。 那里才是真正正在互关、正在起号的人。 主动一点,涨粉会快很多。 #蓝v互关
中文
24
0
14
575
Fermi
Fermi@fermi_lee·
@wngy127952 有心栽花花不开 无心插柳柳成荫
中文
0
0
0
9
被解救的姜戈
被解救的姜戈@wngy127952·
妈的,每月几十块的蓝V订阅费, 再加上翻墙的钱,感觉自己像在给推特打工。 我那点DOT仓位都快没了,蓝V互关这事能回本吗。 真的是越想越气。
被解救的姜戈 tweet media
中文
10
0
4
248
0xV
0xV@0vx888·
关注我的兄弟 我都已经回关 如果有遗漏的 可以私信或者在这个帖子评论区评论 看到了我都会回复的 感谢大家的支持 爱你们 么么叽😘
0xV tweet media
中文
19
0
19
563
哏都VICTOR
哏都VICTOR@EEeEEEeevictor·
今日争取冲刺1900!#蓝标加油 #蓝V 朋友们加油了 不能让 #Premium +的订阅费白交了
哏都VICTOR tweet media
中文
15
0
14
703
cyberkk
cyberkk@krienknight·
1000fo达成,感谢大家的关注
cyberkk tweet media
中文
58
0
47
3.9K
高级分析师
高级分析师@techeconomyana·
中国赢学不能让人理解的一点:明明消费疲软,社零转负了,互联网上吹嘘中国生活高、韩国人吃不起西瓜、美国斩杀线这类反智言论多了起来。
中文
47
5
194
11.9K
微尘印记
微尘印记@weichen_ink·
周三上午这种垃圾时间,我居然涨粉 44🤣 还差5个就可以到 2300了 有没有想互关的蓝V用户,欢迎留个言哈 我都会关注的!
微尘印记 tweet media
中文
6
0
2
264
Shibetoshi Nakamoto
Shibetoshi Nakamoto@BillyM2k·
do you actually drink 64oz of water every day? seems like a lot
English
95
4
91
8.6K
Fermi
Fermi@fermi_lee·
@lb377204209 今年猪价是不是最差的,我老丈人几年前就把养殖场空着了
中文
1
0
0
21
房策
房策@lb377204209·
刚才卖了9头猪,本打算卖60头左右,买猪的嫌小,后面的就没有再装车了,4.7元一斤,整体来说,赔的裤衩子都没了,拿出来2000晚上消遣一下,安慰一下自己受伤的心灵吧! 作为一个失败的90后,给00后一些微不足道的建议吧,国内现在允许私人进入的行业,都卷的冒烟,大家都在赔本赚吆喝,养猪的赔钱、养鱼的赔钱、种菜的赔钱、种水果的赔钱,普通人充分竞争的行业已经毫无未来了,未来只会越来越难,还有,买车千万不要碰新能源,房子如果杠杆太多,就先暂时放弃吧!还有爱情,懂的相互忍让和善良很重要,不结婚也不要去无脑当舔狗,孩子也没那么重要,怎么开心怎么来吧!我对未来的乐观率本来有60%,现在只有30%了,可以说,我感觉未来一片黑暗我看不见路了。
房策 tweet media房策 tweet media
中文
26
0
36
2.9K
黄小木
黄小木@ai_xiaomu·
突然发现618又到了, 为啥618,双11这种以前的狂欢节现在都没声音了?
中文
24
0
13
5.4K
Fermi
Fermi@fermi_lee·
@kfk_ai 老用户一直没开premium,好像是因为spacex上市
中文
1
0
1
9
Kafka
Kafka@kfk_ai·
X真是大善人啊 开了两个月半价 Premium+之后,年费还能再半价
Kafka tweet media
中文
5
0
9
631