Solia007

168 posts

Solia007 banner
Solia007

Solia007

@solia007

谈谈告警的故事

Katılım Haziran 2025
12 Takip Edilen10 Takipçiler
Solia007
Solia007@solia007·
其实让流程能够在运行的过程中验证并思考自身,并非拟人化意义上的“自我意识”,也不是让系统会说“我是谁”。这是一种硬能力:要让流程在执行中,不只往前跑,还得检查自身的中间状态、输出结果和行动轨迹,再决定要不要继续、回退、重试或者改道。也就是说,处理的已经不单是外部任务,还有“我现在是不是还在正确地做这件事”的反思工作。 这条线本身已经很清晰了,但很多讨论还没把它单独拎出来。在调研中,我发现早一点的工作,比如 ReAct、Self-Verification、Self-Refine、Reflexion,重点还在“生成之后回头检查自己”。先给答案,再验证;先出初稿,再反馈、修订;先做一轮,再把失败经验写进下一轮。 往后重心开始发生了转移。比如 CRITIC、Self-Debugging、LATS 这些工作,已经不满足于“模型自己批评自己”,而是越来越明确地把外部工具、程序执行、环境反馈、测试结果、搜索过程都拉进来。重点不再是“会不会反思”,而是“能不能验证”。这其实也是为什么代码代理和网页代理这两年进展特别快的一个原因。 因为这两类任务有硬反馈。代码能不能编译、测试能不能过、改动是不是真的修掉了 bug,这些都能验证。网页任务是不是点对了页面、是不是改对了状态、是不是完成了任务,也能验证。所以我们会看到 WebArena、WebArena Verified、SWE-bench、SWE-bench-Live 这类 benchmark 越来越重要。它们背后的方向其实很一致:不要只看模型说得像不像对,而要看它是不是真的做对了。 工程侧也一样。比如AutoGen 把 reflection 做成 reviewer 回路。LangGraph 强调 durable execution 和 human-in-the-loop。Guardrails、PydanticAI 这类项目把 validator、schema、重试机制正式接进流程。Temporal、Prefect、Kestra 这类系统则提供恢复、检查点和运行时保证。 这些看起来像不同的东西,其实都在往一个方向靠:让流程在执行时,不只是做事,还能判断自己做得对不对。 也就是说自动化升级,会执行、解决重复劳动仅仅是基础起步而已。能验证,开始思考处理不确定性,更为关键,并且从公开的研究看后面的路还很长。
中文
0
0
0
6
Solia007
Solia007@solia007·
@baispx @Lilb67353384 如果按正常货币政策看,一是通过不同工具置换到期资金(净回笼/净投放要看口径和月份),稳住银行间利率;二是做储备结构优化,分散风险(美债、黄金各有波动)。至于别的,不太好说哎
中文
0
0
0
11
老白 | Trader🐮
据悉,中国正在为下一次类似2008年的全球危机做准备。 仅仅本月,中国人民银行就从系统中抽走了1.15万亿元的流动性。 中国持有的美国国债也仍接近20年来的最低点,仅约6940亿美元,而其黄金储备在连续17个月买入后已升至约3430亿美元。 抽走流动性、减少美国债务敞口并增加更多黄金,这是一个相当明确的信号, 中国正在为某件大事做准备。
老白 | Trader🐮 tweet media
中文
23
29
189
120.8K
Solia007
Solia007@solia007·
@baispx @Lilb67353384 “抽走1.15万亿流动性”一般是特定月份某项工具(如MLF到期置换)口径下的净回笼,并不等同于“本月一刀切抽走那么多”。好像近期媒体也用过不同口径(短端+中长期工具合计)来算净回笼,数字接近但表达差异很大。
中文
1
0
0
224
Force
Force@Force_1992·
@Ben190920 跪台办就是这么不要脸。也难怪新华社被喷得关评论
中文
1
0
3
369
LI LIAO SHI
LI LIAO SHI@Ben190920·
台湾商业总会理事长回应大陆惠台10项政策,希望大陆填补因美国关税而造成的损失。 这个哥们真是个实在人。
中文
15
2
19
3.3K
Solia007
Solia007@solia007·
@andyz8818576155 WSJ 的确提到政府在研判战争可能持续 8-12 周、并评估能源冲击会让欧亚更脆弱。但推演成‘故意削弱欧亚的战略杠杆’就属于个人解读了。有点把经济风险评估当成战略阴谋的感觉
中文
1
0
5
2.7K
Andy O
Andy O@andyz8818576155·
华尔街日报今天的头条爆了两个猛料: 1)白宫正在为伊朗战争延长到8-12周做准备。 2)延长战争的底气在于财政部长贝森特认为这次战争主要影响欧洲和亚洲,美受冲击较小。 这意味着美国把这次伊朗战争当成了同时削弱欧洲,亚洲的一个战略杠杠。
Andy O tweet media
中文
38
81
409
89.4K
Solia007
Solia007@solia007·
@DongNMLGB 说的对。翻墙出来的中国人,言语反倒温和很多。内部的殖人现在真的多到离谱。有个叫“Alex 包老师”的,一个毫无常识的大傻逼,比那个 户晨风 强不到哪里去,但是人气超高
中文
0
0
1
118
Emma家的圆荔子【KTV麦霸团】
ber 你发在这x上,评论区不也都是喷你的~ 发墙内,说不定附和你的比x上的还要多呢~ 我说了,美帝最牛逼的产业,没有之一:远程养殖 🤭🤭🤭
Emma家的圆荔子【KTV麦霸团】 tweet media
中文
12
1
87
4.3K
Solia007
Solia007@solia007·
@Ben190920 不好说。可能也知道台湾不会领情的,给再多也不会领情。但是道义制高点得占住。如果台湾直接掀桌子,那是最好的。如果只占便宜,又始终保持现状就挺难搞的。 完全瞎猜的
中文
1
0
5
617
LI LIAO SHI
LI LIAO SHI@Ben190920·
奇葩岛 地球上最反共的岛 老共给好处给到被舆论大骂 被骂到强行撤热搜禁评论 结果 岛内还不领情 觉得你惠得还不够多 觉得你惠台是你欠岛上的 你tm连个党支部都没办法在岛上建立 每回出手却能做到十条二十条惠台政策 然后换不来白眼狼的半句感谢 你们对得起牺牲在四一二反革命政变和朝鲜的先烈吗?
中文
46
6
112
8.2K
Solia007
Solia007@solia007·
@Konekoutena 高市这种形象就是代表了日本大多数人,这没有什么可否认的。ta滑稽也好,丑态百出也罢,跟我们有什么关系
中文
0
1
26
4.7K
枫糖小猫
枫糖小猫@Konekoutena·
在中国特别仇日的那些人都特别支持高市。高市在白宫那些滑稽的丑态已经成为中国互联网上的笑料了。她的经济政策也在把日本推向破产。而高市所驱赶排斥的,都是中国里讨厌共产党最亲日的。现在在日华人一边被高市排挤一边被小粉红嘲笑,可谓里外不是人。日本排斥那些对日本最亲近友好的华人,真的没有理由,也非常愚蠢
windtrack@windtrack_QH

@teenagedreemmin @Konekoutena @SerphRider 哥们你可能搞错了,中国人都特别支持高市,可能比你们日本人还支持

中文
37
931
3.2K
148.8K
迷人的小红
迷人的小红@miren_41319·
李在明真的挺刚啊!韩国这也算支棱起来了
迷人的小红 tweet media迷人的小红 tweet media
中文
26
19
287
126.7K
Solia007
Solia007@solia007·
@KELMAND1 如果中国未来某一天,殖人或公知掌握了国家话语权呢
中文
2
0
2
946
Solia007
Solia007@solia007·
@myrawang0 猪价权重大,但最近跌更多是供给过剩和季节因素叠加。用猪价推导‘通缩到极致必恶性通胀’逻辑未免太可笑。换汇/买美股风险和限制都不小,别让情绪替代数据。
中文
1
0
1
4.4K
Myra Wang
Myra Wang@myrawang0·
我姐姐告诉我 现在中国的猪肉价格大跌 证明需求很弱 也就是通缩到底了 虽然猪肉 ≠ 整体经济 但是猪价只是一个特殊行业指标 通缩 到底的结果是=恶性通胀 如果政府稍后大规模放水(货币政策) 那么未来 一定会出现宏观通胀 那么人民币会大幅贬值 结论如下: 有条件的话 在你的手机银行内 以旅游的原因 换一些欧元 和 美金(欧美老牌发达国家的货币) 不客气😉
中文
160
28
374
190.7K
Solia007
Solia007@solia007·
AI看似降低了准入门槛,但实际上也拔高了语言表达的上限要求。对需求描述越精准,与AI的交流成本也会越低,结果自然就越好。相反,表达能力弱的,与AI的沟通中,会相互带偏对方,导致需求与现实南辕北辙。
中文
1
0
0
24
Solia007
Solia007@solia007·
造谣中国人吃不起饭,是他们这类反贼群体最大的安慰。你给他们解释有用吗?去欧美看病真实体验一下,什么叫穷人真正的看病难。
中文
0
0
1
45
局部围合
局部围合@wei_bu23141·
@renjianyoushu @Lena_G_C 不是,就算人均只有五百元每月的农民,肉蛋奶也是不再缺了。 X友说得没错,现在的农民怕的是生病,而不是食物。 PS:我们湖南这边,农村平时最大的支出是“人情”,也就是很多地方说的 份子钱。
中文
1
0
4
222
北藜
北藜@Lena_G_C·
很多中国人不如黑奴吃得好,一半中国人达不到大种植园的黑奴的营养水准。 我要不是来自相对偏远的农村,见证了这几十年的变化,还经常回国吃“不如黑奴”的饭,我就真信了。 现在绝大部分农村,真不缺那口吃的了。肉、鱼都便宜。 用我妈的话说,现在的生活,每天都是过年。 农民如今最大的忧虑,是看病,而不是吃饭。
北藜 tweet media
中文
166
6
195
44.6K
Solia007
Solia007@solia007·
@supezen 基本同意。太多人跟风然后只玩看脸的“一夜情”,实际用过之后,CC确实不错。但吹的有些过头,捧得也有点太高
中文
0
0
2
617
ZEN
ZEN@supezen·
似乎有点明白了。 Claude Code 适合写前端代码,Codex 适合写后端代码,两者其实各有所长。 但由于前端开发者基数更大,产出的作品也更容易展示和分享,所以 Claude Code 在 X 上的声量明显更高。 以上纯属个人猜测,大家的感受怎么样?
中文
59
4
133
44.7K
Solia007
Solia007@solia007·
AI巨头们联合起来,限制自家AI被蒸馏这事儿,真正利好中国AI。是骡子是马拉出溜溜,凭实力说话。不然总是被蛐蛐,撇不清嫌疑。最重要的是能更利于大众了解真相。只有知道真正的差距,才能更健康的发展自己。
中文
1
0
1
66
Solia007
Solia007@solia007·
@JazzGarlic 中国国内,户晨风之流的货色太多了
中文
0
0
8
1.1K
北美打字员
北美打字员@JazzGarlic·
这年头咋还有傻逼找户晨风拍祝福视频🫠🫠🫠
中文
42
1
163
27K
Kai
Kai@Kai866·
老实说,华为Matebook Fold颜值跟功能是真高,可惜很多国外软件不适配鸿蒙系统,买了一直在吃灰。
中文
14
2
22
15.6K