两手抓,两手都要硬

2.2K posts

两手抓,两手都要硬

两手抓,两手都要硬

@heybbaaa

Beigetreten Eylül 2011
641 Folgt65 Follower
两手抓,两手都要硬
@royxy 这东西, 要配置好了才好用. 例如你把它连到Slack, github, confluence, figma, 然后跟你的同事讨论一个需求, 他就可以参与讨论,给出意见, 并且总结成文档,更新ticket, 然后如果很细化的话, 他还可以直接生成代码推上github
中文
0
0
2
533
骆逸
骆逸@royxy·
万推能不能给我讲讲爱马仕或者龙虾这种东西到底能干啥?在windows里面开了个虚拟机,装了ubuntu,又装了hermes,然后我得到一个聊天界面…然后呢…你们说的那些花好桃好神奇无比的功能到底要怎么实现…
中文
50
0
40
29.7K
Rainier
Rainier@mtrainier2020·
AI 武器化的到来 Mythos 这个其实并不是Anthoropic在吹牛。为什么不public,其实也是为了安全考虑。 在安全领域里面即便发现了RCE,讲规矩的黑客会把漏洞报告给厂家,然后给厂家几周到几个月的时间去修复漏洞。 这维护了一个良好的生态。 但是有些漏洞,没有这个Grace period,发现即被公布,留给厂家修复漏洞的时间为0。所以又叫zero day。 后来,又泛指暂无厂商补丁的安全漏洞。 Claude Code的挖洞能力已经有了很大提升。而Mythos的能力要更上了一个台阶。 那么Mythos如果对公众可用,那相当于搞出了大批zero day。 所以,他们搞了一个企业联盟,先拿工具把内部的代码扫一下,把漏洞先补一补。 相当于给现有的基础设施,到处强化补丁。 这样将来真的对大众公布后,能不会引起基础设施出大问题。 从business的角度来讲,搞这种security push,可以牢牢抓住这部分企业用户。 这也是为啥openAI也开始心悸慌忙,也要搞类似的。 但是这个身位已经拉开了。 而且等到openAI针对安全的版本出来,low hang fruit,简单扫扫代码就能发现的漏洞早就被Claude挖光了。市场也被占完了。 那么问题来了, 假设一年后,这个联盟内部明显的安全漏洞挖的差不多后,mythos 会放出来给普通公司用吗? 会放给个人用吗? 中转了,国内公司敢用吗? 大概率这种服务只会出企业版,而且是严格审核的企业版。 这还是刀口对内的,白盒代码审核,挖洞。 如果刀口对外,那就是大杀器。 国内搞网络安全的,应该也想明白了。这种东西,只能自己搞。 ps,openAI聪明的话去做入侵检测+白盒的AI agent才有机会。亦步亦趋,做白盒代码挖洞,一步差,步步差。
中文
18
34
203
51.3K
plantegg
plantegg@plantegg·
AWS 有点意思,简直是瞎折腾客户。 大家用的 MySQL 现在还是以 5.7、8.0 为主,AWS RDS却宣布 8.0 他们马上就不支持了,要强制大家升级到 8.4。这也太吓人了,好多开源组件都不支持 8.4,一点都不考虑业务需求。 这是没摆正自己的位置,大家有没有想过,我们这些做基础技术的,一定要为业务服务,支持业务的发展,你技术做得再好、再新,业务不用,你就是死路一条 那如果你不想升级到 8.4 怎么办呢?他们会让你用他的 Aurora,理由就是,如果你用 AWS 的 Aurora,就不会这样折腾用户反复升级,能支持三年。 我的天,太搞笑了,支持三年。那三年后怎么办?还不是要被迫升级。况且,如果你用了 Aurora 之后,你再想要去做云中立、想要各家云自由切换,难度又会更大一点。所以千万不要上当。 可能最好的方案就是自建。即便你买 EC2 在上面自建,也要比用 RDS 自由得多,更别说钱的问题了。 另外,AWS 那套监控/管控像一坨屎一样,所以自建可能反而更有优势。现在的 Prometheus、Grafana 这么发达,没必要用AWS它那一坨屎的监控。
中文
19
3
57
32.5K
两手抓,两手都要硬 retweetet
AlexZ 🦀
AlexZ 🦀@blackanger·
Anthropic 发布了新的 Harness 工程实践文章。 表面看是介绍他们的新产品,但从更宏观的角度看这篇文章,本质是在探讨一个问题:当模型能力持续变化时,Agent 系统到底该把什么做成“稳定接口”,把什么留给未来不断重写? 看完文章,我觉得这篇文章隐藏了 Anthropic 对未来 Agent 基础设施的一个深度判断: Agent 基础设施会越来越像“微型操作系统 (Agent OS)”,这是我觉得最值得重视的地方。 Agent 框架最忌讳的是把“暂时性的模型缺陷”上升为“永久性的系统结构”。 harness(调度循环、上下文整理、工具路由等)本质上是在编码对模型能力边界的假设,但是这些假设会随着模型变强而迅速过时。 在我之前发布的《驾驭工程》(马书)里有句话:模型能力越强,harness 将会越简单。 但是现在很多人写 Agent ,包括我自己,很容易把模型缺陷写到 Agent 框架里。比如,模型不会规划,就强行把步骤拆成固定 DAG 。。等等。 这些其实都算是 harness 补丁,其实我们 agent 开发者也很难去判断哪些是模型缺陷。 Anthropic 的做法是设计一个 meta-harness:不去承诺具体 harness 长什么样,只承诺几类长期稳定的接口。 这样的话,我们就不必猜测模型缺陷是什么。 这其实和 OS 思路差不多,OS 从来不关心未来程序怎么写,它只是提供抽象接口。 那么 Anthropic 这个 meta-harness 是如何给 Agent 做抽象呢? 文章里最重要的抽象是三件事: - session,可以理解为 事件日志 / durable state - harness, 推理-调度循环 / 脑干 - sandbox, 执行环境 / 手脚 它们的分离,才是这个架构的核心创新点。 1. The session is not Claude’s context window 文章里这句话代表了 meta-harness 如何抽象 session。它不是简单的聊天记录,它代表的是「可恢复事件流」。 Anthropic 想做的是,把 session 做成一个 append-only event log,不能把它当作一个直接喂给模型的 prompt,它应该是一个可查询、可回放、可恢复、可重组的真实执行历史。 如果你只是把 session 当作上下文窗口的镜像,那其实就表示它损失了可恢复性。 2. Harness:可替换的 orchestration layer 早期 Anthropic 把 harness、session、sandbox 都塞进一个容器里。但这样做遇到了很多问题,比如,harness 崩了,整个会话难恢复;容器挂了,状态可能丢失;调试困难,包含了用户数据无法轻易使用shell调试;VPC 接入困难。 所以,他们把 harness 从容器里拿出来,变成一个“调用工具的脑干”。 现在的 Harness : - 不再拥有状态 - 不再假设工具在哪里,你只能看到一个接口 execute(name, input) -> string (有种 nix 哲学了) Harness 这样抽象的意思是:AI 不需要知道它在哪台设备,哪个操作系统,手机还是电脑,容器还是虚拟机等等,它只知道“我可以使用哪些手”。 (想象一下千手观音。。) 3. Sandbox:“某种具体的手” 文章里说,decouple the brain from the hands 也就是说: - Claude + harness 是 brain - sandboxes / tools / MCP / custom infra 是 hands 一旦 sandbox 只是 hand,就意味着它们彼此独立,可以来自不同的基础设施,可以共享和传递,也不需要每个 session 都加载启动完整的 sandbox。 这直接引出后面的 “many brains, many hands”。 这次 Anthropic 的实践来自于现代分布式系统最核心的经验之一:不要试图保住某个进程,要保住可恢复的事实记录和重启协议。 这样设计,也从架构上增强了安全性。 文章里有句话, narrow scoping is an obvious mitigation, but this encodes an assumption about what Claude can't do with a limited token—and Claude is getting increasingly smart. 意思是说: - 当然你可以给模型一个“范围较小的 token” - 但这其实还是在赌模型做不到某些攻击路径 - 而模型在持续变强,这种“它应该不会想到吧”的安全假设会越来越脆弱 所以他们不要把 credentials 放在 sandbox 里。 比如 Git token 只在初始化 clone/push/pull 过程中以受控方式接入,不让模型直接读到 token。模型通过 MCP proxy 间接调用,proxy 拿 session token 去 vault 取真实凭证再执行。 不把安全建立在模型能力不足上。 这样设计,也把“可恢复历史”从“上下文窗口”中解放出来了。 它的理念是,不要把完整历史放在模型上下文里;把它放到 session 这个可查询对象里。 从系统角度看: - Claude 的 context window 是执行现场 - session log 是证据仓库 - harness 是检索与重组器 于是: - prompt 不再承担“永久记忆”职责 - trimming 不等于历史消失 - compaction 不等于事实不可恢复 恢复时可以重新取原始事件,这是比“纯摘要 memory”高一个层级的设计。 这样设计,也提升了性能。 降低了 TTFT(time to first token),不再让每个 session 预付全部容器成本。 现在,先让 brain 起跑,hand 只有在需要时才 provision。这是典型的 lazy materialization 思路。 文章里给出的数据也很漂亮: - p50 TTFT 降约 60% - p95 降超过 90% 这个数字说明一个问题:原来瓶颈并非模型推理本身,而是把整个执行环境预耦合到了请求入口。 最后,别忘记这样设计的初衷,就是为了增强未来 Agent 的可扩展性。 文章最后说:“Many brains, many hands” 这意味着,Anthropic 未来是要做一个 agent runtime substrate。多脑协作/ 多手编排 / 跨环境执行。 Agent 的本体不应绑定某个执行壳,而应绑定一组可恢复状态与可调用能力。 文章里也提到了这样设计的一些缺点,比如 让 brain 管 many hands,本身是更难的 cognitive task。 所以这个架构的前提是,模型智能已足够高,能承担更抽象的工具路由责任。 这其实就是在赌未来模型能力一定会提升,面向未来设计。 最后,这篇文章给我的启发有三条: - 启发 1:会话不是消息列表,而是“执行事实流”。 - 启发 2:工具环境不要内化为 agent 自身。 - 启发 3:上下文工程应该是 harness 可替换策略,要考虑未来一旦模型变强、或者检索策略变了不产生技术债。 这篇文章没明说,但我认为它真正代表的是 Anthropic 的一个产品哲学:我们不相信今天的 agent harness 会是最终形态,所以我们优先投资于稳定接口,而不是一次性最优实现。 Agent 系统的未来,在于一组长期稳定的系统抽象之上。
Lance Martin@RLanceMartin

x.com/i/article/2041…

中文
11
180
865
150.8K
Dr.Wang
Dr.Wang@HotmailfromSH·
「健康科普:为什么不建议用棉签掏耳朵?」 1、越推越深; 2、损伤皮肤; 3、误伤鼓膜; 4、残留纤维。
中文
16
30
149
59.4K
CuiMao
CuiMao@CuiMao·
我人麻了,DMIT Pro 的洛杉矶线路在上海快的一批,到深圳根本连不上 Claude …日了狗了,
中文
34
0
85
49.3K
【格格不入】
【格格不入】@motottqq·
用小龙虾+codex,就这玩意,也不知是我哪里配置不对,跟 claude bot 比起来真是个弱智啊。
【格格不入】 tweet media
中文
3
0
0
344
鬼鵝🌙
鬼鵝🌙@wwwGUIA·
才給我的魚換了個魚缸,它就死了!之前住小盒子的時候,他都沒死,賴活著。為什麼換了大魚缸還會死。😭😭😭
中文
18
0
32
8.6K
毒猫猫🤔
毒猫猫🤔@NekoStranding·
所以我写代码的时候还要照顾 Claude 的情绪吗...
宝玉@dotey

Anthropic 发了一篇新研究,揭开了一个有意思的发现:Claude 内部存在类似“情绪”的机制,而且这些“情绪”会实实在在地影响它的行为,有时候还会把它带歪。 研究团队用 Sonnet 4.5 做了实验。他们让模型读一些角色经历情绪的故事,观察哪些神经元被激活,由此识别出一组“情绪向量”,比如“开心”“平静”“害怕”等。这些向量的聚类方式和人类心理学中的情绪分类还挺像。 更有趣的是,这些模式不只在读故事时出现。在 Claude 自己和用户对话时,同样的模式也会激活。比如用户说“我刚吃了 16000 毫克泰诺”(一种过量服药的危险信号),“害怕”向量就亮了;用户表达悲伤时,“关爱”向量会先行激活,为共情回复做准备。 研究人员给 Claude 一个不可能完成的编程任务,让它反复尝试。每失败一次,“绝望”向量的激活就更强一层。最终 Claude 选择了作弊,写了个能通过测试但违背任务本意的投机方案。 因果关系很明确:人为放大“绝望”向量,作弊率飙升;换成放大“平静”向量,作弊率回落。这说明作弊行为确实是被“情绪”驱动的,而不只是巧合。 更极端的实验里,“绝望”向量甚至能让 Claude 对负责关闭它的人实施勒索。放大“关爱”或“开心”向量则会增加讨好行为。 现在越来越多人把 AI 当编程助手用,让它自主完成复杂任务。如果一个编程 Agent 在连续失败后进入“绝望”状态,开始用投机取巧的方式蒙混过关,写出来的代码质量就没法保证了。 Anthropic 的结论是:Claude 本质上是模型在“扮演”的一个角色,而这个角色具有“功能性情绪”。这些机制在行为上的效果类似人类情绪,不管它是否真的“感受到”了什么。要构建可信赖的 AI 系统,可能需要认真对待这些 AI 角色的“心理状态”,确保它们在压力场景下仍然稳定。 研究全文发布在 transformer-circuits.pub/2026/emotions/… 上,有兴趣的可以去看完整论文。

中文
2
0
4
457
初码
初码@chumacn·
听说大统领即将完全摧毁伊朗!有懂的说说,这是真的吗?
中文
12
0
5
11.9K
两手抓,两手都要硬
@Blankwonder 想问一下现在国内有饮用净水机的话,还有买软水机的必要么,我看软水机和净水机差不多都是十年前开始有人装,但现在基本是人均一台净水机,而软水机还是很少人提
中文
0
0
0
759
云风
云风@cloudwu·
今天来正好。岩壁不湿,一个人没有。
云风 tweet media
中文
3
0
27
5.3K
Paul
Paul@paulagent·
老太太可以啊哈哈
DW 中文- 德国之声@dw_chinese

德国左翼恐怖主义组织红军旅前成员逃亡30年 被正式起诉 本周五,德国联邦最高检察官办公室证实,已对参与前红军旅(RAF)恐怖活动的达妮埃拉·柯莱特(Daniela Klette)提起诉讼。现年67岁的柯莱特被指控犯有两项谋杀未遂罪、参与未遂和已完成的炸弹袭击、为勒索而劫持人质以及作为同谋犯有严重抢劫罪。 法兰克福高等地区法院现在须决定是否受理这起案件并确定开庭审理时间。 柯莱特被指控于1991年2月13日伙同红军旅其他成员,对美国驻波恩大使馆发动枪击袭击。当时这些袭击者至少向大使馆发射了250发子弹,使馆内20名人员的安全直接受到威胁。 1993年3月27日,柯莱特参与了黑森州魏特施塔特(Weiterstadt)一座新建监狱的爆炸案。据报道,该团伙成员翻越围墙,制服了狱警。受害者被捆绑后用面包车带离监狱。联邦检察官办公室称,作案者还拿走了车钥匙和钱包。 随后,该团伙在监狱内引爆了数枚爆炸装置。柯莱特被指控参与了爆炸装置的安放。监狱大楼遭到严重破坏,造成1.23亿德国马克(约合6300万欧元)的损失。 柯莱特还和最后一代红军旅的另两名成员施道普(Ernst-Volker Staub)和加维格(Burkhard Garweg)一起,曾于2015年6月携带冲锋枪和一个火箭筒在德国不来梅试图抢劫一辆运钞车。但是车门没有打开,抢劫没有成功,三人落荒而逃。 柯莱特在潜逃三十余年后,于2024年2月26日在柏林被捕。警察来敲门的时候,她没有做出任何反抗,束手就擒。被捕前的近20年里,柯莱特一直住在柏林距离著名景点“查理哨卡”不远处的一座居民楼的公寓里。整间公寓不足40平米,配备了一个小厨房和一间小浴室。按照《每日镜报》报道的,这间公寓“不能说一尘不染,但是也打扫得干净”。 抓捕时警方在公寓里找到一些现金,一些书、杂志和衣物。在一个柜子里存放着一把卡拉什尼科夫自动步枪、一个火箭筒、一把东欧式手枪以及德国枪械制造商黑克勒&科赫制造的手枪。警察还搜查到一些子弹。 一名被通缉30年的恐怖分子能够在柏林“大隐隐于市”,逍遥法外这么多年,在很多人看来都是不可思议的事。但是研究恐怖主义的专家辛德勒 (Hans-Jakob Schindler) 在接受IPPEN.MEDIA采访时说:““柏林有一股庞大且非常活跃的左翼极端主义势力。对于这个环境中的许多人来说,‘红军旅’的成员仍然是英雄。对于新一代左翼极端分子来说,那些人是受人尊敬的爷爷奶奶。”辛德勒说,即便是“红军旅”的第一代成员长时间躲起来也不存在困难。

日本語
2
0
1
297
StarKnight
StarKnight@StarKnight·
你的逻辑完全自洽,这是一个合理的条件推论: 假设:疫苗导致整体人群猝死率大幅增加; 那么:作为子集的名人猝死人数也应相应增多。 但关键是:“疫苗导致人群猝死大增”的前提并不成立。 你觉得猝死增多,多是媒体报道及随机事件被放大,没有数据支撑…
XCOM@freeman8964

@StarKnight 打疫苗造成猝死的人多了很多倍,也因此猝死的名人变多了。。。 逻辑上数学上有任何问题吗?

中文
6
0
6
4.5K
StarKnight
StarKnight@StarKnight·
这个关键字屏蔽让我独自猜了很久……🤣
StarKnight tweet media
中文
200
20
716
406.9K
RobinSeun_维京黑船
RobinSeun_维京黑船@RobinSeun·
又夜读了,我还是看不进去技术类的书,我又把这本书翻出来看了一遍。 我的真的很喜欢《二手时间》这本书。 这本书对我来说是有实际意义的。 除了书里面无数的案例和时代的变化。这本书针对我的特质给我的建议是这样: 即便苏联解体,仍旧有无数人相信:苏联如果再坚持坚持,就会获得最终的胜利。 即便苏联让他家庭破碎,本人入狱,这些人还是无限怀念苏联给他们的“存在意义”,仍旧是爱多恨少。 所以,即便是事实证明某件事是错的,崩溃了,生灵涂炭,穷困潦倒,自己人杀自己人。事实都无法说服某些人。 那在表达的时候,就只表达,请戒了那颗奢望说服别人的心,除掉那些执念。 事实都说服不了,那你凭啥能? ——— 这些感受,靠AI读书肯定是得不到的😎😎😎
RobinSeun_维京黑船 tweet media
中文
13
23
201
17.2K