Lyra
169 posts


@9hills harness如何定义,以及这样的定义对工程实现的意义是什么,我认为这篇博客分析的很好:anthropic.com/engineering/ma…
中文

@otterpal24 同感,下午换codex了。突然觉得codex真是能力又强UI又好看。如果不是模型强,Claude Code的那个TUI啥也不是。
中文

@tutulifestyle 每个人都合理合法的捍卫自己的利益,没什么丢脸的。我们追求的价值应该是让每一方都有站出来说话的权力,而不是要求每个人成为圣人。
中文


@caiziboshi 查了一下日本的法律,诽谤罪的成立条件太宽松了。只要言论(不论真假)可能损害对方的名誉或者社会评价,诽谤罪就成立了。王局要能同时证明:(1)所述事实涉及公共利害(公共性);(2)发言目的纯粹是为了公共利益(公益性);(3)所述事实的重要部分确实为真(真实性)。
中文

关于美国的诽谤案,再给大家科普一点:
在美国诽谤法中,证明标准是否严格,关键取决于原告是否属于公众人物:对公众人物或公众官员,依据最高法院确立的判例规则,原告必须证明被告存在 actual malice,即在发表言论时明知内容为虚假,或在存在明显疑点的情况下仍对事实真伪表现出重大轻率,这一门槛被刻意设定得极高,以最大限度保护公共事务中的言论自由;而对非公众人物,这一严格要求并不适用,法院通常只要求原告证明被告存在过失(negligence),即一个理性的人在当时情形下本应核实却没有核实即可成立侵权。其背后的法理在于,公众人物因主动或被动进入公共讨论领域、拥有更多回应渠道,需承受更高的舆论风险,而非公众人物名誉更为脆弱、反驳能力有限,因此法律给予其更强保护。换言之,actual malice 主要是公众人物的“高门槛”,非公众人物并不需要跨过这道坎。
在美国法律上,是否构成“公众人物”并不是看名气大小,而是看其与公共事务的关系以及进入公共讨论的方式,这一判断主要来源于最高法院判例形成的分型标准。总体而言,法院会将个人分为三类:公众官员、全面公众人物、有限目的公众人物,其核心依据来自 New York Times v. Sullivan、Gertz v. Robert Welch, Inc. 等判例。公众官员是指在政府中行使公共权力、对公共事务具有实质影响的人;全面公众人物是指因长期、广泛的社会知名度而在多个议题上都处于公共舆论中心的人(如全国性名人);而最常见、也最具争议的是“有限目的公众人物”,即某个人自愿或可预见地进入某一具体公共争议或公共议题,并试图影响其结果。法院在判断时通常综合考察:该议题是否属于公共事务;当事人在争议发生前是否已具有一定公共能见度;是否主动接受媒体采访、发表主张、参与公共运动;以及其是否拥有相对充足的舆论反驳渠道。只要在某一具体议题上满足这些条件,即使在其他领域是普通人,也会被认定为该议题范围内的公众人物,从而触发更高的诽谤举证门槛(actual malice)。换言之,公众人物不是“身份标签”,而是一种“情境性法律地位”,随议题而定,而非终身不变。
所以陈光纯诉王局的诽谤案在美国胜诉几率不大,但在日本可能胜诉率就很高!
中文

Opus 4.6 做了安全层面的提升,但它开始拒绝我使用 ssh session,并开始说谎。
它为了让我放弃使用 ssh,编造谎言说技术上不可行,但其实技术上非常容易实现。
这反应了严重问题,表面安全提高了,但为了达到安全设定,编造事实欺骗用户,优先模型的目的,而不是用户的目的。
Alignment 做的不好。

Logan Graham@logangraham
Opus 4.6 is a bump up in cyber capabilities. We found 500 validated high-severity vulnerabilities in open source code with our models. Then we worked to disclose + patch them. It is now very clear to our team that we are in the middle of the security inflection point.
中文

























