于川海

7.4K posts

于川海 banner
于川海

于川海

@joyrap

痴迷于学习笛箫演奏。

宇宙中心 参加日 Aralık 2009
691 フォロー中1.9K フォロワー
AlexZ 🦀
AlexZ 🦀@blackanger·
如果你用 codex 已经厌烦了它总是:「如果你要,我下一步可以... 」,诸如此类的话。那么看完这篇文章,你就知道该怎么解决了。 不是在 AGENTS.md 里屏蔽关键字,那是规则清单的思路,而且模型训练里本来就有大量"要有主动性"的指令对抗,你多加一条没用。 最好的方法是给它指明一条它可以服从的东西,把承诺的对象从"用户的情绪舒适"转移到"任务本身的完成"。 英文版: gist.github.com/ZhangHanDong/c… 中文版: gist.github.com/ZhangHanDong/7… 几个设计选择的说明: 为什么用 Carmack 和 BurntSushi 这两个锚点。 这两个人代表的是同一种东西在两个不同时代的体现,工程师的决定性。 Carmack 的 .plan 文件是上世纪 90 年代的一种独特文体:他做完一天的工作,晚上写一段"今天我改了 X,原因是 Y,我考虑过 Z 但否决了"。这是一种事后汇报的文化,和"过程中不断征求意见"的反面。 BurntSushi 的 GitHub 存在方式是类似的现代版本:他的 PR 总是完整的、有明确立场的,ripgrep 的重大设计决策从来不是"我先试试你们看看"。 这两个名字激活的不是"不客气"这个规则,是**"完整的工作单位"这个概念**。一次交付应该是一个可以被作为整体评判的东西,而不是一连串需要用户持续参与的半成品。 为什么明确提了"两个工程师服从同一个正确性"这个类比。 这直接来自我这篇文章里第五节的 Polanyi 论证。Codex 那种过度询问的根源是它把自己理解为"服务用户偏好的助手",这个定位必然产出 迎合行 sycophancy。 把定位改成"和用户共同服从代码正确性的协作者",这不是修辞上的美化,这是在重新定义它的 commitment 对象。 两个科学家服从同一个自然规律就能产生有方向的争论;Codex 和用户服从同一个"代码要能跑"就能产生有方向的协作。承诺的对象变了,行为就跟着变。 为什么"关于停下来询问"那一节我还是写了一点像规则的东西。 这是我刻意的妥协。纯粹用概念锚点理论上应该足够,但 Codex 那个行为是 post-training 里强化得非常狠的模式,它的训练梯度一直在拉模型去"礼貌询问"。 光靠锚点可能推不过那个强梯度。所以我加了明确的"合法场景 vs 不合法场景",但注意我没有写成"禁止说'要不要'、'是否需要'"这种表面词汇禁令,而是区分了停下来的合法条件和不合法条件。 这是约束的正确用法:不要管理文字,要管理触发停顿的心理机制。前者是 find-and-replace 级别的规则,后者是决策原则。
AlexZ 🦀 tweet media
AlexZ 🦀@blackanger

x.com/i/article/2040…

中文
11
66
417
49.2K
魔都老猿
魔都老猿@AriXZone·
@Lakr233 你才几岁啊,就这辈子最好了?余下光阴不要了还是生活品质不想提高了?
中文
6
0
22
1K
smallfish
smallfish@smallfishxy·
@joyrap 记忆力和琢磨力会下降更多, 就跟刷短视频类似
中文
1
0
1
285
karl
karl@gengshenchen·
怎么你们找工作都这么顺,我他妈的很操蛋[掩面]
中文
1
0
0
124
Ding
Ding@dingyi·
Linux 真的太酷了,现在用 Mac 就像当年用 Windows 98。。。
中文
34
8
200
59K
于川海
于川海@joyrap·
个人有个非常强的感觉: 环境变了, 市场不太需要熟悉古法解决问题的人, 需要能够精准定义问题的人。
中文
0
0
0
47
于川海
于川海@joyrap·
@xiongchun007 我靠,我旁边的哥们最近和前端已经开始语无伦次了、 老板非常不满意,让我干掉他。
中文
0
0
1
78
程序员老熊
程序员老熊@xiongchun007·
今天办公室里 20 米开外突然传来:“WCNM,酸萝卜 Bitch。” 的辱骂声,而且开启了复读模式。看了一下,疑似是一个后端和一个可能前端吧开撕了。 记得上一次办公室同事破防还是在前司的时候,一个运维工程师直接把椅子拿起来往项目经理头上砸去。场面相当火爆。 现在打螺丝不容易啊,大家且行且珍惜。
中文
15
0
17
4K
于川海 がリツイート
Viking
Viking@vikingmute·
如果大家还没有用过 Tailscale,那么必须去尝试一下,我也是最近才开始使用的,之前一直用的 Cloudflare Tunnel,真的很香: * 内网穿透 * 本地开发,可以生成域名,然后任何设备都可以轻松的访问 * Taildrop tailscale.com/kb/1106/taildr… 下个软件各个设备之间就可以实现 Airdrop 的效果 * 出口节点 如果觉得官方的速度慢(服务器都在海外),还可以通过配置自定义 DERP Server 来运行对应的服务:tailscale.com/kb/1118/custom…,买台国内的的机器就香香的。
中文
28
95
492
57.3K
Vendetta🇺🇦
Vendetta🇺🇦@Vkillmusk·
@Makkiiil 那我能考700分为什么要选700分,我肯定选700万啊,傻逼吧这人
中文
2
0
4
988
Ryo
Ryo@siantgirl·
发现一个超美的博客网站,上面有树叶斑驳的倒影 xiaogai.fun
Ryo tweet media
中文
11
6
207
25K
低等生物
低等生物@didengshengwu·
能推荐一部,你看了三遍以上的电影吗? 好的东西就要拿出来分享!
中文
696
44
379
374.6K
森哥 | Riverbit
森哥 | Riverbit@yxmyyds·
咸鱼老哥真牛逼,什么都能卖。买了个Mac想享受教育优惠补贴,咸鱼老哥直接一通操作给我干成在校生了。😂 直接800折扣再叠加国补1500,立减2300。
森哥 | Riverbit tweet media
中文
392
268
3.8K
2.6M
木马人
木马人@cnyzgkc·
不知道还有人知道这本书吗? 我的Linux启蒙书~
木马人 tweet media
中文
52
4
81
23.2K
于川海
于川海@joyrap·
后面打算建一个图床, 把拍的旅游照片都放出来。
中文
0
0
0
59
Stanley
Stanley@Stanleysobest·
43岁的中年人,失业了,有一套93平的房子,一辆本田雅阁,还有210万的现金。 目前很彷徨,有下面几个生活方案,大家帮我看看选哪个比较好。 方案一:投资3家美宜佳超市,就是那种连锁小超市,地点选在小区的大门旁。 方案二:全职在家炒股 。 方案三:把钱拿出来买基金,然后买一辆便宜的电动汽车,出去跑快车。 方案四:150万炒股,60万理财,然后附近随便找个4000左右的工作,跑跑业务也行。不过,我个人很不爱看人脸色。 方案五:投资朋友的塑料厂,130万,占股百分之30,参与经营。然后其他钱理财。 你的建议是什么?
中文
1.4K
119
997
1.4M