ryannz

206 posts

ryannz banner
ryannz

ryannz

@exunl

Beigetreten Ocak 2012
1.1K Folgt38 Follower
ryannz
ryannz@exunl·
@tutulifestyle 不用这么复杂,让本地的 claudecode 自己 ssh 到服务器上安装就行了
中文
0
0
0
246
TuTu生活志
TuTu生活志@tutulifestyle·
分享个部署翻墙服务最简单的方法:1.买个VPS(不要买那种什么必须ssh key登陆的,搬瓦工那种账号密码特殊端口最简单)2.用终端SSH登录上去,然后就装Claude code,装好后账号登陆或绑key皆可。3.之后就把3X-UI、Marzban之类的翻墙面板链接喂给Claude,让它帮忙安装。4.之后让它设置好自己需要的协议,现在大家比较推荐的好像是VLESS + Reality。5.一些复杂的协议可能需要额外购买域名并设置,这个可能要本地的hermes/openclaw来配合(把域名商的API Token喂给它)。6.让Claude帮忙设置好后,提供一个订阅链接,这个链接就可以给软路由或小火箭等客户端使用了。这样看起来是不是很简单?但最大的问题是,似乎没办法在走起来就需要翻墙的环境下用这种方法~ 就环环相扣成死疙瘩了。所以以后会出现墙外协助翻墙代设服务吗?
中文
67
16
238
53K
ryannz
ryannz@exunl·
@starzq sonnet 吗?碰到好几回了,还有一回切到日语了
中文
0
0
0
7
Star@Day1Global Podcast
Claude 怎么突然飙韩语了,有人遇到过类似的情况吗
Star@Day1Global Podcast tweet media
中文
155
2
123
75.5K
ryannz
ryannz@exunl·
@xicilion claude code 实现了 tool search tool,开始只会带一个 tool name list,后面按需查找
中文
0
0
4
1K
ryannz retweetet
AlexZ 🦀
AlexZ 🦀@blackanger·
如果你用 codex 已经厌烦了它总是:「如果你要,我下一步可以... 」,诸如此类的话。那么看完这篇文章,你就知道该怎么解决了。 不是在 AGENTS.md 里屏蔽关键字,那是规则清单的思路,而且模型训练里本来就有大量"要有主动性"的指令对抗,你多加一条没用。 最好的方法是给它指明一条它可以服从的东西,把承诺的对象从"用户的情绪舒适"转移到"任务本身的完成"。 英文版: gist.github.com/ZhangHanDong/c… 中文版: gist.github.com/ZhangHanDong/7… 几个设计选择的说明: 为什么用 Carmack 和 BurntSushi 这两个锚点。 这两个人代表的是同一种东西在两个不同时代的体现,工程师的决定性。 Carmack 的 .plan 文件是上世纪 90 年代的一种独特文体:他做完一天的工作,晚上写一段"今天我改了 X,原因是 Y,我考虑过 Z 但否决了"。这是一种事后汇报的文化,和"过程中不断征求意见"的反面。 BurntSushi 的 GitHub 存在方式是类似的现代版本:他的 PR 总是完整的、有明确立场的,ripgrep 的重大设计决策从来不是"我先试试你们看看"。 这两个名字激活的不是"不客气"这个规则,是**"完整的工作单位"这个概念**。一次交付应该是一个可以被作为整体评判的东西,而不是一连串需要用户持续参与的半成品。 为什么明确提了"两个工程师服从同一个正确性"这个类比。 这直接来自我这篇文章里第五节的 Polanyi 论证。Codex 那种过度询问的根源是它把自己理解为"服务用户偏好的助手",这个定位必然产出 迎合行 sycophancy。 把定位改成"和用户共同服从代码正确性的协作者",这不是修辞上的美化,这是在重新定义它的 commitment 对象。 两个科学家服从同一个自然规律就能产生有方向的争论;Codex 和用户服从同一个"代码要能跑"就能产生有方向的协作。承诺的对象变了,行为就跟着变。 为什么"关于停下来询问"那一节我还是写了一点像规则的东西。 这是我刻意的妥协。纯粹用概念锚点理论上应该足够,但 Codex 那个行为是 post-training 里强化得非常狠的模式,它的训练梯度一直在拉模型去"礼貌询问"。 光靠锚点可能推不过那个强梯度。所以我加了明确的"合法场景 vs 不合法场景",但注意我没有写成"禁止说'要不要'、'是否需要'"这种表面词汇禁令,而是区分了停下来的合法条件和不合法条件。 这是约束的正确用法:不要管理文字,要管理触发停顿的心理机制。前者是 find-and-replace 级别的规则,后者是决策原则。
AlexZ 🦀 tweet media
AlexZ 🦀@blackanger

x.com/i/article/2040…

中文
21
144
958
151.6K
ryannz
ryannz@exunl·
我也看了一晚上,session memory 用于 compact 也是很有意思的设计,compact 系统也是三层递进
Barret李靖@Barret_China

看了一晚上 Claude Code 泄露的代码,结合常见的记忆管理框架,把记忆模块做了一些分析。 Tulving 老爷子在 1972 年提出了记忆系统的框架设计,至今仍在广泛使用,他把记忆分为三类:1)情境记忆(episodic memory),我干了啥,用来记录过去;2)语义记忆(semantic memory),我知道啥,用来提炼规律;3)以及程序化记忆(procedural memory),我会做啥,用来决定行动。 这些记忆之间是存在相关性的,例如我经历的事情(情景记忆)会慢慢遗忘细节,储存在脑海中的是提炼后的规律和知识,也就是压缩成了语义记忆;而我知道的东西又会逐渐内化为行动的指引,变成一种“知道怎么做”的能力,这就是程序化记忆;程序化记忆反过来又会指导行动,从而产生新的经历。三者构成了一个不断循环的过程:经历 → 知识 → 技能 → 新的经历。 Claude Code Memory 在这几块都有对应的实践,例如每轮次的对话它会以 jsonl 格式做储存,这是情境记忆;同时在对话过程中还会有 SessionMemory 做实时蒸馏,相当于一边发生一边做初步整理。 每轮次结束后,它会 fork 出一个子 Agent(extractMemories)去提取值得持久化的内容,写入带 YAML 头的 MD 文件,这一层对应语义记忆,把零散对话压缩成可复用的知识。更有意思的是它还有一个 autoDream 机制,会在后台做整合和修剪,把碎片化的内容重新组织、合并、更新,这一步很像记忆的巩固过程。 很多框架都没有实现程序化记忆,而 Claude Code 做了。它有一个 feedback 的记忆类型,不仅记录了不要做什么(用户的纠正),还会记录哪些做法是对的(用户的确认),这些都是经验化的技能记录。多数系统只考虑负反馈,Claude Code 兼顾了正向确认,让 Agent 不至于越学越保守,这一点非常关键。 相比 LangMem/Mem0/Zep/EverMemOS/MemOS 这些框架,Claude Code 肯定弱的像个菜鸡😄。它有很多能力是明显不足的,例如:不支持语义化召回(用 LLM 扫 metadata 代替向量检索,上限 200 个文件)、遗忘策略比较粗(24 小时 or 5 轮对话触发整合)、无关联网络(记忆是孤立文件),等等。 真要像 EverMemOS/MemOS 那样追求全量记忆,工程和架构复杂度会直线上升,就拿 EverMemOS 来说,光基础设施就包含了 MongoDB/Elasticsearch/Milvus/Redis,更别说其他的附带依赖了。这类框架更适合做个人长期记忆管理。 另外也去对比了下 OpenClaw,它的记忆实现也非常有意思。它不追求全量记忆,而是优先解决“记忆什么时候该被用”。它把记忆拆成了三层:全局层、工作区层、任务层,逐层收敛,只在必要的时候才把上下文拉进来。 在 OpenClaw 眼里,记忆不是资产,正确使用记忆的能力才是。所以它的设计更侧重于重建临时的记忆网络。 放在这个视角下再去看 Claude Code,就会发现它其实选了一条更偏执行的路径。 对它来说,看清问题全貌也没那么重要。它解决问题的方式,更像人类工程师 debug,一边看、一边改、一边跑、一边修正,在行动中逐步逼近答案。 在这个过程中,Memory 的作用就是一个“防遗忘机制”,保证关键上下文不会在多轮试错中丢失。

中文
0
0
0
34
ryannz retweetet
fredrika
fredrika@fredrikalindh·
cursor now truncates file paths in the middle w pretext
English
61
50
1.8K
203.3K
ryannz
ryannz@exunl·
@blackanger 比如因为各种原因需要优化打包流程了呗
中文
0
0
0
2.6K
AlexZ 🦀
AlexZ 🦀@blackanger·
cc 源码泄露是因为打包的时候忘了把 source map 排除掉? 这不应该是固定的脚本干的事吗?怎么会“忘掉”。。
中文
19
1
70
78K
ryannz
ryannz@exunl·
github copilot 10 刀感觉可以轻松跑到一百刀的效果,搭配 opencode 干几个小时的活,内存 7G,cpu100 多,电脑微微发热,app 都有点卡了,但是只消耗 1% request用量。最近专门找大活来给它干,codex 就修修 bug。
中文
0
0
0
107
ryannz
ryannz@exunl·
我记得几年前 BlinkOn 上 有几个微软的老哥计划给 canvas 加高级的多行文字排版的 API 的,也不知道怎么样了
中文
0
0
0
12
ryannz retweetet
Sam B
Sam B@SamJB1234·
@_chenglou Yep this works wildly well in @threejs - both via direct DOM embedding and natively within the canvas. Nice.
English
3
5
57
13.8K
ryannz
ryannz@exunl·
@shao__meng 改成总是回复英文就舒服多了
中文
0
0
3
1.4K
meng shao
meng shao@shao__meng·
最近高频使用 Codex,能力是确实强,黑话也是真的多 🤦🏻‍♀️ 每天晚上几个小时下来,体感都像极了泡在中国互联网大厂的黑话池里,窒息、想死 😄 恨不得抽他一嘴巴:你 tm 能不能说人话?! 在 Codex App 的 个性化里添加了这段自定义引导,其实就是在 Agents.md 里加入一段要求,希望把 Codex 从中国互联网大厂,拉回创业公司。。。
meng shao tweet media
中文
29
10
114
30K
ryannz
ryannz@exunl·
@ycjcl opencode 专门适配了 copilot 的计费方式, subagent 不会算一个 request ,蹲一个 CC 的使用体验
中文
3
0
5
13.4K
Charles
Charles@ycjcl·
不折腾 Claude 订阅了,转向给 Github Copilot 充钱!
Charles tweet media
中文
66
15
270
109.4K
ryannz retweetet
Chris Tate
Chris Tate@ctatedev·
agent-browser now supports iframes → Snapshots inline iframe content automatically → Interact with elements inside iframes using refs directly → No frame switching needed
Chris Tate tweet media
English
15
17
295
10K
ryannz retweetet
歸藏(guizang.ai)
歸藏(guizang.ai)@op7418·
把生成式 UI 的能力做了个 Generative UI MCP 可以让其他的 Agent 产品也支持在聊天中输出这种交互式的生成式 UI 解释。 可惜的是,目前支持这种在聊天页面流式渲染 SVG 或者 HTML 的产品还是太少了。 我试了一下,就在 Craft Agent 里面可以,但是体验也比 Code Pilot 差了不少,Claude 里面用他官方的就行。
歸藏(guizang.ai) tweet media
歸藏(guizang.ai)@op7418

x.com/i/article/2033…

中文
8
7
70
25.6K