Tefnut L

245 posts

Tefnut L

Tefnut L

@tefnut42

CS PhD | AI Native | Smarter Growth

เข้าร่วม Haziran 2025
828 กำลังติดตาม78 ผู้ติดตาม
Tefnut L รีทวีตแล้ว
Notion
Notion@NotionHQ·
Carrots, not sticks.
Notion tweet media
English
3
4
55
4.7K
Tefnut L
Tefnut L@tefnut42·
@fatbobman 这个过程本身也要做成闭环,全面梳理的过程中也用来更新 AGENTS.md
中文
0
0
0
41
fatbobman (东坡肘子)
我每天只会让 ai 工作 3-4 个小时,而且不会让他脱离掌控,没有长的独立任务。这一切都有足够的文档来进行约定。 即便如此,2-3 天下来,我就需要对 ai 新生成的代码进行一次全面的梳理,大范围调整。不是质量和功能问题,主要是不符合我的习惯、审美和组织。🤔 你们真的对 ai 的代码看的下去吗?
中文
9
0
11
1.9K
Tefnut L
Tefnut L@tefnut42·
@jolestar agentic 能力提升之后其实就不用按行改了,想想 jetbrains 的 IDE 做重构多方便
中文
1
0
0
51
jolestar
jolestar@jolestar·
AI Coding 时代,好的编程习惯仍然重要 最近做一个 Agent benchmark,发现不能简单地用开发者视角来评估一个编程任务对 AI 的复杂度。 比如一个重构任务:把一个几千行的大文件,按功能拆成十多个小模块。 这个任务对开发者来说其实不算难,主要工作就是移动代码、整理 imports、编译验证,新手也能搞定。 所以想着用一个简单的任务来做一下 benchmark,结果却出乎意料。 Claude Code 判断这个任务比较大,尝试拆了一部分,提了个 PR 写了 Future work 打算分步来。 我自己的 Agent 是“硬上”,往完整拆分的方向推进了更多,但代价也很明显:Token 消耗是 Claude 的几十倍,后面大量时间都花在反复读文件、修编译错误、再读文件、再修错误上。 这让我意识到,人觉得简单的任务,对 Agent 不一定简单。 对人来说,这类重构很多时候就是“把这一段挪过去”。但对 Agent 来说,它要先分批读大文件,记住哪些函数和哪些测试有关,再生成一堆跨文件修改,最后通过编译错误一点点补洞。看起来像机械活,实际变成了一个高 Token、高状态管理成本的任务。 前一段时间看到有人说,AI Coding 时代,拆分模块这些编程原则没那么重要了,反正人也不看代码。现在看,我不太同意。模块边界清楚、文件粒度合适、依赖关系简单,不只是方便人读,也是在帮 Agent 降低任务复杂度。 从另一个角度看,现在 Agent 的读文件和改文件工具,对这种重构也不太顺手。 Coding Agent 改文件,主要还是文本替换。比如 Claude Code 常见的是 old_string / new_string 模式:先给出一段旧文本,再替换成新文本。Codex 常用的是 apply_patch:生成一个类似 git diff 的 patch,表达把旧的内容替换成新的。它们都适合小范围修改,但如果要删除一大段旧代码,或者把一批函数挪到别的文件,模型往往还是要先把原始内容读进上下文,再生成一大段替换或 diff。 所以我后来给 Agent 一个提示,让它先用脚本、sed、perl 这类工具把大文件粗拆开,直接把旧内容删掉,写到新文件中,然后再逐个慢慢修,它的完成度确实高了许多。Agent 默认不会这样做,主要是因为系统提示词里会强烈要求 Agent 用内置工具修改文件,而不是命令行工具。 再往前想一步,Coding Agent 可能还需要更高级的编辑工具。不是只给它一个“替换文本”的接口,而是先通过 parser、LSP 或 compiler 建立代码结构,让 Agent 可以像 IDE 一样做重构:移动函数,删除 impl block,整理 imports。不知道是否有朋友做这方面的尝试。 总的来说,即便是 AI Coding 时代,好的编程习惯还是有价值的。尽量在早期通过 harness engineering,把好的编程习惯变成 Agent 的默认工作方式,比后来再重构的成本要小很多。
中文
13
7
40
6.2K
Tefnut L
Tefnut L@tefnut42·
把新闻连着看,Microsoft 有可能是从 OpenAI 拿不到那么便宜的进货价了。
Tefnut L tweet mediaTefnut L tweet media
中文
0
0
0
11
Tefnut L
Tefnut L@tefnut42·
@AriXZone 有可能是国内和海外价差比较大,海外用户更愿意为商品付高价
中文
0
0
0
1.4K
魔都老猿
魔都老猿@AriXZone·
你能想象吗,一个破宠物饮水机,还他妈的识别我是否用VPN。 我的宠物饮水机红灯闪烁,说要用APP通过蓝牙连接消除故障。结果APP识别到我开了VPN把我的设备给锁了。 一个宠物饮水机而已,有必要这样吗?!
魔都老猿 tweet media
中文
387
37
1.1K
361K
nicekate
nicekate@nicekate8888·
Qwen3.6-27B 智商挺高
nicekate tweet media
中文
15
4
34
7.6K
Yin.银哥
Yin.银哥@YingeAI·
女性的审美普遍很差。 难听的演唱会、难听的音乐节、难看的脱口秀、难看的影视剧/综艺,主流观众都是女性,甚至有的占据80%以上,人数碾压。 好的活动去参加非常OK,比如难听的歌手演唱会,不论是谁,似乎门票都一抢而空。 影视剧/综艺一直这么垃圾,因为主要是女性观众一直在看,男性观众很多退出了。 我感觉很多女性不是看作品去的,一看帅哥,二去感受一种节日的气氛。作品好不好不重要,三是权力崇拜,看到有名有权的人就去追,去崇拜。 可能我的观察是错的。
中文
85
32
711
87.4K
Tefnut L รีทวีตแล้ว
Patrick C Toulme
Patrick C Toulme@PatrickToulme·
Launching pyptx — a Python DSL for writing NVIDIA PTX kernels. One PTX instruction = one Python call. Write pure PTX in Python. Direct Hopper + Blackwell support: wgmma, TMA, tcgen05, mbarriers. JAX + PyTorch integration. Includes GEMM, grouped GEMM, RMSNorm, SwiGLU, and a PTX→Python transpiler pip install pyptx[torch] pip install pyptx[jax] github.com/patrick-toulme…
English
32
133
1.1K
171.3K
Tefnut L รีทวีตแล้ว
Ivan Zhao
Ivan Zhao@ivanhzhao·
We updated our 4 company values this week to keep up with how the company has changed. Here's what I shared with the team internally. I hope it could be helpful for other companies.
Ivan Zhao tweet mediaIvan Zhao tweet mediaIvan Zhao tweet mediaIvan Zhao tweet media
English
47
85
1.5K
251.2K
Tefnut L
Tefnut L@tefnut42·
@wong2__ 你这是一点不用composer啊,其实用opus/gpt做完plan用composer还挺好用的
中文
1
0
1
443
wong2
wong2@wong2__·
我真的很需要Cursor送额度😭
wong2 tweet media
日本語
15
0
20
6.2K
Tefnut L
Tefnut L@tefnut42·
GPT-5.5 确实到了一种完美形态了,不依靠过长的 reasoning 来拟合思考,大概率是大量算力 RL 出来的结果。 不知道 GLM 和 Kimi 什么时候能追平到这个程度。GLM-5.1 和 Kimi-2.6 都在通过加长思考链条来提升性能。 考虑到 GPT-5.4 的样子,也许当前的后训练就是在通过思维链的拉长再提炼来提升真正的智能。
中文
0
0
0
65
GreyWind
GreyWind@GreyWind2077·
@lidangzzz 这是好事啊 如果大家都不买房 工行贷款业务怎么来? 没贷款业务,工行哪来的每年4%的高分红? 这背后是多少家庭30年月供出来的
中文
1
0
6
11.7K
lidang 立党 (劝人卖房/学CS/买SP500/纳100/OpenAI/Anthrop第一人)
我经常说,25~30岁这批刚需党,非常可怕。 双方都是江浙沪独生子女,刚好大学恋爱,毕业到北上杭深打拼,一个事业单位,一个互联网行业,双方都火急火燎要结婚, 刚好双方爹妈都很支持,刚好各自能拿出来700多万现金给孩子结婚用, 一下子1500万现金砸进去,买了一套改善型刚需婚房。 拦都拦不住。
中文
144
25
587
302.7K
Sansi꩜
Sansi꩜@3an3i·
@wey_gu acp能力是不是天生比官方各自的tui要弱
中文
2
0
1
1.8K
Wey Gu 古思为
Wey Gu 古思为@wey_gu·
Zed 也出 conductor like 的项目了 - 基于 acp 能连一切 agent - 一如既往的 gpui 120 fps 顺滑 我要试试! zed.dev/blog/parallel-… 我最近搞得 con 的核心就是 zed 团队的 GPUI + libghostty 🫡
Wey Gu 古思为 tweet media
中文
20
7
194
59.3K
Tefnut L
Tefnut L@tefnut42·
@9hills 写作风格变垃圾那还不如用 gpt-5.4
中文
0
0
0
2.6K
九原客
九原客@9hills·
闹麻了,因为 Copilot 移除了 Opus 4.6,不得不用 Opus 4.7 来写文档,对比如下: 1. Opus 4.6:不管是写作还是编辑工具调用,天花板。 2. Sonnet 4.6:修改长文的时候,经常出现Edit 工具参数错误导致编辑失败。但是写作风格 OK。 3. Opus 4.7:工具调用没问题,就是写作风格垃圾。 需要 Opus 4.6,哪里性价比比较高?
中文
25
1
123
56.2K
Tefnut L รีทวีตแล้ว
Li Yin
Li Yin@panda_liyin·
We decided not to hype Opus 4.7 in @adalengineer . After testing it, our view was simple: for production use, it feels more like a regression than an upgrade over Opus 4.6. A few reasons: - weaker performance on real-world tasks - less effortful reasoning - a hidden pricing hit from tokenizer changes, with the same prompt counting as up to 35% more tokens So while Opus 4.7 is now available in the latest version of AdaL, we’re not positioning it as a headline improvement. Right now, our team is still sticking with Opus 4.6, Gemini 3.1 Pro, and GPT 5.4. We’d rather be honest than promotional. If you’ve used Opus 4.7, I’d love to hear your review.
English
51
29
505
52.4K
Tw93
Tw93@HiTw93·
周末在整一个新的 Skill 叫做 Kami (紙, かみ),大伙可以把他当做 Waza (技, わざ) 的妹妹,Kaku(書く) 的女儿,主打用于 Paper 排版的场景。 比如说你需要产出一页纸的报告,你需要写一个白皮书、需要产出一个精致的PPT、需要弄一个作品集的 PDF 发给别人等等,也就是任何排版的打印场景都可以使用,自动生成精致PDF,里面还具备自动绘制清晰图的能力。 差不多快弄好了,晚上下班后继续整了整,慢慢舒服了,还需要做一点装修的事情,我非常喜欢简洁、清晰、美观的设计方案,但是不喜欢现在看着都是一样的 ai design 风格,所有就用周日一整天做了 Kami,用于我的创作类输出,也分享给小伙伴,期待这周来开源。
Tw93 tweet mediaTw93 tweet mediaTw93 tweet mediaTw93 tweet media
日本語
75
136
1.3K
97.8K