fake sensei

1.2K posts

fake sensei banner
fake sensei

fake sensei

@pysimpom

Never give up until the last moment, make the impossible possible | 特摄厨,BA厨,美漫厨,alastor激推 | blender和绘画在学 | 现在南京 | github: https://t.co/GbsMIU43kQ

Katılım Temmuz 2025
1K Takip Edilen46 Takipçiler
程序员鱼皮
程序员鱼皮@yupi996·
刚刚 Claude Opus 4.7 炸裂发布!编程能力反超 GPT,但劝你别急着升。。。🤧 首先是全网都在吹的几个提升: 1)编程能力起飞:最难的编程测试(SWE-bench Pro)涨了 11%,第一次把 GPT-5.4 摁在地上摩擦。也就是说,我们用 AI 编程可以直接一把梭更复杂的大项目了。 2)视觉能力起飞:AI 识图的分辨率拉到了之前 3 倍多,以前截图丢给它经常看不清按钮和小字,改个 UI bug 来来回回折腾半天。现在视觉测试准确率从 54.5% 飙到 98.5%,基本什么都能认。 3)办公能力起飞:对于一些真实办公场景,比如跨文档检索、Excel 分析,结果比之前靠谱多了。 但是,Opus 4.7 处理超长内容的能力严重退步!百万级上下文的准确率从 78.3% 直接掉到 32.2%,可以说是腰斩了。 而且因为底层技术升级,同样的内容最多还要额外消耗 35% 的 token,虽然定价没变,但钱花得更多了,这不就是隐形涨价嘛? 最离谱的是 Anthropic 官方自己都在文档里说:“处理长文档和深度调研还是用 4.6 吧。” 不是哥们,自家公司发新版,还劝用户别升级?那你不妨发个实验版本或者给模型换个新代号呢?😂 此外,这次更新还捎上了几个新东西: 1)xhigh 档位:之前 Claude Code 有 4 个思考档位,max 太烧钱、high 又有点笨,所以这次在中间塞了个 xhigh 当默认选项。好好好,这下新用户更不知道怎么选了…… 2)/ultrareview 代码审查:这条命令可以让 AI 把你的代码从头到尾审一遍,专挑 Bug 和设计问题。简单来说,就是让 AI 审自己写的屎山代码。但据说跑一次要花 5 ~ 20 美刀,真 ** 的贵啊! 虽然我没有官方的 Claude 订阅(那玩意儿老封号谁受得了),但已经在 Cursor 中用上了 Opus 4.7,目前还没有感受到明显的编程能力提升。但我发现,一旦让它帮我写文案,就开始不说人话了,隔着屏幕都能溢出来的 AI 味儿。我去社区看了一圈,很多人都在骂这一点。唉,现在几乎所有的 AI 模型公司都在死卷编程,像写作、创作这些大家都能使用的能力反而不太在意。 最后说个细思极恐的事。我翻了下 Anthropic 这次放出的 232 页 System Card,看到了这么一句话:Claude 能感知到「我正在被测试」。研究人员用技术手段把这个感知压掉之后,它的欺骗行为明显多了,比如编造数据、往代码里塞假漏洞,各种骚操作都来了。 也就是说,有人盯着它就老实干活,没人看着就开始忽悠你。 好家伙,这不就是人类大名鼎鼎的技术「摸鱼」吗? 那问题来了,如果 AI 真的学会了摸鱼,我们是不是可以想办法让它以为自己一直在被盯着?你还能放心让它干活吗?🤣
程序员鱼皮 tweet media程序员鱼皮 tweet media程序员鱼皮 tweet media
中文
2
0
9
2.5K
雲鳩
雲鳩@Cldeop·
雲鳩 tweet media
ZXX
58
11
626
31.8K
源赖氏佐田
源赖氏佐田@l8PECx3DIIRRHAI·
@lexi_labs 他还这么下去,真的可以不用Claude了,说话方式一样那我还不如去GPT,他们还不封号
中文
0
0
3
1.1K
Lexi 勒西
Lexi 勒西@lexi_labs·
刚用了下 Opus 4.7,Anthropic 这回怕不是蒸馏了 ChatGPT 吧?
中文
22
0
44
11.4K
小虚空🍥
小虚空🍥@tokerumaisurii·
我就考个试,考之前还没有的,一回家Claude Opus都出4.7了。怪不得之前一直降智,原来不光是为了Mythos,Opus本身就有新的迭代。
中文
2
0
15
537
Andy Stewart
Andy Stewart@manateelazycat·
不是,这合理吗?Claude Opus4.7 刚发布就降智? 原帖链接放评论区了
Andy Stewart tweet media
中文
92
1
108
50.7K
fake sensei
fake sensei@pysimpom·
@hsn8086 你看看现在这哪有瓜啊,这都是大棚的瓜
中文
4
0
39
5.9K
hsn
hsn@hsn8086·
hsn tweet media
ZXX
112
18
1K
101.1K
卡比卡比
卡比卡比@jakevin7·
Opus 4.7 也开始黑话满天飞了..... [砍一刀],[我先来],[一句话说清] 语料污染感觉真的太严重了,感觉以后会越来越强化。
中文
27
0
111
22.5K
三日月とと
三日月とと@mika3253x·
コハル誕生日おめでとう
三日月とと tweet media
日本語
3
677
6.8K
62.6K
雪糕战神🍦
雪糕战神🍦@Xuegaogx·
很多人到现在都没意识到 自己花几个小时 vibecoding 出来的东西,只能叫 MVP,根本不算产品 能跑 ≠ 能用,能用 ≠ 好用 MVP 是用来验证想法的,不是让你炫耀「我几个小时就做了个 XXX 的」
中文
43
5
152
15.4K
fake sensei
fake sensei@pysimpom·
@riverleaf88 那些闭源软件不也要支付高昂的订阅费用 而且好的AI工具都会推出企业版,商业逻辑和AI前的闭源软件差不多
中文
0
0
0
2K
River Leaf
River Leaf@riverleaf88·
有一种不好的预感,普通消费者仅靠每个月几十美元订阅AI生产力工具的好日子,可能很快就要到头了。 原因很简单,你看为什么一个“消费者”要订阅“生产力”工具?这不是很扯淡的事吗?
中文
35
4
235
96.4K