claudeshannon

192 posts

claudeshannon

claudeshannon

@pleadunited

A good man

United States Katılım Mart 2023
84 Takip Edilen20 Takipçiler
Sea
Sea@Sea_Bitcoin·
你引领了一个时代 你是最好的产品 也是最努力的一个 你没有做错什么 只是时代变了
Sea tweet media
中文
13
3
99
41.1K
Matthew Dabit
Matthew Dabit@MattDabit·
SuperGrok and X Premium+ subscribers: Grok 4.3 beta is live for you now!!! The performance will shock you. We aren't done yet and will continue to keep improving. We will iterate faster than our rivals and we will be the frontier lab. Enjoy the computer again. @xai @grok
English
141
98
2K
62.1K
华尔街没有名字
华尔街没有名字@WallStreet0Name·
伊朗军方发言人:因美国“违背承诺”,伊方已恢复对霍尔木兹海峡的控制 一天天把大家当狗耍
华尔街没有名字 tweet media
中文
202
10
315
134.1K
claudeshannon
claudeshannon@pleadunited·
@Planckbot @darrencao2024 至少今年的Agent 和去年的就是两回事,投资特别价值投资都是做预期,幻觉还有但趋势在那里,人类员工幻觉也不少
中文
0
0
0
48
hp
hp@Planckbot·
@pleadunited @darrencao2024 我全職做RLHF,老實說模型還是幻覺很大,重要工作還是要有人類介入偵錯
中文
1
0
0
33
Hwang
Hwang@hwwaanng·
Composer 2 虽然是基于 k2.5 rl 的,但是其实到目前为止只有 Cursor 这一个 llm 应用团队证明了自己有高水平 rl 的能力,这 20亿一融,Cursor 自家模型一训,说不好御三家变御四家了。 真实的企业订阅数据 == 高质量的编程数据。高密度人才 == 高水平的产品ship能力。还卷。怎么会凉?
老鬼@laogui

都以为 cursor 没人用了,实际情况是:Cursor 正洽谈以超过 20 亿美元融资、估值达 500 亿美元。 techcrunch.com/2026/04/17/sou…

中文
14
2
109
30.7K
Felix Rieseberg
Felix Rieseberg@felixrieseberg·
We ship new little improvements every single day, but this one was requested so much that I'm tweeting about it: Skip all permissions for Claude Cowork. Use with care, brought to you by @dreamofabear
English
86
59
1.4K
161K
claudeshannon
claudeshannon@pleadunited·
@ClaudeDevs why don’t you directly use dangerously skip? I never had any issues with it
English
0
0
0
17
ClaudeDevs
ClaudeDevs@ClaudeDevs·
Opus 4.7 is a notable improvement on Opus 4.6 in advanced software engineering. It handles long-running tasks with rigor and consistency, pays precise attention to instructions, and devises ways to verify its own outputs before reporting back.
ClaudeDevs tweet media
English
12
13
382
29.7K
墓碑科技
墓碑科技@mubeitech·
AI独立写代码的成功率被推到了87.6%。 看一眼Opus 4.7的成绩单。 在最硬核的SWE-bench Verified测试中它拿下了惊人的高分。 同台竞技的GPT-5.4甚至没有这项成绩,而Gemini 3.1 Pro只有80.6%。 在更复杂的SWE-bench Pro上它也以64.3%的数据稳居第一。 高分没有任何作弊的成分。 测试团队专门跑了记忆筛查机制,剔除了被模型记住的题目。 纯靠底层的推理能力硬解。 多语言和多模态编程能力也同步迎来了大爆发。 最核心的底牌藏在算力消耗图里。 随着投入的Token数量不断增加,Opus 4.7的编程表现呈绝对上升趋势。 当资源拉满时,它解决高难度代码任务的成功率直逼80%。 只要舍得砸算力,AI就能吞下更复杂的工程。 代码世界的智力正在被彻底量化。
墓碑科技 tweet media墓碑科技 tweet media墓碑科技 tweet media
中文
9
2
14
2.9K
Luke Parker
Luke Parker@LukeParkerDev·
anyone wanna make a secret gemini chat where we only discuss gemini?
English
38
0
132
12.5K
DogeDesigner
DogeDesigner@cb_doge·
Grok just hit a new all-time high on web traffic. 🔥 More than 326 million visits last month. More people are switching to Grok.
English
317
869
3.1K
495K
claudeshannon
claudeshannon@pleadunited·
@techeconomyana 一个个付费20都嫌多的用户有什么价值?低付费用户不配高成本服务,最基本的math,企业用户一个员工一天烧5000刀开fast模式眼都不眨
中文
1
0
4
155
高级分析师
高级分析师@techeconomyana·
李广密代表了一类思路。但问题在于给OpenAI开的药方完全不对。OpenAI不应该跟风去to B,而是应该把自己已有优势做大做强。 OpenAI的ChatGPT作为拳头产品增速骤然下降,从8亿到9亿用了半年多,是因为体验持续下降。GPT 5以后模型不说人话,满口黑话,而沙盒、搜索流程也没有持续迭代。
向阳乔木@vista8

张小珺最新一期《商业访谈录》中,李广密对海外AI模型公司的点评概要: 1. Anthropic:战略极专注的领跑者 果断放弃C端市场、多模态发展以及跟风推理模型。 集中全部资源“All in”在 Coding和 Agent等高价值任务上。 采用自上而下战略,极度重视数据,甚至创始人亲自带队清理数据。 内部员工以AGI信仰驱动,信息高度保密,有像物理学家一样踏实寻找工程规律的务实文化。 2. OpenAI:暂时被低估的“范式创造者” 处于阶段性被低估状态,但依然有不可估量的上限与爆发力。 曾一度陷入与 Google 争夺流量的泥潭,导致对 Coding 赛道出现严重误判,晚几个月才将其提至最高优先级。 OpenAI 拥有极高的人才密度,实行类似 VC的“自下而上”探索文化。 推崇从 0 到 1 突破,导致团队摊子铺得太大、少有人愿意做枯燥的数据清理脏活。 正在迅速补齐 Coding 和 Agent 的短板,大概率能追平甚至交替领先。 3. Google (Gemini):最稳的“领先追随者” Gemini 3.0 曾经过度追求跑分,忽视了产品的实际体验。 同样因醉心多模态和C端竞争,严重误判了 Coding 的重要性。 工程师驱动但产品文化较弱,存在一定人事和组织冗余。 尽管反应慢半拍,但依靠强大的 TPU 算力基础、充沛现金流及 Android/Workspace 等天然生态优势。 长期看掉队可能性低。 4. Meta:极具威胁的四号种子选手 已取代 xAI 成为硅谷大模型竞赛的最强挑战者。 团队聚集各家实验室人才,具有极高的人才密度。 能在极短时间(9-10个月)内复刻并融合 Google 和 OpenAI 在多模态与预训练上的优势。 但产品战略似乎并不清晰,且“重金挖人”带来的团队文化,可能缺乏真正冒险和创新的意愿。 5. xAI:陷入摇摆的重资产玩家 核心团队流失和战略摇摆,短期显得有些掉队。 马斯克缺乏耐心,习惯于特斯拉 FSD 那种短平快反馈机制,而大模型数据清洗和迭代需要长期的沉淀。 xAI 在扩大参数规模、多模态、AI 搜索和 Coding 之间反复横跳,导致团队疲于奔命、牺牲长期的模型质量。 不过依靠充足的 GPU 储备和马斯克的个人魄力,仍有一定悬念。

中文
7
3
27
8.2K
claudeshannon
claudeshannon@pleadunited·
赶紧的山姆哥,就差你了
中文
0
0
0
6
claudeshannon
claudeshannon@pleadunited·
@imwsl90 不是19倍,claude最新估值是8000亿美金,3000亿已经是历史了
中文
0
0
0
33
卫斯理
卫斯理@imwsl90·
百度还是有点东西的 minimax 的创始人在百度实习过,现在 minimax 的市值已经超过百度了 anthropic 的创始人在百度实习过,现在 anthropic 的估值是百度的 19 倍
卫斯理 tweet media卫斯理 tweet media
中文
106
31
392
123K
claudeshannon
claudeshannon@pleadunited·
@linyishan 能做到composer 2.0 的水平,能在512G mac studio上本地部署,就算你赢😂
中文
1
0
0
2.3K
yishan
yishan@lin_yishan·
DeepSeek V4 还是用 N 卡做的训练 散了吧,都回家吃饭去🤣
中文
48
1
145
85.6K
claudeshannon
claudeshannon@pleadunited·
@EvanWritesX 做个桌面客户端还只能chat,把我逗笑了,跟其它两家比就是幼儿园水平的东西,一周vibe出来的都比这个强。gemini只会过拟合benchmarks
中文
0
0
1
1.3K
Jason
Jason@EvanWritesX·
Gemini 客户端无法登录?国内用户必看排查指南 时间线上看到不少朋友反映下载了 Gemini 客户端却无法登录,排查了一下发现大多数问题都出在科学上网工具的 HTTPS 解密设置上,分享给大家。 ▎问题原因 我们在中国使用 Gemini 必须挂代理,但很多代理工具(Surge、Clash、Stash、Quantumult X 等)默认开启了 HTTPS 解密(MitM),并且把 *.googleapis.com 加入了解密列表。 而 Google 的服务有证书锁定机制,会直接拒绝第三方证书,导致连接失败,在请求日志里表现为一堆红色的 MitM Failed ▎排查步骤 第一步:检查 HTTPS 解密列表 打开你的代理工具,找到 HTTPS 解密 / MitM 设置,看看主机名列表里是否有: *.googleapis.com *.google.com 如果有,取消勾选这两个域名。 Surge 用户也可以直接在配置文件 [MITM] 部分加上排除前缀: hostname = -*.googleapis.com, -*.google.com ▎第二步:重新加载配置 修改完之后一定要记得重新加载配置,否则不生效。 第三步:确认节点能访问 Google 用浏览器测试能否打开 google.com,如果不能,说明节点本身有问题,换个节点试试。 ▎操作完成后 回到 Gemini 客户端重新登录,正常情况下就可以成功了。
Jason@EvanWritesX

Gemini macOS 版客户端来了。 下载地址: gemini.google/mac/?utm_sourc…

中文
18
34
191
52.8K