
Tinyfool
109.6K posts

Tinyfool
@tinyfool
Youtuber 20年老程序员,业已退休,不以写代码为主业。 不是英语老师,但开发了"英语轻松读",做了广受好评的学习英语的视频。 心在日本,人目前在天津 Youtube: 英语学习之路 https://t.co/fY05anVN8r 胡说八道 https://t.co/FQLaNWFD5j


ios用户知道自己交了苹果税吗? 我充50块公交卡,到账50元 我游戏充248到账依然是248 我交100块话费,到账也是100块 这也没什么问题啊


美国限制外国人访问最新 AI 模型,可能是在给自己挖坑。 GPU 禁令已经证明了一件事: 你越不卖给中国, 中国越会加速自研。 Nvidia GPU 出口限制,直接刺激了中国芯片和 AI 加速器的发展。 几年后,中国很可能不只是买家,而是全球 GPU / AI 加速器市场的重要玩家。 现在,同样的剧情,可能会在 AI 模型上重演。 原本很多国家愿意直接用美国模型。 但如果美国说: “你不能用。” “你只能受限制地用。” “你不在白名单里,不能访问最新模型。” 那结果会是什么? 他们会自己做模型。 或者转向中国模型。 美国原本掌握的是全球 AI 模型市场的入口。 但一旦把“全球可用性”亲手削弱,市场就会开始寻找替代品。 AI 模型的竞争,不只是性能竞争。 还是可访问性竞争、生态竞争、全球分发竞争。 未来投资人也会重新计算: 一个只能在美国及少数盟友市场使用的模型, 和一个可以在全球市场流通的模型, 到底谁的商业价值更大? 美国想用限制保护领先优势。 但很可能,限制本身正在加速竞争对手的崛起。


国产模型能用了,但我还不敢用 前段时间,我的 GPT 账户意外被封,被迫开始全面试用国产模型 过去两周,我深度使用了 DeepSeek v4 Pro、Xiaomi Mimo 2.5 Pro、Minimax M3 和 Kimi 2.7,覆盖编码、文字创作和 Hermes Agent 自动化三大场景 以下是真实使用体验 DeepSeek v4 Pro:资深老编辑 文字能力确实顶尖,总结、翻译、摘要、润色都让我非常满意。但代码生成、长时任务和 Agent 工具调用只能算差强人意。它更像一位经验丰富的老编辑——文笔一流,但让他写代码或处理复杂流程,就有点力不从心 Xiaomi Mimo 2.5 Pro:六边形战士 综合能力最均衡,没有明显短板。文字、代码、逻辑都在线,像一个公司里随时能顶上的得力助手,交给他的任务基本都能稳妥完成。 Minimax M3:名校实习生 文字功底不如 DeepSeek,但在长时任务和 Agent 工具调用上表现很稳定。缺点是"智商"偶尔着急,复杂推理会卡壳。像一个名校毕业的实习生——执行力不错,但遇到需要深度思考的问题还得再带一带 Kimi 2.7:准旗舰水准 这是四款中表现最好的,整体能力接近 GPT 5.5 的水准。除了发布第一天有些不稳定,后续更新后体验大幅提升,目前是我最常用的国产模型 国产模型的共同痛点:稳定性 然而,这些模型都有一个通病——输出稳定性不足 以我的 Hermes Agent 为例:我有十几个定时自动化任务,在 GPT 5.5 下可以数月稳定运行 但同样的 Prompt 和任务流交给上述国产模型,几乎每天都会有一两个任务莫名其妙报错 诡异的是,这些报错任务单独手动执行时,又能顺利通过 这种"薛定谔的报错"让我很难完全信任它们处理无人值守的长时任务 我的当前工作流 因此,我对国产模型和 GPT 5.5 采取了不同的信任策略: 一次性、短时任务 → 首选 Kimi 2.7,效率和质量都足够 代码开发、复杂项目、长时自动化任务 → 仍回退到 GPT 5.5,稳定性是底线 简单来说:国产模型我已经敢用,但还不敢完全放手,关键任务仍需人工审查代码和结果,充当最后一道防线。 PS:至于GLM 5.2,我对智普伤透心了,没有好感,故略过

Andrej Karpathy (not a US citizen), the top AI scientist at Anthropic, is now barred from accessing Anthropic's top AI model. This is beyond stupid. _










