crazytime

45 posts

crazytime

@crazytime

Katılım Ocak 2009

202 Takip Edilen10 Takipçiler

crazytime@crazytime·6h

@xicilion /goal 把实现计划甩给它

中文

238

响马@xicilion·6h

codex 有个臭毛病，大小干点活就跑过来汇报邀功。这本来没什么，大不了打个继续。但是汇报多了，它就不记得自己在干什么了，开始不断随便干点边角料就过来汇报一下。然后你如果脑子不清楚，很容易就会以为它已经做完目标在打扫战场。对策是事先写好规划，只要它来邀功，就把计划甩它脸上。

中文

12.8K

crazytime@crazytime·1d

@mranti debug能力对比kimi k2.6如何？

中文

663

Michael Anti@mranti·1d

因为小米的API赠送，我尝试着用mimo-v2.5-pro接Claude Code了几天，体验总结是：能干基本的活和编程，但要debug的时候，就不如Deepseek V4 pro了（我现在把这个模型当成了benchmark）。所以，我还是切换回Deepseek了。

中文

32.3K

crazytime@crazytime·1d

@python_xxt @tombkeeper 这里面中国其他的AI模型都不是最新版，就deepseek用最新版，这是什么评测？

中文

761

Robinson · 鲁棒逊@python_xxt·1d

from @tombkeeper 2026 年 5 月 1 日，美国国家标准与技术研究院（NIST）下属的人工智能标准与创新中心（CAISI）发布了对 DeepSeek V4 的测试。结论是： 1、DeepSeek V4 是迄今为止 CAISI 评估过的最强大中国 AI 模型。 2、CAISI 认为 DeepSeek V4 的性能与 8 个月前发布的 GPT-5 类似，而 DeepSeek 自己的测试报告则认为与 Opus 4.6 和 GPT-5.4 类似。 3、和同类模型相比，DeepSeek V4 最大的优势是成本低廉。 CAISI 评估报告中最引人注意的是下面这张图。这张图暗示了自 DeepSeek R1 发布以来，中国最强大的模型和美国最强大的模型之间的差距实际上在慢慢扩大。论文链接放评论区

中文

10.7K

crazytime@crazytime·2d

@dingyi 60美金很快的，我上次用KIMI半天就用了30美金😭

日本語

802

Ding@dingyi·2d

怎么这么多人被 opencode 的这个中文翻译误导了。。。请求数不等于请求次数。真实用量是最多 60 美金/月。

九原客@9hills

想奶一下 OpenCode Go，又快量又多，喜欢用DeepSeek V4 Pro。但是怕又和Github Copilot 一样被奶死。

中文

27.4K

crazytime@crazytime·2d

@skywind3000 几千上万根本跑不了，得百万起才能运行能用的模型，不知道什么时候硬件价格才能降下来

中文

513

LIN WEI@skywind3000·2d

有时候觉得这个东西太重要，需要自己掌握，不要每次交钱依赖商用服务，所以每次好的小模型更新，我都会下载下来试试，每次发现大的进步都会冲动想买台独立硬件来跑参数更大的版本，但最后想想评估了一下，本地模型再好也比不过云端的收费版本，花几千上万最后只是满足自己的掌控感和占有欲太不值了。

Jackywine@Jackywine

我一直有个疑问，本地运行大模型的必要性是什么？🤔 除了隐私和无需 token

中文

14.9K

crazytime@crazytime·3d

@ai_xiaomu 这观点有点扯，僵化是领导，我也不想天天干固定套路的事，要是放手让我干新东西，开心还来不及呢

中文

黄小木@ai_xiaomu·6d

罗福莉的采访已经透露了小米本次的裁员： 1. 优先招大二、大三本科生实习生，弱化大四、往届、有多年行业经验的人 2. 成熟职场经验，很多时候是思维枷锁有多年工作经验的人，会被旧范式、老思路、行业惯性困住，习惯用固定方法解题，思维被固化、被污染，很难拥抱大模型全新架构、新想法、新探索。 3. 大二大三是思维黄金期这个阶段学生：有基础专业知识，没有被职场规训、没有被求职内卷驯化接纳新事物速度极快，学习成本极低，1–4个月就能上手核心研发大家如何看待呢？

中文

209

257

324.6K

crazytime@crazytime·3d

@dotey 对啊，70B的东西根本无法工作，还在那自鸣得意，为了刷点流量而胡说八道

中文

797

宝玉@dotey·3d

为了省 $25，不值得…

huangserva@servasyy_ai

这个也太屌了！这个中国开发者在飞机上用 MacBook 本地跑 Llama 70B，整整 11 小时没有网络，处理了完整的客户项目。他坐在跨大西洋航班的靠窗位置，设备是 MacBook Pro M4，64GB 内存。机上 WiFi 要价 25 美元，他拒绝了。没有云端 API，没有连接 Anthropic 或 OpenAI 的服务器，完全没有互联网。只有一台本地运行的 Llama 3.3 70B（bf16）和他自己写的编排脚本。模型通过 llama.cpp 运行。生成速度 71 tokens/秒，上下文约 60,000 tokens，内存占用 48.6 GiB / 64 GiB，起飞时电池剩余 3 小时 21 分钟。起飞前他给编排器写了这样的系统提示： "你是一个运行在单台 MacBook 上的离线编排器。没有网络。你唯一的资源是 /Users/dev/work 下的本地文件、localhost:8080 的 Llama 70B 推理服务，以及 3 小时 21 分钟的电池预算。处理 /Users/dev/work/queue.jsonl 中的任务队列（每行一个客户任务）。对每个任务：起草 → 运行本地评估 → 保存产物到 /Users/dev/work/done/。每 12 个任务保存一次上下文检查点，以便更换电池后恢复。仅在队列为空或电池低于 5% 时停止。" 所以这个系统完全清楚自己运行在什么资源上。它知道自己未来 11 小时没有外部连接。它知道自己的内存和电池都是有限的。它知道在飞机降落之前不会有人类介入。系统跑在一个循环里。从队列取任务，推理，保存产物，写检查点。一个接一个。当电池低于 5% 时，编排器自动暂停，等待笔记本切换到备用充电宝，然后从最后一个检查点恢复。这是系统在飞行中的日志： "saved context checkpoint 8 of 12 (pos_min = 488, pos_max = 50118, size = 62.813 MiB)" "restored context checkpoint (pos_min = 488, pos_max = 50118)" "prompt processing progress: n_tokens = 50 / 60818" "task 37016 done | tps = 71 s tokens text → /Users/dev/work/done/proposal_westside.md" 窗外是云层、蓝天，没有 WiFi。托盘上是一台 MacBook，一个打开的终端，两个屏幕，一个 localhost 推理服务。这是过去一年里我见过的最漂亮的离线 AI 工作流： 11 小时飞行，WiFi 费用 0 美元，所有客户队列在降落前全部清空。这个故事的核心不是技术多牛（llama.cpp 跑 70B 现在很常规），而是一个完整的离线自主工作流，编排器理解自己的资源约束，自动管理电池和检查点，没人干预干了 11 小时。这种"self-aware computing"的感觉确实挺酷的！ x.com/i/status/20499…

中文

107

68.8K

crazytime@crazytime·3d

@mranti 有闲鱼的情况下至少对个人用户，国产模型毫无价格优势

中文

534

Michael Anti@mranti·3d

这个研究最大的方法论错误是忽略开源的巨大成本优势。在Deepseek V4 Pro差距SOTA模型并不多，但价格几十倍下降的情况下，你觉得用户会担心这所谓8个月的赛马差距吗？用户不是每个任务都是黑进华尔街和破解p=Np难题。用户需要能打、便宜、稳定、能控制的模型。

Lisan al Gaib@scaling01

chinese models are ~8 months behind and are falling further behind

中文

236

65.5K

crazytime@crazytime·4d

@tuzi_ai 它们不可能用灰产吧，那得多贵，什么人用得起？

中文

151

兔妹_兔子@tuzi_ai·4d

中转站已经进入了第二阶段了，小型企业、大型企业都开始下场。我已经不知道未来天会变成什么样子了，尤其是我看到腾讯、阿里也都下场建了中转站，向国内卖海外模型的时候。🙃

兔妹_兔子@tuzi_ai

这是 5.1 的周卡，买的便宜还真不少。看样子推友的假期都非常“丰富”😄 99 元-->2000 美金：适合all-in coding 新生代程序员 store.tu-zi.com/item/91?from=1… 9.9 元-->150 美金：适合新手入门 store.tu-zi.com/item/90?from=1… 让先进的人工智能技术触手可及😇

中文

3.3K

crazytime@crazytime·4d

@goodhunt 老铁，不用建微信群，你建个tg的群就行了啊

中文

Hunter Bown@goodhunt·4d

鲸鱼兄弟们好，我是做 DeepSeek-TUI 的那个美国佬。说真的，特别想跟国内的鲸鱼兄弟们一起混——但我的翻墙技能仅限于写代码，微信到现在都没搞定，属实有点丢人。求各位大佬帮个忙： 1）帮忙转发扩散一下，让这个开源终端工具翻过高墙被兄弟们看到 2）顺手帮我验证个微信号，我想建个群，大家一起聊 DeepSeek、聊开源、聊怎么把 agent 做得更好作为交换，我发誓死守 cargo install 这条安装路径，绝不让任何一个兄弟受 npm 的苦。顺带一提，这段话是 DeepSeek 帮我润色的——感谢鲸鱼赐我流利中文 🙏 github.com/Hmbown/DeepSee…

中文

847

572

761.9K

crazytime@crazytime·4d

@m0d8ye 把诈骗叫生意？

中文

3.2K

crazytime@crazytime·28 Nis

@manateelazycat 怎么不用deepseek

中文

8.3K

Andy Stewart@manateelazycat·28 Nis

这几天很多朋友问我哪里买 GPT 5.5 最便宜稳定？连接在评论区，我和我整个公司都在用，一天使劲整也花不了多少钱 Codex真的是量大管饱，超级便宜啊

中文

418

155.8K

crazytime@crazytime·28 Nis

@lifesinger 都用中转了，还投诉市场监管局？

中文

503

Frank Wang 玉伯@lifesinger·27 Nis

国内 AI 应用创业的营商环境是： 1、20 美元/月的订阅套餐，积分制。有用户订阅后疯狂用，把积分用完后，转手一个投诉，让当地市场监管总局的人联系我，要求退款。原因是：积分消耗太快。我查了下后台，发现他用的是 Opus 4.6 模型。 2、还有更灰色的是，不说了。说了怕把你带坏。 3、还有国内某鱼平台，各种空手套钱的折扣码。也不说了，防不胜防。 4、当然，海外部分地区也一堆问题。 5、还有一堆堆坑。 Manus 能杀出来，是真心开心。现在就没几个真正杀出来的真 AI 应用。大量只是拿着资本的钱在造数据，然后让下一轮资本接盘。这世道。没有谁对谁错。这世道里，真正杀出来的，有赤子之心的，有多少艰辛不能与人说。

中文

299

73.5K

crazytime@crazytime·27 Nis

@chumacn 人都被边控了，还交易什么

中文

1.2K

初码@chumacn·27 Nis

提问，Manus那几个嘚瑟的同志，是不是得断腕退钱了？有没有可能已经收到钱挥霍了一波了😂？他们有没有可能铤而走险私下继续和Meta达成屁眼交易，直接转移源代码？

中文

59.1K

crazytime@crazytime·27 Nis

@manateelazycat 按token计费，比coding plan贵多了

中文

598

Andy Stewart@manateelazycat·27 Nis

不是，DeepSeek 你怎么回事，降价的基础上还能降价？？？百万 Token 的缓存命中价格从0.25元直接降到 0.025元。太狠了🥲

Andy Stewart@manateelazycat

还是 DeepSeek 凶猛啊，你们不是嫌我贵？ DeepSeek V4 Pro 2.5折活动启动！🤣 真铁血硬汉子！

中文

137

67K

crazytime@crazytime·26 Nis

@iPaulCanada 整个巴黎的气温只有一个传感器？

中文

2.7K

iPaul@iPaulCanada·24 Nis

“万物皆可赌” 的Polymarket 最近遭遇了带有“黑色幽默”的金融诈骗。一男子两次押注巴黎最高温达到22℃，两次都中了，获利3.69万美元。他的做法很简单，用便携式吹风机加热戴高乐机场的气候传感器。巴黎气象局已报警。

中文

371

286

3.7K

1.1M

crazytime@crazytime·26 Nis

@cholf5 那用deepseek

日本語

330

周尔复@cholf5·26 Nis

Codex 这个额度是认真的吗，跑一个逆向任务直接5h清空，weekly limit 从 100% 用到 71%，要是这么玩的话，我可要粉转黑了。

中文

114

63.8K

crazytime@crazytime·26 Nis

@op7418 跟coding plan比太贵了，根本用不起

中文

195

歸藏(guizang.ai)@op7418·25 Nis

这才是那个 Deepseek 啊，Deepseek 限时 2.5 折！ V4-Pro 百万 Token 输出只需要 6 块钱朋友们，这还要啥自行车

歸藏(guizang.ai)@op7418

DeepSeek V4详细的官方公告也发了：模型参数 (a) Pro 版本：总参数 1.6T，激活参数 49B (b) Flash 版本：总参数 284B，激活参数 13B (c) 预训练数据量：均为 32T 模式区分（网页端与 APP） (a) 专家模式：代表 Pro 版本 (b) 快速模式：代表 Flash 版本测评表现在多项测评成绩上，该模型与 Opus 4.6 持平。其中，Agent 能力显著增强，世界知识也显著提高。技术改进全新的注意力机制已应用于新模型中，相比传统方法，大幅降低了对计算和显存的要求。

中文

124

52.9K

crazytime@crazytime·24 Nis

@5cdcmkbk 什么核弹，这不是摆明了承认训练用的不是950

中文

923

Aei@5cdcmkbk·24 Nis

其他公司小字都是藏拙，DeepSeek在小字藏核弹。牛

中文

11.4K

crazytime@crazytime·24 Nis

@karminski3 从他的那行“下半年部署昇腾芯片后API价格会大幅下降”的小字推测，训练用的不是华为，否则怎么会推理还没搞定

中文

2.3K

karminski-牙医@karminski3·24 Nis

好奇这次是全国产卡训练了吗？

中文

34.7K

Keşfet

@xicilion @mranti @python_xxt @tombkeeper @dingyi @skywind3000 @ai_xiaomu @dotey