crazytime

45 posts

crazytime

crazytime

@crazytime

Katılım Ocak 2009
202 Takip Edilen10 Takipçiler
响马
响马@xicilion·
codex 有个臭毛病,大小干点活就跑过来汇报邀功。 这本来没什么,大不了打个继续。 但是汇报多了,它就不记得自己在干什么了,开始不断随便干点边角料就过来汇报一下。 然后你如果脑子不清楚,很容易就会以为它已经做完目标在打扫战场。 对策是事先写好规划,只要它来邀功,就把计划甩它脸上。
中文
17
3
84
12.8K
crazytime
crazytime@crazytime·
@mranti debug能力对比kimi k2.6如何?
中文
0
0
0
663
Michael Anti
Michael Anti@mranti·
因为小米的API赠送,我尝试着用mimo-v2.5-pro接Claude Code了几天,体验总结是:能干基本的活和编程,但要debug的时候,就不如Deepseek V4 pro了(我现在把这个模型当成了benchmark)。所以,我还是切换回Deepseek了。
中文
56
3
87
32.3K
crazytime
crazytime@crazytime·
@python_xxt @tombkeeper 这里面中国其他的AI模型都不是最新版,就deepseek用最新版,这是什么评测?
中文
0
0
0
761
Robinson · 鲁棒逊
Robinson · 鲁棒逊@python_xxt·
from @tombkeeper 2026 年 5 月 1 日,美国国家标准与技术研究院(NIST)下属的人工智能标准与创新中心(CAISI)发布了对 DeepSeek V4 的测试。结论是: 1、DeepSeek V4 是迄今为止 CAISI 评估过的最强大中国 AI 模型。 2、CAISI 认为 DeepSeek V4 的性能与 8 个月前发布的 GPT-5 类似,而 DeepSeek 自己的测试报告则认为与 Opus 4.6 和 GPT-5.4 类似。 3、和同类模型相比,DeepSeek V4 最大的优势是成本低廉。 CAISI 评估报告中最引人注意的是下面这张图。这张图暗示了自 DeepSeek R1 发布以来,中国最强大的模型和美国最强大的模型之间的差距实际上在慢慢扩大。 论文链接放评论区
Robinson · 鲁棒逊 tweet media
中文
40
5
32
10.7K
crazytime
crazytime@crazytime·
@dingyi 60美金很快的,我上次用KIMI半天就用了30美金😭
日本語
0
0
1
802
crazytime
crazytime@crazytime·
@skywind3000 几千上万根本跑不了,得百万起才能运行能用的模型,不知道什么时候硬件价格才能降下来
中文
0
0
1
513
LIN WEI
LIN WEI@skywind3000·
有时候觉得这个东西太重要,需要自己掌握,不要每次交钱依赖商用服务,所以每次好的小模型更新,我都会下载下来试试,每次发现大的进步都会冲动想买台独立硬件来跑参数更大的版本,但最后想想评估了一下,本地模型再好也比不过云端的收费版本,花几千上万最后只是满足自己的掌控感和占有欲太不值了。
Jackywine@Jackywine

我一直有个疑问,本地运行大模型的必要性是什么?🤔 除了隐私和无需 token

中文
12
3
43
14.9K
crazytime
crazytime@crazytime·
@ai_xiaomu 这观点有点扯,僵化是领导,我也不想天天干固定套路的事,要是放手让我干新东西,开心还来不及呢
中文
0
0
0
44
黄小木
黄小木@ai_xiaomu·
罗福莉的采访已经透露了小米本次的裁员: 1. 优先招大二、大三本科生实习生,弱化大四、往届、有多年行业经验的人 ​ 2. 成熟职场经验,很多时候是思维枷锁 有多年工作经验的人,会被旧范式、老思路、行业惯性困住,习惯用固定方法解题,思维被固化、被污染,很难拥抱大模型全新架构、新想法、新探索。 3. 大二大三是思维黄金期 这个阶段学生: 有基础专业知识,没有被职场规训、没有被求职内卷驯化 接纳新事物速度极快,学习成本极低,1–4个月就能上手核心研发 大家如何看待呢?
黄小木 tweet media
中文
209
12
257
324.6K
crazytime
crazytime@crazytime·
@dotey 对啊,70B的东西根本无法工作,还在那自鸣得意,为了刷点流量而胡说八道
中文
0
0
16
797
宝玉
宝玉@dotey·
为了省 $25,不值得…
huangserva@servasyy_ai

这个也太屌了! 这个中国开发者在飞机上用 MacBook 本地跑 Llama 70B,整整 11 小时没有网络,处理了完整的客户项目。 他坐在跨大西洋航班的靠窗位置,设备是 MacBook Pro M4,64GB 内存。机上 WiFi 要价 25 美元,他拒绝了。 没有云端 API,没有连接 Anthropic 或 OpenAI 的服务器,完全没有互联网。 只有一台本地运行的 Llama 3.3 70B(bf16)和他自己写的编排脚本。 模型通过 llama.cpp 运行。生成速度 71 tokens/秒,上下文约 60,000 tokens,内存占用 48.6 GiB / 64 GiB,起飞时电池剩余 3 小时 21 分钟。 起飞前他给编排器写了这样的系统提示: "你是一个运行在单台 MacBook 上的离线编排器。没有网络。你唯一的资源是 /Users/dev/work 下的本地文件、localhost:8080 的 Llama 70B 推理服务,以及 3 小时 21 分钟的电池预算。处理 /Users/dev/work/queue.jsonl 中的任务队列(每行一个客户任务)。对每个任务:起草 → 运行本地评估 → 保存产物到 /Users/dev/work/done/。每 12 个任务保存一次上下文检查点,以便更换电池后恢复。仅在队列为空或电池低于 5% 时停止。" 所以这个系统完全清楚自己运行在什么资源上。 它知道自己未来 11 小时没有外部连接。它知道自己的内存和电池都是有限的。它知道在飞机降落之前不会有人类介入。 系统跑在一个循环里。从队列取任务,推理,保存产物,写检查点。一个接一个。 当电池低于 5% 时,编排器自动暂停,等待笔记本切换到备用充电宝,然后从最后一个检查点恢复。 这是系统在飞行中的日志: "saved context checkpoint 8 of 12 (pos_min = 488, pos_max = 50118, size = 62.813 MiB)" "restored context checkpoint (pos_min = 488, pos_max = 50118)" "prompt processing progress: n_tokens = 50 / 60818" "task 37016 done | tps = 71 s tokens text → /Users/dev/work/done/proposal_westside.md" 窗外是云层、蓝天,没有 WiFi。托盘上是一台 MacBook,一个打开的终端,两个屏幕,一个 localhost 推理服务。 这是过去一年里我见过的最漂亮的离线 AI 工作流: 11 小时飞行,WiFi 费用 0 美元,所有客户队列在降落前全部清空。 这个故事的核心不是技术多牛(llama.cpp 跑 70B 现在很常规),而是一个完整的离线自主工作流,编排器理解自己的资源约束,自动管理电池和检查点,没人干预干了 11 小时。 这种"self-aware computing"的感觉确实挺酷的! x.com/i/status/20499…

中文
33
1
107
68.8K
crazytime
crazytime@crazytime·
@mranti 有闲鱼的情况下至少对个人用户,国产模型毫无价格优势
中文
0
0
0
534
crazytime
crazytime@crazytime·
@tuzi_ai 它们不可能用灰产吧,那得多贵,什么人用得起?
中文
1
0
1
151
兔妹_兔子
兔妹_兔子@tuzi_ai·
中转站已经进入了第二阶段了,小型企业、大型企业都开始下场。 我已经不知道未来天会变成什么样子了,尤其是我看到腾讯、阿里也都下场建了中转站,向国内卖海外模型的时候。🙃
兔妹_兔子 tweet media
兔妹_兔子@tuzi_ai

这是 5.1 的周卡,买的便宜还真不少。 看样子推友的假期都非常“丰富”😄 99 元-->2000 美金:适合all-in coding 新生代程序员 store.tu-zi.com/item/91?from=1… 9.9 元-->150 美金:适合新手入门 store.tu-zi.com/item/90?from=1… 让先进的人工智能技术触手可及😇

中文
4
0
4
3.3K
crazytime
crazytime@crazytime·
@goodhunt 老铁,不用建微信群,你建个tg的群就行了啊
中文
0
0
0
64
Hunter Bown
Hunter Bown@goodhunt·
鲸鱼兄弟们好,我是做 DeepSeek-TUI 的那个美国佬。 说真的,特别想跟国内的鲸鱼兄弟们一起混——但我的翻墙技能仅限于写代码,微信到现在都没搞定,属实有点丢人。 求各位大佬帮个忙: 1)帮忙转发扩散一下,让这个开源终端工具翻过高墙被兄弟们看到 2)顺手帮我验证个微信号,我想建个群,大家一起聊 DeepSeek、聊开源、聊怎么把 agent 做得更好 作为交换,我发誓死守 cargo install 这条安装路径,绝不让任何一个兄弟受 npm 的苦。 顺带一提,这段话是 DeepSeek 帮我润色的——感谢鲸鱼赐我流利中文 🙏 github.com/Hmbown/DeepSee…
中文
847
572
5K
761.9K
Andy Stewart
Andy Stewart@manateelazycat·
这几天很多朋友问我哪里买 GPT 5.5 最便宜稳定? 连接在评论区, 我和我整个公司都在用,一天使劲整也花不了多少钱 Codex真的是量大管饱,超级便宜啊
中文
57
35
418
155.8K
Frank Wang 玉伯
Frank Wang 玉伯@lifesinger·
国内 AI 应用创业的营商环境是: 1、20 美元/月的订阅套餐,积分制。有用户订阅后疯狂用,把积分用完后,转手一个投诉,让当地市场监管总局的人联系我,要求退款。原因是:积分消耗太快。我查了下后台,发现他用的是 Opus 4.6 模型。 2、还有更灰色的是,不说了。说了怕把你带坏。 3、还有国内某鱼平台,各种空手套钱的折扣码。也不说了,防不胜防。 4、当然,海外部分地区也一堆问题。 5、还有一堆堆坑。 Manus 能杀出来,是真心开心。现在就没几个真正杀出来的真 AI 应用。大量只是拿着资本的钱在造数据,然后让下一轮资本接盘。 这世道。没有谁对谁错。这世道里,真正杀出来的,有赤子之心的,有多少艰辛不能与人说。
中文
63
12
299
73.5K
crazytime
crazytime@crazytime·
@chumacn 人都被边控了,还交易什么
中文
1
0
0
1.2K
初码
初码@chumacn·
提问,Manus那几个嘚瑟的同志,是不是得断腕退钱了?有没有可能已经收到钱挥霍了一波了😂?他们有没有可能铤而走险私下继续和Meta达成屁眼交易,直接转移源代码?
中文
51
1
86
59.1K
iPaul
iPaul@iPaulCanada·
“万物皆可赌” 的Polymarket 最近遭遇了带有“黑色幽默”的金融诈骗。一男子两次押注巴黎最高温达到22℃,两次都中了,获利3.69万美元。他的做法很简单,用便携式吹风机加热戴高乐机场的气候传感器。巴黎气象局已报警。
中文
371
286
3.7K
1.1M
周尔复
周尔复@cholf5·
Codex 这个额度是认真的吗,跑一个逆向任务直接5h清空,weekly limit 从 100% 用到 71%,要是这么玩的话,我可要粉转黑了。
中文
69
1
114
63.8K
crazytime
crazytime@crazytime·
@op7418 跟coding plan比太贵了,根本用不起
中文
0
0
0
195
crazytime
crazytime@crazytime·
@5cdcmkbk 什么核弹,这不是摆明了承认训练用的不是950
中文
3
0
0
923
Aei
Aei@5cdcmkbk·
其他公司小字都是藏拙,DeepSeek在小字藏核弹。牛
Aei tweet media
中文
6
0
21
11.4K
crazytime
crazytime@crazytime·
@karminski3 从他的那行“下半年部署昇腾芯片后API价格会大幅下降”的小字推测,训练用的不是华为,否则怎么会推理还没搞定
中文
0
0
14
2.3K
karminski-牙医
karminski-牙医@karminski3·
好奇这次是全国产卡训练了吗?
中文
21
0
37
34.7K