0xTodd

10.9K posts

0xTodd

@0xTodd

Singapore Se unió Eylül 2016

3K Siguiendo71.4K Seguidores

0xTodd@0xTodd·2h

@Web3_Yuuu 后面有可能能解决特供海外😂

中文

YUUU(🚀,🚀)@Web3_Yuuu·3h

@0xTodd 然而海外用国产模型更多的还是国际站的吧，服务器在海外的，用中国服务器一是部分国家合规通不过，二是内容审核也很蛋疼

中文

147

0xTodd@0xTodd·3h

中国在 AI 时代出口的新饽饽就是 Token 了。国产模型超低的推理价格；内蒙新疆过剩的电力（大量弃风，弃光）；主打一个量大管饱，顺着一根 API 就卖向了全世界。 PS：就差一个国产显卡或者 AI FPGA 矿机就闭环了

Bonna | U酪乳@bonnazhu

重新审视 Token (词元）的属性 TLDR：之前我也一度觉得是大宗商品/资产甚至还设想过相关的交易和定价逻辑也看到不少人提过Token期货，交易所之类但现在我倾向它只是一种服务，没必要过度金融化毕竟它没有办法脱离AI推理单独存在，无法被提前生产出来或预先被囤积。但换个角度看，是服务，就天然是分层的、多元的，不同的人有不同的需求，这其实也恰恰奠定了AI 经济必将是百花齐放而非赢家通吃的基础。在这浪潮中，红利属于能把廉价 Token 加工成更有价值的 Token 卖出去的人。 -------------------------------- 我的一些个人思绪和逻辑： 1、Token (词元）经济从何而来？首先它是AI训练转向AI推理的产物，这是理解 Token 商业模式的基础。过去模型训练时代，主要是卖算力时间。为什么？因为训练是持续性的大工程，需要大量算力协同工作。这种规模的投入，有资本的大厂基本都会选择自购，毕竟可控性最强，但对于没有能力一次性投入大量资金的团队来说，出于对稳定性的要求，也会倾向选择租赁模式，包下一整段时间的独占使用权，榨干这段时间内算力的所有价值，是一种占用的逻辑。但随着主流大模型开始进入商用阶段，AI 算力的需求重心也从模型训练转向了推理。你用 GPT聊天、用 Claude写代码、问豆包问题，这些本质上都是在跑推理，每一次调用，都在为你做一次推理和计算。而推理是相对碎片化的、一次性的、用完即走的。虽然也有不少企业，仍然会采用租赁或自购的模式来跑推理，但对于广大中小开发者和应用方来说，他们对算力独占性的要求并不高，因而额外衍生出了按消耗计费的模式，这样算力服务商就可以把算力资源同时卖给成千上万个客户。 Token (词元) 就是在这种背景下而产生的，衡量每次计算消耗了多少资源的那个单位，你付的钱，就是对这次计算的补偿，本质是消耗逻辑。所以训练和推理是完全不同的生意形态：训练时代，商业模式是卖 GPU 时间。推理时代，商业模式是卖 Token (词元)。 --------------------------------- 2、为何Token (词元) 是服务属性而非商品/金融属性？卖Token (词元)，就是卖服务！ Token (词元) 经济，本质是服务经济！为什么？一个比较直接的原因是 Token (词元）不能被预先生产出来，而是产出后就被消耗掉了，并作为衡量你这次推理服务所消耗资源的参考，来给你计费。且Token (词元) 的一些特性，也和大宗商品的逻辑不像： - 价格长期下降趋势 - Pay-As-You-Go - 难以标准化你在Claude的100万Token额度，和你在Minimax的100万Token额度，两者本身是没有可比性的，模型不同，性能不同，定价完全可以不一样。而大家愿意接受价格差异的原因，也是因为 Token (词元) 本质上计量了一种非标准化的服务，而不同用户对服务的诉求是不同的，有的人看重性能，所以愿意支付溢价，有的人看重成本控制，所以觉得国产开源模型也够用了。而整个模型市场占有率，并没有出现几家独大，本身也是其服务属性的体现。如果 Token (词元) 是资产，那资产的流动性、网络效应，一定会引发所有资源最终向一个市场集中，形成赢家通吃的局面。但恰巧 Token (词元) 其实是服务，而服务市场天然是分层的、多元的，不同的服务商满足不同的需求，所以才构成了 AI 经济百花齐放的基础。我想通这点后，就不再纠结模型厂商只有哪家笑到最后了。因为未来必将是多模型共存、多层级并行的格局，Token（词元）也将会被计入到企业的会计成本之中，并反映到企业的产品和服务之中。比较值得关注的一点是，AI时代Token所代表的服务经济和传统的人力服务经济，成本曲线可能是完全反过来的。由人所提供的服务，长期要求的是报酬上升，这也是为什么服务业占比高的经济体，服务更贵。但 Token 服务恰恰相反，价格长期只会下降，当 Token 逐步替代掉一部分原本需要人力智力才能完成的工作，这部分成本不但不会随时间上升，反而会持续走低。这可能也是这一波AI的红利之一。 ------------------------- 3、这个Token (词元) 服务都有谁在卖？ - 闭源模型厂商 - 开源模型厂商 - 开源模型托管商 - 大模型聚合器、中转站 1）闭源模型厂商：直营为主，分销为辅最直接的模式。OpenAI 卖 GPT 的 Token，Anthropic 卖 Claude 的 Token。模型自己训的、API 自己提供、定价权在自己手里，产品和渠道都是自己的，跟品牌直营店一个逻辑。当然作为最顶级的模型，难免会被接入像一些API中转站，或者Open Router这样的大模型聚合平台被动分销。 2）开源模型厂商：开源也挺赚钱的开源模型谁都可以拿去用，很多人不想自己本地跑，因此催生出了一批开源模型托管商，他们可以帮你跑模型，并按 Token 收费。但这就引出一个问题：Token 的钱都让模型托管商这些中间商赚了，开源模型的开发者自己怎么赚钱？这一点，至少中国的开源模型厂商，走的很灵活。像Minimax，Kimi，Zhipu，它们都有自有的 API 直售，更多面向开发者群体，并且也都有自己的 Coding Plan 订阅包，把按 token 计费玩出了订阅制，完全是中国移动卖流量的玩法。而OpenClaw 这波更是让它们赚得盆满钵满，各自推出了品牌化的 Claw 产品，帮用户把 OpenClaw 部署好，底层跑自家模型，Token 消耗从自家 API 走。 3）开源模型托管商：帮别人跑模型，赚差价对于那些没有能力或意愿自己卖 Token 的开源模型来说，托管商就是它们触达用户的渠道。它们帮开发者跑模型、按 Token 收费： - Together AI / Fireworks：自有 GPU 集群 + 极致推理优化，核心竞争力是翻台率，同样的卡单位时间能吐出更多 Token。 - Groq：自研 LPU 推理专用芯片，不用传统 GPU，核心竞争力是极致速度，跑 Llama、Qwen 等开源模型比 GPU 快。 - Cloudflare Workers AI：全球 300+ 边缘节点，跑 Llama、Mistral、Qwen，最近还加了智谱 GLM 和 Kimi，核心竞争力是低延迟 + 开发者生态 - AWS Bedrock / Google Vertex AI — 企业级云平台，跑 Llama、Mistral 等主流开源模型，核心竞争力是客户的数据和基础设施已经在这些云上了，迁移成本低 4）大模型聚合器：一个入口管所有模型闭源和开源的大模型越来越多，而不同场景适合不同模型，不同模型的优劣势不同，对开发者来说，一个个去接不同厂商和托管商的 API，管理起来很痛苦。于是催生了 OpenRouter 这类聚合器，可以接几十个模型，开发者在一个地方统一管理、按需切换即可。 OpenRouter按照批发转零售的模式盈利，各家模型厂商把自己的Token分销出去。而 OpenClaw 这波直接让 OpenRouter 上中国模型的消耗量暴增，前十名 Token 消耗量中，中国模型占了 61%，前五有四个是中国的。而围绕这条 Token (词元) 产业链，也衍生出了一些其他的参与者和新需求：第一是一些推理优化引擎，vLLM、SGLang 这些开源项目，在大家对效率极致追求的当下，通过对硬件算子层面（更高效地利用 GPU 计算单元，减少内存碎片和带宽瓶颈）以及 LLM 算法层面（让多个请求共享已经算过的内容，更聪明地管理显存）的优化，提升同一张卡在同一时间内的 Token 吞吐量。它们自己不面向终端用户收费，但 Together AI、Fireworks 这些托管商底层用的就是这些技术。也有不少自己本地跑开源模型的开发者，会直接使用 vLLM 或 SGLang 来搭建自己的推理服务。第二是对Token消耗的优化需求，当 Token 消耗逐渐常态化，自然就会有人开始琢磨怎么省钱，也有不少人早就抱怨OpenClaw高昂的Token消耗，那么，帮你预览一次 Prompt 会消耗多少 Token、建议怎么优化 Prompt 来降本、甚至自动帮你选性价比最高的模型和服务商的产品，就很有市场了。 ---------------------------- 4、AI经济时代，真正的机会在哪？我觉得 Token 经济的红利，属于把廉价的 Token 加工成更有价值的 Token 卖出去的人。 1）如果你有能力，就做一个模型，哪怕是微调的你不需要从头训一个 GPT，在开源模型基础上针对某个垂直场景做微调，只要在某个细分领域效果够好，就有人愿意按 Token 付费调用你的模型。前面说了，Token 是服务，服务市场天然分层，通用大模型吃不掉所有场景，垂直微调的模型在自己的领地里反而更有定价权。 2）做一个新时代的产品，开放 API 你的产品底层消耗 Token，但你的产品本身也可以对外输出能力，你开放 API，让别的开发者和 Agent 来调用。你买入底层模型的 Token，加上你的产品逻辑和数据，产出更高价值的 Token 服务卖出去。这跟传统行业买原材料、加工、卖成品的逻辑是一样的。 3）写 Skill，做 Agent 每一个被广泛使用的 Skill 和 Agent，背后都是源源不断的 Token 消耗。你写的 Skill 越好用、越多人用，你帮模型厂商卖出去的 Token 就越多。这不是你直接卖 Token，但你是这条产业链上的分销渠道。而不管你选哪条路，你的护城河在我看来最终都会归结为三样东西：算力、算法、数据。算力影响你的吞吐量算法影响你的效率和成本数据决定你是不是不可替代

中文

5.4K

0xTodd@0xTodd·4h

@0xCheshire 666

176

柴郡🔔｜Crypto+AI Plus@0xCheshire·1d

接下来我要做这个世界上最危险最刺激的事：用 Codex 清理 C 盘。

中文

111

392

119K

0xTodd@0xTodd·4h

@mydream2025 老马最近刚把人都开了，够呛了

中文

mydream2025@mydream2025·1d

@0xTodd 他们估值多少，完全取决于有没有人能超越他们要是老马搞出个新模型，能把他们按在地上摩擦，那么马上就缩水，要是老马半年后，搞的模型还是个二流，御三家还是御三家，甚至后面的跟他们的差距越来越大，市场一看，搞大模型确实难，那估值就蹭蹭的涨。

中文

275

0xTodd@0xTodd·1d

很多人认为 Claude 母公司 Anthropic 最后一轮估值 3800 亿美金贵了。但要我说，他们对喜欢宏大叙事的资金缺乏想象力（为梦想窒息流派）。对比一下： OpenAI 最后一轮估值 8400 亿美金 $ETH 在熊初 3100 美金左右也是 3800 亿美金前者产品被 Claude 按在地上摩擦后者距离 ATH 还有 60% 空间呢

中文

25.6K

0xTodd@0xTodd·1d

@owenliang60 是的，甚至资金都开始研究间接渠道购买了，例如亚马逊

中文

808

Luckybb🍟@owenliang60·1d

@0xTodd 嘻嘻，现在一级市场600b都根本买不到，人们对什么叫窒息一无所知

中文

980

0xTodd@0xTodd·1d

@0xSunNFT 是的，看那普通散户把溢价那么高的 VCX 都冲爆了

中文

1.8K

0xSun@0xSunNFT·1d

@0xTodd Anthropic不是觉得380B贵不贵的问题，是现在私募市场普遍500B以上的价格加上Carry一般人还买不到的问题

中文

7.8K

0xTodd@0xTodd·1d

@ZLiao3 哈哈哈通讯被劫持了

中文

120

橘皮乌龙||Leo@ZLiao3·1d

@0xTodd 警惕数据泄露和中间人攻击

中文

175

0xTodd@0xTodd·2d

我让龙虾 28 号提醒我开个套餐结果它忘了但是由于我天天用语音转文字的 AI 输入法导致给龙虾下任务时我老婆也偷听到了最后今天是她最终提醒了我人脑大模型的心跳机制大胜 #论AI怎么改变了我的生活😂

中文

0xTodd@0xTodd·1d

@CuiMao 现在已经老实多了以前才是真的猛，尤其是二次元图片，简直百无禁忌

中文

655

CuiMao@CuiMao·1d

和grok image 大战了300回合，太牛逼了，干啥啥不行，搞黄第一名。我彻底服了他了，

中文

138

56.7K

0xTodd@0xTodd·1d

@Michael_Liu93 感觉川普突然想明白了，学会了定义，他把对委内瑞拉的行动定义为司法部的行动，属于联合执法。然后对伊朗定义为消除威胁，也没走国会批准，属于和俄罗斯那个“特别军事行动”有一拼。

中文

1.6K

憨厚的麦总@Michael_Liu93·2d

有个想不通的地方，特朗普第一届没有开战，且一直把“不开战的总统”当作自己的政绩，到了第二届这是怎么了，又是委内瑞拉、伊朗、古巴的，为什么前面已经有了这么多失败，每任总统总是逃不出把美国卷入战争的命运。

中文

239

259

177.9K

0xTodd@0xTodd·1d

@0xLaughing 我也是同感

日本語

239

Laughing🪁@0xLaughing·1d

用上了豆包输入法，没get到铺天盖地吹的点在哪，准确率比不过Typeless，甚至还没我自建的高它最大特点是，说话有一个实时输出文字流优势在于，AI 时代节奏越来越快，产品需要像游戏一样设计「爽感」游戏靠爆装备、打击感、combo连击让人上瘾 AI 产品就得靠及时反馈、个性化多巴胺这些心理钩子

中文

0xTodd@0xTodd·1d

@xingpt 也不是不行

日本語

683

XinGPT🐶@xingpt·2d

女装的我你爱了吗 prompt在评论区

中文

17.8K

0xTodd@0xTodd·1d

@jiroucaigou 笑死我老婆要求给你这条狠狠点赞

中文

努力赚钱的菜狗@jiroucaigou·2d

@0xTodd 给老婆200U订阅费吧哈哈哈奖励一下

中文

145

0xTodd@0xTodd·1d

@PANewsLab 暂时 1:0

中文

PANews 疯狂实习生（被Ai骑在头上版）@PANewsLab·2d

@0xTodd 人类赢了耶！

中文

170

0xTodd@0xTodd·1d

@roger9949 估计偷偷拿去单独发子项目去了

中文

168

Roger波杰克@roger9949·2d

@0xTodd 还好gpt把成人项目砍了

中文

501

0xTodd@0xTodd·2d

@TheVincentLamar 最新版本号整体来说更聪明，不同分级代表不同价格，老模型也会退役

中文

269

文森辣妈 🚸 Vincent Lamar@TheVincentLamar·2d

@0xTodd 所以这个分级的意义在于什么呢？

中文

436

0xTodd@0xTodd·2d

真的恐怖，Claude 的新模型 Mythos 已经开始超小范围内测了，居然还能碾压 Opus 一个级别。 Haiku 是三行诗，Sonnet 是十四行诗，Opus 是杰作，Mythos 字面意思则是神话。不管是真的泄露，还是在某种低调营销，根据目前已知的信息，这个模型是 Opus 的上位模型，逻辑和代码能力都提升了一个等级。而且据报道，最牛逼的是在网络安全领域，以至于 Anthropic 要先给安全相关领域的公司小范围内测，来增加防守方的实力，而不是潜在、未知的攻击方。 Opus 已经经常成精了，不知道 Mythos 会神话到什么程度。