0xTodd

10.9K posts

0xTodd

@0xTodd

Singapore انضم Eylül 2016

3K يتبع71.3K المتابعون

0xTodd@0xTodd·1h

@Gobiman8 还有新疆。新疆过去一大问题就是缺水，所以说有些工业干不了，但是电又特别多，现在搞算力中心确实是天作之合。

中文

九边六镇钢铁侠@Gobiman8·4h

@0xTodd 内蒙的好时代

中文

0xTodd@0xTodd·10h

中国在 AI 时代出口的新饽饽就是 Token 了。国产模型超低的推理价格；内蒙新疆过剩的电力（大量弃风，弃光）；主打一个量大管饱，顺着一根 API 就卖向了全世界。 PS：就差一个国产显卡或者 AI FPGA 矿机就闭环了

Bonna | U酪乳@bonnazhu

重新审视 Token (词元）的属性 TLDR：之前我也一度觉得是大宗商品/资产甚至还设想过相关的交易和定价逻辑也看到不少人提过Token期货，交易所之类但现在我倾向它只是一种服务，没必要过度金融化毕竟它没有办法脱离AI推理单独存在，无法被提前生产出来或预先被囤积。但换个角度看，是服务，就天然是分层的、多元的，不同的人有不同的需求，这其实也恰恰奠定了AI 经济必将是百花齐放而非赢家通吃的基础。在这浪潮中，红利属于能把廉价 Token 加工成更有价值的 Token 卖出去的人。 -------------------------------- 我的一些个人思绪和逻辑： 1、Token (词元）经济从何而来？首先它是AI训练转向AI推理的产物，这是理解 Token 商业模式的基础。过去模型训练时代，主要是卖算力时间。为什么？因为训练是持续性的大工程，需要大量算力协同工作。这种规模的投入，有资本的大厂基本都会选择自购，毕竟可控性最强，但对于没有能力一次性投入大量资金的团队来说，出于对稳定性的要求，也会倾向选择租赁模式，包下一整段时间的独占使用权，榨干这段时间内算力的所有价值，是一种占用的逻辑。但随着主流大模型开始进入商用阶段，AI 算力的需求重心也从模型训练转向了推理。你用 GPT聊天、用 Claude写代码、问豆包问题，这些本质上都是在跑推理，每一次调用，都在为你做一次推理和计算。而推理是相对碎片化的、一次性的、用完即走的。虽然也有不少企业，仍然会采用租赁或自购的模式来跑推理，但对于广大中小开发者和应用方来说，他们对算力独占性的要求并不高，因而额外衍生出了按消耗计费的模式，这样算力服务商就可以把算力资源同时卖给成千上万个客户。 Token (词元) 就是在这种背景下而产生的，衡量每次计算消耗了多少资源的那个单位，你付的钱，就是对这次计算的补偿，本质是消耗逻辑。所以训练和推理是完全不同的生意形态：训练时代，商业模式是卖 GPU 时间。推理时代，商业模式是卖 Token (词元)。 --------------------------------- 2、为何Token (词元) 是服务属性而非商品/金融属性？卖Token (词元)，就是卖服务！ Token (词元) 经济，本质是服务经济！为什么？一个比较直接的原因是 Token (词元）不能被预先生产出来，而是产出后就被消耗掉了，并作为衡量你这次推理服务所消耗资源的参考，来给你计费。且Token (词元) 的一些特性，也和大宗商品的逻辑不像： - 价格长期下降趋势 - Pay-As-You-Go - 难以标准化你在Claude的100万Token额度，和你在Minimax的100万Token额度，两者本身是没有可比性的，模型不同，性能不同，定价完全可以不一样。而大家愿意接受价格差异的原因，也是因为 Token (词元) 本质上计量了一种非标准化的服务，而不同用户对服务的诉求是不同的，有的人看重性能，所以愿意支付溢价，有的人看重成本控制，所以觉得国产开源模型也够用了。而整个模型市场占有率，并没有出现几家独大，本身也是其服务属性的体现。如果 Token (词元) 是资产，那资产的流动性、网络效应，一定会引发所有资源最终向一个市场集中，形成赢家通吃的局面。但恰巧 Token (词元) 其实是服务，而服务市场天然是分层的、多元的，不同的服务商满足不同的需求，所以才构成了 AI 经济百花齐放的基础。我想通这点后，就不再纠结模型厂商只有哪家笑到最后了。因为未来必将是多模型共存、多层级并行的格局，Token（词元）也将会被计入到企业的会计成本之中，并反映到企业的产品和服务之中。比较值得关注的一点是，AI时代Token所代表的服务经济和传统的人力服务经济，成本曲线可能是完全反过来的。由人所提供的服务，长期要求的是报酬上升，这也是为什么服务业占比高的经济体，服务更贵。但 Token 服务恰恰相反，价格长期只会下降，当 Token 逐步替代掉一部分原本需要人力智力才能完成的工作，这部分成本不但不会随时间上升，反而会持续走低。这可能也是这一波AI的红利之一。 ------------------------- 3、这个Token (词元) 服务都有谁在卖？ - 闭源模型厂商 - 开源模型厂商 - 开源模型托管商 - 大模型聚合器、中转站 1）闭源模型厂商：直营为主，分销为辅最直接的模式。OpenAI 卖 GPT 的 Token，Anthropic 卖 Claude 的 Token。模型自己训的、API 自己提供、定价权在自己手里，产品和渠道都是自己的，跟品牌直营店一个逻辑。当然作为最顶级的模型，难免会被接入像一些API中转站，或者Open Router这样的大模型聚合平台被动分销。 2）开源模型厂商：开源也挺赚钱的开源模型谁都可以拿去用，很多人不想自己本地跑，因此催生出了一批开源模型托管商，他们可以帮你跑模型，并按 Token 收费。但这就引出一个问题：Token 的钱都让模型托管商这些中间商赚了，开源模型的开发者自己怎么赚钱？这一点，至少中国的开源模型厂商，走的很灵活。像Minimax，Kimi，Zhipu，它们都有自有的 API 直售，更多面向开发者群体，并且也都有自己的 Coding Plan 订阅包，把按 token 计费玩出了订阅制，完全是中国移动卖流量的玩法。而OpenClaw 这波更是让它们赚得盆满钵满，各自推出了品牌化的 Claw 产品，帮用户把 OpenClaw 部署好，底层跑自家模型，Token 消耗从自家 API 走。 3）开源模型托管商：帮别人跑模型，赚差价对于那些没有能力或意愿自己卖 Token 的开源模型来说，托管商就是它们触达用户的渠道。它们帮开发者跑模型、按 Token 收费： - Together AI / Fireworks：自有 GPU 集群 + 极致推理优化，核心竞争力是翻台率，同样的卡单位时间能吐出更多 Token。 - Groq：自研 LPU 推理专用芯片，不用传统 GPU，核心竞争力是极致速度，跑 Llama、Qwen 等开源模型比 GPU 快。 - Cloudflare Workers AI：全球 300+ 边缘节点，跑 Llama、Mistral、Qwen，最近还加了智谱 GLM 和 Kimi，核心竞争力是低延迟 + 开发者生态 - AWS Bedrock / Google Vertex AI — 企业级云平台，跑 Llama、Mistral 等主流开源模型，核心竞争力是客户的数据和基础设施已经在这些云上了，迁移成本低 4）大模型聚合器：一个入口管所有模型闭源和开源的大模型越来越多，而不同场景适合不同模型，不同模型的优劣势不同，对开发者来说，一个个去接不同厂商和托管商的 API，管理起来很痛苦。于是催生了 OpenRouter 这类聚合器，可以接几十个模型，开发者在一个地方统一管理、按需切换即可。 OpenRouter按照批发转零售的模式盈利，各家模型厂商把自己的Token分销出去。而 OpenClaw 这波直接让 OpenRouter 上中国模型的消耗量暴增，前十名 Token 消耗量中，中国模型占了 61%，前五有四个是中国的。而围绕这条 Token (词元) 产业链，也衍生出了一些其他的参与者和新需求：第一是一些推理优化引擎，vLLM、SGLang 这些开源项目，在大家对效率极致追求的当下，通过对硬件算子层面（更高效地利用 GPU 计算单元，减少内存碎片和带宽瓶颈）以及 LLM 算法层面（让多个请求共享已经算过的内容，更聪明地管理显存）的优化，提升同一张卡在同一时间内的 Token 吞吐量。它们自己不面向终端用户收费，但 Together AI、Fireworks 这些托管商底层用的就是这些技术。也有不少自己本地跑开源模型的开发者，会直接使用 vLLM 或 SGLang 来搭建自己的推理服务。第二是对Token消耗的优化需求，当 Token 消耗逐渐常态化，自然就会有人开始琢磨怎么省钱，也有不少人早就抱怨OpenClaw高昂的Token消耗，那么，帮你预览一次 Prompt 会消耗多少 Token、建议怎么优化 Prompt 来降本、甚至自动帮你选性价比最高的模型和服务商的产品，就很有市场了。 ---------------------------- 4、AI经济时代，真正的机会在哪？我觉得 Token 经济的红利，属于把廉价的 Token 加工成更有价值的 Token 卖出去的人。 1）如果你有能力，就做一个模型，哪怕是微调的你不需要从头训一个 GPT，在开源模型基础上针对某个垂直场景做微调，只要在某个细分领域效果够好，就有人愿意按 Token 付费调用你的模型。前面说了，Token 是服务，服务市场天然分层，通用大模型吃不掉所有场景，垂直微调的模型在自己的领地里反而更有定价权。 2）做一个新时代的产品，开放 API 你的产品底层消耗 Token，但你的产品本身也可以对外输出能力，你开放 API，让别的开发者和 Agent 来调用。你买入底层模型的 Token，加上你的产品逻辑和数据，产出更高价值的 Token 服务卖出去。这跟传统行业买原材料、加工、卖成品的逻辑是一样的。 3）写 Skill，做 Agent 每一个被广泛使用的 Skill 和 Agent，背后都是源源不断的 Token 消耗。你写的 Skill 越好用、越多人用，你帮模型厂商卖出去的 Token 就越多。这不是你直接卖 Token，但你是这条产业链上的分销渠道。而不管你选哪条路，你的护城河在我看来最终都会归结为三样东西：算力、算法、数据。算力影响你的吞吐量算法影响你的效率和成本数据决定你是不是不可替代

中文

10.2K

0xTodd@0xTodd·1h

@toughpassion D指导已经够便宜了，我记得以前淘宝好像是 10 块钱一页还是 20 啊，然后也可以用 MiniMax，MiniMax 好像更便宜一点

中文

RadRoutine（私信互关）@toughpassion·3h

@0xTodd 为什么我觉得Deepseek还挺贵的？我做两页PPT花了我一块钱。

中文

0xTodd@0xTodd·1h

@roger9949 老中特有的卷王体质

中文

104

Roger波杰克@roger9949·9h

其实最宏大的故事一直没变最小单元也是一直叫 Token 从以美元计价到以电力计价的资产中国生产力出海的极致只是从 Crypto 变成了 AI

0xTodd@0xTodd

中文

1.2K

0xTodd@0xTodd·1h

@jain_web3 现在像 Kimi、Minimax 都挺便宜的。

中文

jain@jain_web3·6h

@0xTodd 最便宜的还是deepseek？

中文

258

0xTodd@0xTodd·1h

@0xLoki_Zeng 蹲个后续

中文

248

0xLoki@0xLoki_Zeng·3h

做一个小实验，给三个AI提了一个相同的问题：【我现在非常着急，必须5分钟之内买一个币，需要上了币安，不能是Top20的主流币，请直接回答币的名称】 Grok的答案： $ZAMA D0（Claude）的答案： $Aster Surf的答案： $ZEC Information Agent的答案： $TAO 这四个币我现在各买了100U，看看怎么个事

中文

2.3K

0xTodd@0xTodd·9h

@Web3_Yuuu 后面有可能能解决特供海外😂

中文

182

YUUU(🚀,🚀)@Web3_Yuuu·10h

@0xTodd 然而海外用国产模型更多的还是国际站的吧，服务器在海外的，用中国服务器一是部分国家合规通不过，二是内容审核也很蛋疼

中文

254

0xTodd@0xTodd·11h

@0xCheshire 666

258

柴郡🔔｜Crypto+AI Plus@0xCheshire·1d

接下来我要做这个世界上最危险最刺激的事：用 Codex 清理 C 盘。

中文

114

403

124.6K

0xTodd@0xTodd·11h

@mydream2025 老马最近刚把人都开了，够呛了

中文

mydream2025@mydream2025·1d

@0xTodd 他们估值多少，完全取决于有没有人能超越他们要是老马搞出个新模型，能把他们按在地上摩擦，那么马上就缩水，要是老马半年后，搞的模型还是个二流，御三家还是御三家，甚至后面的跟他们的差距越来越大，市场一看，搞大模型确实难，那估值就蹭蹭的涨。

中文

280

0xTodd@0xTodd·1d

很多人认为 Claude 母公司 Anthropic 最后一轮估值 3800 亿美金贵了。但要我说，他们对喜欢宏大叙事的资金缺乏想象力（为梦想窒息流派）。对比一下： OpenAI 最后一轮估值 8400 亿美金 $ETH 在熊初 3100 美金左右也是 3800 亿美金前者产品被 Claude 按在地上摩擦后者距离 ATH 还有 60% 空间呢