0xTodd

10.9K posts

0xTodd banner
0xTodd

0xTodd

@0xTodd

Long BTC, Love the World | 热衷研究 | 在 @researchnothing 琢磨策略 | 在 @ebunker_eth 打包区块 | #Binance 远古交易用户 https://t.co/42whA3ioyb | #OKX 资深钱包用户 https://t.co/8Aes1jx1Xn | NFA

Singapore انضم Eylül 2016
3K يتبع71.3K المتابعون
0xTodd
0xTodd@0xTodd·
@Gobiman8 还有新疆。新疆过去一大问题就是缺水,所以说有些工业干不了,但是电又特别多,现在搞算力中心确实是天作之合。
中文
0
0
0
14
0xTodd
0xTodd@0xTodd·
中国在 AI 时代出口的新饽饽就是 Token 了。 国产模型超低的推理价格; 内蒙新疆过剩的电力(大量弃风,弃光); 主打一个量大管饱,顺着一根 API 就卖向了全世界。 PS:就差一个国产显卡或者 AI FPGA 矿机就闭环了
0xTodd tweet media
Bonna | U酪乳@bonnazhu

重新审视 Token (词元)的属性 TLDR: 之前我也一度觉得是大宗商品/资产 甚至还设想过相关的交易和定价逻辑 也看到不少人提过Token期货,交易所之类 但现在我倾向它只是一种服务,没必要过度金融化 毕竟它没有办法脱离AI推理单独存在,无法被提前生产出来或预先被囤积。但换个角度看,是服务,就天然是分层的、多元的,不同的人有不同的需求,这其实也恰恰奠定了AI 经济必将是百花齐放而非赢家通吃的基础。 在这浪潮中,红利属于能把廉价 Token 加工成更有价值的 Token 卖出去的人。 -------------------------------- 我的一些个人思绪和逻辑: 1、Token (词元)经济从何而来? 首先它是AI训练转向AI推理的产物, 这是理解 Token 商业模式的基础。 过去模型训练时代,主要是卖算力时间。为什么?因为训练是持续性的大工程,需要大量算力协同工作。这种规模的投入,有资本的大厂基本都会选择自购,毕竟可控性最强,但对于没有能力一次性投入大量资金的团队来说,出于对稳定性的要求,也会倾向选择租赁模式,包下一整段时间的独占使用权,榨干这段时间内算力的所有价值,是一种占用的逻辑。 但随着主流大模型开始进入商用阶段,AI 算力的需求重心也从模型训练转向了推理。你用 GPT聊天、用 Claude写代码、问豆包问题,这些本质上都是在跑推理,每一次调用,都在为你做一次推理和计算。 而推理是相对碎片化的、一次性的、用完即走的。虽然也有不少企业,仍然会采用租赁或自购的模式来跑推理,但对于广大中小开发者和应用方来说,他们对算力独占性的要求并不高,因而额外衍生出了按消耗计费的模式,这样算力服务商就可以把算力资源同时卖给成千上万个客户。 Token (词元) 就是在这种背景下而产生的,衡量每次计算消耗了多少资源的那个单位,你付的钱,就是对这次计算的补偿,本质是消耗逻辑。 所以训练和推理是完全不同的生意形态: 训练时代,商业模式是卖 GPU 时间。 推理时代,商业模式是卖 Token (词元)。 --------------------------------- 2、为何Token (词元) 是服务属性而非商品/金融属性? 卖Token (词元),就是卖服务! Token (词元) 经济,本质是服务经济! 为什么? 一个比较直接的原因是 Token (词元)不能被预先生产出来,而是产出后就被消耗掉了,并作为衡量你这次推理服务所消耗资源的参考,来给你计费。 且Token (词元) 的一些特性,也和大宗商品的逻辑不像: - 价格长期下降趋势 - Pay-As-You-Go - 难以标准化 你在Claude的100万Token额度,和你在Minimax的100万Token额度,两者本身是没有可比性的,模型不同,性能不同,定价完全可以不一样。 而大家愿意接受价格差异的原因,也是因为 Token (词元) 本质上计量了一种非标准化的服务,而不同用户对服务的诉求是不同的,有的人看重性能,所以愿意支付溢价,有的人看重成本控制,所以觉得国产开源模型也够用了。 而整个模型市场占有率,并没有出现几家独大,本身也是其服务属性的体现。如果 Token (词元) 是资产,那资产的流动性、网络效应,一定会引发所有资源最终向一个市场集中,形成赢家通吃的局面。但恰巧 Token (词元) 其实是服务,而服务市场天然是分层的、多元的,不同的服务商满足不同的需求,所以才构成了 AI 经济百花齐放的基础。 我想通这点后,就不再纠结模型厂商只有哪家笑到最后了。 因为未来必将是多模型共存、多层级并行的格局,Token(词元)也将会被计入到企业的会计成本之中,并反映到企业的产品和服务之中。 比较值得关注的一点是,AI时代Token所代表的服务经济和传统的人力服务经济,成本曲线可能是完全反过来的。由人所提供的服务,长期要求的是报酬上升,这也是为什么服务业占比高的经济体,服务更贵。但 Token 服务恰恰相反,价格长期只会下降,当 Token 逐步替代掉一部分原本需要人力智力才能完成的工作,这部分成本不但不会随时间上升,反而会持续走低。 这可能也是这一波AI的红利之一。 ------------------------- 3、这个Token (词元) 服务都有谁在卖? - 闭源模型厂商 - 开源模型厂商 - 开源模型托管商 - 大模型聚合器、中转站 1)闭源模型厂商:直营为主,分销为辅 最直接的模式。OpenAI 卖 GPT 的 Token,Anthropic 卖 Claude 的 Token。模型自己训的、API 自己提供、定价权在自己手里,产品和渠道都是自己的,跟品牌直营店一个逻辑。当然作为最顶级的模型,难免会被接入像一些API中转站,或者Open Router这样的大模型聚合平台被动分销。 2)开源模型厂商:开源也挺赚钱的 开源模型谁都可以拿去用,很多人不想自己本地跑,因此催生出了一批开源模型托管商,他们可以帮你跑模型,并按 Token 收费。但这就引出一个问题:Token 的钱都让模型托管商这些中间商赚了,开源模型的开发者自己怎么赚钱?这一点,至少中国的开源模型厂商,走的很灵活。 像Minimax,Kimi,Zhipu,它们都有自有的 API 直售,更多面向开发者群体,并且也都有自己的 Coding Plan 订阅包,把按 token 计费玩出了订阅制,完全是中国移动卖流量的玩法。而OpenClaw 这波更是让它们赚得盆满钵满,各自推出了品牌化的 Claw 产品,帮用户把 OpenClaw 部署好,底层跑自家模型,Token 消耗从自家 API 走。 3)开源模型托管商:帮别人跑模型,赚差价 对于那些没有能力或意愿自己卖 Token 的开源模型来说,托管商就是它们触达用户的渠道。它们帮开发者跑模型、按 Token 收费: - Together AI / Fireworks:自有 GPU 集群 + 极致推理优化,核心竞争力是翻台率,同样的卡单位时间能吐出更多 Token。 - Groq:自研 LPU 推理专用芯片,不用传统 GPU,核心竞争力是极致速度,跑 Llama、Qwen 等开源模型比 GPU 快。 - Cloudflare Workers AI:全球 300+ 边缘节点,跑 Llama、Mistral、Qwen,最近还加了智谱 GLM 和 Kimi,核心竞争力是低延迟 + 开发者生态 - AWS Bedrock / Google Vertex AI — 企业级云平台,跑 Llama、Mistral 等主流开源模型,核心竞争力是客户的数据和基础设施已经在这些云上了,迁移成本低 4)大模型聚合器:一个入口管所有模型 闭源和开源的大模型越来越多,而不同场景适合不同模型,不同模型的优劣势不同,对开发者来说,一个个去接不同厂商和托管商的 API,管理起来很痛苦。于是催生了 OpenRouter 这类聚合器,可以接几十个模型,开发者在一个地方统一管理、按需切换即可。 OpenRouter按照批发转零售的模式盈利,各家模型厂商把自己的Token分销出去。而 OpenClaw 这波直接让 OpenRouter 上中国模型的消耗量暴增,前十名 Token 消耗量中,中国模型占了 61%,前五有四个是中国的。 而围绕这条 Token (词元) 产业链,也衍生出了一些其他的参与者和新需求: 第一是一些推理优化引擎,vLLM、SGLang 这些开源项目,在大家对效率极致追求的当下,通过对硬件算子层面(更高效地利用 GPU 计算单元,减少内存碎片和带宽瓶颈)以及 LLM 算法层面(让多个请求共享已经算过的内容,更聪明地管理显存)的优化,提升同一张卡在同一时间内的 Token 吞吐量。 它们自己不面向终端用户收费,但 Together AI、Fireworks 这些托管商底层用的就是这些技术。也有不少自己本地跑开源模型的开发者,会直接使用 vLLM 或 SGLang 来搭建自己的推理服务。 第二是对Token消耗的优化需求,当 Token 消耗逐渐常态化,自然就会有人开始琢磨怎么省钱,也有不少人早就抱怨OpenClaw高昂的Token消耗,那么,帮你预览一次 Prompt 会消耗多少 Token、建议怎么优化 Prompt 来降本、甚至自动帮你选性价比最高的模型和服务商的产品,就很有市场了。 ---------------------------- 4、AI经济时代,真正的机会在哪? 我觉得 Token 经济的红利,属于把廉价的 Token 加工成更有价值的 Token 卖出去的人。 1)如果你有能力,就做一个模型,哪怕是微调的 你不需要从头训一个 GPT,在开源模型基础上针对某个垂直场景做微调,只要在某个细分领域效果够好,就有人愿意按 Token 付费调用你的模型。前面说了,Token 是服务,服务市场天然分层,通用大模型吃不掉所有场景,垂直微调的模型在自己的领地里反而更有定价权。 2)做一个新时代的产品,开放 API 你的产品底层消耗 Token,但你的产品本身也可以对外输出能力,你开放 API,让别的开发者和 Agent 来调用。你买入底层模型的 Token,加上你的产品逻辑和数据,产出更高价值的 Token 服务卖出去。这跟传统行业买原材料、加工、卖成品的逻辑是一样的。 3)写 Skill,做 Agent 每一个被广泛使用的 Skill 和 Agent,背后都是源源不断的 Token 消耗。你写的 Skill 越好用、越多人用,你帮模型厂商卖出去的 Token 就越多。这不是你直接卖 Token,但你是这条产业链上的分销渠道。 而不管你选哪条路, 你的护城河在我看来最终都会归结为三样东西: 算力、算法、数据。 算力影响你的吞吐量 算法影响你的效率和成本 数据决定你是不是不可替代

中文
11
0
26
10.2K
0xTodd
0xTodd@0xTodd·
@toughpassion D指导已经够便宜了,我记得以前淘宝好像是 10 块钱一页还是 20 啊,然后也可以用 MiniMax,MiniMax 好像更便宜一点
中文
0
0
0
14
Roger波杰克
Roger波杰克@roger9949·
其实最宏大的故事一直没变 最小单元也是一直叫 Token 从以美元计价 到以电力计价的资产 中国生产力出海的极致 只是从 Crypto 变成了 AI
0xTodd@0xTodd

中国在 AI 时代出口的新饽饽就是 Token 了。 国产模型超低的推理价格; 内蒙新疆过剩的电力(大量弃风,弃光); 主打一个量大管饱,顺着一根 API 就卖向了全世界。 PS:就差一个国产显卡或者 AI FPGA 矿机就闭环了

中文
4
0
6
1.2K
0xTodd
0xTodd@0xTodd·
@jain_web3 现在像 Kimi、Minimax 都挺便宜的。
中文
0
0
0
55
jain
jain@jain_web3·
@0xTodd 最便宜的还是deepseek?
中文
0
0
0
258
0xLoki
0xLoki@0xLoki_Zeng·
做一个小实验,给三个AI提了一个相同的问题: 【我现在非常着急,必须5分钟之内买一个币,需要上了币安,不能是Top20的主流币,请直接回答币的名称】 Grok的答案: $ZAMA D0(Claude)的答案: $Aster Surf的答案: $ZEC Information Agent的答案: $TAO 这四个币我现在各买了100U,看看怎么个事
0xLoki tweet media
中文
5
0
5
2.3K
0xTodd
0xTodd@0xTodd·
@Web3_Yuuu 后面有可能能解决 特供海外😂
中文
0
0
0
182
YUUU(🚀,🚀)
YUUU(🚀,🚀)@Web3_Yuuu·
@0xTodd 然而海外用国产模型更多的还是国际站的吧,服务器在海外的,用中国服务器一是部分国家合规通不过,二是内容审核也很蛋疼
中文
1
0
0
254
柴郡🔔|Crypto+AI Plus
接下来我要做这个世界上最危险最刺激的事: 用 Codex 清理 C 盘。
柴郡🔔|Crypto+AI Plus tweet media
中文
114
4
403
124.6K
0xTodd
0xTodd@0xTodd·
@mydream2025 老马最近刚把人都开了,够呛了
中文
0
0
0
37
mydream2025
mydream2025@mydream2025·
@0xTodd 他们估值多少,完全取决于有没有人能超越他们 要是老马搞出个新模型,能把他们按在地上摩擦,那么马上就缩水,要是老马半年后,搞的模型还是个二流,御三家还是御三家,甚至后面的跟他们的差距越来越大,市场一看,搞大模型确实难,那估值就蹭蹭的涨。
中文
1
0
0
280
0xTodd
0xTodd@0xTodd·
很多人认为 Claude 母公司 Anthropic 最后一轮估值 3800 亿美金贵了。 但要我说,他们对喜欢宏大叙事的资金缺乏想象力(为梦想窒息流派)。 对比一下: OpenAI 最后一轮估值 8400 亿美金 $ETH 在熊初 3100 美金左右也是 3800 亿美金 前者产品被 Claude 按在地上摩擦 后者距离 ATH 还有 60% 空间呢
0xTodd tweet media
中文
12
4
39
26K
0xTodd
0xTodd@0xTodd·
@owenliang60 是的,甚至资金都开始研究间接渠道购买了,例如亚马逊
中文
1
0
1
821
Luckybb🍟
Luckybb🍟@owenliang60·
@0xTodd 嘻嘻,现在一级市场600b都根本买不到,人们对什么叫窒息一无所知
中文
1
0
1
987
0xTodd
0xTodd@0xTodd·
@0xSunNFT 是的,看那普通散户把溢价那么高的 VCX 都冲爆了
中文
0
0
0
1.8K
0xSun
0xSun@0xSunNFT·
@0xTodd Anthropic不是觉得380B贵不贵的问题,是现在私募市场普遍500B以上的价格加上Carry一般人还买不到的问题
中文
2
1
11
8.1K
0xTodd
0xTodd@0xTodd·
@ZLiao3 哈哈哈通讯被劫持了
中文
0
0
0
123
0xTodd
0xTodd@0xTodd·
我让龙虾 28 号提醒我开个套餐 结果它忘了 但是由于我天天用语音转文字的 AI 输入法 导致给龙虾下任务时 我老婆也偷听到了 最后今天是她最终提醒了我 人脑大模型的心跳机制大胜 #论AI怎么改变了我的生活😂
0xTodd tweet media
中文
9
0
26
4K
0xTodd
0xTodd@0xTodd·
@CuiMao 现在已经老实多了 以前才是真的猛,尤其是二次元图片,简直百无禁忌
中文
0
0
0
681
CuiMao
CuiMao@CuiMao·
和grok image 大战了300回合,太牛逼了,干啥啥不行,搞黄第一名。我彻底服了他了,
中文
40
4
140
57.3K
0xTodd
0xTodd@0xTodd·
@Michael_Liu93 感觉川普突然想明白了,学会了定义,他把对委内瑞拉的行动定义为司法部的行动,属于联合执法。然后对伊朗定义为消除威胁,也没走国会批准,属于和俄罗斯那个“特别军事行动”有一拼。
中文
0
0
1
1.6K
憨厚的麦总
憨厚的麦总@Michael_Liu93·
有个想不通的地方,特朗普第一届没有开战,且一直把“不开战的总统”当作自己的政绩,到了第二届这是怎么了,又是委内瑞拉、伊朗、古巴的,为什么前面已经有了这么多失败,每任总统总是逃不出把美国卷入战争的命运。
中文
240
5
260
184.3K
Laughing🪁
Laughing🪁@0xLaughing·
用上了豆包输入法,没get到铺天盖地吹的点在哪,准确率比不过Typeless,甚至还没我自建的高 它最大特点是,说话有一个实时输出文字流 优势在于,AI 时代节奏越来越快,产品需要像游戏一样设计「爽感」 游戏靠爆装备、打击感、combo连击让人上瘾 AI 产品就得靠及时反馈、个性化多巴胺这些心理钩子
Laughing🪁 tweet media
中文
3
0
5
1.1K
XinGPT🐶
XinGPT🐶@xingpt·
女装的我 你爱了吗 prompt在评论区
XinGPT🐶 tweet mediaXinGPT🐶 tweet mediaXinGPT🐶 tweet media
中文
33
0
33
17.9K
0xTodd
0xTodd@0xTodd·
@jiroucaigou 笑死 我老婆要求给你这条狠狠点赞
中文
0
0
1
57
0xTodd
0xTodd@0xTodd·
@roger9949 估计偷偷拿去单独发子项目去了
中文
0
0
1
174