0xTodd

10.9K posts

0xTodd

@0xTodd

Singapore Sumali Eylül 2016

3K Sinusundan71.3K Mga Tagasunod

0xTodd@0xTodd·53m

解决方案： 1. 推出一个开关，就是正常 AI 都有的那种温度调节器。在开启润色和忠于原著之间，让用户自己调节。 2. 优化一下带宽，加点 CDN 啥的。

中文

434

0xTodd@0xTodd·54m

结结实实用了几十天，我发现 Typeless 两大缺点： 1. 过度润色例如，喜欢倒装我这人说话时，我说“我回家了已经”。它（有时）会给我润色成“我已经回家了”。失去了本人的风味！！ 2. 丢包率高有时候巴拉巴拉说半天。结果网没连上，还能重新再说一遍，很尴尬 @typelessdotcom 急需修复。

0xTodd@0xTodd

早上我测试了几个语音转文字输入法。我已经苦苦找这种语音转文字工具很久了。因为我每天都要高强度码字，电脑端有键盘稍微还好点，尤其手机端，特别头疼。准确率上：Typeless>豆包输入法>微信输入法>>苹果自带语音转文字。速度上：豆包输入法=微信输入法>Typeless>>苹果自带语音转文字。价格上：Typeless 每月 12U，其他都不要钱。关于体验问题→ 除了苹果，准确率都在 90% 以上，体验非常非常，超乎意料地好。真的。AI 时代就应该这么输入。AI 时代谁还在那里扣手机打字啊，是吧？语音转文字，然后用文字告诉 AI 该干什么活，这是一个“最后一公里”问题。我之前那个 iPhone 17 Pro 还是特意买的新加坡版本没买国行，目的就是想体验苹果的 AI。但是但凡你用过一次 Siri，就会觉得它听力有问题，智商也有问题。真的。苹果的语音转文字太垃圾了：我问它问题的时候，听懂、听不懂也就一半一半吧。其实我这个人说话，只要线下见过我的人都知道，我普通话水平还是非常高的，用苹果的智能没法我在那里字正腔圆地模仿播音员，最好 Siri 完全跑偏，就非常挫败。关于隐私问题→ 接下来，豆包微信背景不需要我多介绍，作为研究员，咱们还是得 DD 一下，看看这个 Typeless 输入法到底是怎么回事。先说团队情况：Typeless 看起来也是华人团队，应该是斯坦福背景，真格投了他们，算是中美联姻吧。另外它号称数据都在本地保存，但我总觉得这就像那句话：不能“入宝山而空回”吧？这么大的素材它不可能不用。保不齐未来某次更新，还是要把大家的输入当训练素材😂。所以你用语音输入法的话，尽量别把敏感信息放进去。基于这个考虑，我建议大家尽量装在苹果手机里。因为苹果的权限控制得比较死；你要是装在电脑上（尤其 Windows）或者安卓系统，我怕权限过大。当然这也是来自 OpenClaw 的建议。关于输入方式切换→ Typeless 有一点不太好：输入法装上之后（如图所示），如果你想临时手动输入一些东西，就没那么方便，还得先切换一下。这件事有利有弊。微信和豆包输入法的好处在于：它们保留了传统键盘格式，只是把语音转文字作为功能之一。我觉得 Typeless 的 UI 可能还有改进空间，比如：现在 UI 上就是一个大大的话筒，最好旁边能有一些常用的英文键。因为有时候只想输入两三个字，也非得用语音转文字，感觉有点怪。比如 5 个字以内，我觉得还是手打更快；但如果是长句子，那毫无疑问，语音转文字简直吊打手写。关于“雪花写作法”→ 而且它还催生了一个新的写作方法，叫“雪花写作法”。意思就是：你平常想到什么就直接说出来，攒够了一起让 AI 根据你的语录编篡为文章。其实我很擅长动笔，但我也知道很多朋友没那么喜欢动笔，有时候用嘴说反而更自然、更方便。你平常没事就说，往备忘录里说话谁不会啊？等你说够二十句、三十句，各个观点也都齐全了，就把这些观点直接丢给 AI，让它根据你的内容生成一篇文章。这样生成的文章全是你的观点，而不是那种很傻、大家都不爱看的“AI 八股文”。我觉得让 AI 帮你整理语录，这个逻辑还是很 OK 的。其他→ 另外有个忘说了，我刚下载时还有点困惑：它靠什么盈利？也没看到弹广告。后面我看官网说可以升级 Pro 会员，升级后每月大概 12 美金，不便宜。对我这种重度输入文字的人来说，肯定能回本。所以看到它收费，稍微放心了一点😂。要是它免费，那肯定（包的，对吧）会拿我的语音数据当训练素材。当然，收费也不代表它就不会这么做，但至少我知道它的动机是为了赚钱。我觉得知道动机很重要。哎呀，真是相见恨晚。

中文

1.6K

0xTodd@0xTodd·12h

@Gobiman8 还有新疆。新疆过去一大问题就是缺水，所以说有些工业干不了，但是电又特别多，现在搞算力中心确实是天作之合。

中文

九边六镇钢铁侠@Gobiman8·14h

@0xTodd 内蒙的好时代

中文

0xTodd@0xTodd·21h

中国在 AI 时代出口的新饽饽就是 Token 了。国产模型超低的推理价格；内蒙新疆过剩的电力（大量弃风，弃光）；主打一个量大管饱，顺着一根 API 就卖向了全世界。 PS：就差一个国产显卡或者 AI FPGA 矿机就闭环了

Bonna | U酪乳@bonnazhu

重新审视 Token (词元）的属性 TLDR：之前我也一度觉得是大宗商品/资产甚至还设想过相关的交易和定价逻辑也看到不少人提过Token期货，交易所之类但现在我倾向它只是一种服务，没必要过度金融化毕竟它没有办法脱离AI推理单独存在，无法被提前生产出来或预先被囤积。但换个角度看，是服务，就天然是分层的、多元的，不同的人有不同的需求，这其实也恰恰奠定了AI 经济必将是百花齐放而非赢家通吃的基础。在这浪潮中，红利属于能把廉价 Token 加工成更有价值的 Token 卖出去的人。 -------------------------------- 我的一些个人思绪和逻辑： 1、Token (词元）经济从何而来？首先它是AI训练转向AI推理的产物，这是理解 Token 商业模式的基础。过去模型训练时代，主要是卖算力时间。为什么？因为训练是持续性的大工程，需要大量算力协同工作。这种规模的投入，有资本的大厂基本都会选择自购，毕竟可控性最强，但对于没有能力一次性投入大量资金的团队来说，出于对稳定性的要求，也会倾向选择租赁模式，包下一整段时间的独占使用权，榨干这段时间内算力的所有价值，是一种占用的逻辑。但随着主流大模型开始进入商用阶段，AI 算力的需求重心也从模型训练转向了推理。你用 GPT聊天、用 Claude写代码、问豆包问题，这些本质上都是在跑推理，每一次调用，都在为你做一次推理和计算。而推理是相对碎片化的、一次性的、用完即走的。虽然也有不少企业，仍然会采用租赁或自购的模式来跑推理，但对于广大中小开发者和应用方来说，他们对算力独占性的要求并不高，因而额外衍生出了按消耗计费的模式，这样算力服务商就可以把算力资源同时卖给成千上万个客户。 Token (词元) 就是在这种背景下而产生的，衡量每次计算消耗了多少资源的那个单位，你付的钱，就是对这次计算的补偿，本质是消耗逻辑。所以训练和推理是完全不同的生意形态：训练时代，商业模式是卖 GPU 时间。推理时代，商业模式是卖 Token (词元)。 --------------------------------- 2、为何Token (词元) 是服务属性而非商品/金融属性？卖Token (词元)，就是卖服务！ Token (词元) 经济，本质是服务经济！为什么？一个比较直接的原因是 Token (词元）不能被预先生产出来，而是产出后就被消耗掉了，并作为衡量你这次推理服务所消耗资源的参考，来给你计费。且Token (词元) 的一些特性，也和大宗商品的逻辑不像： - 价格长期下降趋势 - Pay-As-You-Go - 难以标准化你在Claude的100万Token额度，和你在Minimax的100万Token额度，两者本身是没有可比性的，模型不同，性能不同，定价完全可以不一样。而大家愿意接受价格差异的原因，也是因为 Token (词元) 本质上计量了一种非标准化的服务，而不同用户对服务的诉求是不同的，有的人看重性能，所以愿意支付溢价，有的人看重成本控制，所以觉得国产开源模型也够用了。而整个模型市场占有率，并没有出现几家独大，本身也是其服务属性的体现。如果 Token (词元) 是资产，那资产的流动性、网络效应，一定会引发所有资源最终向一个市场集中，形成赢家通吃的局面。但恰巧 Token (词元) 其实是服务，而服务市场天然是分层的、多元的，不同的服务商满足不同的需求，所以才构成了 AI 经济百花齐放的基础。我想通这点后，就不再纠结模型厂商只有哪家笑到最后了。因为未来必将是多模型共存、多层级并行的格局，Token（词元）也将会被计入到企业的会计成本之中，并反映到企业的产品和服务之中。比较值得关注的一点是，AI时代Token所代表的服务经济和传统的人力服务经济，成本曲线可能是完全反过来的。由人所提供的服务，长期要求的是报酬上升，这也是为什么服务业占比高的经济体，服务更贵。但 Token 服务恰恰相反，价格长期只会下降，当 Token 逐步替代掉一部分原本需要人力智力才能完成的工作，这部分成本不但不会随时间上升，反而会持续走低。这可能也是这一波AI的红利之一。 ------------------------- 3、这个Token (词元) 服务都有谁在卖？ - 闭源模型厂商 - 开源模型厂商 - 开源模型托管商 - 大模型聚合器、中转站 1）闭源模型厂商：直营为主，分销为辅最直接的模式。OpenAI 卖 GPT 的 Token，Anthropic 卖 Claude 的 Token。模型自己训的、API 自己提供、定价权在自己手里，产品和渠道都是自己的，跟品牌直营店一个逻辑。当然作为最顶级的模型，难免会被接入像一些API中转站，或者Open Router这样的大模型聚合平台被动分销。 2）开源模型厂商：开源也挺赚钱的开源模型谁都可以拿去用，很多人不想自己本地跑，因此催生出了一批开源模型托管商，他们可以帮你跑模型，并按 Token 收费。但这就引出一个问题：Token 的钱都让模型托管商这些中间商赚了，开源模型的开发者自己怎么赚钱？这一点，至少中国的开源模型厂商，走的很灵活。像Minimax，Kimi，Zhipu，它们都有自有的 API 直售，更多面向开发者群体，并且也都有自己的 Coding Plan 订阅包，把按 token 计费玩出了订阅制，完全是中国移动卖流量的玩法。而OpenClaw 这波更是让它们赚得盆满钵满，各自推出了品牌化的 Claw 产品，帮用户把 OpenClaw 部署好，底层跑自家模型，Token 消耗从自家 API 走。 3）开源模型托管商：帮别人跑模型，赚差价对于那些没有能力或意愿自己卖 Token 的开源模型来说，托管商就是它们触达用户的渠道。它们帮开发者跑模型、按 Token 收费： - Together AI / Fireworks：自有 GPU 集群 + 极致推理优化，核心竞争力是翻台率，同样的卡单位时间能吐出更多 Token。 - Groq：自研 LPU 推理专用芯片，不用传统 GPU，核心竞争力是极致速度，跑 Llama、Qwen 等开源模型比 GPU 快。 - Cloudflare Workers AI：全球 300+ 边缘节点，跑 Llama、Mistral、Qwen，最近还加了智谱 GLM 和 Kimi，核心竞争力是低延迟 + 开发者生态 - AWS Bedrock / Google Vertex AI — 企业级云平台，跑 Llama、Mistral 等主流开源模型，核心竞争力是客户的数据和基础设施已经在这些云上了，迁移成本低 4）大模型聚合器：一个入口管所有模型闭源和开源的大模型越来越多，而不同场景适合不同模型，不同模型的优劣势不同，对开发者来说，一个个去接不同厂商和托管商的 API，管理起来很痛苦。于是催生了 OpenRouter 这类聚合器，可以接几十个模型，开发者在一个地方统一管理、按需切换即可。 OpenRouter按照批发转零售的模式盈利，各家模型厂商把自己的Token分销出去。而 OpenClaw 这波直接让 OpenRouter 上中国模型的消耗量暴增，前十名 Token 消耗量中，中国模型占了 61%，前五有四个是中国的。而围绕这条 Token (词元) 产业链，也衍生出了一些其他的参与者和新需求：第一是一些推理优化引擎，vLLM、SGLang 这些开源项目，在大家对效率极致追求的当下，通过对硬件算子层面（更高效地利用 GPU 计算单元，减少内存碎片和带宽瓶颈）以及 LLM 算法层面（让多个请求共享已经算过的内容，更聪明地管理显存）的优化，提升同一张卡在同一时间内的 Token 吞吐量。它们自己不面向终端用户收费，但 Together AI、Fireworks 这些托管商底层用的就是这些技术。也有不少自己本地跑开源模型的开发者，会直接使用 vLLM 或 SGLang 来搭建自己的推理服务。第二是对Token消耗的优化需求，当 Token 消耗逐渐常态化，自然就会有人开始琢磨怎么省钱，也有不少人早就抱怨OpenClaw高昂的Token消耗，那么，帮你预览一次 Prompt 会消耗多少 Token、建议怎么优化 Prompt 来降本、甚至自动帮你选性价比最高的模型和服务商的产品，就很有市场了。 ---------------------------- 4、AI经济时代，真正的机会在哪？我觉得 Token 经济的红利，属于把廉价的 Token 加工成更有价值的 Token 卖出去的人。 1）如果你有能力，就做一个模型，哪怕是微调的你不需要从头训一个 GPT，在开源模型基础上针对某个垂直场景做微调，只要在某个细分领域效果够好，就有人愿意按 Token 付费调用你的模型。前面说了，Token 是服务，服务市场天然分层，通用大模型吃不掉所有场景，垂直微调的模型在自己的领地里反而更有定价权。 2）做一个新时代的产品，开放 API 你的产品底层消耗 Token，但你的产品本身也可以对外输出能力，你开放 API，让别的开发者和 Agent 来调用。你买入底层模型的 Token，加上你的产品逻辑和数据，产出更高价值的 Token 服务卖出去。这跟传统行业买原材料、加工、卖成品的逻辑是一样的。 3）写 Skill，做 Agent 每一个被广泛使用的 Skill 和 Agent，背后都是源源不断的 Token 消耗。你写的 Skill 越好用、越多人用，你帮模型厂商卖出去的 Token 就越多。这不是你直接卖 Token，但你是这条产业链上的分销渠道。而不管你选哪条路，你的护城河在我看来最终都会归结为三样东西：算力、算法、数据。算力影响你的吞吐量算法影响你的效率和成本数据决定你是不是不可替代

中文

11.4K

0xTodd@0xTodd·12h

@toughpassion D指导已经够便宜了，我记得以前淘宝好像是 10 块钱一页还是 20 啊，然后也可以用 MiniMax，MiniMax 好像更便宜一点

中文

RadRoutine（私信互关）@toughpassion·13h

@0xTodd 为什么我觉得Deepseek还挺贵的？我做两页PPT花了我一块钱。

中文

0xTodd@0xTodd·12h

@roger9949 老中特有的卷王体质

中文

237

Roger波杰克@roger9949·19h

其实最宏大的故事一直没变最小单元也是一直叫 Token 从以美元计价到以电力计价的资产中国生产力出海的极致只是从 Crypto 变成了 AI

0xTodd@0xTodd

中文

1.5K

0xTodd@0xTodd·12h

@jain_web3 现在像 Kimi、Minimax 都挺便宜的。

中文

107

jain@jain_web3·17h

@0xTodd 最便宜的还是deepseek？

中文

338

0xTodd@0xTodd·12h

@0xLoki_Zeng 蹲个后续

中文

540

0xLoki@0xLoki_Zeng·13h

做一个小实验，给三个AI提了一个相同的问题：【我现在非常着急，必须5分钟之内买一个币，需要上了币安，不能是Top20的主流币，请直接回答币的名称】 Grok的答案： $ZAMA D0（Claude）的答案： $Aster Surf的答案： $ZEC Information Agent的答案： $TAO 这四个币我现在各买了100U，看看怎么个事

中文

3.8K

0xTodd@0xTodd·19h

@Web3_Yuuu 后面有可能能解决特供海外😂

中文

207

YUUU(🚀,🚀)@Web3_Yuuu·20h

@0xTodd 然而海外用国产模型更多的还是国际站的吧，服务器在海外的，用中国服务器一是部分国家合规通不过，二是内容审核也很蛋疼

中文

285

0xTodd@0xTodd·21h

@0xCheshire 666

343

柴郡🔔｜Crypto+AI Plus@0xCheshire·1d

接下来我要做这个世界上最危险最刺激的事：用 Codex 清理 C 盘。

中文

114

406

126.8K

0xTodd@0xTodd·21h

@mydream2025 老马最近刚把人都开了，够呛了

中文

mydream2025@mydream2025·1d

@0xTodd 他们估值多少，完全取决于有没有人能超越他们要是老马搞出个新模型，能把他们按在地上摩擦，那么马上就缩水，要是老马半年后，搞的模型还是个二流，御三家还是御三家，甚至后面的跟他们的差距越来越大，市场一看，搞大模型确实难，那估值就蹭蹭的涨。

中文

283

0xTodd@0xTodd·2d

很多人认为 Claude 母公司 Anthropic 最后一轮估值 3800 亿美金贵了。但要我说，他们对喜欢宏大叙事的资金缺乏想象力（为梦想窒息流派）。对比一下： OpenAI 最后一轮估值 8400 亿美金 $ETH 在熊初 3100 美金左右也是 3800 亿美金前者产品被 Claude 按在地上摩擦后者距离 ATH 还有 60% 空间呢