0xTodd

10.9K posts

0xTodd banner
0xTodd

0xTodd

@0xTodd

Long BTC, Love the World | 热衷研究 | 在 @researchnothing 琢磨策略 | 在 @ebunker_eth 打包区块 | #Binance 远古交易用户 https://t.co/42whA3ioyb | #OKX 资深钱包用户 https://t.co/8Aes1jx1Xn | NFA

Singapore Sumali Eylül 2016
3K Sinusundan71.3K Mga Tagasunod
0xTodd
0xTodd@0xTodd·
解决方案: 1. 推出一个开关,就是正常 AI 都有的那种温度调节器。 在 开启润色 和 忠于原著 之间,让用户自己调节。 2. 优化一下带宽,加点 CDN 啥的。
中文
0
0
2
434
0xTodd
0xTodd@0xTodd·
结结实实用了几十天,我发现 Typeless 两大缺点: 1. 过度润色 例如,喜欢倒装我这人说话时,我说“我回家了已经”。 它(有时)会给我润色成“我已经回家了”。 失去了本人的风味!! 2. 丢包率高 有时候巴拉巴拉说半天。 结果网没连上,还能重新再说一遍,很尴尬 @typelessdotcom 急需修复。
0xTodd@0xTodd

早上我测试了几个语音转文字输入法。 我已经苦苦找这种语音转文字工具很久了。因为我每天都要高强度码字,电脑端有键盘稍微还好点,尤其手机端,特别头疼。 准确率上:Typeless>豆包输入法>微信输入法>>苹果自带语音转文字。 速度上:豆包输入法=微信输入法>Typeless>>苹果自带语音转文字。 价格上:Typeless 每月 12U,其他都不要钱。 关于体验问题→ 除了苹果,准确率都在 90% 以上,体验非常非常,超乎意料地好。 真的。AI 时代就应该这么输入。AI 时代谁还在那里扣手机打字啊,是吧? 语音转文字,然后用文字告诉 AI 该干什么活,这是一个“最后一公里”问题。 我之前那个 iPhone 17 Pro 还是特意买的新加坡版本没买国行,目的就是想体验苹果的 AI。但是但凡你用过一次 Siri,就会觉得它听力有问题,智商也有问题。 真的。苹果的语音转文字太垃圾了:我问它问题的时候,听懂、听不懂也就一半一半吧。 其实我这个人说话,只要线下见过我的人都知道,我普通话水平还是非常高的,用苹果的智能没法我在那里字正腔圆地模仿播音员,最好 Siri 完全跑偏,就非常挫败。 关于隐私问题→ 接下来,豆包微信背景不需要我多介绍,作为研究员,咱们还是得 DD 一下,看看这个 Typeless 输入法到底是怎么回事。 先说团队情况:Typeless 看起来也是华人团队,应该是斯坦福背景,真格投了他们,算是中美联姻吧。 另外它号称数据都在本地保存,但我总觉得这就像那句话:不能“入宝山而空回”吧?这么大的素材它不可能不用。 保不齐未来某次更新,还是要把大家的输入当训练素材😂。 所以你用语音输入法的话,尽量别把敏感信息放进去。 基于这个考虑,我建议大家尽量装在苹果手机里。因为苹果的权限控制得比较死; 你要是装在电脑上(尤其 Windows)或者安卓系统,我怕权限过大。当然这也是来自 OpenClaw 的建议。 关于输入方式切换→ Typeless 有一点不太好:输入法装上之后(如图所示),如果你想临时手动输入一些东西,就没那么方便,还得先切换一下。 这件事有利有弊。微信和豆包输入法的好处在于:它们保留了传统键盘格式,只是把语音转文字作为功能之一。 我觉得 Typeless 的 UI 可能还有改进空间,比如: 现在 UI 上就是一个大大的话筒,最好旁边能有一些常用的英文键。因为有时候只想输入两三个字,也非得用语音转文字,感觉有点怪。 比如 5 个字以内,我觉得还是手打更快;但如果是长句子,那毫无疑问,语音转文字简直吊打手写。 关于“雪花写作法”→ 而且它还催生了一个新的写作方法,叫“雪花写作法”。 意思就是:你平常想到什么就直接说出来,攒够了一起让 AI 根据你的语录编篡为文章。 其实我很擅长动笔,但我也知道很多朋友没那么喜欢动笔,有时候用嘴说反而更自然、更方便。你平常没事就说,往备忘录里说话谁不会啊? 等你说够二十句、三十句,各个观点也都齐全了,就把这些观点直接丢给 AI,让它根据你的内容生成一篇文章。 这样生成的文章全是你的观点,而不是那种很傻、大家都不爱看的“AI 八股文”。我觉得让 AI 帮你整理语录,这个逻辑还是很 OK 的。 其他→ 另外有个忘说了,我刚下载时还有点困惑:它靠什么盈利?也没看到弹广告。 后面我看官网说可以升级 Pro 会员,升级后每月大概 12 美金,不便宜。对我这种重度输入文字的人来说,肯定能回本。 所以看到它收费,稍微放心了一点😂。要是它免费,那肯定(包的,对吧)会拿我的语音数据当训练素材。 当然,收费也不代表它就不会这么做,但至少我知道它的动机是为了赚钱。我觉得知道动机很重要。 哎呀,真是相见恨晚。

中文
4
0
4
1.6K
0xTodd
0xTodd@0xTodd·
@Gobiman8 还有新疆。新疆过去一大问题就是缺水,所以说有些工业干不了,但是电又特别多,现在搞算力中心确实是天作之合。
中文
0
0
0
31
0xTodd
0xTodd@0xTodd·
中国在 AI 时代出口的新饽饽就是 Token 了。 国产模型超低的推理价格; 内蒙新疆过剩的电力(大量弃风,弃光); 主打一个量大管饱,顺着一根 API 就卖向了全世界。 PS:就差一个国产显卡或者 AI FPGA 矿机就闭环了
0xTodd tweet media
Bonna | U酪乳@bonnazhu

重新审视 Token (词元)的属性 TLDR: 之前我也一度觉得是大宗商品/资产 甚至还设想过相关的交易和定价逻辑 也看到不少人提过Token期货,交易所之类 但现在我倾向它只是一种服务,没必要过度金融化 毕竟它没有办法脱离AI推理单独存在,无法被提前生产出来或预先被囤积。但换个角度看,是服务,就天然是分层的、多元的,不同的人有不同的需求,这其实也恰恰奠定了AI 经济必将是百花齐放而非赢家通吃的基础。 在这浪潮中,红利属于能把廉价 Token 加工成更有价值的 Token 卖出去的人。 -------------------------------- 我的一些个人思绪和逻辑: 1、Token (词元)经济从何而来? 首先它是AI训练转向AI推理的产物, 这是理解 Token 商业模式的基础。 过去模型训练时代,主要是卖算力时间。为什么?因为训练是持续性的大工程,需要大量算力协同工作。这种规模的投入,有资本的大厂基本都会选择自购,毕竟可控性最强,但对于没有能力一次性投入大量资金的团队来说,出于对稳定性的要求,也会倾向选择租赁模式,包下一整段时间的独占使用权,榨干这段时间内算力的所有价值,是一种占用的逻辑。 但随着主流大模型开始进入商用阶段,AI 算力的需求重心也从模型训练转向了推理。你用 GPT聊天、用 Claude写代码、问豆包问题,这些本质上都是在跑推理,每一次调用,都在为你做一次推理和计算。 而推理是相对碎片化的、一次性的、用完即走的。虽然也有不少企业,仍然会采用租赁或自购的模式来跑推理,但对于广大中小开发者和应用方来说,他们对算力独占性的要求并不高,因而额外衍生出了按消耗计费的模式,这样算力服务商就可以把算力资源同时卖给成千上万个客户。 Token (词元) 就是在这种背景下而产生的,衡量每次计算消耗了多少资源的那个单位,你付的钱,就是对这次计算的补偿,本质是消耗逻辑。 所以训练和推理是完全不同的生意形态: 训练时代,商业模式是卖 GPU 时间。 推理时代,商业模式是卖 Token (词元)。 --------------------------------- 2、为何Token (词元) 是服务属性而非商品/金融属性? 卖Token (词元),就是卖服务! Token (词元) 经济,本质是服务经济! 为什么? 一个比较直接的原因是 Token (词元)不能被预先生产出来,而是产出后就被消耗掉了,并作为衡量你这次推理服务所消耗资源的参考,来给你计费。 且Token (词元) 的一些特性,也和大宗商品的逻辑不像: - 价格长期下降趋势 - Pay-As-You-Go - 难以标准化 你在Claude的100万Token额度,和你在Minimax的100万Token额度,两者本身是没有可比性的,模型不同,性能不同,定价完全可以不一样。 而大家愿意接受价格差异的原因,也是因为 Token (词元) 本质上计量了一种非标准化的服务,而不同用户对服务的诉求是不同的,有的人看重性能,所以愿意支付溢价,有的人看重成本控制,所以觉得国产开源模型也够用了。 而整个模型市场占有率,并没有出现几家独大,本身也是其服务属性的体现。如果 Token (词元) 是资产,那资产的流动性、网络效应,一定会引发所有资源最终向一个市场集中,形成赢家通吃的局面。但恰巧 Token (词元) 其实是服务,而服务市场天然是分层的、多元的,不同的服务商满足不同的需求,所以才构成了 AI 经济百花齐放的基础。 我想通这点后,就不再纠结模型厂商只有哪家笑到最后了。 因为未来必将是多模型共存、多层级并行的格局,Token(词元)也将会被计入到企业的会计成本之中,并反映到企业的产品和服务之中。 比较值得关注的一点是,AI时代Token所代表的服务经济和传统的人力服务经济,成本曲线可能是完全反过来的。由人所提供的服务,长期要求的是报酬上升,这也是为什么服务业占比高的经济体,服务更贵。但 Token 服务恰恰相反,价格长期只会下降,当 Token 逐步替代掉一部分原本需要人力智力才能完成的工作,这部分成本不但不会随时间上升,反而会持续走低。 这可能也是这一波AI的红利之一。 ------------------------- 3、这个Token (词元) 服务都有谁在卖? - 闭源模型厂商 - 开源模型厂商 - 开源模型托管商 - 大模型聚合器、中转站 1)闭源模型厂商:直营为主,分销为辅 最直接的模式。OpenAI 卖 GPT 的 Token,Anthropic 卖 Claude 的 Token。模型自己训的、API 自己提供、定价权在自己手里,产品和渠道都是自己的,跟品牌直营店一个逻辑。当然作为最顶级的模型,难免会被接入像一些API中转站,或者Open Router这样的大模型聚合平台被动分销。 2)开源模型厂商:开源也挺赚钱的 开源模型谁都可以拿去用,很多人不想自己本地跑,因此催生出了一批开源模型托管商,他们可以帮你跑模型,并按 Token 收费。但这就引出一个问题:Token 的钱都让模型托管商这些中间商赚了,开源模型的开发者自己怎么赚钱?这一点,至少中国的开源模型厂商,走的很灵活。 像Minimax,Kimi,Zhipu,它们都有自有的 API 直售,更多面向开发者群体,并且也都有自己的 Coding Plan 订阅包,把按 token 计费玩出了订阅制,完全是中国移动卖流量的玩法。而OpenClaw 这波更是让它们赚得盆满钵满,各自推出了品牌化的 Claw 产品,帮用户把 OpenClaw 部署好,底层跑自家模型,Token 消耗从自家 API 走。 3)开源模型托管商:帮别人跑模型,赚差价 对于那些没有能力或意愿自己卖 Token 的开源模型来说,托管商就是它们触达用户的渠道。它们帮开发者跑模型、按 Token 收费: - Together AI / Fireworks:自有 GPU 集群 + 极致推理优化,核心竞争力是翻台率,同样的卡单位时间能吐出更多 Token。 - Groq:自研 LPU 推理专用芯片,不用传统 GPU,核心竞争力是极致速度,跑 Llama、Qwen 等开源模型比 GPU 快。 - Cloudflare Workers AI:全球 300+ 边缘节点,跑 Llama、Mistral、Qwen,最近还加了智谱 GLM 和 Kimi,核心竞争力是低延迟 + 开发者生态 - AWS Bedrock / Google Vertex AI — 企业级云平台,跑 Llama、Mistral 等主流开源模型,核心竞争力是客户的数据和基础设施已经在这些云上了,迁移成本低 4)大模型聚合器:一个入口管所有模型 闭源和开源的大模型越来越多,而不同场景适合不同模型,不同模型的优劣势不同,对开发者来说,一个个去接不同厂商和托管商的 API,管理起来很痛苦。于是催生了 OpenRouter 这类聚合器,可以接几十个模型,开发者在一个地方统一管理、按需切换即可。 OpenRouter按照批发转零售的模式盈利,各家模型厂商把自己的Token分销出去。而 OpenClaw 这波直接让 OpenRouter 上中国模型的消耗量暴增,前十名 Token 消耗量中,中国模型占了 61%,前五有四个是中国的。 而围绕这条 Token (词元) 产业链,也衍生出了一些其他的参与者和新需求: 第一是一些推理优化引擎,vLLM、SGLang 这些开源项目,在大家对效率极致追求的当下,通过对硬件算子层面(更高效地利用 GPU 计算单元,减少内存碎片和带宽瓶颈)以及 LLM 算法层面(让多个请求共享已经算过的内容,更聪明地管理显存)的优化,提升同一张卡在同一时间内的 Token 吞吐量。 它们自己不面向终端用户收费,但 Together AI、Fireworks 这些托管商底层用的就是这些技术。也有不少自己本地跑开源模型的开发者,会直接使用 vLLM 或 SGLang 来搭建自己的推理服务。 第二是对Token消耗的优化需求,当 Token 消耗逐渐常态化,自然就会有人开始琢磨怎么省钱,也有不少人早就抱怨OpenClaw高昂的Token消耗,那么,帮你预览一次 Prompt 会消耗多少 Token、建议怎么优化 Prompt 来降本、甚至自动帮你选性价比最高的模型和服务商的产品,就很有市场了。 ---------------------------- 4、AI经济时代,真正的机会在哪? 我觉得 Token 经济的红利,属于把廉价的 Token 加工成更有价值的 Token 卖出去的人。 1)如果你有能力,就做一个模型,哪怕是微调的 你不需要从头训一个 GPT,在开源模型基础上针对某个垂直场景做微调,只要在某个细分领域效果够好,就有人愿意按 Token 付费调用你的模型。前面说了,Token 是服务,服务市场天然分层,通用大模型吃不掉所有场景,垂直微调的模型在自己的领地里反而更有定价权。 2)做一个新时代的产品,开放 API 你的产品底层消耗 Token,但你的产品本身也可以对外输出能力,你开放 API,让别的开发者和 Agent 来调用。你买入底层模型的 Token,加上你的产品逻辑和数据,产出更高价值的 Token 服务卖出去。这跟传统行业买原材料、加工、卖成品的逻辑是一样的。 3)写 Skill,做 Agent 每一个被广泛使用的 Skill 和 Agent,背后都是源源不断的 Token 消耗。你写的 Skill 越好用、越多人用,你帮模型厂商卖出去的 Token 就越多。这不是你直接卖 Token,但你是这条产业链上的分销渠道。 而不管你选哪条路, 你的护城河在我看来最终都会归结为三样东西: 算力、算法、数据。 算力影响你的吞吐量 算法影响你的效率和成本 数据决定你是不是不可替代

中文
12
2
29
11.4K
0xTodd
0xTodd@0xTodd·
@toughpassion D指导已经够便宜了,我记得以前淘宝好像是 10 块钱一页还是 20 啊,然后也可以用 MiniMax,MiniMax 好像更便宜一点
中文
0
0
0
40
Roger波杰克
Roger波杰克@roger9949·
其实最宏大的故事一直没变 最小单元也是一直叫 Token 从以美元计价 到以电力计价的资产 中国生产力出海的极致 只是从 Crypto 变成了 AI
0xTodd@0xTodd

中国在 AI 时代出口的新饽饽就是 Token 了。 国产模型超低的推理价格; 内蒙新疆过剩的电力(大量弃风,弃光); 主打一个量大管饱,顺着一根 API 就卖向了全世界。 PS:就差一个国产显卡或者 AI FPGA 矿机就闭环了

中文
4
0
6
1.5K
0xTodd
0xTodd@0xTodd·
@jain_web3 现在像 Kimi、Minimax 都挺便宜的。
中文
0
0
0
107
jain
jain@jain_web3·
@0xTodd 最便宜的还是deepseek?
中文
1
0
0
338
0xLoki
0xLoki@0xLoki_Zeng·
做一个小实验,给三个AI提了一个相同的问题: 【我现在非常着急,必须5分钟之内买一个币,需要上了币安,不能是Top20的主流币,请直接回答币的名称】 Grok的答案: $ZAMA D0(Claude)的答案: $Aster Surf的答案: $ZEC Information Agent的答案: $TAO 这四个币我现在各买了100U,看看怎么个事
0xLoki tweet media
中文
6
0
8
3.8K
0xTodd
0xTodd@0xTodd·
@Web3_Yuuu 后面有可能能解决 特供海外😂
中文
0
0
0
207
YUUU(🚀,🚀)
YUUU(🚀,🚀)@Web3_Yuuu·
@0xTodd 然而海外用国产模型更多的还是国际站的吧,服务器在海外的,用中国服务器一是部分国家合规通不过,二是内容审核也很蛋疼
中文
1
0
0
285
柴郡🔔|Crypto+AI Plus
接下来我要做这个世界上最危险最刺激的事: 用 Codex 清理 C 盘。
柴郡🔔|Crypto+AI Plus tweet media
中文
114
4
406
126.8K
mydream2025
mydream2025@mydream2025·
@0xTodd 他们估值多少,完全取决于有没有人能超越他们 要是老马搞出个新模型,能把他们按在地上摩擦,那么马上就缩水,要是老马半年后,搞的模型还是个二流,御三家还是御三家,甚至后面的跟他们的差距越来越大,市场一看,搞大模型确实难,那估值就蹭蹭的涨。
中文
1
0
0
283
0xTodd
0xTodd@0xTodd·
很多人认为 Claude 母公司 Anthropic 最后一轮估值 3800 亿美金贵了。 但要我说,他们对喜欢宏大叙事的资金缺乏想象力(为梦想窒息流派)。 对比一下: OpenAI 最后一轮估值 8400 亿美金 $ETH 在熊初 3100 美金左右也是 3800 亿美金 前者产品被 Claude 按在地上摩擦 后者距离 ATH 还有 60% 空间呢
0xTodd tweet media
中文
12
4
39
26.6K
0xTodd
0xTodd@0xTodd·
@owenliang60 是的,甚至资金都开始研究间接渠道购买了,例如亚马逊
中文
1
0
1
833
Luckybb🍟
Luckybb🍟@owenliang60·
@0xTodd 嘻嘻,现在一级市场600b都根本买不到,人们对什么叫窒息一无所知
中文
1
0
1
991
0xTodd
0xTodd@0xTodd·
@0xSunNFT 是的,看那普通散户把溢价那么高的 VCX 都冲爆了
中文
0
0
0
1.9K
0xSun
0xSun@0xSunNFT·
@0xTodd Anthropic不是觉得380B贵不贵的问题,是现在私募市场普遍500B以上的价格加上Carry一般人还买不到的问题
中文
2
1
11
8.6K
0xTodd
0xTodd@0xTodd·
@ZLiao3 哈哈哈通讯被劫持了
中文
0
0
0
125
0xTodd
0xTodd@0xTodd·
我让龙虾 28 号提醒我开个套餐 结果它忘了 但是由于我天天用语音转文字的 AI 输入法 导致给龙虾下任务时 我老婆也偷听到了 最后今天是她最终提醒了我 人脑大模型的心跳机制大胜 #论AI怎么改变了我的生活😂
0xTodd tweet media
中文
9
0
26
4K
0xTodd
0xTodd@0xTodd·
@CuiMao 现在已经老实多了 以前才是真的猛,尤其是二次元图片,简直百无禁忌
中文
0
0
0
688
CuiMao
CuiMao@CuiMao·
和grok image 大战了300回合,太牛逼了,干啥啥不行,搞黄第一名。我彻底服了他了,
中文
40
4
140
57.5K
0xTodd
0xTodd@0xTodd·
@Michael_Liu93 感觉川普突然想明白了,学会了定义,他把对委内瑞拉的行动定义为司法部的行动,属于联合执法。然后对伊朗定义为消除威胁,也没走国会批准,属于和俄罗斯那个“特别军事行动”有一拼。
中文
0
0
1
1.6K
憨厚的麦总
憨厚的麦总@Michael_Liu93·
有个想不通的地方,特朗普第一届没有开战,且一直把“不开战的总统”当作自己的政绩,到了第二届这是怎么了,又是委内瑞拉、伊朗、古巴的,为什么前面已经有了这么多失败,每任总统总是逃不出把美国卷入战争的命运。
中文
240
5
260
186.1K
Laughing🪁
Laughing🪁@0xLaughing·
用上了豆包输入法,没get到铺天盖地吹的点在哪,准确率比不过Typeless,甚至还没我自建的高 它最大特点是,说话有一个实时输出文字流 优势在于,AI 时代节奏越来越快,产品需要像游戏一样设计「爽感」 游戏靠爆装备、打击感、combo连击让人上瘾 AI 产品就得靠及时反馈、个性化多巴胺这些心理钩子
Laughing🪁 tweet media
中文
3
0
5
1.1K
XinGPT🐶
XinGPT🐶@xingpt·
女装的我 你爱了吗 prompt在评论区
XinGPT🐶 tweet mediaXinGPT🐶 tweet mediaXinGPT🐶 tweet media
中文
33
0
33
17.9K