Nobody

278 posts

Nobody banner
Nobody

Nobody

@Hugo10241024

NLP Engineer,大模型从业者,量化交易爱好者。

Katılım Ağustos 2018
625 Takip Edilen66 Takipçiler
Nobody
Nobody@Hugo10241024·
@mranti 我在window下面直接装的Claude Code、Kimi code都没有什么问题,龙虾和爱马仕没试过
中文
1
0
0
2.3K
Michael Anti
Michael Anti@mranti·
Windows在AI时代真憋屈啊,现在装什么Agent都得用Windows Linux(WSL)才能装上,这还比如直接用Linux系统呢。
中文
74
4
173
82.9K
Nobody
Nobody@Hugo10241024·
@laozhang2579 agent核心逻辑就是 while if elif elif else 这没有问题
中文
0
0
2
204
老张来了
老张来了@laozhang2579·
老张今天正式转到AI Agent组 看了一天源码 眼都要花了 当看到工具调用Tool Call是通过关键字if/else 瞬间石化
中文
25
1
122
52.5K
Nobody
Nobody@Hugo10241024·
@hylarucoder 用LangSmith是不是能解决观测性的问题
中文
1
0
0
2.4K
海拉鲁编程客
海拉鲁编程客@hylarucoder·
真心建议每个程序员都去手搓一个自用的 Coding Agent。 纯靠写 Prompt 糊文本做 Skill,观测性太差了,你根本摸不到 harness 模型的上限在哪。缺乏 Agent 的状态流转做约束,复杂任务根本控不住。 最近用 AI 搓了个 mini 版的 Claude Code,对 Agent 的理解稍微升了点。 PS: 我经常从 Gemini / GPT-5.4 蒸馏 SOP Skill,再下放给 @MiniMax_AI 模型来跑任务. 建议可以考虑试试.
中文
77
117
1.1K
148.6K
Nobody
Nobody@Hugo10241024·
@kingluffywang 阿里云确实不行,我跟客服说他们的大模型api为什么没有没有greedy模式的参数,翻来覆去就是说不行不知道
中文
1
1
2
691
北美王路飞
北美王路飞@kingluffywang·
把说阿里云中控台那条先删了,我随口吐个槽,阿里云服务的小编已经帮我去解决问题了,我看下这个时间点确实心里觉得过意不去,大周末的还给打工人额外加活
中文
11
0
34
13K
Nobody
Nobody@Hugo10241024·
Allen AI,因为资助方式发生变化,研究基础模型核心人员去微软了,真是可惜。Allen人工智能研究所几乎是唯一一个同时开源模型权重、训练数据、训练配方、训练日志以及中间ckpt的机构,olmo系列、Molmo系列模型以后也没有了。
xlr8harder@xlr8harder

Article here. This presumably explains why the CEO, COO, and OLMo lead researcher all just left for Microsoft. geekwire.com/2026/microsoft…

中文
0
0
2
127
Nobody
Nobody@Hugo10241024·
@yetone HLE, BrowseComp, SWE- Verified。Kimi 2.5评测agent能力用的三个数据集,仅供参考。
Nobody tweet media
中文
0
0
1
700
yetone
yetone@yetone·
有什么 coding agent 的 benchmark 吗?我想去测试一下不同的 coding agent 的能力。
中文
24
7
138
31.3K
Nobody
Nobody@Hugo10241024·
@mranti 应该也会有专门的ASIC模块,可以跑本地的大模型
中文
0
0
0
441
Michael Anti
Michael Anti@mranti·
其实过去几年,我们都在猜测和期待AI笔记本电脑的落地,当时的想法就是等待本地好的大模型出现。但其实现在明白了,AI笔记本电脑就是装“AI操作系统”(也就是小龙虾)的Mac和Linux电脑。新时代的新东西,不会像我们过去期待的那样发展。
中文
12
4
72
18.6K
Nobody
Nobody@Hugo10241024·
@lianyanshe 模型部署在国内,欧美国家访问,速度会很慢
中文
0
0
1
725
链研社|AI First🔶💧
8毛一度的中国电,如何涨价13倍卖给美国? 算力的尽头是电力,在AI时代的全球竞争中,中国用电力能源的优势,完成一场从卖中国廉价产品到卖算力的过渡。 1. AI的本质是电力炼金术 以前中国把电力变成铝,价值只翻了一倍。现在,中国把电力变成Token,价值翻了13倍。 初级形态: 1 度中国电直接卖 0.8 元 有运输成本问题、储存等问题 传统工业: 转化为铝锭出口,产值约 1.5 元 电力固化成产品,可被储存、运输 AI 推理: 通过大模型推理转化为 Token 卖给海外用户,产值约 11 元 运输成本几乎为 0,结算周期短,多少都能卖 当算力的尽头指向电力,中国凭借 0.8元/度的工业电价和全球最高的新能源装机量,已经掌握了AI时代的铸币权。卖Token就是变相在卖高附加值的电,让电力的出口附加值翻了 13.7 倍。 2. Token是21世纪的数字集装箱正如集装箱改变了全球贸易,Token改变了能源出口的形态,把电力封装成算力再出口,运输成本极低。 传统的电力出口受限于电网覆盖和地缘政治,但Token通过光缆就能全球流动。中国西部弃风弃光的电力,也能用上了,芯片消耗电力变成全球开发者争抢的Token。但这不是简单的资源出口,而是能源、电力基建、芯片、算法构成的算力系统,质量也许不是最高,但价格更低。能从市场获得显著的竞争优势。 3. 中国胜在模型的价格优势,尽管在算法和芯片上落后,但总体最优,不是所有事情都需要最好的模型,最好的芯片来处理。 在全球 AI 行业进入智能体(Agent)大爆发时代,AI 不再只是对话框,而是 7x24 小时运行的数字员工。这直接导致了 Token 和API 调用量呈指数级增长,成本成为了不得不考虑的事情。 硅谷有顶尖算法,但却面临电力短缺和昂贵电价的问题。中国模型与Claude等顶级模型 16倍的价差,也并非完全不能用,像客服、销售等高度流程化的工作不是非要最好的模型。当AI进入应用大爆发阶段,模型能力差距已经不是特别大的情况下,性价比的重要性被拔高了。 4. 从BTC挖矿到工业算力 中国电力发展最猛的 10 年,靠廉价的水电挖出了全球70%的比特币。今天,中国算力支撑了全球超过一半的推理任务,也是因为有当时的电力基建。 自从 519 禁令以后中国算力出口似乎完成了华丽的转变,从前的比特币是数字黄金,现在的Token是数字石油(刚需)。中国正利用完善的工业体系,把AI推理彻底工业化、廉价化、全球化。 中国正凭借全球最廉价的插座和系统最优的算力工厂,把0.8元的度电成本,包装成16元的Token,通过光缆卖向全世界。
链研社|AI First🔶💧 tweet media链研社|AI First🔶💧 tweet media链研社|AI First🔶💧 tweet media链研社|AI First🔶💧 tweet media
中文
36
63
217
51.2K
Nobody
Nobody@Hugo10241024·
@TechFlowPost 部署的服务器不一定在中国。前年我们用的gpt3.5的api,就是用的微软云日本的服务,要相对快一些
中文
0
0
0
1.9K
Nobody
Nobody@Hugo10241024·
@mranti @PandaTalk8 llama的训练语料里中文不多,中文支持的不好
中文
0
0
0
254
Michael Anti
Michael Anti@mranti·
@PandaTalk8 测试了下,和我预测的一样,烧定的模型最大的问题可能是无法更新,质量太差:
Michael Anti tweet media
中文
11
0
24
10.5K
Mr Panda
Mr Panda@PandaTalk8·
Taalas 成立两年半,24个人, 花了3000万美金, 开发了一个平台,可以将任何 AI 模型转化为定制芯片。由此产生的「硬核模型」比基于软件的实现快一个数量级,成本更低,功耗更低。 可以在官网体验:15585 tok/s,生成时间 24 毫秒,真正的毫秒级响应。 taalas.com/the-path-to-ub… Taalas 的做法是把模型权重直接固化进芯片电路,存储与计算在物理上融为一体,彻底消除了传统 GPU 推理中的内存带宽瓶颈。代价是极端的专用化——每个模型对应一块芯片,通用性几乎为零。 这其实是计算技术演进中一条反复出现的底层规律:在时间、空间、能耗、通用性等多维约束下,寻找新的帕累托最优。 从算法到编译器,从操作系统到数据库,从云计算到 AI加速器,每一层技术栈都在不同维度上体现这一逻辑。 Taalas 选择将通用性压到极致,换取速度和能效的数量级提升——和当年比特币 ASIC 矿机取代 GPU 挖矿的逻辑如出一辙。 所以计算机科学不会过时。问题规模持续增长,约束条件持续变化,而寻找最优权衡的需求永远存在。 每一轮技术浪潮,都是在新的硬件与应用场景下,把这条底层规律再实现一遍。 这也是为什么我一直建议: 无论你是否从事技术工作,都值得去学一些计算机科学。不是为了学会写代码——AI 已经越来越擅长这件事。 而是去掌握那些不会被淘汰的底层思维:如何分解问题,如何在约束条件下做权衡,如何用抽象管理复杂性。 这些能力不会因为 AI 的到来而贬值,恰恰相反——当 AI 成为每个人都能使用的工具时,真正拉开差距的,是谁能更好地定义问题、评估方案、理解系统的边界与代价。 懂得计算思维的人,不是和 AI 竞争,而是能驾驭它。
Mr Panda tweet media
中文
11
11
53
27K
Nobody
Nobody@Hugo10241024·
@askeunchi_7777 可以先读个语言班感受一下,看看喜不喜欢
中文
0
0
0
506
池大王
池大王@askeunchi_7777·
我好想去留学啊,我从小就想出去上学,也可以开拓一下眼界,看见网上都说德国留学便宜但是不好毕业,但是我是真的好心动。。
中文
142
13
772
232.8K
Nobody
Nobody@Hugo10241024·
@interjc @mranti 是的,而且很多地区不是很重视口语考试,一般想考学生自己准备,老师也不会额外辅导
中文
0
0
1
74
Justin
Justin@interjc·
感觉中国学生学了那么多年英语依然无法开口说话的罪魁祸首,在于高考没有口语环节 哪怕只安排额外 30 分,都能调动大家学习的积极性 学习方法什么的倒是其次
中文
182
2
314
155.7K
Nobody
Nobody@Hugo10241024·
@mranti @interjc 高考其实是有口语考试的的,但是如果大学不想学英语专业,口语成绩不是必须的。而且通过口语的难度不大
中文
1
0
2
777
Michael Anti
Michael Anti@mranti·
@interjc 如果高考有口语,寒门更难进好大学了。
中文
24
2
195
42.2K
Nobody
Nobody@Hugo10241024·
@python_xxt EE一点都不比CS简单,不是按照学习能力划分的
中文
0
0
0
152
Robinson · 鲁棒逊
Robinson · 鲁棒逊@python_xxt·
我用LLM做过很多专业和就业的思考 结论和立党的观点几乎完全相同 学习能力强 → CS 学习能力一般 → EE 原因很简单,这是未来世界大基建的需求 → 虚拟世界的基建: 算力 + 算法 + 数据 + 软件系统 → 物理世界的基建: 能源 + 电力电子 + 半导体 + 传感器 + 通信 + 控制 如果能做到 CS + EE,恭喜你,钢铁侠 🫡
lidang 立党 (劝人卖房/学CS/买SP500/纳100/OpenAI/Anthrop第一人)@lidangzzz

高考600分以下的最好出路、唯一铁饭碗,就是学EE。 中国未来一个最大产业趋势,就是用整整一代人的财政和市场作为代价,彻底解决半导体国产自主可控的问题,解决芯片上下游卡脖的问题。 这不是一个产业盈利和外贸的问题,这首先是国家战略安全、产业安全、信息安全问题,是国家安全问题, 所以必须用国家战略级别的手段和魄力,用市场准入、补贴、地方财政和国家产业大基金一起滋滋孵化、国产红线、各大互联网厂商认购订单、国企央企强制采购等等方式, 扶持半导体制造和高端半导体设计整条产业链,彻彻底底、完完全全扶持一整套国产半导体产业。 除了半导体以外,还有一大批外围其他小众领域核心硬科技产业,比如医疗器械、船舶、航空航天(国产山寨SpaceX、starlink)等等,都是未来中国各级地方基金、国务院各产业部门扶持的热点项目。 对于高考600分以下的小朋友,如果不爱编程、不想学编程、甚至不爱学习的人而言, 选个EE(电子、信息、通信、集成电路、自动化、电气、光电)专业,毕业进入这些行业,混吃等死一辈子, 愿意学习的,考个211,读个本硕博,踏踏实实死磕VLSI,毕业进华为海思、寒武纪、摩尔线程、瑞芯微、紫光展锐等等半导体设计公司,或者大疆、比亚迪、小米这些消费电子和新能源汽车, 不愿意学习的,普通垃圾一本毕业,考个垃圾一本硕士,找个中芯国际、新凯来、鹏芯微、长江长鑫等等半导体制造,年薪30万也能混吃等死一辈子, 再不愿意学习的,读个三本电子专业,进个单片机、智能手环、山寨无人机公司,当个销售工程师、售后工程师、测试工程师, 哪怕大学一门课都没听,但必须至少懂一丁丁技术,只要能正确区分示波器和微波炉,能看得懂PLC的梯形图,能分得清仪器上的红灯绿灯,知道电线电容电阻焊锡不能咽下去,智商高于75, 你就可以有一个月薪1.5万、混吃等死大半辈子的工作。 虽然学了EE,基本上跟科技互联网和AI的机会彻底告别绝缘(哪怕进了华为海思做ascend 910 series,但是你依然觉得自己跟LLM六小虎不在一个层面), 但是至少比学个垃圾材料环境、数学物理化学、学个人文社科经管垃圾三本毕业(就业率<20%),出路要强太多了。 EE这个行业,不需要你喜欢,不需要你爹妈懂,因为高考不到600分的人,也他妈别谈什么“我喜欢什么行业”、“我从小梦想学什么专业”了, 这个分数段的人,能保证一辈子有碗饭吃、一辈子在一个被江浙沪广东地方财政扶持、擦边进入国产强制半导体和仪器设备采购名录、一辈子能让你混吃等死的半导体企业, 已经是这一代人当今时代最大的福报了。

中文
25
50
290
229.1K
ℓ
@L_eacc·
有点想搞个投影仪,想听听大家看法😜
中文
10
0
15
1.4K
ChatGPT辽太郎
ChatGPT辽太郎@jian_w3ng·
- C/C++系统编程的课没人选了怎么办? - 把课名改成深入理解PyTorch底层实现。
中文
16
6
165
72.8K
Michael Anti
Michael Anti@mranti·
和凯恩培训C++,一直到链表的时候才真正弄懂指针的物理意义,真不容易。在这个过程中,AI辅助学习用处不大,找到一个从硬件角度解释指针意义的Youtube才最终搞定。
中文
20
5
70
39.5K
Nobody
Nobody@Hugo10241024·
@zhoynqi3 你低估了气候的影响
中文
0
0
0
745
悠悠的信
悠悠的信@yoyobewild·
看到帖子说:不要移民去北欧,那里天气寒冷又少阳光,很容易抑郁症 。 我想,比起中国这个失业狂潮席卷、女性安全问题严重、职场文化非人、食品安全堪忧、动物保护缺席、官民地位不对等、维权困难等等等的情况………那还是………气候差点就差点吧
中文
151
49
2.4K
351.5K