wendy wang

150 posts

wendy wang

wendy wang

@wangwendy780

Katılım Kasım 2024
237 Takip Edilen14 Takipçiler
Zeeshan Patel
Zeeshan Patel@zeeshanp_·
scaling up on blackwell gpus is much harder than people think. rewriting the entire modeling stack to utilize hardware efficiently and correctly is not an easy feat. simple mistakes in hw/sw codesign can create major issues at the hardware level. one example of this is the power smoothing feature on blackwell. the component on chip that is responsible for power smoothing will eventually melt after a few months of usage, and this can cause a lot of transient issues during large scale training. one of the frontier labs had to learn this the hard way.
English
33
22
558
160.3K
0x鸣人
0x鸣人@LuBtc888·
AI时代的确定性风口机会到底有哪些? 下一个暴富风口:Token 出海! 新疆一度电 2 毛钱 → 国内 500 万 Token 卖10 元→ 卖到美国直接400 元! 800 倍暴利,这就是 AI 时代的 数字鸦片! 普通人应该怎么做?一条视频全懂👇
中文
212
289
1.8K
283.6K
新闻调查
新闻调查@xinwendiaocha·
中国官媒女主播说如果战争爆发,号召男性公民参战,保护脚下的每一寸土地!
中文
324
32
246
112.4K
路飞 🏴‍☠️ AI 研究员🧐
一个 Anthropic 前研究员, 把 Claude 的内部用法讲出来了 里面有个点很关键: 很多人用 Claude, 其实在白白浪费一大块推理能力。 就一个很常见的用法问题。 下面这 10 个提示词, 基本就是官方思路。
路飞 🏴‍☠️ AI 研究员🧐 tweet media
中文
24
65
265
42.7K
知识玩家
知识玩家@BrainQuestor·
突发新闻:如果你的工作中还没用Claude,你已经落后了。 复制这7个提示词:
中文
7
33
145
44.3K
wendy wang
wendy wang@wangwendy780·
@cuichenghao 赫尔姆兹海峡不是伊朗的海峡,伊朗说封就封,应该给予伊朗更大的打击,打到他妈的不敢威胁绑架全球正常经济秩序
中文
7
0
52
10.2K
作家崔成浩
作家崔成浩@cuichenghao·
周六,特朗普称,“如果伊朗不从现在起48小时内完全开放霍尔木兹海峡,美国将打击并摧毁其各个发电厂,首先从最大的发电厂开始。” 玩过红色警戒的都知道,一旦断电意味着满盘皆输。
作家崔成浩 tweet media作家崔成浩 tweet media
中文
230
96
1.2K
262.8K
touchstone🇺🇸试金石
美国退役少尉,45岁有7孩的电视台主持人现任战争部长, 宣布美国伊朗共享波斯海域,伊朗享有海底,美国享有海面💪💪💪😂😂😂
中文
40
64
949
262.7K
wendy wang
wendy wang@wangwendy780·
@7warroom 直接永远控制海峡 草泥马伊朗自己死还要拉全球垫背
中文
0
0
0
373
战斗室
战斗室@7warroom·
蓬佩奥刚刚释放了一个重磅信号。 霍尔木兹海峡即将被永久释放。 三十年的勒索,到头了。 赫格塞斯和参谋长联席会议正在进行前期铺垫。 大批军事资源已经就位。 为什么不立刻动手? 因为要确保陆海空三军的绝对安全。 这不是一次简单的巡航。 目标是彻底清除伊朗的布雷能力,以及所有威胁船只的导弹。 时间表? 没人能给出确切日期,这取决于条件的成熟。 过去三十年,海峡从来没有真正开放过。 德黑兰一直把这条水道当作勒索世界的筹码。 结果是什么? 是虚高的风险溢价,是全球贸易头上的达摩克利斯之剑。 以前华盛顿的官僚选择忍受,甚至绥靖。 现在,新政府要把这扇门从外面彻底焊死。 不是清理几个月,而是要实现长期的、根本性的改观。 三十年的地缘政治枷锁,能不能在几周内被彻底砸碎?
中文
81
252
1.3K
231.9K
Jack Sparrow 张梓太太
Jack Sparrow 张梓太太@JackSparrowCCP1·
刚刚,消息人士证实,以色列总理本雅明·内塔尼亚胡在特拉维夫的住所遭到伊朗无人机袭击后死亡。 🚨如果为真,只能说,该好好审判的战犯,就这么死了,略显草率。
Jack Sparrow 张梓太太 tweet media
Jack Sparrow 张梓太太@JackSparrowCCP1

🔥#BREAKING A reliable source confirms the death of Israeli Prime Minister Benjamin Netanyahu after his residence in Tel-Aviv was targeted by an Iranian drone. #Netanyahu

中文
288
19
335
359K
护法道长
护法道长@daoge2018·
目前来看 解放军打任何国家的军队都是降维碾压局 ✌️
中文
209
5
285
92.3K
西蒙•冯•弗雷德里希•胥库兹Simon Von Friedrich Xurcuz
🚨 最新,已证实: 据摩萨德(Mossad)发布的波斯语(伊朗官方语言)资料显示,伊朗伊斯兰政权新近选定的最高领袖、阿里·哈梅内伊(Ali Khamenei)之子——莫杰塔巴·哈梅内伊(Mojtaba Khamenei)已经身亡。
西蒙•冯•弗雷德里希•胥库兹Simon Von Friedrich Xurcuz tweet media
中文
44
31
446
63.6K
比特币橙子Trader
比特币橙子Trader@oragnes·
穷人越自律,被收割得越惨🩸 最近江学勤教授的演讲视频全网爆火🔥 彻底戳穿了中产阶级的成功学谎言 个人命运的真相根本不是自律 而是看透这场阶层博弈的 Game Reset PS:视频长达50多分钟,收藏慢慢看,非常有启发👇
中文
240
1.2K
4.3K
394.8K
Andrej Karpathy
Andrej Karpathy@karpathy·
Three days ago I left autoresearch tuning nanochat for ~2 days on depth=12 model. It found ~20 changes that improved the validation loss. I tested these changes yesterday and all of them were additive and transferred to larger (depth=24) models. Stacking up all of these changes, today I measured that the leaderboard's "Time to GPT-2" drops from 2.02 hours to 1.80 hours (~11% improvement), this will be the new leaderboard entry. So yes, these are real improvements and they make an actual difference. I am mildly surprised that my very first naive attempt already worked this well on top of what I thought was already a fairly manually well-tuned project. This is a first for me because I am very used to doing the iterative optimization of neural network training manually. You come up with ideas, you implement them, you check if they work (better validation loss), you come up with new ideas based on that, you read some papers for inspiration, etc etc. This is the bread and butter of what I do daily for 2 decades. Seeing the agent do this entire workflow end-to-end and all by itself as it worked through approx. 700 changes autonomously is wild. It really looked at the sequence of results of experiments and used that to plan the next ones. It's not novel, ground-breaking "research" (yet), but all the adjustments are "real", I didn't find them manually previously, and they stack up and actually improved nanochat. Among the bigger things e.g.: - It noticed an oversight that my parameterless QKnorm didn't have a scaler multiplier attached, so my attention was too diffuse. The agent found multipliers to sharpen it, pointing to future work. - It found that the Value Embeddings really like regularization and I wasn't applying any (oops). - It found that my banded attention was too conservative (i forgot to tune it). - It found that AdamW betas were all messed up. - It tuned the weight decay schedule. - It tuned the network initialization. This is on top of all the tuning I've already done over a good amount of time. The exact commit is here, from this "round 1" of autoresearch. I am going to kick off "round 2", and in parallel I am looking at how multiple agents can collaborate to unlock parallelism. github.com/karpathy/nanoc… All LLM frontier labs will do this. It's the final boss battle. It's a lot more complex at scale of course - you don't just have a single train. py file to tune. But doing it is "just engineering" and it's going to work. You spin up a swarm of agents, you have them collaborate to tune smaller models, you promote the most promising ideas to increasingly larger scales, and humans (optionally) contribute on the edges. And more generally, *any* metric you care about that is reasonably efficient to evaluate (or that has more efficient proxy metrics such as training a smaller network) can be autoresearched by an agent swarm. It's worth thinking about whether your problem falls into this bucket too.
Andrej Karpathy tweet media
English
962
2.1K
19.5K
3.6M
老周横眉
老周横眉@laozhouhengmei·
伊朗现在开始在霍尔木兹海峡铺水雷。有人说伊朗没能力大面积铺开,但一个30公里宽的航道,只要藏着几十枚,就没有人敢通过了,赌不起。首先你保险就买不进。 川普急了,发文大喊大叫:你们要是敢放水雷,我就对你狂轰滥炸!。 说得好像之前不已经在狂轰滥炸了一样。 这就是跟光脚的人决斗的问题。 你炸好了,炸到你最后没有东西可炸了,他还是继续恶心你。 油价飙上天、世界经济崩溃,对一个已经被经济制裁47年的疯狂神权来说,他们无所谓的。 这些都是川普和他的草台班子事前完全不考虑的。
老周横眉 tweet media
中文
205
33
518
132K
🌞Sunny哥
🌞Sunny哥@BTC__Sunny·
崩盘了 原油价格暴跌32%,从每桶119美元跌至81美元 历史上单日跌幅最大的一次
🌞Sunny哥 tweet media🌞Sunny哥 tweet media
中文
164
81
1.2K
571.9K
Liuping Xu
Liuping Xu@LPX2019·
重磅消息:被炸死的伊朗最高领袖阿亚图拉·阿里·哈梅内伊之子、新任最高领袖穆杰塔巴·哈梅内伊今天下午在美以空军的空袭中身受重伤,后因伤势过重不治身亡。 官方确认尚待公布。
中文
384
185
2K
933.2K
艾森 Essen
艾森 Essen@essen_ai·
过去五年,数百位华裔顶尖科学家从美国“出走”——不是移民,而是回归。 他们大多出生在中国,本科在清华、中科大,博士去哈佛、MIT;如今带着二十年经验,回到深圳湾实验室、西湖大学,甚至湖南大学,担任PI、院长、讲席教授。 他们不为“逃离美国”,而是为“回到能做大事的地方”。 美国的“中国行动计划”让科研变成风险职业:实验室被突击检查,合作者被调查,申请经费像在赌命。 中国呢?给启动经费数千万,建独立实验室,让PI自己选团队、定方向,甚至可直报国家战略。 你看到了谢振飞回武汉做mRNA疫苗,苏飞回清华造芯片,蒋剑锋在北大建二维材料团队。 最值得玩味的,不单是华人回国,越来越多非华裔的诺奖级学者,如“石墨烯之父”Geim、“菲尔兹奖”得主Ngo Bao Chau,也纷纷选择香港和杭州。 他们不是冲着“华人文化”来的。 而是冲着一个敢花钱、敢给自由、敢赌未来的基础科研新生态。 问题是: 当美国还在纠结“谁在为共产党工作”,中国却在问:“谁敢为人类突破工作?”这赌局,到底谁在下注?
艾森 Essen tweet media
艾森 Essen@essen_ai

中国学者去年预测:美军THAAD和爱国者系统,无法有效拦截高超音速导弹。 今天,伊朗导弹穿透了以色列的“铁穹”与美军在中东的防空网,直击国防部与机场——画面显示,拦截弹在空中徒劳翻滚,目标却仍在下坠。 这不是偶然。论文早指出:高超音速武器在40公里以下低空滑翔时,热信号会干扰红外导引头;它的机动轨迹远超拦截弹的横向加速度极限;即使命中,也可能因冗余设计不引爆。 美军系统不是“失效”——而是“从未为这种威胁设计过”。它们针对的是弹道导弹,不是会拐弯、能贴地飞行、音速九倍的幽灵。 而美国正在研发的“黄金穹顶”天基拦截网,仍属纸面计划。当对手的武器已飞过你的防线,你的下一代防御还在图纸上。 问题是:当“预警-拦截-摧毁”的黄金链条在3分钟内被切断,我们是否还在用20世纪的逻辑,管理21世纪的威胁? 还是说,真正的战争,早已在传感器失效的那一刻,就结束了?

中文
204
67
449
172.6K