damageboy

15.5K posts

damageboy

damageboy

@damageboy

Making the world a better place through page tables Works at #5700FF Pronouns: Has/Been

Antarctica 加入时间 Mayıs 2008
954 关注2.2K 粉丝
置顶推文
damageboy
damageboy@damageboy·
My vectorized sorting extravaganza is out and about. A LOT of work went into this (referring to the javascript in the posts :) Read, retweet, send scathing reviews, open issues, heat your house with it: This goes to Eleven! Pt. 1-3, code, nuget out: bits.houmus.org/2020-01-28/thi…
English
9
65
180
0
PnL
PnL@PnL63962200·
@Mathilda_Thepro שיקנו רובוט שוטף שישטוף כשהם ישנים. תודה ויום טוב, לעוד עצות בזוגיות כנסו לאונליפנס שלי
עברית
1
0
11
423
Mathilda
Mathilda@Mathilda_Thepro·
וואלה בעיני היא חוצפנית. בעלה רוצה לשטוף את הרצפה כל ערב, לא מבקש ממנה שום עזרה רק לא להקשות או להתנגד. לה זה מפריע… היא משליכה את זה על הסטנדרטים הגבוהים שהוא הביא מהבית.
עברית
55
0
59
18.7K
damageboy
damageboy@damageboy·
@CiItay @Gilbr11 ועכשיו אני לא יכול להפסיק לחשוב על זה
עברית
0
0
1
7
Itay Ci
Itay Ci@CiItay·
@Gilbr11 אבל אני לא רוצה לראות את באפט בבקיני
עברית
1
0
5
142
yahli
yahli@YahliMendler·
@yotam_edri אני חושב שהעיסוק הזה - וזה בעצם די מובן מאליו - נובע בעיקר מתחושת האשמה של ישראלים על העובדה שהם חיים באפרטהייד. ׳תראו יש סיבה שעשינו חוק עונש מוות לערבים!!׳
עברית
1
0
4
159
Yotam Edri 🕊
Yotam Edri 🕊@yotam_edri·
העיסוק האובססיבי של ישראלים סאחים באתנו-דמוגרפיה של מדינות מערב אירופה לעולם לא תפסיק להדהים אותי. בעוד רגע טיל היפרסוני עלול להחריב להם את השכונה, אבל אירופה.
יואב הלר Yoav Heller@yheller81

אילון כל כך צודק. אני חייתי בלונדון בין 2009-2013. הסימנים היו כבר אז די ברורים שם. בריטניה משתנה מהותית ומאבדת את הצפון. זה ייגמר רע כי בסוף הם יתפכחו ויבינו שמאוחר מדי

עברית
6
6
134
4.9K
damageboy 已转推
Marco Elver
Marco Elver@maelver·
Finally, with Clang 22's release, here's v1 of Linux kernel slab cache partitioning with help of Clang's AllocToken feature: @google.com/" target="_blank" rel="nofollow noopener">lore.kernel.org/all/2026033111…
English
2
6
24
5.8K
חדשות 13
חדשות 13@newsisrael13·
קצין בכיר בצה"ל: "לא רואים היערכות מיוחדת באיראן לירי במהלך החג" bit.ly/4lXZml4 @OrHeller (צילום: אייל מרגולין, פלאש 90)
חדשות 13 tweet media
עברית
16
4
31
68.2K
damageboy
damageboy@damageboy·
@ronaldmannak Have you been following: x.com/altryne/status…
Alex Volkov@altryne

PSA: If you've been running out of Claude session quotas on Max tier, you're not alone. Read this. Some insane Redditor reverse engineered the Claude binaries with MITM to find 2 bugs that could have caused cache-invalidation. Tokens that aren't cached are 10x-20x more expensive and are killing your quota. If you're using your API keys with Claude this is even worse. This is also likely why this isn't uniform, while over 500 folks replied to me and said "me too", many (including me) didn't see this issue. There are 2 issues that are compounded here (per Redditor, I haven't independently confirmed this) : 1s bug he found is a string replacement bug in bun that invalidates cache. Apparently this has to do with the custom @bunjavascript binary that ships with standalone Claude CLI. The workaround there is to use Claude with `npx @anthropic-ai/claude-code` 2nd bug is worse, he claims that --resume always breaks cache. And there doesn't seem to be a workaround there, except pinning to a very old version (that will miss on tons of features) This bug is also documented on Github and confirmed by other folks. I won't entertain the conspiracy theories there that Anthropic "chooses" to ignore these bugs because it gets them more $$$, they are actively benefiting from everyone hitting as much cached tokens as possible, so this is absolutely a great find and it does align with my thoughts earlier. The very sudden spike in reporting for this, the non-uniform nature (some folks are completely fine, some folks are hitting quotas after saying "hey") definitely points to a bug. cc @trq212 @bcherny @_catwu for visibility in case this helps all of us.

English
1
0
2
1K
Ronald Mannak
Ronald Mannak@ronaldmannak·
Is it just me or has Claude Code become completely unusable? Even during off-peak hours (2x the rate limit), I hit my session limit within MINUTES after hitting enter the first time this morning. One single prompt, working on open source repos I've used for months (but I guess still aren't automatically cached by Claude).
Ronald Mannak tweet media
English
44
7
194
17K
damageboy
damageboy@damageboy·
@ludwigABAP @yacineMTB Of course they are responsible: if it hadn't been for them adoption may have been faster and the service would crash sooner.
English
0
0
1
715
ludwig
ludwig@ludwigABAP·
@yacineMTB really thankful to jared for blocking me when i said it was retarded to pretend that claude code's "product team" was somehow the reason for how popular it is and not just a question of the models + the most obvious next step imaginable
English
8
4
214
10.1K
kache
kache@yacineMTB·
really thankful to jared summer for inventing claude code
English
13
2
263
21.8K
damageboy
damageboy@damageboy·
@adin_dan (גם אם הוא לא תמיד היה נכון) Is doing A LOT OF WORK here, Neshama.
0
0
1
340
Dan Adin דן עדין
הרבה שינויים לרעה עברה החברה הישראלית שגדלתי בה. אבל המהפך הנורא ביותר, הטראגי, שובר הלב, הוא מנראטיב של חברה רודפת שלום הנאלצת לשאת לעיתים בעול המלחמה (גם אם הוא לא תמיד היה נכון) - לנראטיב של חברה אלימה, ששה אלי קרב, חובבת מלחמות, מתרגשת ממווות, חוששת מהפסקות אש ומנורמאליות. ישראל השתלבה במרחב ואיבדה את יתרונה המוסרי על אויביה. אינני מוצא עוד את מקומי בחברה כזו. אף שהגירה ככל הנראה איננה אפשרית עבורי, נפשית כבר נטשתי
עברית
131
199
1.6K
57.1K
LadyValor
LadyValor@lady_valor_07·
You’re offered $4 million to uninstall Facebook from your phone forever. Would you do it?
LadyValor tweet media
English
10.7K
615
7.7K
530.5K
damageboy 已转推
Tom Yeh
Tom Yeh@ProfTomYeh·
I built MatmulFlow (matmul-flow.pages.dev) — an interactive tool that makes matrix multiplication dimensions visual, part of my AI by Hand ✍️ series. Matrix multiplication dimensions are confusing. Which is the inner dimension? Columns of the first or rows of the second? And when you chain five multiplications together, it gets worse. The idea: represent matrices as rectangles. Shift the second matrix up and to the right. The edges that must align become obvious. The result fills in the remaining space. No memorization. You can see it. It extends to chains. Stack vertically for left-multiplication. Stack horizontally for right-multiplication. Resize any matrix and watch the dimensions "flow" through the entire chain. Give it a try!
English
9
42
428
24.3K
damageboy
damageboy@damageboy·
Really like the concept of lat.md, shown by @1st1 to @mitsuhiko. One thing that was not so clearly discussed is what happens when you have an already relatively large code based that you want/need to introduce lat.md into. Seems like a lot of upfront work to get onboarded.
English
1
0
6
547
damageboy
damageboy@damageboy·
@mitsuhiko Didn't say I believe it. The market assumes it's all revertable. That's my explanation.
English
0
0
3
519
Armin Ronacher ⇌
Armin Ronacher ⇌@mitsuhiko·
How is the market this calm after such a massive disruption and continued escalation? This makes absolutely no sense to me.
English
44
3
198
38K
Andreas Abel
Andreas Abel@uops_info·
I have added latency, throughput, and port usage data for Emerald Rapids, Meteor Lake, Arrow Lake, and Zen 5 to uops.info/table.html.
English
7
45
232
35.4K
damageboy
damageboy@damageboy·
@NBhgdrh יש תחרות רק עם כמה עוד יותר מטומטם זה הולך להיות, חבל שלזה לא שמו שעון במאקו.
עברית
0
0
1
262
דג הכסף
דג הכסף@NBhgdrh·
יש במאקו חלונית הנוקבת בזמן שחלף מאז נרשם שיגור מאיראן, ברמת השניות והדקות, וגם מתי נרשם השיגור האחרון מלבנון. אנחנו באמת המקום המופרע בעולם. אין תחרות בכלל
דג הכסף tweet media
עברית
8
1
197
7.2K
damageboy
damageboy@damageboy·
@ResearchQf I doubt Claude will generate enough multi core load to justify this beast, but have fun. A Ryzen X3D2 sounds like the right amount of overkill to me...
English
0
0
0
151
QF Research
QF Research@ResearchQf·
I may order this system. It's a monster. $50 grand + displays, but payoff could be big for many reasons. $AMD Threadripper PRO 9985WX 64 Core 512GB ECC DDR5 $NVDA RTX PRO 6000 Blackwell Max-Q 96GB x 2 4 TB NVMe PCIe Gen5 SSD 14100 MB/s 8 TB NVMe PCIe Gen4 SSD 7000 MB/s My workstation is outdated for this era. I sometimes wait more than an hour for even simple local workloads based on Claude Code or Codex outputs. 192GB VRAM & 512GB DDR5 should be pretty good for various agentic AI and local AI apps for a while, including multiple simultaneous 70B-class FP4 models with decent token speeds at home, or larger models with possibly some RAM offloading. If you have any experience with Puget as compared to Dell or Lenovo, please let me know.
QF Research tweet media
English
7
1
38
12.3K
Nir Ben-Zvi
Nir Ben-Zvi@nir_benz·
דקגון מכריזים על Decagon Labs ומספרים על איך שהמוצר שלהם עובר בהדרגה למודלים שהם ״אימנו בעצמם״. כמובן שמדובר ב-fine-tune של הטופ שיש לסין להציע. והנה אנחנו כבר בנקודה בה self-hosted models נהיה cost effective ו״נכון עסקית״. בשנה הקרובה נראה יותר ויותר חברות עושות את זה. לא API wrappers. אימון, serving, אוטו-סקיילינג וכל השבאנג. והסיבה היא - המודלי open source לא צריכים להיות ״טובים כמו קלוד״. הם צריכים להיות טובים כמוהו במשימה ספציפית שכדי להצליח בה צריך להחריב חצי מה-context שלו בדוגמאות. ותחת הפריימינג הזה יש כבר לא מעט מקרים. בהתחלה רק חברות גדולות יחסית יעזו (כי אין מה לעשות, העסק נהיה הרבה יותר יקר משהיה לפני 3-4 שנים) ובהמשך גם נראה סטרטאפים עושים את זה את זה מ-day one, כמו שתמיד היה. עכשיו רק נשאר לקוות שהמערב יתאפס על עצמו ויציע תחרות למודלים של Qwen, Kimi ו-MiniMax.
Ashwin Sreenivas@AshwinSreenivas

Introducing Decagon Labs, our research and agent orchestration team. Over 80% of model traffic at Decagon now runs on models we’ve trained in-house, structured as a network of specialized models handling different parts of the interaction: detection, orchestration, response generation, and evaluation.

עברית
3
0
38
6.3K
damageboy 已转推
Jianyang Gao
Jianyang Gao@gaoj0017·
The TurboQuant paper (ICLR 2026) contains serious issues in how it describes RaBitQ, including incorrect technical claims and misleading theory/experiment comparisons. We flagged these issues to the authors before submission. They acknowledged them, but chose not to fix them. The paper was later accepted and widely promoted by Google, reaching tens of millions of views. We’re speaking up now because once a misleading narrative spreads, it becomes much harder to correct. We’ve written a public comment on openreview (openreview.net/forum?id=tO3AS…). We would greatly appreciate your attention and help in sharing it.
Google Research@GoogleResearch

Introducing TurboQuant: Our new compression algorithm that reduces LLM key-value cache memory by at least 6x and delivers up to 8x speedup, all with zero accuracy loss, redefining AI efficiency. Read the blog to learn how it achieves these results: goo.gle/4bsq2qI

English
97
974
6.4K
954.4K