Avishai Ish-Shalom

10.3K posts

Avishai Ish-Shalom banner
Avishai Ish-Shalom

Avishai Ish-Shalom

@nukemberg

reality: the show where everything's made up and the points don't matter. sw eng, complex systems and math. Hard truths, no sugarcoating.

Katılım Ekim 2012
217 Takip Edilen2K Takipçiler
Sabitlenmiş Tweet
Avishai Ish-Shalom
Avishai Ish-Shalom@nukemberg·
insanity is doing the same thing over and over again, but expecting different results Probability is doing the same thing over and over again and getting different results. ¯\_(ツ)_/¯
English
2
9
50
0
Avishai Ish-Shalom retweetledi
Liran Tal
Liran Tal@liran_tal·
יש משרות פתוחות אצלנו בסניק, אם מישהו מחפש שלחו לי DM אפשר לראות באתר של החברה את הרשימה snyk.io/_next/data/OxV…
עברית
5
4
17
5.8K
Avishai Ish-Shalom
Avishai Ish-Shalom@nukemberg·
@OriKatz3 המשימה של איש BI היא להביא "תובנות" לא דאשבורד. השאלה היא לא האם AI מגדיל תפוקה בתת משימה כלשהי אלא בכמה הוא מגדיל תפוקה במשימה האמיתית. יש משימות שבהן הוא מקטין תפוקה
עברית
0
0
1
37
Tomer Gabel
Tomer Gabel@tomerg·
@nukemberg Ride it out and you’ll have a corresponding wave of “here’s a gargantuan stack of money, save my ass” contracts 🤷
English
1
0
2
39
Avishai Ish-Shalom retweetledi
Aviran Mordo
Aviran Mordo@aviranm·
סטודנטים למחשבים - ההרשמה לתוכנית הסטודנטים של וויקס נפתחה ל 48 שעות בלבד. סטודנטים למדעי המחשב והנדסת תוכנה המסיימים ב 2028 לפחות, זו ההזדמנות שלכם. הגישו מועמדות ושתפו עם חברים, זו תוכנית הסטודנטים היחידה שתיפתח השנה שתכשיר אתכם להיות מהנדסי תוכנה בעולם ה AI. הגישו עכשיו: wixenter.com
GIF
עברית
1
6
21
5.2K
Avishai Ish-Shalom
Avishai Ish-Shalom@nukemberg·
The building blocks for agentic development at scale are appearing
Oz Katz@ozkatz100

🚀 Today we're launching Tilde.run. 🚀 The team behind @lakeFS has been thinking hard about how agents should operate inside a company. Not in a toy sandbox, not with a list of approved tool calls, but with real access to real data and real infrastructure.

English
0
0
1
73
Gwen (Chen) Shapira
Gwen (Chen) Shapira@gwenshap·
The biggest mistake you can make while working on a distributed system is thinking that you are not working on a distributed system.
English
9
21
161
11.6K
Avishai Ish-Shalom retweetledi
Seth Daniel
Seth Daniel@sethdanie1·
I've realized that I simply don't care what non-Jews think about what will keep Jews safe, and what constitutes anti-Semitism. My understanding of Jewish history just makes it impossible to take them seriously. When someone who's not Jewish tries to explain to me why something is or isn't anti-Semitic, I feel like I'm listening to a ten-year-old give a TED talk on what makes a successful marriage.
English
21
49
331
5.9K
Ilya Sher
Ilya Sher@ilya_sher_prog·
Observation: apparently, nobody uses all those AI capabilities to actually improve anything.
English
1
0
1
44
Avishai Ish-Shalom
Avishai Ish-Shalom@nukemberg·
@ShirPeled זה רק מראה כמה מעט פריקונומיקס מבינים באנטומיה, אסתטיקה והיסטוריה
עברית
0
0
1
108
Shir Granot Peled
Shir Granot Peled@ShirPeled·
דל״פ: פריט הלבוש הכי מטומטם בפער עצום זה חגורה. אין בה שום היגיון פיזיקלי, ואם היה לנו שכל היינו כולנו הולכים עם שלייקס במקום זה. בשום מקום אחר לא היינו משתמשים ככה בחיכוך כדי למנוע מבד לגלוש למטה, כאשר אפשר פשוט לעגן אותו למשהו שנמצא בכיוון ההפוך לכיוון הנפילה.
Samani@samanio

יש פריט לבוש מפגר יותר מעניבה?

עברית
52
1
395
60.1K
Avishai Ish-Shalom
Avishai Ish-Shalom@nukemberg·
@aviranm There are no benchmarks that cannot be gamed. Sorry but I don't make the rules 🤷
English
0
0
0
50
Aviran Mordo
Aviran Mordo@aviranm·
We have released an AI benchmark that you can actually trust, and cannot be "gamed"
Maor Shlomo@MaorShlomo

We’re introducing a new model benchmark. And it’s a different kind of benchmark. (Basemark? Vibench?) A different kind because it’s breathing, constantly updated from millions of builders. Not a closed set of tasks. For a while now the public benchmark have not been really useful. Many models scoring high on benchmarks with very low real world usability So we’re introducing to the world a new benchmark that we’re using internally and found extremely useful. Our benchmark is basically how satisfied millions of users are when using different models. IMO it’s the closest measurement to how useful a model is in real world use cases. This metric is also correlated with our own business metrics - conversion, retention, etc. We called it the frustration meter. It’s automatically analysing millions of messages daily It detects bug loops, repeated requests, etc. We use this to benchmark every model we consider shipping. Not by asking "did it generate correct code." By asking "how did the builder feel after using it." it’s a good benchmark to measure model degradation. So far in the past few weeks we haven’t found any. Here's where the top models stand right now, ranked by average frustration score (scale 1 to 5, lower is better): opus 4.6 - 1.3 sonnet 4.6 - 1.4 opus 4.7 - 1.5 gpt 5.5 - 1.5 gpt 5.4 - 1.6 Gemini 3.1 - 2.2 For app building, Opus 4.6 seems better than 4.7 to a lot of builders. We ran Opus 4.7 50/50 against Opus 4.6 across over 10,000 apps. Frustration riseed by 43%. Turns per request by 19%. Gemini 3.1 don’t perform well at the moment, I left out of the graph as it made it unclear due to it’s rapid changes in this benchmark. Quick note - this is all aggregated data, and do not involve reading individual or identifiable conversations. We’ll keep tracking it and I’ll share it from time to time.

English
1
0
4
311
Avishai Ish-Shalom
Avishai Ish-Shalom@nukemberg·
@Moshe_Friedman_ ברגע שאין לבג"ץ שיתוף פעולה מהרשויות האכיפה אנחנו כבר שם. 😞
עברית
0
0
0
11
משה פרידמן
משה פרידמן@Moshe_Friedman_·
@nukemberg זו בדיוק לב הטענה של הארנק והחרב. זו המגבלה על בג"צ, והיא הכרחית. מה שבג"צ עדה אתמול הוא (עוד) צעד לכיוון של משבר חוקתי אמיתי, כזה שעשוי להיות מוכרע על ידי החרב. אני לא חושב שאנחנו שם ואני מטיל מקווה שההנהגות של שלושת הרשויות לא יובילו אותנו לשם.
עברית
1
0
0
23
משה פרידמן
משה פרידמן@Moshe_Friedman_·
אני אמנם תומך בתוכן החלטת בג"ץ - יש להפעיל סנקציות משמעותיות כנגד אלו שלא מתגייסים בניגוד לחוק. אבל אני לא חושב שנכון שבג"ץ יתווה תכנית מעשית איך לגרום ליותר חרדים להתגייס. זו נראית לי חריגה משמעותית מהתפקיד שלו, וטעות אסטרטגית. הפסיקה מתייחסת לטענה הזו, אבל, לצערי, דוחה אותה.
Or Carmi • אור כרמי@orcarmi

- החלטת בג"ץ בבקשה לפי פקודת ביזיון משפט בעניין ההשתמטות החרדית -   אולי לא הרגשתם, אבל היום התרחשה בישראל רעידת אדמה של ממש.   לא, אני לא מדבר על האיחוד הפוליטי של בנט ולפיד – אלא על החלטת בג"ץ, שהיא כנראה הכי חריפה בתולדותינו.   נושא ההחלטה, איך לא – ההשתמטות החרדית הממומנת. >>

עברית
10
0
21
2.2K
Avishai Ish-Shalom
Avishai Ish-Shalom@nukemberg·
@Moshe_Friedman_ בג"ץ יכול להטיל מה שבא לו, אבל מי אוכף את הסנקציות? משרדי הממשלה והמשטרה. בג"ץ *כבר הטיל סנקציות* ומשרדי הממשלה והמשטרה סירבו לאכוף אותן. אם בג"ץ יוציא צו מעצר לבן גביר על ביזיון בית המשפט, אתה רואה סיטואציה שבה המפכ"ל יאכוף אותו?
עברית
1
0
0
18
משה פרידמן
משה פרידמן@Moshe_Friedman_·
@nukemberg עקרונית לפי ג'מיני (וההגיון שלי) בג"צ יכול להטיל סנקציות על הממשלה ועל חברים בממשלה. כולל סנקציות אישיות כספיות וכולל העברת סמכויות או אפילו מאסר. אני מסכים שאנחנו במשבר חוקתי עמוק. העמקה שלו לא מועילה. בסופו של דבר שלטון דמוקרטי מבוסס על הסכמות לגבי כללי המשחק.
עברית
1
0
0
25
Avishai Ish-Shalom
Avishai Ish-Shalom@nukemberg·
@Moshe_Friedman_ איזה סנקציות בדיוק אפשר להפעיל מול ממשלה מפירת חוק? אתה שוכח ש100% מהיכולת האכיפה של בג"ץ - כולל מעצרים על ביזיון בית המשפט - נמצא בידי הרשות המבצעת. לתת לבג"ץ ארנק וחרב זה לא פיתרון; אבל נכון לעכשיו אנחנו במשבר חוקתי עמוק
עברית
1
0
0
21
משה פרידמן
משה פרידמן@Moshe_Friedman_·
@nukemberg אפשר להפעיל סנקציות נגד הממשלה, אבל באמת זה מוגבל. לתת לבג"צ ארנק וחרב זה בוודאי לא פתרון. x.com/Moshe_Friedman…
משה פרידמן@Moshe_Friedman_

@TalWeksler @brosheli זה אכן תפקידה של הכנסת. אם אתה חושב שאין לזה היתכנות *בכלל* אפשר לסגור את העסק וללכת הביתה. אלו היסודות של השיטה. המחשבה שבית המשפט יוכל להתגבר על כשל כזה בעזרת ניהול ישיר של גופי הממשלה היא גם הזויה אבל בעיקר נופלת לאותו הכשל. זו השיטה, וכמו כל שיטה היא עובדת עד גבול מסויים.

עברית
1
0
0
24
Boris Cherkasky
Boris Cherkasky@cherkaskyb·
אחרי שהדאטא שלנו עבר נורמליזציה לכדי סכמה משותפת, וכאן, כאשר יש סכמה משותפת, ואנחנו יודעים בדיוק באיזה properties שלה נמצאים האמוג׳ים - אנחנו יכולים ב״פעם אחת״ להכיל את הלוגיקה שלנו על כל הדאטא. >
עברית
3
0
5
307
Boris Cherkasky
Boris Cherkasky@cherkaskyb·
יש מתח קבוע בין ביצועים לקומונליות וגנרליזציה - אנחנו מצד אחד רוצים מערכות מהירות ויעילות, אך מצד שני - אנחנו רוצים מסלולים (code paths) גנריים שיטפלו בכלל המקרים. עקרונית - ככל שהקוד גנרי יותר, יש פחות יכולת לנצל את הייחודיות של הקלט לצורכי ביצועים, וכך המתח הנ״ל נבנה. >
עברית
2
0
26
2.5K
Avishai Ish-Shalom
Avishai Ish-Shalom@nukemberg·
@liran_tal Yes, well... OSS wasn't originally envisioned to be "free code on the internet written by anonymous dudes". The current model is inherently insecure
English
0
0
0
16
Liran Tal
Liran Tal@liran_tal·
If you haven't been working inside isolated environments like containers (or some other cloud sandbox) for the past several years, nor having any other supply chain security guardrail tool... are you brave or what? do you want me to link you to my container security article?
Liran Tal tweet media
English
4
0
2
471
Avishai Ish-Shalom
Avishai Ish-Shalom@nukemberg·
@morad ההנחה של אלון מאסק שגויה. מטרת מערכת החינוך היא לייצר אוכלוסייה ממושמעת עם בסיס אחיד.
עברית
1
0
3
121
Morad Stern 🇮🇱
Morad Stern 🇮🇱@morad·
״כמו משחק וידאו״ - 2 דקות של אילון מאסק על מערכת החינוך: מאסק טוען שמערכת החינוך מבוססת על הנחה שגויה - שכל התלמידים צריכים ללמוד את אותו הדבר. באותו קצב ובאותו סדר, כמו פס ייצור. בפועל, זה לא משרת לא את המהירים ולא את המתקשים, אלא פשוט מיישר את כולם לפי לוח זמנים. הוא מציין שהעולם כבר לא פועל כמו כלכלת מפעלים של העבר, אבל מערכת החינוך עדיין כן - ולכן היא לא מותאמת למציאות החדשה. הפתרון שהוא מציע הוא למידה מותאמת אישית, שבה כל תלמיד מתקדם בקצב שלו, דרך תחומי העניין שמדברים אליו. כאן נכנסת הבינה המלאכותית: היא יכולה ללמד אחד על אחד, לזהות פערים בזמן אמת, ולהתאים את הדרך שבה החומר נלמד - משהו שמורה בכיתה גדולה לא יכול לעשות. בנוסף, הוא מבקר גם את ההשכלה הגבוהה. לדעתו, חלק גדול מהערך מגיע מהאינטראקציה עם האנשים שם ולא מהמוסד עצמו, ולעיתים תואר הוא יותר הוכחת התמדה מאשר ידע אמיתי. השורה התחתונה שלו: הבעיה היא לא ביכולת של תלמידים ללמוד - אלא בעיצוב של מערכת החינוך, שלא מותאמת לעידן שבו כבר אפשר ללמוד בצורה אישית, דינמית ומעניינת יותר.
עברית
7
4
73
5.8K