Guy Davidson

1K posts

Guy Davidson banner
Guy Davidson

Guy Davidson

@guyd33

Machine learning researcher @JaneStreetGroup. PhD @NYUDataScience in AI & CogSci, specifically in goals and their representations in minds & machines (he/him).

New York, USA Katılım Nisan 2019
1.9K Takip Edilen1.3K Takipçiler
Sabitlenmiş Tweet
Guy Davidson
Guy Davidson@guyd33·
New preprint alert! We often prompt ICL tasks using either demonstrations or instructions. How much does the form of the prompt matter to the task representation formed by a language model? Stick around to find out 1/N
Guy Davidson tweet media
English
1
34
276
49.5K
Guy Davidson
Guy Davidson@guyd33·
@intothecrevasse Next time tot go, the paneer makhani and eggplant larger plates are fantastic, as is the pav bhaji
English
0
0
1
2.5K
Charles Bramesco
Charles Bramesco@intothecrevasse·
Absolutely bonkers new Indian action in Park Slope at Pangat: sev puri dahi puri, chicken koliwada, chili paneer, ghati chicken curry
Charles Bramesco tweet mediaCharles Bramesco tweet mediaCharles Bramesco tweet mediaCharles Bramesco tweet media
Filipino
15
28
1.6K
164.3K
Guy Davidson
Guy Davidson@guyd33·
@nir_benz הנחתי שפאתוס זה המודל הבא אחרי מיתוס, אבל אולי הם הקדימו :)
עברית
1
0
1
44
Nir Ben-Zvi
Nir Ben-Zvi@nir_benz·
@guyd33 אז אנחנו מסכימים, נראה לי :) הישג טכנולוגי מרשים, כנראה באותו סדר גודל כמו קודמיו מבית אנטרופיק. פשוט הפעם עם פאתוס.
עברית
1
0
2
102
Nir Ben-Zvi
Nir Ben-Zvi@nir_benz·
לא בלתי מעניין\כולנו *לא* הולכים למות: סטרטאפ בשם Aisle Security (מנחש שהם עוסקים בסקיוריטי) ערך בדיקה: הם לקחו את פרצות האבטחה מהמאמר של אנטרופיק על Mythos, ובדקו מודלים שהיו זמינים להם על אותם קטעי קוד בנסיון למצוא אותן. אז מה בדקו ומה גילו? >>
עברית
15
4
183
39.8K
Guy Davidson
Guy Davidson@guyd33·
@nir_benz אני לא חושב שהועלם נגמר, ואני בטוח שאנטרופיק עושים אחלה יח״צ; אני מניח שהמציאות היא איפשהו באמצע, מצד אחד זו קפיצת מדרגה מרשימה, ומצד שני זה לא אפוקליפסות סייבר
עברית
1
0
1
120
Nir Ben-Zvi
Nir Ben-Zvi@nir_benz·
@guyd33 ברור לי שזה לא טריוויאלי. אני לא חושב שהחוקרים/כותבים ניסו לשכנע שכן. הם ניסו לשכנע שזה לא הדבר הכי מפחיד בעולם, אלא אבולוציה הגיונית, ושאנטרופיק בעיקר עוסקים ביח״צ עם הדו״ח שלהם. אגב, הנה עוד דוגמא:
vik@vikhyatk

guys. we need to shut it all down ai has gotten too powerful. the world will never be the same

עברית
1
0
5
4.8K
Guy Davidson
Guy Davidson@guyd33·
@nir_benz הנחתי שאם הם היו יוצאים מראש את אחת החולשות שאנטרופיק עשו מהן הייפ, הם היו אומרים, אבל אולי לא
עברית
1
0
1
9
Nir Ben-Zvi
Nir Ben-Zvi@nir_benz·
@guyd33 קודם כל נראה לי שזה מה שהם עושים ויש סיכוי לא רע שהם מצאו :) דבר שני - בסקייל, לעשות דבר כזה עולה הרבה מאוד כסף. אתה תעשה את זה אם יש לך סיבה.
עברית
1
0
1
14
Guy Davidson
Guy Davidson@guyd33·
@nir_benz עכשיו, המחיר להריץ מודל ברמה מסוימת בגדול יורד, ואולי יורד מהר יותר משכמות הקוד הרלוונטי בעולם עולה, אבל לדעתי השאלה של איפה בכלל לחפש חולשה (ובטח כשמדובר על חולשה שאולי דורשת לחלוש על כמה מקומות שונים בקוד) היא ממש לא טריוויאלית, ולעשות לה סקיילינג עם חיפוש נאיבי זה קשה.
עברית
1
0
1
113
Nir Ben-Zvi
Nir Ben-Zvi@nir_benz·
@guyd33 התייחסתי לזה בתגובות (וגם הכותבים הגונים וכותבים על זה). אם יש לך זכוכית מגדלת שמוצאת את אפי מצוין במטר על מטר, ויש לך קוד שמנהל אלפי זכוכיות מגדלת כאלה - סיימת.
עברית
2
0
1
88
Guy Davidson
Guy Davidson@guyd33·
@nir_benz המחקר הזה לא בלתי מעניין, אבל אני חושב שהוא קצת מוכר את עצמו יותר מדי. בהקבלה: אנטרופיק פרסמו שיש להם מודל ״איפה אפי״ מדהים שיכול לפתור איפה אפי בגודל של מגרש כדורגל, והמחקר הזה אומר ״סימנו למודל קטן יותר את המטר על מטר שבו אפי, וגם המודל הקטן מצא, תאכלו תחת אנטרופיק״.
עברית
1
0
1
189
Guy Davidson
Guy Davidson@guyd33·
@_kobim אני משתמש ב-Strong וזה פותר את זה יפה
עברית
0
0
1
216
kobim
kobim@_kobim·
משתמשים באפליקציה חינמית לחדר כושר? לא צריך הרבה, רק לתעד מה עשיתי עם ממשק נח. בינתיים פשוט כותב בפתק בטלפון אבל מעצבן אותי להקליד כל פעם מחדש את אותם דברים. (תציעו לי לכתוב משהו עם קלוד, איי דר יו)
עברית
26
0
49
7.2K
Guy Davidson
Guy Davidson@guyd33·
@eyalFeder כל הסיפור מהמם, אבל הטענה שאין שווארמה מעל בינונית בניו יורק קצת מפוקפקת… היית ב-OMG על השביעית ורחוב עשר או שבזי באמסטרדם ו-93? (אני מניח שזה למטרות הסיפור, אבל אני גם תמיד בעד להרים לשווארמה מקומית)
עברית
1
0
4
84
Eyal Feder-Levy
Eyal Feder-Levy@eyalFeder·
האישה הנחמדה יצאה מהדוכן ואישית הובילה אותי דרך שורה של דלתות ומסדרונות שבסופן הופעתי מחדש בדיוטי פרי. הודתי למות הדרך שלי ופניתי לאכול שווארמה בינונית (משום מה אין שווארמה בניו יורק) ולחכות לטיסה. וכך הסתיימה החוויה החד פעמית הזאת. >>
Eyal Feder-Levy tweet media
עברית
6
0
453
32.7K
Eyal Feder-Levy
Eyal Feder-Levy@eyalFeder·
השבוע עשיתי משהו שמעט מאוד אנשים זוכים לחוות בימי חייהם. עשיתי קונקשן בנתב"ג. <<
Eyal Feder-Levy tweet media
עברית
58
18
2.1K
241.6K
Guy Davidson
Guy Davidson@guyd33·
@_kobim מה המקום? מקווה שהקפה מצוין (התפריט לפחות עושה רושם טוב)
עברית
0
0
1
118
kobim
kobim@_kobim·
נצפה מקום שגובה את אותו מחיר על אספרסו ואמריקנו כמו שההיגיון מחייב. הקאצ׳? זה המחיר:
kobim tweet media
עברית
5
0
27
1.4K
Guy Davidson retweetledi
Dr. Karen Ullrich
Dr. Karen Ullrich@karen_ullrich·
If “getting started with agents” feels like setup hell — same. So we made a starter tutorial: First agent running in <14 minutes, no Docker/AWS. Laptop + API key only. 👇 youtube.com/watch?v=gzNW_L…
YouTube video
YouTube
English
0
3
13
1.6K
Guy Davidson
Guy Davidson@guyd33·
@sarahcat21 I almost brought an aeropress and coffee from home before I decided that’s a bit extra. I slightly regret the decision.
English
0
0
1
193
Sarah Catanzaro
Sarah Catanzaro@sarahcat21·
Last time I attended NeurIPS in SoCal, I hopped a fence to get into Uber’s after party so I could check out the ice luge. Those days are gone; now I travel with a senior citizens survival kit.
Sarah Catanzaro tweet media
English
4
0
31
3.3K
Guy Davidson
Guy Davidson@guyd33·
We're also presenting some work! Our (@adinamwilliams @LakeBrenden @todd_gureckis ) interpretability work on task representations from different prompting forms will be poster #1016 on Friday's afternoon session (4:30-7:30, hall C/D/E) x.com/guyd33/status/…
Guy Davidson tweet media
Guy Davidson@guyd33

New preprint alert! We often prompt ICL tasks using either demonstrations or instructions. How much does the form of the prompt matter to the task representation formed by a language model? Stick around to find out 1/N

English
1
1
12
841
Guy Davidson
Guy Davidson@guyd33·
Like ~everyone, I'll also be at #NeurIPS this week! Please reach out to chat about past (goal representations, cognitive science, intrep) or current interests (LLM mental state inference, social environments for RL). Also if you have leads on great coffee, craft beer, or tacos.
English
3
3
52
4.2K
Guy Davidson
Guy Davidson@guyd33·
@redtachyon Eh my read is more of a tongue in cheek “if you know you know” than trying and failing
English
0
0
1
14
Ariel
Ariel@redtachyon·
@guyd33 Ah, so it was a joke and he just failed at indicating it, thanks.
English
1
0
1
26
Guy Davidson retweetledi
Dr. Karen Ullrich
Dr. Karen Ullrich@karen_ullrich·
Stop by the Meta booth tomorrow, Wednesday Dec 3rd at #NeurIPS in San Diego! 🤖📱 We demo our new research environment, OpenApps, for digital agents. Generate thousands of app versions to train and evaluate multimodal agents to use apps like humans do. Not attending? Stay tuned
Dr. Karen Ullrich tweet media
English
1
2
10
924
Mark Goldstein
Mark Goldstein@marikgoldstein·
so far in this thread i've seen - bird rock coffee roasters - jaunt coffee roasters - rikka fika - dark horse - goldchild thanks all!
English
4
0
4
475
Mark Goldstein
Mark Goldstein@marikgoldstein·
what are the good* espresso places in san diego? *wide definition of "good" here: doesn't have to be pristine, concrete counters, jazz/lofi, light roast, let-you smell-the-ground-beans-before-serving-you, etc (and better if it is not! but will tolerate it)
English
9
1
26
6K
Diana Cai
Diana Cai@dianarycai·
Where are folks going to get large posters printed near the San Diego convention center? #NeurIPS2025
English
6
1
11
4K
Guy Davidson
Guy Davidson@guyd33·
@joannejang Absolutely, interesting and hard problem. Unclear what exactly to measure, how much of what good EQ looks like is user-dependent, and how aligned writing style/tone is with EQ (and/or the perception of it)
English
0
0
1
276
Joanne Jang
Joanne Jang@joannejang·
too many people conflating model eq & model personality + too few people who care enough about eq to work on such a fuzzy problem when there are problems far easier to measure & hill-climb on
English
42
12
226
37.5K