Omer Raviv
4.2K posts

Omer Raviv
@omerraviv
Engineering Manager @ Datadog. Formerly creator & CTO @ Ozcode. Obsessed with changing the way debuggers work, in your IDE and in the Cloud.
Israel Katılım Mart 2008
951 Takip Edilen648 Takipçiler

Teyana Taylor says she’s had talks with Paul Thomas Anderson about a ‘ONE BATTLE AFTER ANOTHER’ sequel centered on Perfidia.
“The conversations are very, very real. I want to give everybody confirmation that I am currently begging PTA to give us that.”
(Source: indiewire.com/awards/conside…)

English

@Gruffalos_Child @ArielaGoesFake @dfubar לי הדבר היחיד שעובד עם בן 4 זה להכניס טקס - נשיקה, חיבוק גדול, כיף (מלשון high five). אחרי הכיף מסתובבים וכל אחד הולך לדרכו. לוקח חמש שניות והוציא אותי לגמרי מהבושות של הגננת חייבת להחזיק אותו כדי שאוכל ללכת.
Brookline, MA 🇺🇸 עברית

@ArielaGoesFake @dfubar בגורם חיצוני שיעשה לו את המעבר, יש לו אפס יכולות ואפס תחושת מסוגלות לבצע את זה בעצמו. אבל בבית ספר השער פתוח עד הצלצול, והמחנכת לא מחכה בשער ולוקחת אותו פיזית, וכן צריך להיכנס ולצעוד לכיתה בעצמך. אז אני חושבת שאם היה אפשר להתחיל בפרידות יותר אקטיביות כבר בגילאי הגן, זה היה מסייע.
עברית
Omer Raviv retweetledi

Aspire + coding agents - 109 commits and 41 PRs in a week! we keep learning that code reviews matter, tests do NOT replace user testing and making it easy to test PRs is non-negotiable. Humans are the UI threads; agents are the background threads - don't block the UI!
#aspire
English
Omer Raviv retweetledi
Omer Raviv retweetledi
Omer Raviv retweetledi

I find that Claude Code planning mode is only useful for really small tasks - for larger tasks what's working better for me:
Ask Claude to make a plan in a markdown file -- then promptly take that Claude out back and shoot it (ctrl+c)
Spin up a new Claude and tell it:
"a previous agent made [plan.md]. - please review this plan in detail and call out anything that appears to be overengineering needlessly for what should be a simple, robust system"
NewClaude generally is of the opinion that OldClaude was a total fuckhead, and subsequently comes up with a way better plan.
Optionally, you can spin up a 3rd Claude and ask it evaluate both plans in the context of the existing codebase - but I generally just find that JudgeClaude agrees that OldClaude was a fuckhead and NewClaude's plan is the right way to go.
English
Omer Raviv retweetledi

@nivlekstims @Frankie_Ries @BasedTorba @grok I think your psychotherapist would like to speak with you
English

Silicon Valley is spending billions and billions of dollars to prevent what you saw @grok was capable of today.
English
Omer Raviv retweetledi
Omer Raviv retweetledi

@omerraviv @hasolidit תתבייש! מה ששנוא עליך אל תעשה לחברך וכבוד המת אל תשכח
עברית

@SamoelOren @hasolidit הוא היה אדם רע מאוד וגרם להרבה מאוד נזק. מכבדים את המת, היה אדם אחרי הכל, אבל לא שוכחים ולא מפסיקים לעסוק בזה רק בגלל שמת.
עברית

@hasolidit תתביישו אדם נפטר ואפילו נגד המתים התחלתם להסית אין גבול לבושה לאן הגענו
עברית
Omer Raviv retweetledi

There is a lot of (justified) of excitement about MCP, but just like most function calling approaches, I think it has a severe limitation at the moment, and I am kind of of flabbergasted why I am the only one that is bothered by it.
The problem is that when you define a tool using MCP [0] you can only specify the *inputSchema* but not the *outputSchema* (the same is the case for OpenAI [1], Claude [2], Mistral [3], Gemini [4], ...). And the optional description of a tool is just a "hint" to the model.
That means that when the model needs to decide to call a tool, it can only rely on the structure of the the inputs (not even on the description). But since it does not know the structure of the output of the call, it cannot reason about the composition of multiple tool calls to solve a complex problem. Instead it needs to take a guess, call some first tool, and then interpret the output before it can reason about how to continue.
The fact that tools are dynamically typed wrt to their results makes it also impossible for other tools, and humans, to reason about tools (that is a lot of tools :-). Imagine I would explain MCP to you by only showing the types you send to an MCP server, but none of the types that you receive from a server.
Since tools are for all intents and purposes really just fancy REST apis, just like OpenAPI definitions [5], tool calling and MCP tools should also specify their outputs.
English

@ericzakariasson @baltaaazr I need prompts support in MCP, so that MCP servers can define their best practices and I can trigger them via `/` commands.
English

AMA about cursor, @baltaaazr and i will be answering as much as we can
English

@boazbe המבנה תיקיות, ולהכריח אותו גם לעבוד לפי זה, וגם לעדכן כשצריך. ככה אתה והLLM מסונכרנים על הdesign ולLLM יותר נוח כי יש אבסטרקתיות שמאפשרות לקונטקסט ווידאו להכיל רק את מה שצריך בכל רגע נתון
עברית

@boazbe בעיה פתירה במידה רבה ואני חושב שזה ממש טעות לחשוב שעדיף לLLM קובץ אחד גדול , זה בהכרח אומר שיהיה בקונטקסט הרבה דברים לא רלוונטים, מה שמגדיל את בעיית ה"בליל חרא"
הפתרון הכי טוב שאני מכיר כרגע זה פשוט להכריח אותו לעבוד עם קובץ architecture.md שגם מסביר את הdesign וגם את ..
עברית

כל הקטע של קידוד עם AI יוצר התנהגויות דיי מעניינות.
אני מרגיש שברגע שנתתי את השליטה לAI היכולת שלי לבנות על גביו נמוכה יותר ככל שהוא בנה עבורי יותר.
בבסיס זה סוג של משבר קיום שבו המוח שלי אומר לי "מה אתה טמבל למה לעבוד קשה, תן לו לנסות לתקן את זה".
ואז אחרי שהוא חירבן את זה יותר ויותר, אני לוקח את השליטה רק כדי להשקיע איזה שעה להבין את הבליל חרא שיצא לו.
כאילו זה לא באמת בליל חרא, אבל תוצר שטוב לAI להבנה הוא לא תוצר שטוב לבנאדם להבנה. הAI צריך פחות אבסטרקטיות ויותר קונטקסט, בגדול הוא צריך את כל הפרויקט בקובץ אחד. אני לעומת זאת צריך חתיכות קטנות שמבודדות היטב זה מזה.
כאילו זה לא רק שהAI עושה אותי עצלן ומטומטם יותר, הוא גם מונע ממני להשתלב בפרויקט אח"כ כי הוא כותב קוד שטוב עבורו, ולא עבורי.
אני מניח שככל שהכלים שמפתחים עבורנו תוכנה ישתפרו יצליחו לשפר גם את זה, אבל כרגע זה דיי גומר את הפרודוקטיביות שלי כמתכנת, ואני מעדיף להישאר עם השלמות נקודתיות של שורה/פונקציה, ולא השלמות של פיצ'רים שלמים.
עברית
Omer Raviv retweetledi

I've seen a ton of text-to-SQL startups over the last two years - some standalones, some open source, some within big companies.
Most of the evaluations looked like this: "Yes, your model does a good job on four tables [orders, order_items, items, users] with six columns that all have logical names... but we have 1000+ tables, including a Salesforce Opportunities table with 500 semantically similar columns."
I am ready to declare that text-to-SQL now works at industry scale. Be deliberate with semantic layer + context, use metadata, curate your surface area, leverage MCP interfaces, use 3.7 or 4.5. It works.
English












