Or Lenchner

1.6K posts

Or Lenchner

Or Lenchner

@orlench

CEO, https://t.co/QOCLFrBfbI | keeping public data, public.

Israel Katılım Aralık 2012
744 Takip Edilen705 Takipçiler
Ofir Ozeri
Ofir Ozeri@0fir0z·
@mluggy @YogSho שום סיכוי, מדפסת כסף ליותר מדי אנשים עשירים (ובוא לא נשכח שהיא מוחזקת ע״י קרן פרטית לגמרי כן?) ומאוד חזקים
עברית
2
0
0
115
Amitai Ziv
Amitai Ziv@amitaiz·
שים Data בשם אתה בסדר.
עברית
1
0
2
261
Ofir Dor
Ofir Dor@doritsos·
בחסות המהפכה על רקע עליית הבינה המלאכותית, ברייט דאטה קופצת בהכנסות. החברה חצתה את 300 מיליון דולר בקצב הכנסות שנתי, נכון לרבעון האחרון, וצומחת במעל 50%. קצב ה-EBITDA השנתי של ברייט חצה את רף 100 מיליון דולר, נכון לרבעון האחרון. ברייט דאטה הישראלית עוסקת בפיתוח כלים לקצירת מידע, היא מאפשרת לחברות שמפתחות AI לאסוף מידע מהרשת לאימון המודלים וגם כדי שהמודלים יוכלו לתת תשובות עדכניות למשתמשים. היתרון של ברייט הוא היכולת שלה לעקוף חסימות של כלים לא אנושיים מלקרוא אתרי אינטרנט , חסימות שהיו מונעים מהמודלים להגיע למידע. לכתבה המלאה בתגובות
עברית
5
3
41
8.5K
Or Lenchner
Or Lenchner@orlench·
@ron_mizrahio אשמח לראות איך אפשר לעזור שולח לך בפרטי
עברית
1
0
0
111
Ron Mizrahi
Ron Mizrahi@ron_mizrahio·
@doritsos חברה מדהימה ומצויינת - אבל! העלות לצערי מאוד גבוה ושולחת אותי להתפזר בין כמה חברות. אין סיבה לקחת 1.35 דולר על 1000 בקשות חיפוש כאשר יש מתחרים שנותנים את אותו הדבר ב0.3-0.4. כנ״ל בסקרייפינג.
עברית
3
0
3
598
Cyburger
Cyburger@Cyburgerim·
@orlench @amitaiz תודה רבה. חיפשתי לפי URL ספציפי. לצורך העניין: עלה דף חדש לווב, אונדקס ע"י מנוע חיפוש תוך שניות והתוכן שלו השתנה חצי שעה אחר כך - אני מעוניין לראות את הגרסא המקורית כפי שעלתה במקור (ואולי השתנתה חצי שעה לאחר מכן). וH&M זה הדבר האחרון שמעניין אותי 😆
עברית
1
0
0
32
Cyburger
Cyburger@Cyburgerim·
תגידו - יש אלטרנטיבה לגוגל cache? (פליז אל תגידו ווייבאק - זה לא תופס)
עברית
3
0
4
1.9K
Or Lenchner
Or Lenchner@orlench·
@amitaiz @Cyburgerim אנחנו שומרים בערך 3 מיליארד עמודים ביום, מעל 400 מיליארד בינתיים, אבל לא מאונדקס כמנוע חיפוש. אתה יכול נגיד לקנות את כל העמודים של h&m שחיפשת שם, היסטורית ולהתחיל לברור מתוך זה :) זה בעיקר לאימון מודלים ענקיים
עברית
1
0
2
31
Amitai Ziv
Amitai Ziv@amitaiz·
@Cyburgerim אני *חושב* שברייט דאטה כן אבל עבור לקוחות משלמים. נכון @orlench ?
עברית
2
0
1
121
Or Lenchner
Or Lenchner@orlench·
@amitaiz ששששש, אם סמוטריץ' ישמע על זה הוא יקצץ ויעביר את התקציב לסטרוק
עברית
0
0
3
599
Amitai Ziv
Amitai Ziv@amitaiz·
תזכורת: אם ילדכם עולה לכיתה א', מזל טוב! מגיע לכם office 365 בחינם מעתה ועד כיתה יב'.
עברית
35
29
553
45.9K
Or Lenchner
Or Lenchner@orlench·
@lielkyzer מה שכמובן ישפיע על הגרעון... 7%? בעזרת השם
עברית
0
0
0
43
Liel Kyzer || ליאל קייזר
הכלכלן הראשי באוצר מוריד את תחזית הצמיחה של ישראל לשנה הזאת ב-0.5%, מ-3.6% ל-3.1% הרקע להורדת התחזית הלחימה באיראן שלא נלקחה בחשבון בתחזית הקודמת והתארכות הלחימה ברצועה. באוצר מעדכנים את התחזית לשנה הבאה כלפי מעלה - אבל קצת קשה להתייחס לזה ברצינות רגע לפני מבצע לכיבוש הרצועה
Liel Kyzer || ליאל קייזר tweet media
עברית
10
6
68
2.6K
Ran Bar-Zik
Ran Bar-Zik@barzik·
קלאודפלייר, שהוא סםק הwaf (פיירוול לאתרי אינטרנט) מאפשר חסימה ל-LLM שסורקים אתרים ושואבים את תוכנם. זו תהיה גם הגדרה בברירת מחדל לדומיינים חדשים. זה... מעניין.
Ran Bar-Zik tweet media
עברית
26
2
307
18K
Or Lenchner
Or Lenchner@orlench·
@OmriRT זאת לא הנחה, אנחנו עושים סקרייפינג מאתרים שמשתמשים בקלאודפלייר ואין שום שינוי :) את הדעה המשפטית שלי אתה מכיר היטב 😀
עברית
0
0
1
30
Omri Rachum-Twaig
Omri Rachum-Twaig@OmriRT·
@orlench כן, זו גם ההנחה שלי. השאלה מה יהיה האפקט המשפטי לאורך זמן
עברית
1
0
0
36
Omri Rachum-Twaig
Omri Rachum-Twaig@OmriRT·
אז יש כאן דיון אם אפשר בכלל לאתר ולחסום באופן מדויק קרולרים של LLM שאוספים מידע לצורך אימון. במקביל למאמץ הטכני, יש גם מאמץ משפטי מקביל, לפחות באירופה. הAI Act דורש ממפתחים של מודלים גדולים החל מעוד שבועיים לתעד את כל מקורות המידע לאימון ובמיוחד תוכן מוגן בזכות יוצרים >>
Ran Bar-Zik@barzik

קלאודפלייר, שהוא סםק הwaf (פיירוול לאתרי אינטרנט) מאפשר חסימה ל-LLM שסורקים אתרים ושואבים את תוכנם. זו תהיה גם הגדרה בברירת מחדל לדומיינים חדשים. זה... מעניין.

עברית
2
0
5
516
Or Lenchner
Or Lenchner@orlench·
@danibauman2 @barzik זה זניח.. מדובר פה על אתרי תוכן, לא אתר איקומרס שהמחיר משתנה כל שעה וצריך לגשת שוב ושוב. באתרי תוכן אתה אוסף הכל פעם אחת ואז מידי פעם ניגש לבדוק אם יש תוספת. זה טראפיק נמוך שגם לא יחסם, וגם לא יהיה שווה יותר מגרוש וחצי ליצרן התוכן במידה והמודל יסכים לשלם
עברית
0
0
0
59
dani bauman
dani bauman@danibauman2·
@orlench @barzik המודל צריך אותו שוב ושוב כדי להתאמן כי עם הזמן יש תוכן חדש/שונה. נניח ממצא מדעי חדש שמוכיח שתיאוריה ישנה היתה שגויה.
עברית
1
0
0
60
Or Lenchner
Or Lenchner@orlench·
@meduplam חשוב לציין, שמהראשון ביולי, מתי שהם הכריזו על חסימה של הסקרייפרים כדיפולט, כלום לא קרה...אין חסימה בפועל. המודל הזה שבור לא רק כי טכנית זה לא מתאפשר, אלא גם כי כל יצרן תוכן שהוא לא אימפריית תוכן, רק יפגע: או שיקבל גרוש וחצי, או שימחק מהאינטרנט החדש כי המודל לא יתייחס אליך.
עברית
1
0
5
151
אופטיקאי מדופלם
חברת קלאודפלייר הכריזה בתחילת החודש על ״יום העצמאות לתוכן באינטרנט״. על כך ש-AI מאיץ את הדעיכה של הווב הפתוח דיברנו פה כבר מספר פעמים: היחס בין מספר הפעמים שבוטים אוטומטיים כמו של גוגל או OpenAI מבקרים, לבין מספר הביקורים האנושיים שמגיעים לאותו אתר, צונח במהירות. ואם הצ׳אט בוט קורא את האתר שלי, ומנסח מחדש תשובות עבור היוזרים שלו על סמך זה, ואף יוזר כבר לא מבקר באתר שלי – למה שאשתתף במשחק הזה בכלל? הפיתרון של קלאודפלייר הוא שירות שחוסם בוטים של חברות AI. כאלו שמבקרים (עושים crawling) באתר על מנת להוריד את התוכן, ולצרף אותו לסט האימון של מודל שפה גדול. אותו שירות עדיין יאפשר למשתמשים אנושיים רגילים להמשיך לבקר באתר, לצרוך את התוכן, ו(אולי) לצפות ולהקליק על פרסומות. השירות הזה של קלאודפלייר הושק – והיה זמין בלחיצת כפתור – כבר לפני למעלה משנה. ומעל מיליון לקוחות אכן בחרו להפעיל אותו. החל מהראשון ביולי האחרון עם זאת – התאריך עליו קלאודפלייר הכריזה בתור יום העצמאות של התוכן – השירות הזה גם יפעל בדיפולט. לקוחות יוכלו לכבות אותו כמובן. אבל למה שיבחרו לעשות את זה? המשמעות היא שמרבית התוכן באינטרנט – מלבד בעלי אתרים שבאופן אקטיבי יבחרו לאפשר לבוטים של AI גישה לאתר שלהם – יהיה סגור בפני יצרניות ה-LLM. מלבד אחת מהן: גוגל. גוגל משתמשת באותו בוט גם כדי לבצע crawling לאתרי אינטרנט במטרה להכניס אותם לאינדקס החיפוש שלה, וגם במטרה להכניס אותם לסט האימון של מודלי השפה הגדולים שלה. הנימוק הוא שמודלי השפה של גוגל נכללים במסגרת תוצאות החיפוש, עם פיצ׳רים כמו AI Overviews או AI Mode. מכיוון שבעלי האתרים עדיין רוצים להיכלל בתוצאות החיפוש של גוגל, הם מאפשרים לגוגל-בוט להוריד את התוכן שלהם. זה משמש — לצד אינדקס החיפוש — גם לאימון של מודלי שפה גדולים. כל זה שם את גוגל בעמדת יתרון אל מול כל יצרנית LLM אחרת: קלאודפלייר למעשה בנתה חומה מסביב לתוכן באינטרנט הפתוח, והשאירה רק לגוגל את המפתחות. קלאודפלייר מציעה שירות נוסף: תשלום עבור crawl. בעלי האתרים יוכלו לגבות כסף מחברות ה-AI. בדומה לעסקאות שחברות גדולות כמו ניוז קורפ או רדיט עושות עם יצרניות המודלים הגדולות. המוצר החדש יאפשר דמוקרטיזציה של המודל הזה - כל אתר, בכל גודל, יוכל למכור - בצורה אוטומטית – גישה לתוכן שלו תמורת תשלום לכל ביקור. זה יהיה מעניין לראות אם מכאן יתפתח המודל העסקי החדש שיאפשר לאינטרנט הפתוח להמשיך להתקיים.
אופטיקאי מדופלם tweet media
עברית
7
4
101
5.7K
Or Lenchner
Or Lenchner@orlench·
@NavotV @tomer_balan אם כבר שאלת..למרות שלא תייגת! נבות בחייאת הייתי אצלך בפודקאסט :) לא עושים סקרייפינג מאחורי לוג אין בשום פנים ואופן (החכמה זה לא לקבל את הלוגין בכלל)
עברית
0
0
2
36
Navot Volk
Navot Volk@NavotV·
@tomer_balan שנשאל את המנכ״ל? לדעתי אני צודק אבל אם אתה יודע אז אתה יודע.
עברית
3
0
0
259
Navot Volk
Navot Volk@NavotV·
מי רוצה לבנות איתי שירות חדש? נקרא לזה Dream Feed שם זמני. העיקרון פשוט: אתה מחבר את ה סושיאל , ניוזלטרים שאתה מנוי עליהם, ואתרים שאתה קורא. והשירות בונה לך דיילי דייג’סט אישי (עם קצת AI כי אין ברירה). שאתה מקבל במייל פעם או פעמיים ביום. מה אני מביא? מוצר ויוז קייס. DM פתוח.
עברית
29
0
57
9.6K
Or Lenchner
Or Lenchner@orlench·
@ariyederi מתי עשית הצהרת הון פעם אחרונה?
עברית
0
0
1
45
אריה מכלוף דרעי
ש״ס תתנגד לכל יוזמה להעלאת שכר הח״כים והשרים בעת הזו. בעיצומה של מלחמה, כשציבורים שלמים מתמודדים עם קיצוצים – זו לא העת ולא הזמן.
עברית
335
12
478
52.8K
Or Hiltch
Or Hiltch@_orcaman·
בדיוק בצ׳ק אין דרך האפליקציה לקראת טיסה הלילה 🙃
עברית
2
0
22
1.7K
Or Lenchner
Or Lenchner@orlench·
@raz_kaplan חשבתי אנחנו חברים! למה חינם? בוא קח קרדיט ממני. יש לך את המייל :) גם הוצאנו MCP: @brightdata/mcp" target="_blank" rel="nofollow noopener">npmjs.com/package/@brigh
עברית
0
0
1
30
RazK
RazK@raz_kaplan·
היי מומחים, יש המלצה על סקרייפר שמתחיל חינם ועובד טוב עם כלי וייב קודינג? בגדול עם @base44 אבל לא אין בעיה לקרסר. התחלתי עם @firecrawl אבל הוא מקרטע. הסתכלתי על @JinaAI_ crawl4ai @scrapegraphai דעתכם?
עברית
4
0
2
660