Omar

18.3K posts

Omar banner
Omar

Omar

@O2mar_

أهلًا بك مجدداً | خبير دبلوماسي ، اقتصادي ، رياضي،كوميدي، متحلطم اجتماعي….etc

Joined Temmuz 2022
957 Following5.2K Followers
Pinned Tweet
Omar
Omar@O2mar_·
اللهم إنك عفو تحب العفو فاعف عنا🌿
العربية
0
0
7
73.3K
Omar
Omar@O2mar_·
كل عام وانتم بخير
العربية
0
0
2
217
Omar
Omar@O2mar_·
Omar tweet media
ZXX
0
0
0
245
ـعـ
ـعـ@BookerComstock1·
@O2mar_ ياخي أحب فيك أصالة المحتوى
العربية
1
0
0
123
Omar
Omar@O2mar_·
صليت القيام بحي بشمال الرياض يوم قال الإمام اللهم اقضي ديوننا محد قال آمين الا انا والبنقالي اللي قدامي
العربية
2
0
6
2.6K
Omar
Omar@O2mar_·
Omar tweet media
ZXX
0
0
0
362
Omar
Omar@O2mar_·
اتوقع اني مكثر شوربه..... رحت المسجد بالسياره رجعت البيت،،، لاحظت ان السياره مختفيه عن البيت قلت وين؟🤔 طلعت السياره بالمسجد
GIF
العربية
0
0
6
657
Omar
Omar@O2mar_·
طول رمضان سكليف واتاخر ٣ ساعات كل يوم بالافطار السنوي اول شخص يجي انا
العربية
0
0
1
312
Omar
Omar@O2mar_·
ZXX
0
0
0
212
Omar
Omar@O2mar_·
ZXX
0
0
0
182
Omar
Omar@O2mar_·
تم الاشباع مدري تمت التعبئه بنجاح وش كان الستيكر هههههه
العربية
0
0
0
149
Omar
Omar@O2mar_·
العالم كلهم منصدمين ان رمضان بكره حتى حارتنا زحمه
العربية
0
0
0
243
Omar
Omar@O2mar_·
الشهر عليكم مبارك توني كنت اصلي التراويح وجمبي طفل بعد التسليمه الخامسه لف علي لو سمحت متى يخلص صلينا كثير وواضح انه تعب المسكين وكانت الصلاة مسترسله وسريعه قلت بيصلي الشفع والوتر الحين وبيقرا من جزء عمّ وبعدها دعاء وخلاص بعد ماخلص شفع كلهم يطالعوني ها خلص!؟ طيب مو انا الامام💀
العربية
0
0
1
587
Omar
Omar@O2mar_·
Omar tweet mediaOmar tweet media
ZXX
1
0
1
473
Omar retweeted
Saad
Saad@Sa4d_k1·
من أكثر الأوراق البحثية انتشارًا في مجتمع الذكاء الاصطناعي هذا الشهر وبداية هذا العام كانت ورقة تتحدث عن التسارع الكبير في قدرات نماذج الذكاء الاصطناعي والطلب المتزايد على تدريبها، حيث بدأنا نقترب من مشكلة شهيرة صارت تُعرف باسم “جدار البيانات (Data Wall)”: البيانات العامة عالية الجودة على الإنترنت تقترب من النفاد، بينما احتياج النماذج إلى البيانات يستمر بالتوسع لفترة طويلة كان الافتراض العام في تدريب نماذج اللغة: انه كلما زدنا عدد وحدات التدريب (tokens) تحسّن النموذج (ولا يزال هذا صحيحًا جزئيًا في بعض الحالات)، لكن الواقع اليوم يفرض تحوّلًا مهمًا: المعادلة بدأت تنتقل من “المزيد من وحدات (tokens)” إلى “وحدات أفضل (tokens)” (المقصود بيانات ذات جودة افضل) عنوان الورقة: OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration فكرة الورقة بشكل مباشر: كثير من الحلول الحالية للتعامل مع “جدار البيانات” تقع في مسارين، وكلاهما غير كافي لوحده: - المسار الأول (Static Filters): تنظيف/تصنيف البيانات قبل التدريب لاستبعاد الغير مرغوب بهم. مشكلته أنه قرار ثابت لا يتكيّف مع تغيّر احتياج النموذج عبر مراحل التدريب. - المسار الثاني (Dynamic Selection): اختيار البيانات أثناء التدريب بناءً على مؤشرات سهلة القياس مثل الخسارة (loss function) أو “اتجاه التعلّم” الخام (raw gradients). المشكلة أن قرار التحديث الحقيقي في التدريب لا يعتمد على هذه الإشارات بشكل مباشر، لأنه يمر عبر المُحسّن (optimizer مثل AdamW) الذي يغيّر شكل واتجاه التحديث اقتراح الورقة (Optimizer-aware): بدل الاعتماد على الخسارة فقط، تقترح الورقة اختيار العيّنات بحسب أثرها الحقيقي على التعلّم بعد المُحسّن (optimizer-aware): أي نختار البيانات التي تدفع النموذج “فعليًا” نحو التحسّن، مع تجنّب تكرار عينات متشابهة داخل الدفعة للحفاظ على التنوع. تصوّر مبسّط: بدل ما التدريب يستهلك بياناته بشكل عشوائي، الورقة تقترح إضافة “طبقة اختيار” داخل التدريب: في كل خطوة تُراجع مجموعة عينات قصيرة من البيانات وتختار فقط العينات التي تُعطي أكبر تحسّن فعلي للنموذج الآن (وتتجنب العينات المتشابهة). النتيجة: تدريب على بيانات أقل لكن أثرها أعلى. النتائج كانت واضحة في جانب “الكفاءة”: في تجربة Qwen3-8B-Base على SciencePedia، حققت الورقة نتائج أفضل باستخدام 500 مليون وحدة تدريب (tokens) بدل 3 مليار وحدة أي بيانات أقل بحوالي 6×، وهذا يترجم عمليا إلى حوسبة أقل، وقت تدريب أقل، وتكلفة أقل مع أداء أعلى الورقة تتجاوز 40 صفحة وفيها تفاصيل تقنية وتجارب كثيرة حاولت هنا تلخيص الفكرة الأساسية بأكبر قدر ممكن من الوضوح. إذا يهمك التعمّق أو الاطلاع على الأرقام والمنهجية كاملة، أنصح بقراءتها مباشرة: arxiv.org/pdf/2602.05400
Saad tweet media
العربية
1
25
216
13.3K
Omar
Omar@O2mar_·
يوم الحبايب زين اذا الواحد حب نفسه
العربية
0
0
0
163
Omar
Omar@O2mar_·
اتوقع هالمباراة متحمس لها اكثر من زواجي اليوم
Omar tweet media
العربية
0
0
0
169
Omar
Omar@O2mar_·
جاني عرض من شركه رحت لحقين الدوام بنفس اليوم قلتلهم خلاص مع السلامه العرض سحبوه انا :
Omar tweet media
العربية
0
0
1
411
Omar
Omar@O2mar_·
نونيز وليوناردو
Omar tweet media
العربية
0
0
0
228