bahman atashbartehrany

140 posts

bahman atashbartehrany banner
bahman atashbartehrany

bahman atashbartehrany

@atashbartehrani

Ai engineer , trader

Inscrit le Eylül 2023
185 Abonnements6 Abonnés
عادل طالبی
عادل طالبی@AdelTalebi·
@atashbartehrani من برای اصلاح کدهای قبلا نوشته شده پایتون و بهبود سرعت اجرا استفاده کردم که عالی بود. کدهای عالی اپوس ۴.۶ را طوری اصلاح کرد که اجرای کدهایی که حتی ۲ ساعت طول می کشید با کامپیوتر معمولی من، حالا ۱۰ دقیق انجام می شود. چند مورد را نوشتم. در توییت های سه چهار روز پیش هست
فارسی
0
0
0
59
عادل طالبی
عادل طالبی@AdelTalebi·
هر کس گفت Fable 5 فرقی با Opus 4.8 یا چه می‌دونم کدکس و چی‌چی تی‌پی‌تی و غیره نداره، محکم، با آخرین زورتون، بزنید تو گوشش. شما نمی‌دونید چرا زدید ولی اون خودش یا می‌دونه و حقشه و یا نمی‌دونه و حرف زده که قطعا حقشه. همین.
فارسی
4
0
29
1.4K
Arta🧠
Arta🧠@arta_asd·
فهمیدم که باید یه Distillation suite بنویسم که چیزی که میخوام رو اعم از CoT و ToT کپچر کنه برای Offline distillation اینایی که هست جواب کارم رو نمیده من سه تا ویژگی کامل میخوام: Local model, colab support BYOK و BYOK + FreeLLMAPI شروع کردم بنویسمش
1
0
15
769
Peter Gostev (SF: 22-26 June)
Le Chaton Fat: We have requested an urgent authorisation from the French government to extend the axis to display the result on the Agent Arena
Peter Gostev (SF: 22-26 June) tweet media
Arena.ai@arena

Exciting news: Claude Fable 5 ranks #1 on the new Agent Arena leaderboard! Fable 5 leads by the widest margin ever over Opus-4.8 and GPT-5.5 on two key signals: confirmed task success rate and praise vs. complaint, despite weaker steerability. If Fable can do something, it will do it very well. If it can't/doesn't want to do something, it may be hard to steer the model towards the goal. In Agent Arena, we measure models on millions of real-world, long-horizon agentic tasks. Models get web search, filesystem, and terminal tools to complete complex workflows: writing code, creating slide deck, researching the web, building apps, and analyzing documents. We use the causal tracing methodology to measure a model's net improvement which indicates how much it improves outcomes relative to the average model. Huge congrats to @AnthropicAI for the incredible milestone! Below we break down how Claude Fable 5 (based on Mythos) scored across 5 signals, drawn from tasks submitted by a global community of users.

English
44
55
1.3K
163.2K
KHAN
KHAN@khanmohamadi81·
@atashbartehrani آقا بیا پی وی یه صحبتی داشته باشیم به نظرم
فارسی
1
0
0
6
KHAN
KHAN@khanmohamadi81·
امروز یه تست سریع از gemmaDiffusion 26B بگیریم ببینیم چیجوریاس
فارسی
2
0
2
159
Nahid
Nahid@nahid_pro09·
DeepSeek just dropped 5M FREE tokens — no credit card, no gimmicks😳 If you’re still paying for baseline LLM access to test your apps, you’re burning cash. DeepSeek is currently the hottest model in the space, and they’re letting developers test their infrastructure for free. what you get for $0: -5M free tokens on signup -No credit card required to start -Opt-out settings for data privacy (training-prompt exclusion) -30-day window to build and test before moving to pay-as-you-go -what you can build right now: -High-reasoning AI coding assistants -Custom R1-powered applications -RAG pipelines for private data -Complex agentic toolchains that actually think why this matters: >most developers are locked into expensive provider tiers >this is perfect for prototyping, benchmarking, and local dev >gives you the runway to prove your concept before hitting the API bill how to get started (1 min): ->go to the DeepSeek platform ->sign up with your email ->verify your account ->grab your API key and start prompting important: >5M tokens expire after 30 days — use them or lose them >perfect for testing the limits of R1 reasoning >community-vetted, widely used in the open-source ecosystem >keep your API keys secure (never commit them to public repos) >don't wait for your trial to end >start building with DeepSeek for $0 while everyone else is still debating costs, you should be shipping bookmark this before payying for extra api link in comment↓
Nahid tweet media
English
11
9
117
10K
David Ondrej
David Ondrej@DavidOndrej1·
Le Chaton Fat makes Fable look like ancient technology who knew the French were the closest to AGI all along…
English
59
35
787
68.6K
bahman atashbartehrany
bahman atashbartehrany@atashbartehrani·
@khanmohamadi81 این مدلها سرعتشون بالاست میشه روی اونها روش‌هایی مثل MCTs پیاده سازی کرد ، کلا به نظرم میشه فاین تیون کردشون بعد با چند دفعه خروجی گرفتن جواب دقیقی گرفت
فارسی
1
0
1
9
bahman atashbartehrany
bahman atashbartehrany@atashbartehrani·
@khanmohamadi81 اونم دیفیوژن هست ، ده میلیون توکن رایگان میده ، سرعتش خیلی بالاس ، اگه دوست داری ایده دارم رو فاین تیون جما ، کار کنیم
فارسی
1
0
1
14
KHAN
KHAN@khanmohamadi81·
@atashbartehrani حاجی اینو تست نکردم ولی خیلی از این diffusion llm ها خوشم میاد یه مدتی باید برم کامل بخونمشون
فارسی
1
0
0
16
bahman atashbartehrany
bahman atashbartehrany@atashbartehrani·
@mseymari_ به نظرم همین مهندسی معکوس بوده ، ظرف دو روز من دیتا ست دیدم رو hf
فارسی
0
0
0
13
mohammad seymari
mohammad seymari@mseymari_·
گویا دلیل اصلی محدودیت ناگهانی Anthropic، نگرانی از دسترسی احتمالی یه گروه چینی به مدل Mythos 5 و مهندسی معکوس بوده! یعنی جلوگیری از امکان Distillation یا «تقطیر مدل»! یعنی مدل AI ضعیف‌تر می‌تونه با یادگیری از پاسخ‌های مدل بسیار قدرتمند، بخشی از توانایی‌های اون رو بازسازی کنه!!!
The Verge@verge

China may have accessed Mythos theverge.com/ai-artificial-…

فارسی
1
0
3
125
Mistral AI
Mistral AI@MistralAI·
Mistral’s AI Now Summit is coming to Paris on May 28 and tickets are live! What you’ll hear: 📷 Technical deep dives to help you build and deploy AI. 📷 Mistral’s founders on AI-driven transformation in large organizations, company trajectory, and upcoming releases. One day to leave with: ✅ Hands-on techniques to deploy and scale AI ✅ Practical insights on AI use cases ✅ Connections with peers to help you build your own AI Get your pass now → ainowsummit.com
Mistral AI tweet media
English
66
69
495
162.6K
Navid Taheri
Navid Taheri@naviidtaheri·
دورانِ مدل‌های Frontier رسماً تموم شد! با قابلیت جدید Fusion در پلتفرم OpenRouter، ترکیب موازی چند مدل ارزان و اقتصادی (مثل Gemini Flash + Kimi + DeepSeek) امتیازی نزدیک به Fable 5 یا حتی بالاتر از GPT-5.5 و Opus 4.8 می‌گیره… اون هم با نصف قیمت! 🧵
OpenRouter@OpenRouter

Introducing the Fusion API, the smartest compound model in the market. Fusion achieves Fable-level intelligence at half the price. How it works 👇

فارسی
5
6
135
20.8K
bahman atashbartehrany
bahman atashbartehrany@atashbartehrani·
@PsyopBaz متشکرم خیلی دقیق و کامل توضیح دادید ، ممنون از وقتتون
فارسی
0
0
1
15
Sed
Sed@PsyopBaz·
Sed@PsyopBaz

یه Data & Analytics Agent نیاز داشتیم که بتونه آمار دقیق و Real Time یوزرها و interactionشون تو بخش‌های مختلف و با فیچرهای سایتمون رو با کوئری از دیتابیس (با دسترسی های درست و کافی با در نظر گرفتن کامل امنیت) پیدا کنه و جواب بده. مثل یه ‌چت‌بات داخلی که توی slackمونه و به همه‌ی اطلاعات آماری یوزرهامون دسترسی داره. حدود یک‌ماهی میشد که ایده‌ش رو داشتیم یه wishlist گروهی درست کرده بودیم از سوال‌هایی که این ایجنت «باید بتونه» جواب بده. حدود ۸۰ تا سوال اساسی بود. من تجربه‌ی ساخت ایجنت‌های مشابه این رو داشتم و به‌کمک ابزارهایی که تا اونموقع در اختیار داشتیم، برآوردمون از مدت‌زمان لازم واسه تحقیق و ساخت و تست و عملیاتی شدن نسخه‌ی (مثلاً) آلفای این بات تو slackمون حداقل یک‌هفته بود. قرار بود هفته‌ی آینده رو بذاریم واسش. ولی Fable 5 اومد. و من (تقریباً) کل کاری که کردم این بود که به Claude Code (که با connector به slackم وصله) گفتم اون سوالات رو از اسلک بخونه، نحوه‌ی دسترسی به دیتابیس (که البته تو claude.md بخش زیادیش بود) و حدود حداکثری دسترسی برای این بات روی سرور prod و staging رو تعریف کردم. /effort رو گذاشتم روی ultracode و ازش خواستم به‌کمک subagentهاش ریسرچ و investigate کنه قبل شروع. وقتی این workflow تموم شد چندتا سوال و جواب و تصمیم‌گیری‌های مهم و کارهای manual تنظیم کردن بات slack از طرف من بود که انجام دادمش و کانتکستی که واسه شروع کار لازم داشت رو کامل‌تر از قبل واسش آماده کردم. بعدش /loop رو فعال کردم و ازش خواستم تا وقتی بات به تمام اون سوالات wishlistمون تو slack جواب درست نداد واینسته. و بوم. ۲ ساعت بعد تموم شد. و بات کار می‌کرد! همه همکارا تو اسلک تگش میکردن. چندتا اشکال جزئی تو formating خروجی اسلک بود و یکم هم با دیدن نحوه‌ی همکار‌هامون با این بات تازه‌متولدشده باعث شد بعد یکی دو ساعت چندتا پرامپت دیگه هم تو همون سشن مربوط به ساخته‌شدن این پروژه رد و بدل کنیم و تمام. بات درست شد. و داره خیلی بهتر از انتظارات اولیه‌مون کار میکنه. و یه‌چیزایی تا همین الان از الگوی استفاده‌ی کاربرها به‌کمکش فهمیدیم که پشمای همه‌مون ریخته.

QME
1
0
0
30
Sed
Sed@PsyopBaz·
نمیدونم چندتاتون، چقدر تونستید از Fable استفاده کنید. ولی حسی که من بعد از اولین تجربه‌ی جدی از این مدل (تسک‌های مرتبط به‌ کار) داشتم مثل روزی بود که واسه اولین بار با GPT 3.5 صحبت کردم. جادویی. مدل بسیار قوی و کلی‌نگر و مورداعتماد. ورای هر مدلی که تا الان باهاش سر و کار داشتم و تو کدزدن ازش کمک می‌گرفتم. به‌شکلی که تسکی که قرار بود هفته‌ی آینده‌م رو کلا روش باشم، به کمک Fable تو فقط دو‌ساعت‌ونیم تموم شد. باور و قبولش واسه خودمم سخت بود. برنامه‌ی تیم کلاً تغییر کرد و قرار شد تا وقتی به فیبل تو اکانت‌های Maxمون دسترسی داریم (۲۲ جون) پروژه‌هایی که داشتن تو بک‌لاگ خاک می‌خوردن رو بسپاریم بهش. و همه‌چی هم داشت خیلی خوب و ورای برنامه‌ریزی‌هامون پیش می‌رفت. نمی‌دونم «اگه» دسترسی به Fable محدود نمیشد تا کی قرار بود از nerf کردن‌های انتروپیک در امان بمونه و ما دقیقاً به همون مدل دسترسی داشته باشیم. و نمی‌دونم اگه قرار باشه دوباره با همین اسم برگرده، دقیقاً همین مدله یا نه. ولی Fable نزدیک‌ترین تجربه‌ی من به AGI و به‌نظرم بهترین جواب واسه کسایی که از دوران GPT4 معتقدند که «راه AGI از LLMها نمی‌گذره» بود.
maria@maria_rcks

I’m suffering from post-Fable depression

فارسی
7
1
70
8.4K