moscato
133 posts


AMD acaba de dar un golpe fuerte en la IA local.
Lisa Su subió al escenario con un mini PC del tamaño de un libro grueso en una sola mano y ejecutó en vivo un modelo de 235 mil millones de parámetros. Sin datacenter. Sin cloud. Sin alquilar GPUs.
El protagonista es el Ryzen AI Max+ 395 (Strix Halo). Es el primer chip x86 que une CPU y GPU con 128 GB de memoria unificada. En Linux, el GPU puede usar hasta ~110 GB de esa memoria.
Para ponerlo en contexto: una RTX 5090 tiene 32 GB y una 4090 tiene 24 GB. Este pequeño equipo ofrece más del triple de memoria accesible para modelos grandes, en un chasis compacto.
En pruebas específicas de inferencia (como DeepSeek R1), superó en más de 3x al rendimiento de una RTX 5080 cuando el modelo no cabe en la VRAM de la tarjeta de Nvidia.
El precio real del equipo con 128 GB (GMKtec EVO-X2) suele estar entre $1,800 y $2,500 según ofertas (el kit oficial de AMD es más caro).
Para quien usa mucho IA, esto cambia las cuentas: en vez de pagar cientos de dólares al mes en suscripciones (Claude, ChatGPT Pro, Cursor, etc.), puedes correr modelos potentes localmente con Ollama, LM Studio o similares. Privacidad total, sin límites de tokens y sin que te corten el servicio a las 3 a.m.
No es que las suscripciones vayan a desaparecer mañana, pero para muchos casos de uso (RAG con documentos privados, prototipos, agentes locales, etc.) esta opción se vuelve muy atractiva.
Estamos viendo el inicio de una nueva etapa de IA local accesible y potente??
Español

最近在带入组的本科实习生,发现怎么读论文其实是科研训练里最容易被忽略的一步。
推荐一篇每个科研新人都该读的经典短文:S. Keshav 的 How to Read a Paper。
文章提出了非常实用的“三遍读论文法”:
第一遍,5 到 10 分钟快速扫读:标题、摘要、引言、章节标题、结论和参考文献。
目标是回答 5C:
Category, Context, Correctness, Contributions, Clarity。
也就是判断这篇论文是什么、和谁相关、假设是否合理、贡献是什么、写得清不清楚。
第二遍,认真读论文主线,但先跳过证明细节。重点看图表、实验设置、结果是否清楚、引用了哪些关键工作。
第三遍才进入深度理解:尝试像复现一样重建作者的思路,检查假设、方法、创新点和潜在漏洞。
放在今天看,这个方法和 AI 辅助读论文其实很契合。
第一遍可以让 AI 帮忙快速总结论文的研究问题、核心贡献和主要结论,但自己一定要判断这篇文章是否真的值得继续读。
第二遍可以让 AI 帮忙解释方法、实验设置、图表和不熟悉的概念,但不能只看 AI 总结。关键图表、实验设计和结果数字一定要回到原文核对。
第三遍可以让 AI 扮演 reviewer,帮你追问:这篇文章的假设是否成立?实验是否支持结论?有没有 missing baseline?有没有潜在的数据泄漏、评价偏差或过度 claim?
读论文不是“读完”就行。真正重要的是知道什么时候快速跳过,什么时候认真理解。
尤其在 AI 工具越来越强的情况下,科研新人更需要训练自己的判断力。
AI 可以帮你压缩信息,但不能替你决定一篇论文是否重要、是否可信、是否值得借鉴。
web.stanford.edu/class/ee384m/H…

中文

验证了我的猜想,川子早就在五角大楼提供武器的时候就和anthropic结下梁子了,他是个记仇的总统,整达里奥的方法不计其数,这次fable5只是前菜。
CuiMao@CuiMao
有人问我阿迪王这么没去,我真的句真心话,达里奥真配不上,他算什么东西呢,还没上市就整天这么傲,等上市了川普有100000种方法收拾他。
中文

开什么国际玩笑?
Claude 的 Fable 5 模型我刚体验两天就被禁止使用了?
本来就是奔着 Fable 5 花了真金白银才去的,直接禁用不合理吧?是不是得免除会员费了?


Jove. 💚 💧@0xJoveXu
Claude 史上最强模型 Fable 5 发布了 之前我一直用的都是 CodeX ,但最近用的时候发现被降智,做出来的图片比以前差了好多 然后我自己搭建过 VPS ,花了 169 U 一年。结果呢,节点还是不够纯净,依然是厂房 IP 花费了力气效果还不好,也是没招了。今天偶然发现有一个直接接入美国家宽的机场,专门做高质量独享静态住宅的 IP 。 我买了一个体验了一下,确实牛逼啊。Claude 账号不会封了,直接用上不降智的满血版 AI 这个巨巨重要!我之前是被网速折磨的不行,现在是被生产力不足折磨的不行。 现在按照我的搭配,Claude Fable5 模型配上住宅 IP 直接享受到人类最高的科技。这几百块钱花的真值! 👉equaldcdn.com/?ref=f37bcfe282
中文




















