Phyrexia AKA GG

21.3K posts

Phyrexia AKA GG banner
Phyrexia AKA GG

Phyrexia AKA GG

@phyrexia

Geek, Gamer, Maker, Friend, Dad. Former Rioter IBMer ~ Trabajando para ser feliz día a día, N∂maste ~ Mis opiniones son mias y de nadie más.

Chile Katılım Şubat 2008
1.6K Takip Edilen620 Takipçiler
Phyrexia AKA GG
Phyrexia AKA GG@phyrexia·
El fin de semana se hizo para programar, 500.000 loc en 2 días! Y contando!
Español
0
0
0
12
Phyrexia AKA GG
Phyrexia AKA GG@phyrexia·
@steipete How many hours of sleep are you getting? I’ve learn is inverse to the tokens burned daily.
English
0
0
0
106
Peter Steinberger 🦞
my brain: don't read the hacker news comments, don't read the hacker news comments me: reads the hacker news comments
English
74
14
768
64K
Phyrexia AKA GG
Phyrexia AKA GG@phyrexia·
Just a small widget in my phone (hardware widget) to track my usage and agents
English
0
0
0
10
Phyrexia AKA GG
Phyrexia AKA GG@phyrexia·
@steipete Great insight, I’ve been coding like my tokens are unlimited and went to x40 results, 30.000loc in a day , actually I think I have more ideas than projects at this point!
English
0
0
0
28
Peter Steinberger 🦞
People freaking out over my AI spend. What nobody sees: Part of what excites me so much about working on OpenClaw is that I'm trying to answer the question: How would we build software in the future if tokens don't matter? We constant run ~100 codex in the cloud, reviewing every PR, every issue. If a fix on main lands, @clawsweeper will eventually find that 6 month old issue and close it with an exact reference. We run codex on every commit to review for security issues (as it's far too easy to miss). We run codex to de-duplicate issues and find clusters and send reports for the most pressing issues. We have agents that can recreate complex setups, spin up ephemeral crabbox.sh machines, log into e.g. Telegram, make a video and post before/after fix on the PR. There's codex that watch new issues and - if it fits our documented vision well, automatically create a PR of it. (that then another codex reviews) We have codex running that scans comments for spam and blocks people. We have codex instances running that verify performance benchmarks and report regressions into Discord. We have agents that listen on our meetings and proactively start work, e.g. create PRs when we discuss new features while we discuss them. We build clawpatch.ai to split all our projects into functional units to review and find bugs and regresssions. We do the same split for security with Vercel's deepsec and Codex Security to find regressions and vulnerabilities. All that automation allows us to run this project extremely lean.
English
497
399
7.2K
1.9M
Phyrexia AKA GG
Phyrexia AKA GG@phyrexia·
Creo que ayer rompí mi récord 30000+ LOC trabajando en mis proyectos realmente estamos en una época maravillosa donde puedes pasar de las ideas a algo concreto en horas.
Español
0
0
0
13
Claude
Claude@claudeai·
Effective today, we are: 1) Doubling Claude Code’s 5-hour rate limits for Pro, Max, and Team plans; 2) Removing the peak hours limit reduction on Claude Code for Pro and Max plans; and 3) Substantially raising our API rate limits for Opus models.
English
1.3K
4K
44.6K
9M
Claude
Claude@claudeai·
We’ve agreed to a partnership with @SpaceX that will substantially increase our compute capacity. This, along with our other recent compute deals, means that we’ve been able to increase our usage limits for Claude Code and the Claude API.
English
4.8K
12.1K
131K
23.7M
Cristian Córdova 🐧
Cristian Córdova 🐧@barckcode·
Primera app hecha 100% con el Qwen 3.6 servido por el server de la comunidad de NaN. Es un bot sencillo de Discord, que hace RAG de algunas docs de la comunidad (modelo de embeddings tambien servido por el server de la comunidad) para responder dudas y recomendar configuraciones
Cristian Córdova 🐧 tweet media
Cristian Córdova 🐧@barckcode

Pues oficialmente echó a andar el primer server de la comunidad de NaN. ~30 personas construyendo con modelos OS de diferentes características y finalidades. Ahora si a quemas tokens y poner esas GPUs al rojo vivo 🔥 Podeis uniros aún a la waitlist: nan.builders

Español
3
1
58
5.1K
Phyrexia AKA GG
Phyrexia AKA GG@phyrexia·
@vodafone_es El servicio es muy malo, la red saturada , bloquean tráfico, no se los recomiendo para nada
Español
1
0
0
42
Vodafone España
Vodafone España@vodafone_es·
Una red preparada para un consumo cada vez más exigente. En Semana Santa 2026, nuestros clientes aumentaron el uso de datos móviles un 17,2%, impulsados por el despliegue de la red 5G (+47%) y la creación de contenido en redes por parte de los usuarios. El tráfico de subida creció un 66%, reflejo de un consumo más simétrico y de alta capacidad. Seguimos invirtiendo en una red robusta, cuando más se necesita 🚀 #VodafoneEspaña #5G #Conectividad #DatosMóviles #SemanaSanta2026
Vodafone España tweet media
Español
10
2
8
2.6K
Phyrexia AKA GG
Phyrexia AKA GG@phyrexia·
@vodafone_es El servicio es muy malo, la red saturada , bloquean tráfico, no se los recomiendo para nada
Español
0
0
0
25
Phyrexia AKA GG
Phyrexia AKA GG@phyrexia·
@barckcode Me viene pasando exactamente lo mismo y justo desde marzo, no sé si usar el code viejo lo arregla.
Español
0
0
0
34
Cristian Córdova 🐧
Cristian Córdova 🐧@barckcode·
🤔 Están muy bien los papers y sus benchmarks pero cuando el río suena… Lejos de hablar de la sensación generalizada de muchas personas muy top, voy a dar mi humilde opinión. Llevo usando Claude Code casi desde la Beta. Opus 4.5 fue un antes y un después y Opus 4.6 fue una gran evolución. Hasta ~finales de Marzo todo iba como la seda. Llevo con un harness para desarrollo local que he ido iterando desde Noviembre del año pasado y me daba resultados fantásticos. Los equipos de agentes de Claude Code eran una maravilla (que quema tokens como locos pero una maravilla) Desde que empezó Abril sin embargo ha empezado a haber cosas muy raras: - peores respuestas en general (tanto para administrar infra como para desarrollar) - estimaciones de tiempo random que nadie le ha pedido (Ejem: “voy a tardar 12h en esta tarea” luego tarda 3 minutos y mal) - se salta reglas deliberadamente indicadas en sus ficheros de config de múltiples formas cosa que antes nunca hacía - se salta levantar su equipo de agentes y toca recordárselo, incluso sin haber compactado su contexto antes Podría listar mil cosas pero el resumen es el mismo y repito que si varias personas hemos notado lo mismo. Raro es que algo no hayan tocado por mucho que digan que no. Opus 4.7 se siente “igual” que cuando salió Opus 4.6 pero con la diferencia de que con el nuevo tokenizador usa ~el doble de tokens que antes. Lo que equivale a gastarte antes tus límites… y mira que tengo el Max x20 pero pues me da que están allanando el terreno para un plan superior dentro de no mucho. En fin, repito que esta sensación es bastante generalizada. No algo de 2/3 personas. Por lo que la skill issue pues bueno, podría decir quizá de mí pero de otra gente mucho más top que yo me extrañaría. Lo importante de todas formas es ser críticos con lo que usamos para obtener un mejor servicio. Si simplemente leemos un paper y vemos un benchmark y aplaudimos no sirve para nada y el servicio empeora. Pasa con todo, no solo con esto.
Julio César Fernández @jcfmunoz

1. Opus 4.7 es otro modelo. No es 4.6 2. Opus 4.6 no ha sido nerfeado en forma alguna. Funciona igual de bien que al principio (si sabes usarlo, claro). 3. El nuevo tokenizador de Opus 4.7 es parte de la capacidad de mejora del modelo. 4. Si no te gusta, ahí tienes GLM u otros. Esto no está copiado y pegado de otros: esto es trabajo real, lectura de papers, estudio y compresión.

Español
14
10
179
37.5K
Phyrexia AKA GG
Phyrexia AKA GG@phyrexia·
@barckcode Buenisimo como vas a manejar los limit, concurrencia, credenciales etc? Tienes tu propio gateway?
Español
1
0
0
170
Cristian Córdova 🐧
Cristian Córdova 🐧@barckcode·
Ya me lo han habilitado! 🔥 Vamos a quemar esta RTX 6000 con 96GB de vRAM como si no hubiera un mañana. Tengo ahora que hacer aún todo el setup (instalarle el SO, el stack para servir modelos, etc) pero bueno, queda nada. Seguramente haga un post de todo el setup que haga aquí
Cristian Córdova 🐧 tweet media
Cristian Córdova 🐧@barckcode

Ya he solicitado el primer server para la comunidad de NaN. Lo montaré en EU con todos los juguetes para poder empezar a quemar tokens como locos sin limites. Nos quedan pocas plazas para empezar a levantar el server de LATAM/USA también. ¡Apúntate! nan.builders

Español
8
4
62
12.3K
Phyrexia AKA GG
Phyrexia AKA GG@phyrexia·
@vodafone_es Que mal anda la red de Vodafone, hacen traffic shapping, mucho packet loss en las tardes sobre todo, una red sobresaturada y lenta... pensando en subir una web de monitoreo y reclamo de los clientes.
Phyrexia AKA GG tweet media
Español
1
0
0
102
Phyrexia AKA GG
Phyrexia AKA GG@phyrexia·
@ugogofx 24gb es poco considerando que es compartida con la gpu si usas cosas intensas tu gpu al Menos usará 16gb (con llm mucho más ) y deja solo 8 para el so lo que es poco revisa tu monitor donde está el problema, Apple por defecto limita el máximo de gpu pero creo que de base 32+
Español
0
0
0
83
Ugo | Miniamaker
Ugo | Miniamaker@ugogofx·
c’est invivable de bosser avec, je suis deg l’écran est vraiment beau, le processeur est fou mais : - 24go de ram c’est vrmt pas suffisant, dès que j’ouvre chrome + photoshop + discord ça lag de fou, tu peux avoir que quelques petites app ouvertes en même temps vrmt l’enfer - la consommation du mac, sans rien, juste avec le ProMotion je suis à 25W de conso mdrrrrr je sais pas si c’est moi qui a un problème ou si c’est comme ça mais j’ai maximum 4-5h d’autonomie (sur les 26h annoncé) je suis chaud d’avoir vos retours d’expérience parce que sois je suis maudit soit le produit me correspond juste pas mdr
Ugo | Miniamaker@ugogofx

le nouveau bébé

Français
477
15
784
1.5M
Phyrexia AKA GG
Phyrexia AKA GG@phyrexia·
@JohnGalt_is_www Algo de la matemática no cuadra, los modelos open source son un peldaño más abajo que los modelos de frontera y los de frontera están por debajo de los nuevos desarrollos como Mythos, por lo que es bueno poder correr open source local y barato privado pero no es lo mismo ni cerca
Español
0
0
0
422
ae^((-(x-b)^2)/(2c^2))
ae^((-(x-b)^2)/(2c^2))@JohnGalt_is_www·
Alquilando la rtx 5090 en runpod la ecuacion te da menos de USD 0.01 el millon de tokens BTW, Google te da 14k requests gratis por dia de todos los gemma4, pero es para hacer un costo real Si quisieras hacerte tu propio plan "claude max" nivel sonnet 4.5 al precio que vale ese computo hoy, te daria un costo de unos USD 2/mes con toda la furia, sin depender de una empresa china ni nada de eso, algo que hace solo 3 meses lo pagaban 200usd a una empresa que quema 30B/yr para dar ese servicio a ese precio, ese es el nivel de locura en el que estamos No tiene sentido que algo sea tan ineficiente, quiero decir, si, hay nichos en los que justificará, pero son los menos, tarde o temprano la necesidad de eficiencia en costos va a acomodar todo esto que hoy esta roto
Lila@LilaRest

Introducing 𝐆𝐞𝐦𝐦𝐚 𝟒 𝟑𝟏𝐁 𝐓𝐮𝐫𝐛𝐨 ⚡️ It runs on a 𝘴𝘪𝘯𝘨𝘭𝘦 RTX 5090, at 51 tok/s (single) and 1244 tok/s (batched). And prefills up to 15359 tok/s. It's 𝟔𝟖% 𝐬𝐦𝐚𝐥𝐥𝐞𝐫 in GPU memory and ~𝟐.𝟓𝐱 𝐟𝐚𝐬𝐭𝐞𝐫 than the base model, and retains nearly 𝐢𝐝𝐞𝐧𝐭𝐢𝐜𝐚𝐥 𝐪𝐮𝐚𝐥𝐢𝐭𝐲 on benchmarks (1-3% loss). Turbo is a derivative of the NVFP4 quant that NVIDIA released a few days ago. It fully leverages NVIDIA Blackwell FP4 tensor cores for ~𝟐× 𝐡𝐢𝐠𝐡𝐞𝐫 𝐜𝐨𝐧𝐜𝐮𝐫𝐫𝐞𝐧𝐭 𝐭𝐡𝐫𝐨𝐮𝐠𝐡𝐩𝐮𝐭 𝐭𝐡𝐚𝐧 𝐨𝐭𝐡𝐞𝐫 𝐪𝐮𝐚𝐧𝐭𝐬. I'm using it for hard classification tasks — on internal benchmarks it showed 𝐒𝐨𝐧𝐧𝐞𝐭-𝟒.𝟓-𝐥𝐞𝐯𝐞𝐥 𝐢𝐧𝐭𝐞𝐥𝐥𝐢𝐠𝐞𝐧𝐜𝐞 (scored well above Haiku 4.5), at a 600𝘵𝘩 of the cost. A single RTX 5090 scales up to 18 req/s at 1000in/20out 🥵. Model card and benchmark in comments 👇 I'd love to hear your use cases.

Español
40
62
1.2K
149.6K
Dani
Dani@danitoszwarc·
El tweet de @miriamgonp me empujó hacia la IA orientada a la salud. @javilop pasó una semana aplicando IA al historial médico de Míriam y compartió su metodología. Yo lo hice app. MedSynth: análisis adversarial para historiales médicos complejos. github.com/daniszwarc/Med…
Español
24
49
222
43.9K