Alex

558 posts

Alex

@randhufflepuff

Earth Beigetreten Şubat 2018

2.3K Folgt91 Follower

Alex@randhufflepuff·6d

@0xTib3rius @GriFdotpy It matches my experience. Some prompts are extremely token intensive. For example: ‘Review this Swift project for performance issues, logic problems, etc.’ The full prompt is more than 1,000 words, and it burns through your daily limits very quickly.

English

Tib3rius@0xTib3rius·6d

@GriFdotpy Oh yeah they were. Basically huge iterative research + dev loops. People pointed out mistakes I was making which meant the cache reads were insane. I've fixed how I run it now. But even still, that was a weekend of token spend.

English

4.2K

Tib3rius@0xTib3rius·6d

4 prompts just reviewing previous work this morning, and I'm at 61% of my session limit, on the $100/mo plan. I love Claude Code but this is getting really stupid.

English

777

70.4K

Alex@randhufflepuff·10 Mar

@XMihura @Merymer code.claude.com/docs/en/permis… según entiendo configurar un deny edit debe servir para tu escenario.

Español

Alex@randhufflepuff·10 Mar

@XMihura @Merymer ¿Cuántas reglas tienes, cuál modelo usas normalmente, existen reglas contradictorias, has intentado mover esta instrucción al principio? Querer construir algo agnóstico limita mucho, aunque espero que todo el mundo acabe copiando los permisos de Claude Code.

Español

Mihura@XMihura·10 Mar

A ver, consulto al simcluster que estoy mejorando el workflow con Obsidian y busco ideas el workflow funciona bastante bien, excepto por una cosa: - el agente a veces se "olvida" de las reglas y modifica el archivo .canvas (es un .json) de forma "ilegal" normalmente no es un problema, pero me gustaría hacerlo "bien" he pensado en lo siguiente: - crear una CLI tool en python, con funciones limitadas de lectura y de escritura, para que el agente interaccione con el .canvas, en vez de editar el archivo directamente - proteger el .canvas para que el agente solo pueda editarlo a través del CLI de esta manera garantizo que el agente no se salte las reglas Alguna idea más limpia? Importante: necesita ser "agent agnostic", es decir, debe ser independiente de Claude Code, Codex, Gemin CLI, Cursor... mi set-up ahora sería un rules.md con las reglas y un .py con el CLI qué opináis?

Mihura@XMihura

hoy le estoy echando un rato a construirme un protocolo para trabajar con agentes la idea es la siguiente: tener un espacio donde tanto yo como el agente podamos añadir y ejecutar tareas dentro de un proyecto. también me interesa que tenga en cuenta dependencias y jerarquías entre las distintas tareas de momento estoy construyendo un set-up SENCILLO y FÁCIL de usar he elegido como base para trabajar un documento CANVAS de Obsidian que Claude Code pueda editar y un archivo rules .md con la descripción del protocolo y reglas tanto para mí como para el agente por ejemplo, una regla es que el agente puede proponer tareas (en MORADO) pero yo soy quien las aprueba poniéndolas en ROJO o que yo soy el que decide cuando una tarea está completa cambiando el color a VERDE cuando un agente empieza una tarea esta se pone en NARANJA así puedo ir siguiendo visualmente el progreso del proyecto qué opináis? si os interesa cuando tenga algo sólido puedo compartir el protocolo de forma más formal

Español

9.3K

Alex@randhufflepuff·10 Mar

@gukras @DamianCatanzaro Si tienes activado el uso adicional aplica otra matemática aquí. Es desde luego similar a lo que han hecho con el modo rápido, no consume del plan (Codex sí lo hace) y no es nada barato. Se están acercando al modelo de Cursor con estas novedades.

Español

Alex@randhufflepuff·10 Mar

@gukras @DamianCatanzaro Es el costo de la API sin ninguna duda. Por dos cosas: es caro y te están informando de antemano. Cuando usas Claude Code importa poco cuanto puede costar una operación, no vas a pagar más allá de la suscripción. Si sobrepasas el límite de las 5 horas toca esperar, nada más.

Español

Damián Catanzaro ☕️@DamianCatanzaro·10 Mar

Perdón!?

Claude@claudeai

Code Review optimizes for depth and may be more expensive than other solutions, like our open source GitHub Action. Reviews generally average $15–25, billed on token usage, and they scale based on PR complexity.

Español

655

183.4K

Alex@randhufflepuff·8 Mar

@Shinnzo_xd Perhaps not. 5.4 is a fusion between a main/thinking model and a codex model.

English

ShinZo@Shinnzo_xd·8 Mar

@jxnlco @airkatakana @OpenAIDevs So GPT-5.4 Codex coming?

English

147

Air Katakana@airkatakana·8 Mar

why does codex have 3 "latest" models? why is there a gpt-5.4 but no gpt-5.4 codex? am i supposed to use regular gpt-5.4 in codex? is gpt-5.4 actually gpt-5.4-codex but they just named it differently? it says it's an agentic coding model please help @OpenAIDevs

English

541

101.7K

Alex@randhufflepuff·8 Mar

ZXX

Alex@randhufflepuff·8 Mar

@Xene1042 @accelereta42_ Solamente trabajar te consume mínimo 8 horas al día, luego en el tiempo de ocio habrán actividades con mayor prioridad que otras, leer comparado con ver algo en Netflix. Aunque no quiere decir que no hagas las dos. Por último, sábado y domingo son demasiado cortos.

Español

Miguel Gurrea 🇪🇺🇺🇦@Xene1042·7 Mar

@accelereta42_ ¿Por qué no puedes profundizar?

Español

139

Acelerador@accelereta42_·7 Mar

yo hice un examen de francés en RPG Maker allá por el 2014. Con doblaje y todo. Qué tiempos aquellos, realmente no hay nada peor que ser listo de pequeño para darte cuenta de que sólo eres uno más y nunca podrás profundizar de verdad en los temas que te interesaban.

Lumberjack Eleanor, Mistress of Demon Judo@dreadoftherave

People were doing incomprehensible things with RPG Maker 2000 back in 2008

Español

1.1K

Alex@randhufflepuff·28 Şub

@juanmacias @AnthropicAI Incluso el creador de Claude Code recomendó hace mucho luego de cada implementación lanzar una tarea de limpieza para simplificar. Ahora en la última versión está disponible como comando. Es curioso que sea necesaria una fase de postprocesado.

Español

Alex@randhufflepuff·28 Şub

@juanmacias @AnthropicAI Hay tareas que consumen tokens a lo bestia. Por ejemplo: revisar todo el proyecto buscando problemas de rendimiento, vulnerabilidades, errores de concurrencia o lógicos etc. Ahí toca limitar el alcance y claramente pagar el plan Max, con el 5x es suficiente.

Español

2.5K

juanmacias 🏳️‍🌈@juanmacias·28 Şub

Lleva unos días Claude Code consumiendo muchísimo, inicialmente (como buen humano) le he echado la culpa a @AnthropicAI . Pero como casi en el 99% de los casos, la culpa es mía. A medida que vas trabajando, le vas dando ordenes que se escriben en archivos md =>

Español

131

52.9K

Alex@randhufflepuff·27 Şub

@lentejasfangirl Fácil, no es el producto final. Aunque la verdad, no está claro que vayan a mejorar las texturas.

Español

225

marta lenteja 🇵🇸@lentejasfangirl·27 Şub

La excusita de “la Switch 1 da para lo que da” ya no va a servir, cual pondréis ahora?

Español

1.9K

Alex@randhufflepuff·13 Şub

@SIGKITTEN For very specific use cases, like a SQL agent generator or structured extraction, it is good

English

SIGKITTEN@SIGKITTEN·13 Şub

hate to say it but... 128k tokens aint enough

English

4.6K

Alex retweetet

Jean P.D. Meijer ― 🇪🇺 eu/acc@initjean·8 Şub

have you guys seen the new Claude Opus ad?

Jean P.D. Meijer ― 🇪🇺 eu/acc tweet media

English

1.9K

86.7K

Alex@randhufflepuff·7 Şub

@juanmacias Aquí en Twitter mucha gente se quejaba de que a veces no prestaba tanta atención y hacía chapuzas, lo contrario de Codex, un modelo más lento y quirúrgico. Con las últimas versiones se han intercambiado los papeles y ahora Codex es más rápido.

Español

juanmacias 🏳️‍🌈@juanmacias·7 Şub

Opus 4.6...... 10 minutos en lo que antes hacía en 1... de verdad no lo entiendo...

Español

7.5K

Alex@randhufflepuff·3 Şub

@Kailzer Understanding of legal documents

English

Kailzer@Kailzer·3 Şub

@chetaslua What do you mean by law?

English

668

Chetaslua@chetaslua·3 Şub

🚨 Mega Thread of Feb Launch Closed Source > Sonnet 5/Fennec - best coding agentic model ever with 1 mill context > Gemini 3 Pro GA/ Snowbunny - best multimodal understanding and frontend with hallucinations > Gpt 5.3 - best model for math and law and I can bet on it Open Source >Minimax m2.5 - this will be better than gemini 3 Pro with no laziness and hallucinations > Glm -5 - this will be like claude on your local machine I have tested 3 out of this 5 and for release date it can be any day , if any questions you can ask in comment and also tag me if I forgot something

English

331

75.8K

Alex@randhufflepuff·2 Şub

@nudpiedo ¿De dónde obtienes este dato?

Español

Víctor R. Escobar 📖🐁@nudpiedo·2 Şub

Menos del 3% de Apps publicadas en la App Store el 2025 han ganado más de 100$.

Español

342

Alex@randhufflepuff·17 Oca

@jtravev @CarlosBeneyto Es Cursor.

Español

405

Jose Trave@jtravev·17 Oca

@CarlosBeneyto Que plan tienes de Claude? Pro o el Max?

Español

3.3K

Carlos Beneyto@CarlosBeneyto·17 Oca

Considero esto peor que las drogas ahora mismo. Llevo unos pocos dias haciendo vibe-coding "enserio" termino de currar en idealista y me pongo 4-5h de media al día. Resumen: - 100$ gastados - +700M tokens gastados. - +100 commits hechos - 6 meses de trabajo en 6 días

Español

423

59.1K

Alex@randhufflepuff·1 Oca

@BettaTech Daniel Kokotajlo predice este escenario para 2027, en 18 meses veremos

Español

120

Martí@BettaTech·1 Oca

A ver si este es el año en el que desaparecemos los desarrolladores. Ahora ya si de si

Español

3.5K

Alex@randhufflepuff·2 Ara

@scaling01 Better wait, 5.1 is only a small improvement after all

English

103

Lisan al Gaib@scaling01·2 Ara

at this point should I even run GPT-5.1 for $50-100 or just wait for the new model that comes out in a couple of days?

Lisan al Gaib@scaling01

LisanBench results for DeepSeek-V3.2 DeepSeek-V3.2 and V3.2 Speciale are affordable frontier models* *the caveat is that they are pretty slow at ~30-40tks/s and produce by far the longest reasoning chains at 20k and 47k average output tokens (incl. reasoning) - which results in extremely long waiting times per request but pricing is incredible for example, Sonnet 4.5 Thinking costs 10x ($35) as much and scores much lower than DeepSeek-V3.2 Speciale ($3) DeepSeek V3.2 Speciale also scored 13 new high scores Validity ratio is super high, which means when it does produce one wrong word transition it doesn't fall into some kind of doom loop of errors

English

8.1K

Alex@randhufflepuff·18 Eki

@Love2Code This applies to Altman, but not to Amodei.

English

ThePrimeagen@ThePrimeagen·18 Eki

29 months into 6 months from AI taking your job Andrej K> "I feel like the industry [...] it's trying to pretend that this [Current AI] is amazing. And it's not—it's slop"

ThePrimeagen@ThePrimeagen

28 months in to 6 months from AI taking your jobs * 4 months into 24 months until cursor is obsolete * 6 months into 6 months until ai writes 90% of your code (part 2, the codening)

English

159

268

3.9K

646.3K

Entdecken

@0xTib3rius @GriFdotpy @XMihura @Merymer @gukras @DamianCatanzaro @Shinnzo_xd @jxnlco