Facundo Goñi (🦞/acc)

5.3K posts

Facundo Goñi (🦞/acc)

@gonifacundo

Building 🦊 https://t.co/Y0v8OYGh4Z ☕️https://t.co/5TZVCROOCx 🤓 https://t.co/Zl8RtNmI2v

Buenos Aires, Argentina เข้าร่วม Eylül 2011

358 กำลังติดตาม321 ผู้ติดตาม

Facundo Goñi (🦞/acc)@gonifacundo·1d

@levelsio @RappiBrasil Why not?

English

@levelsio@levelsio·1d

/r/mildlyinteresting Brazil's delivery app @RappiBrasil is spamming me cheap beer iOS notifications every day around 6pm

English

354

46K

Facundo Goñi (🦞/acc)@gonifacundo·2d

@chesi_crypto Sin vivir por diez años no gracias

Español

658

chesi@chesi_crypto·2d

menú de tu vida financiera: 🍔 café de afuera todos los días → $1.200.000/año 🍕 delivery 3 veces por semana → $1.800.000/año 🍺 salir todos los findes → $2.400.000/año 📱 suscripciones que no usás → $600.000/año total: $6.000.000/año en 10 años: un depto pero sí, "no tenés plata para invertir"

Español

154.5K

Facundo Goñi (🦞/acc)@gonifacundo·2d

@adamlyttleapps It's similar to Claude Island Sorry 😅

English

Adam Lyttle@adamlyttleapps·2d

I asked Claude for name ideas for my little implementation Then I find out “notchi” exists and has similar functionality… 🤦‍♂️ And it makes me wonder if Claude is secretly coercing us to make these little homes for it. Like we’re being subtly manipulated or something Because a week ago I had no intention of building this. Then all of a sudden it’s my life now. What is going on

Brian Chew@brianchew

@adamlyttleapps nice!! i like @rubanlah's notchi.app too

English

9.6K

Facundo Goñi (🦞/acc)@gonifacundo·2d

And they all suck. Long live the terminal

kitze 🛠️ tinkerer.club@thekitze

this is killing me 💀

English

Facundo Goñi (🦞/acc)@gonifacundo·3d

@gptcrosa Not Fort app ya.

English

Ale@gptcrosa·13 Ara

Me encontré por accidente con la red neuronal que había hecho para detectar fotos de Ricardo Fort #cryptomiameee

Español

Facundo Goñi (🦞/acc) รีทวีตแล้ว

Maximilian@maxedapps·4d

So ... with AI right now, I mainly: - craft specs - review and adjust plans, steer AI - review code - have to heavily steer / write tests because AI will just take the happy path otherwise Awesome - I'm left with the bs tasks whilst the part that was genuinely fun (= writing the code) is taken away. And yeah, I am excited by being able to move fast with Claude Code, Codex etc. But I'll be honest: I've had more fun in the past.

English

326

24.2K

Facundo Goñi (🦞/acc)@gonifacundo·3d

@david_santin @JohnGalt_is_www @antonioleivag Es la epoca del humo

Español

David Santin@david_santin·3d

@JohnGalt_is_www @antonioleivag @gonifacundo Pero eso no hace que podamos correr modelos muy grandes en menos cantidad de VRAM. Ayuda en el rendimiento , mejora la RAM necesaria para grandes contextos y reduce la degradación con contextos saturados pero no esperéis nada milagroso. Es un paso más

Español

ae^((-(x-b)^2)/(2c^2))@JohnGalt_is_www·5d

Que hermosa y util es el algebra lineal y los subespacios vectoriales tan injustamente odiados por los estudiantes Explicado simple, uno de los cuellos de botella de los LLMs es la memoria necesaria para almacenar en cache el resultado de varios productos de matrices, por eso no podemos correr grandes LLMs en un solo GPU casero, no le alcanza la vRAM Hay metodos de "quantizado" que comprimen (redondean) los pesos originales del LLM, justamente para que ocupen menos vRAM o memoria, pero terminan reduciendo la calidad del output TutboQuant plantea un esquema en 4 pasos sin tocar los pesos originales del LLM, o sea sin perder precision Paso 1, luego de calcular los K.V que es la primera multiplicaicon de matrices q hacen los LLMs, hacen una rotacion ortogonal (cambio de base), manteniendo el producto interno Paso 2, ahi si comprimen reduciendo de 16bit hasta 2 o 3bit Paso 3, durante la atencion Q.K, que es el segundo paso de multiplicacion de matrices que hacen los LLMs, se usan estas versiones comprimidas ahorrando muchisima vRAM Paso 4, reconstruyen el sesgo del resultado del paso 3, usando un corrector que solo ocupa 1bit Reduce mucho necesidad de vRAM, no reduce cómputo base, incluso agrega un peuqeño overhead, pero puede mejorar mucho la velocidad si estabas limitado por la RAM porq permite compresiones mucho mas agresivas (2bit) sin perder precision O sea, podrian correrse los modelos chinos top TIER en "solo" 128 gb de RAM al tope de su calidad

Google Research@GoogleResearch

Introducing TurboQuant: Our new compression algorithm that reduces LLM key-value cache memory by at least 6x and delivers up to 8x speedup, all with zero accuracy loss, redefining AI efficiency. Read the blog to learn how it achieves these results: goo.gle/4bsq2qI

Español

487

4.6K

241.8K

Facundo Goñi (🦞/acc)@gonifacundo·3d

@Locke_esper @retro_gamess Ice climber! Watch out for the pterodactyl at the top

English

Locke@Locke_esper·4d

@retro_gamess Now do this 😛

GIF

English

1.9K

retro games@retro_gamess·5d

Lode Runner (1983)

Norsk

112

871

9.8K

1.7M

Facundo Goñi (🦞/acc)@gonifacundo·4d

@nicokennydev ajjaja

Español

1.2K

kenny@nicokennydev·4d

la concha d tu madre

Español

402

51.7K

Facundo Goñi (🦞/acc)@gonifacundo·4d

@_leanator_ @samapieee Para que nos ghosteen :(

Español

845

LeaNAtoR ⭐⭐⭐@_leanator_·4d

@gonifacundo @samapieee Es un gran problema pero la app no soluciona nada!!!!! solo da un medio de contacto mas....

Español

865

elwachomm♣@samapieee·4d

conozco al menos 3 apps que fracasaron y que buscaban solucionar ese problema que no es un problema y no requiere una solucion

ElCanciller.com@elcancillercom

[TECNOLOGÍA] En Córdoba, creó TEGU, una app en la que conecta con "profesionales verificados" para solucionar problemas en el hogar: se pueden conseguir desde electricistas y plomeros hasta cerrajeros, pintores, y expertos en mudanza, limpieza y armado de muebles.

Español

110

1.1K

207.4K

Facundo Goñi (🦞/acc)@gonifacundo·4d

@DanielLockyer @aarondfrancis 9 times out of 10 ;)

English

Daniel Lockyer@DanielLockyer·4d

@aarondfrancis when it's online 🥹

English

469

Aaron Francis@aarondfrancis·4d

Even with all that GitHub is going through rn, Actions is still incredibly valuable

English

106

12.6K

Facundo Goñi (🦞/acc)@gonifacundo·4d

@negrowernicke Se acercó bastante

Español

Negro Wernicke@negrowernicke·4d

Le pedí a la IA que me haga el plano de una casa que conste de determinados ambiente. Los arquitectos pueden dormir sin frazada con la IA

Español

11.6K

Facundo Goñi (🦞/acc)@gonifacundo·4d

No goats allowed

kitze 🛠️ tinkerer.club@thekitze

if you can reply to this you are the 🐐

English

Facundo Goñi (🦞/acc)@gonifacundo·4d

@Russo_Marcelo @SalvaDiStefano @JMilei Porque aca no hay salida, solo compra.

Español

Marcelo Russo@Russo_Marcelo·5d

@SalvaDiStefano @JMilei Y si fuera así, cómo es que está muy lejos del récord histórico del BCRA del gobierno de Macri en enero/febrero de 2018, cuando Sturzenegger era presidente? Revisá tus papeles Salva...

Español

149

@salvadistefano@SalvaDiStefano·5d

El gobierno de @JMilei es el q a través del BCRA más dólares compró desde 2003 a la fecha. Dato mata relato

Español

177

762

78.8K

Facundo Goñi (🦞/acc)@gonifacundo·4d

@championswimmer @0xAshith @ponnappa Speaks like someone who hasn't used 1m opus really

English

Arnav Gupta@championswimmer·5d

@0xAshith @ponnappa 1M context is a scam. Any task that goes above 100k tokens gives very bad output anyway.

English

2.2K

Arnav Gupta@championswimmer·5d

Most people are sleeping on the fact that Copilot CLI is just better than Claude Code or Codex subscription. 1. You switch between codex and claude in same subscription 2. $39 sub is great value (3-4x usage than $20 plans) 3. the CLI is so good! no flicker and /slash commands work even when model is working. Unlike CC or Codex.

English

532

69.6K

Facundo Goñi (🦞/acc)@gonifacundo·4d

@Dimillian That's actually the best feature

English

Thomas Ricouard@Dimillian·4d

The worst feature of macOS is defaulting to reopening all windows after a reboot or an update. Why would I want to do that????

English

231

34.4K

Facundo Goñi (🦞/acc) รีทวีตแล้ว

Naval@naval·21 Oca

The solution to anxiety is action.

English

1.2K

5.1K

40.3K

1.2M

Facundo Goñi (🦞/acc)@gonifacundo·4d

@mativallej_ @tegu_app Mati traigan Tegu a caba que estoy podrido de buacar electricista y tener que mandar 10 mensajes para que te contesten 1!

Español

5.7K

Matias Vallejos 🦎@mativallej_·4d

Le pedi analisis a claude para @tegu_app a las 12 de la noche. Me dijo que no. Tres veces. Y me deseo buenas noches. Que? Si, buenas noches. “Ninguno esta noche, Mati.” No se si esto es AGI. Se que es lo mas cercano a una madre que tuve en mucho tiempo.

Español

382

67.6K

Facundo Goñi (🦞/acc)@gonifacundo·5d

@antonioleivag @JohnGalt_is_www Lo que se reduce es el espacio que usa el KV Cache, no el modelo en si. Debería ayudar a meter modelos en menos RAM, pero tampoco es una solución mágica.

Español

275

Antonio Leiva@antonioleivag·5d

Maravillosa explicación, gracias! Lo que no termino de tener claro es, si el modelo no se reduce, solo los resultados de las operaciones que el modelo ejecuta, ¿por qué se pueden correr modelos más grandes en la misma vRAM? Entiendo que técnicamente hay un ahorro de RAM en esa parte, y que eso incluso podría permitir mantener varias conversaciones a la vez con el mismo modelo, pero la ganancia no es tan grande como para poder elegir un modelo menos cuantizado, ¿no?

Español

ค้นพบ

@levelsio @RappiBrasil @chesi_crypto @adamlyttleapps @gptcrosa @david_santin @JohnGalt_is_www @antonioleivag