Root Rat

34.8K posts

Root Rat banner
Root Rat

Root Rat

@root_rat

IT nerd 🖥️. Ex pisaplayas y 🔱. Rajadas, opiniones personales y shitposting. Gracias a Twitter, ahora tengo un pódcast.

Katılım Mart 2024
2.7K Takip Edilen14.9K Takipçiler
Root Rat
Root Rat@root_rat·
Puliendo el sistema que reconoce el tipo de layout en mi generador de clips, me he encontrado con un par de edge cases donde tiende a fallar, aunque el 99% del tiempo lo hace bien. Dándole una pensada en cómo mejorarlo se me ha ocurrido usar detección de caras, pero sin recurrir a la GPU, así que tiré por MediaPipe corriendo en CPU y dejé la 4090 libre para lo que realmente la necesita. El sistema anterior analizaba brillo en zonas hardcodeadas del frame, lo que funciona razonablemente bien pero se pone tonto con contenido fullscreen. MediaPipe en cambio extrae el frame completo, detecta caras y clasifica el layout según cómo están distribuidas: apiladas a la izquierda significa screenshare con webcams en sidebar, repartidas por el frame significa tiles de cámara. Si aparecen menos de dos cae al sistema de brillo como fallback, y ahí está la clave de todo. La tentación era combinar ambas señales en paralelo como validación cruzada, pero esa idea no resuelve nada porque el problema de fondo no es de señal sino de arbitraje. Cuando face detection dice screenshare y brillo dice 2tile necesitas una regla que decida quién gana, y esa regla termina siendo invariablemente "prioriza faces", que es exactamente lo que ya hace el fallback. Vuelta completa para llegar al mismo sitio, con el doble de complejidad. Los únicos casos donde brillo podría corregir a faces son los casos donde faces ya no tiene señal suficiente. Cuando MediaPipe ve dos o más caras y clasifica el layout esa señal es fiable, y los falsos positivos del análisis de brillo (un waterfall SDR a pantalla completa, un bumper de calavera) no le afectan en absoluto. Con cascade siempre corriendo se van unos 65ms por frame contra los 2-5ms del fallback, y con 20 samples por clip eso son 1,3 segundos extra de latencia por clip solo en detección de layout, sin ningún beneficio real a cambio.
Root Rat@root_rat

Terminando el sistema ya en serio, fuera del modo POC. Mañana vídeo con hilo de cómo funciona todo. Bastante virguero, 100% local, y con IA solo donde hay que usarla. Últimamente veo mucho esa filosofía de que el agente lo haga todo a pura fuerza bruta con modelos frontier. Me parece un error. Hay cosas en las que no necesitamos que el modelo haga absolutamente nada, y forzarlo igualmente es simplemente mala ingeniería. Como hablaba ayer en el podcast con Pau y @Poliorcetes: sistemas IA de guerrilla, optimización de recursos y capa de control. Ingeniería de software de siempre, pero con cositas golosonas a mayores que resuelven problemas que antes era imposible abordar desde un enfoque determinista. En este caso concreto, la selección de clips según qué diálogo se está teniendo, con condiciones preestablecidas, consiguiendo que el corte final quede como gancho que invite a ver el vídeo completo. Eso sí necesita modelo. El resto, no.

Español
0
0
8
704
Root Rat retweetledi
Santiago
Santiago@AnalystSantiago·
“A 40.000 pies de altura el mundo es imperfecto, a ras de suelo es implacable”. 1993, Mogadiscio, todo estaba cuidadosamente planeado, una misión relativamente sencilla, se convirtió en una de rescate. Si sucedió, el error se repite. __ Danny McKnight, Col
Santiago tweet media
Español
0
11
48
3.2K
Nav Toor
Nav Toor@heynavtoor·
🚨Someone just open sourced a computer that works when the entire internet goes down. It's called Project N.O.M.A.D. A self-contained offline survival server with AI, Wikipedia, maps, medical references, and full education courses. No internet. No cloud. No subscription. It just works. Here's what's packed inside: → A local AI assistant powered by Ollama (works fully offline) → All of Wikipedia, downloadable and searchable → Offline maps of any region you choose → Medical references and survival guides → Full Khan Academy courses with progress tracking → Encryption and data analysis tools via CyberChef → Document upload with semantic search (local RAG) Here's the wildest part: A solar panel, a battery, a mini PC, and a WiFi access point. That's it. That's your entire off-grid knowledge station. 15 to 65 watts of power. Works from a cabin, an RV, a sailboat, or a bunker. Companies sell "prepper drives" with static PDFs for $185. This gives you a full AI brain, an entire encyclopedia, and real courses for free. One command to install. 100% Open Source. Apache 2.0 License.
Nav Toor tweet media
English
442
3K
18.1K
750.4K
Root Rat
Root Rat@root_rat·
Terminando el sistema ya en serio, fuera del modo POC. Mañana vídeo con hilo de cómo funciona todo. Bastante virguero, 100% local, y con IA solo donde hay que usarla. Últimamente veo mucho esa filosofía de que el agente lo haga todo a pura fuerza bruta con modelos frontier. Me parece un error. Hay cosas en las que no necesitamos que el modelo haga absolutamente nada, y forzarlo igualmente es simplemente mala ingeniería. Como hablaba ayer en el podcast con Pau y @Poliorcetes: sistemas IA de guerrilla, optimización de recursos y capa de control. Ingeniería de software de siempre, pero con cositas golosonas a mayores que resuelven problemas que antes era imposible abordar desde un enfoque determinista. En este caso concreto, la selección de clips según qué diálogo se está teniendo, con condiciones preestablecidas, consiguiendo que el corte final quede como gancho que invite a ver el vídeo completo. Eso sí necesita modelo. El resto, no.
Root Rat tweet media
Español
5
5
67
6.5K
John πccasani
John πccasani@Piccasani·
@root_rat Amigo por qué actúas así, cómo un inadaptado, también he desarrollado herramientas similares he probado incluso las APIs de AWS y Azure, se cómo se comportan por eso te lo pregunté, no entiendo tu parafernalia al responder ya estás viejo
Español
1
0
0
32
Mihura
Mihura@XMihura·
qué opina tuiter relojes de mi reloj? ten cuidado con lo que dices @DonUhr24, que me lo regaló mi mujer 🧐
Mihura tweet media
Español
38
0
97
40K
Charles
Charles@CharlesX1198·
@root_rat Ya sea por parte de tu alter ego digital o ud mismo, currado y clarificador análisis.. 🤔.. mientras aquí seguimos ensayando con los drones dj.. Verdad..??..
Español
1
0
2
192
Marta Peirano
Marta Peirano@minipetite·
Esta tarde tengo el ENORME placer de sentarme con @InesRisotas y Nerea Pérez de las Heras, jefas de @SaldremosMejor, para hablar de IA y mujeres, de desigualdad automatizada, de acoso en Redes y de pornografía sintética no consentida. Venid a vernos en el @ambitocultural
Marta Peirano tweet media
Español
9
3
30
6.8K
Root Rat
Root Rat@root_rat·
@Piccasani Ah, ¿estás usando mi herramienta? Menudo prodigio para saber cómo hace los cortes, su rendimiento y si detecta los cambios de algo que he hecho yo y que no está liberado… vaya crack. ¿Qué me has metido, un troyano?
Español
1
0
0
31
John πccasani
John πccasani@Piccasani·
@root_rat Un dolor de cabeza al momento de hacer los cortes es los falsos positivos, muchas veces no detecta bien los cambios.
Español
1
0
0
29