ΩT 🧞‍♂️

3.4K posts

ΩT 🧞‍♂️ banner
ΩT 🧞‍♂️

ΩT 🧞‍♂️

@Vivientne

Marseille, France Katılım Eylül 2020
173 Takip Edilen68 Takipçiler
ً
ً@gldnryujin·
@Benedinhoooo mdrrr si t'es satisfait de finir à égalité de points avec un rennes qui a fait une demi saison compliquée avec beye, alors qu'en février t'avais au moins 10 points de plus, vas-y
Français
1
0
0
45
💤
💤@tnkss91·
Pas facile les maths à Columbia
Français
10
3
208
25.2K
ForSure
ForSure@ForSureFc·
@SuperCazarre Juste faut changer la règle ... Dans la surface si une frappe est cadré et elle est arrêté par une main = pénalti ! Si une frappe est pas cadré= cf indirect ! C'est juste la logique du jeu et plus de polémique !
Français
1
0
0
427
jojo 🇵🇹 🏴󠁧󠁢󠁥󠁮󠁧󠁿
@m0iiraa @ThipOff Mais c’est moi qui ai arbitré ? Moi je l’aurais donner le peno mais celui qui décide a dit non et t’explique que sa tape d’abord son pied moi j’y peut rien et celui de se soir te dis que davies touche de la main direct
Français
2
0
0
182
Thip
Thip@ThipOff·
Mais POURQUOI CE PENALTY N’A ALORS PAS ETE SIFFLÉ ???! Si Davies est sifflé lui aussi devait l’être Je supporte ni l’OM ni le PSG mais j’avoue ne pas comprendre la différence…. Certes les règles ont été changées mais y’a aucune logique sur les décisions au global
Thip tweet media
Français
70
249
1.8K
87K
ΩT 🧞‍♂️ retweetledi
🇵🇸
🇵🇸@Nwrvnce·
on pue la merde mais l’enchaînement d’evenement paranormal depuis 7,8 mois c’est à étudier en profondeur j’ai jamais vu ça
Français
6
242
1.5K
60.2K
OM Actus
OM Actus@Oya273604589136·
@BenByllel perso cette saison je supporte le psg en ldc, lens en ligue 1 et Tottenham en pl, la saison prochaine on verra selon le mercato qu'on fait
Français
1
0
0
339
Byllel
Byllel@BenByllel·
Mon histoire avec ce club est terminé et j'espère ne plus jamais me faire avoir par ce narratif du supporterisme héréditaire. L'om est un immense Ponzi, où bcp se font exploiter sous couvert de l'amour du maillot... " J'AI COMPRIS " disait le boss. #TEAMOM
GIF
Français
34
34
226
74K
Anthony Dz
Anthony Dz@Dz7AnTh0·
@BisCaptain Dans ce cas pourquoi vous supporter tous le barca en + de l'OM.. je pense que la majeur parti des supporter marseillais , pense que cetait le massilia du barca 🤣
Français
1
0
0
99
Captain
Captain@BisCaptain·
Je sais pas ce que tu as entendu mais lu pas grand chose c'est sur Massilia (Marseille antique) était bien une mégapole grecque et une ville commerciale de premier plan en Europe plusieurs siècles avant que les premiers parisiis servent pour le tourisme sexuel des peuples nordiques
Parisien88officiel 🇲🇦 🤲🇵🇸 🇨🇩 🇸🇩🤲@Parisien88off

@SLYFredoS Ptdrrr Marseille c’est grecque maintenant eh vas y j’aurais tout entendu moi

Français
5
0
49
5.9K
David@oxythan
David@oxythan@oxythan·
"Au lieu de décrire un vecteur avec des coordonnées classiques (X, Y, Z), tu le convertis en coordonnées polaires : une distance + un angle" Ceux qui bossent en compression de données ne rêvez pas, si ça tient en distance + angle, deux coordonnées cartésiennes auraient suffit :)
Brivael Le Pogam@brivael

Google vient de publier un papier qui compresse les LLMs à 3 bits. 8x plus rapide, 6x moins de mémoire. Zéro perte de performance 🤯🤯🤯 Le truc c'est que la méthode est élégante au point d'en être presque triviale une fois qu'on la comprend. Ça s'appelle TurboQuant. Je vous vulgarise tout le paper : Déjà, le problème de base. Quand un LLM génère du texte, il doit se "souvenir" de tout ce qu'il a lu et écrit avant. Ce système de mémoire s'appelle le KV cache (key-value cache). Imaginez un étudiant qui prend des notes ultra détaillées pendant un cours. Plus le cours est long, plus ses notes prennent de place sur son bureau. À un moment il n'a plus de place pour écrire. C'est exactement ce qui se passe avec les LLMs : plus le contexte est long, plus le KV cache explose en mémoire. C'est un des plus gros bottlenecks de l'inférence aujourd'hui. La solution classique c'est la quantization. L'idée est simple : au lieu de stocker chaque nombre avec une précision extrême (32 bits, genre 3.14159265...), tu le stockes avec moins de précision (4 bits, genre "~3"). C'est comme passer d'une photo RAW de 50 MB à un JPEG de 2 MB. Tu perds un peu de détail mais visuellement c'est quasi pareil. Le problème c'est que les méthodes classiques de quantization trichent un peu. Pour chaque petit bloc de données compressé, elles doivent stocker des "constantes de calibration" en pleine précision. C'est comme si pour chaque photo JPEG vous deviez garder un petit post-it en haute résolution à côté qui dit "voilà comment décoder cette image". Ces post-its rajoutent 1 à 2 bits par nombre. Quand tu essaies de compresser à 2 ou 3 bits, cet overhead représente une part énorme de ta mémoire totale. Ça annule une bonne partie du gain. TurboQuant résout ça en deux étapes. Étape 1 : PolarQuant. Au lieu de décrire un vecteur avec des coordonnées classiques (X, Y, Z), tu le convertis en coordonnées polaires : une distance + un angle. C'est comme remplacer "va 3 rues à l'est puis 4 rues au nord" par "va 5 rues direction 37 degrés". Même info, format plus compact. L'astuce c'est qu'avant de faire ça, tu appliques une rotation aléatoire sur tes vecteurs. Ça rend leur distribution prévisible et uniforme. Du coup tu n'as plus besoin de stocker les fameuses constantes de calibration, la géométrie fait le travail toute seule. Étape 2 : QJL (Quantized Johnson-Lindenstrauss). Après PolarQuant il reste une petite erreur résiduelle. QJL la corrige avec 1 seul bit par nombre. Le principe vient d'un théorème mathématique qui dit qu'on peut projeter des données de haute dimension dans un espace plus petit tout en préservant les distances entre les points. QJL pousse ça à l'extrême : il réduit chaque valeur projetée à juste son signe (+1 ou -1). Un seul bit. Et grâce à un estimateur spécial qui combine la query en haute précision avec ces données ultra compressées, le modèle calcule toujours des scores d'attention précis. Les résultats sont assez dingues. Sur les benchmarks long-context (LongBench, Needle in a Haystack, RULER...) avec Gemma et Mistral : zéro perte de performance à 3 bits. Le KV cache est réduit d'un facteur 6x. Et sur H100, le calcul des scores d'attention est jusqu'à 8x plus rapide qu'en 32 bits. Le tout sans aucun fine-tuning ou entraînement supplémentaire. Tu branches, ça marche. Et le plus intéressant : ça ne sert pas qu'aux LLMs. TurboQuant surpasse aussi les méthodes state of the art en vector search, c'est à dire la techno qui permet de chercher par similarité dans des bases de milliards de vecteurs (ce qui fait tourner Google Search, les systèmes de recommandation, le RAG...). Mon take : l'inférence c'est là où se joue la vraie bataille économique de l'AI. Les marges de toute l'industrie dépendent du coût par token en production. Un gain de 6 à 8x sur la mémoire et la vitesse d'inférence, sans aucune perte de qualité, ça change fondamentalement l'équation. Ce type de recherche ne fait pas de bruit sur Twitter mais son impact business est potentiellement supérieur à celui d'un nouveau foundation model.

Français
18
6
269
69.8K
Akashi 🐺🍉
Akashi 🐺🍉@akashi_yz·
@dinaleslikan Vote pour personne en plus c pire d’avoir un ennemi infiltré qu’un ennemi déclaré
Français
3
1
73
6.3K
Akashi 🐺🍉
Akashi 🐺🍉@akashi_yz·
Ceux qui votent lfi vous êtes bizarres wallah vous étonnez pas après que y aura des hijab arc-en-ciel multicolore lgbt
Français
103
99
1.4K
223.4K
ΩT 🧞‍♂️
ΩT 🧞‍♂️@Vivientne·
Presque 2027 encore en train de rager sur ce club d’abrutis pendant que mon cousin a une femme un gosse
Français
2
0
5
141
ΩT 🧞‍♂️
ΩT 🧞‍♂️@Vivientne·
@ddsh____ Mais on est 2e toute la saison, sur une saison 1 d’un projet vous voulez quoi de plus Ya eu des matchs de merde oui mais comme pour tout le monde on est pas le Bayern Ça arrive pas à la cheville de la honte qu’on subit juste en 2026
Français
0
0
0
21