
Mon thread originel :
x.com/nb4ld/status/2…
Nicolas@nb4ld
Pour tout ce qui est calcul intensif (kernels, opérations matricielles, quant/dequant)...), je fais maintenant coder le LLM directement en assembleur. Il arrive à aller chercher un niveau d'optimisation que le compilateur n'atteint pas.
English




















