Post

@Capetlevrai Il existe un modèle basé sur TurboQwant 13.3 GB donc une 16go la fera tourner avec un compromis sur le contexte. Une 24go pourra faire tourner sur un contexte beaucoup plus élever : huggingface.co/YTan2000/Qwen3…
Français

@flammedemon @Capetlevrai j'ai une rtx4070 c'est possible de faire ça aussi ? ou elle nul cette carte ?
Français

@Issa201735 @Capetlevrai C'est un modèle 12go ? Si c'est le cas sa paraît short. Il faudrait passer sur des modèles plus petit. Des 9b en 8-bit peut être.
Utilise lmstudio c'est très visuel et pratique pour voir quel modèle tu peux charger ou non.
Français

