
Yo con mi humilde 1060 tratando de entrenar un modelo para que haga poemas :'D
Jordi Neil@JordiNeil
Si se han preguntado qué se requiere para entrenar un LLM, en el libro de Gen IA de databricks explican cómo lo hicieron ellos: 12T tokens de datos 3072 GPUs H100 Conectadas por 3.2Tbps Y duraron tres meses entrenando. Esto sin contar el tiempo de adquisición y preparación de datos...
Español





