
@Cyberpr0ud @queru_lant Stimmt. Du brauchst sogar mit open source TTS modellen wie qwen3-tts ein 3 sekunden sample mit transcription.
Aber die echte Frage ist, wann soll das gewesen sein? Wir reden hier von KI voice cloning das es vor 2-3 Jahren so nicht gab.
Deutsch








































