Chatterbox
resemble-ai
MIT-lizenziertes offenes TTS mit Zero-Shot Voice Cloning - 500M Parameter, 23+ Sprachen.
Was ist Chatterbox?
Chatterbox ist eine Familie offener TTS-Modelle von Resemble AI. Das neueste Multilingual V3 (500M Parameter) deckt 23+ Sprachen mit sprachübergreifendem Voice Cloning ab; Chatterbox-Turbo (350M) zielt auf Voice Agents mit niedriger Latenz. Beide unterstützen Zero-Shot Cloning aus einem Referenzclip, mit MIT auf Code und Weights.
Vor- & Nachteile
Pros
- MIT auf Code und Weights - die permissivste Lizenz unter den aufstrebenden TTS-Modellen
- Aktiv gepflegt von einem gut ausgestatteten Voice-Unternehmen mit schneller Iteration
- Multilingual V3 deckt 23+ Sprachen mit sprachübergreifendem Voice Cloning ab
Cons
- Hohe Star-Zahl für ein etwa einjähriges Repo verdient etwas Vorsicht
- Die Richtung kann sich mit den kommerziellen Prioritäten des unterstützenden Unternehmens verschieben
- Qualitätsvergleiche sind selbst berichtet; unabhängige V3-Benchmarks sind begrenzt
Lizenz
MIT (OSI-open)
Wann interessant
Du benötigst MIT-lizenziertes, produktionsreifes mehrsprachiges TTS mit Voice Cloning, das du kommerziell self-hosten kannst.
Wann zu früh
Du benötigst vollständig community-verifizierte V3-Benchmarks oder machst dir Sorgen um das langfristige Open-Source-Engagement eines VC-finanzierten Unternehmens.
Kommerzielle Alternative & Verwandtes
- Kommerzielles Pendant: ElevenLabs
Dieses Repo war in der Ausgabe 2026-07 des Open-Source-KI-Radars.
voicebox
jamiepine
Kostenlose, lokale Alternative zu ElevenLabs für TTS, Voice Cloning und Diktieren mit Agent-Integration.
VoxCPM
OpenBMB
Tokenizer-freies TTS-System von OpenBMB für 30 Sprachen mit Voice Design und Echtzeit-Streaming.
supertonic
supertone-inc
Sehr schnelles On-Device-TTS via ONNX mit 31-Sprachen-Unterstützung, läuft auf CPU, Browser und Mobile.