NeuTTS Air
neuphonic
On-Device-TTS mit sofortigem Voice Cloning - ~360M aktive Parameter, GGUF-Builds für Telefone, Laptops und Raspberry Pi.
Was ist NeuTTS Air?
NeuTTS ist eine Sammlung von On-Device-TTS-Modellen von Neuphonic auf kleinen LLM-Backbones mit einem 50-Hz-Neural-Codec. NeuTTS-Air (~360M aktive Parameter, Apache-2.0) beherrscht Englisch mit sofortigem Cloning aus 3 Sekunden Audio; GGUF-Quantisierungen laufen auf Telefonen, Laptops und Einplatinencomputern. Nano fügt Spanisch/Deutsch/Französisch unter einer restriktiveren Lizenz hinzu.
Vor- & Nachteile
Pros
- GGUF-first-Design läuft out of the box auf Raspberry Pi und Android
- NeuTTS-Air-Weights sind Apache-2.0 - genuinely offen für kommerzielle Nutzung
- Sofortiges Voice Cloning aus 3 Sekunden in On-Device-Größenordnung ist in dieser Gewichtsklasse selten
Cons
- Multilingual-Nano-Weights erfordern eine kostenpflichtige kommerzielle Nutzung oberhalb einer Umsatzschwelle
- Das Apache-lizenzierte Air-Modell ist nur Englisch; mehrsprachig benötigt das eingeschränkte Nano
- Kleines Startup; Nachahmungs-Sites sind aufgetaucht - Quelle verifizieren
Lizenz
Apache-2.0 (Air weights) (Open weight, mit Auflagen) - Modell-Lizenz: NeuTTS Open License v1.0 (Nano)
NeuTTS-Air-Weights sind Apache-2.0; die mehrsprachigen NeuTTS-Nano-Weights nutzen die NeuTTS Open License v1.0 (kostenlos für Forschung/begrenzte kommerzielle Nutzung, kostenpflichtig oberhalb einer Umsatzschwelle). Nur via neuphonic.com und diesem GitHub verifizieren - Nachahmungs-Sites existieren.
Wann interessant
Du benötigst genuinely edge-deploybares TTS mit Cloning für eingebettete, mobile oder compliance-sensitive Anwendungen, bei denen das Senden von Audio an eine API nicht akzeptabel ist.
Wann zu früh
Du benötigst mehrsprachige Unterstützung unter einer vollständig offenen Lizenz oder unabhängig verifizierte Qualitäts-Benchmarks.
Kommerzielle Alternative & Verwandtes
- Kommerzielles Pendant: ElevenLabs
Dieses Repo war in der Ausgabe 2026-07 des Open-Source-KI-Radars.
voicebox
jamiepine
Kostenlose, lokale Alternative zu ElevenLabs für TTS, Voice Cloning und Diktieren mit Agent-Integration.
VoxCPM
OpenBMB
Tokenizer-freies TTS-System von OpenBMB für 30 Sprachen mit Voice Design und Echtzeit-Streaming.
Chatterbox
resemble-ai
MIT-lizenziertes offenes TTS mit Zero-Shot Voice Cloning - 500M Parameter, 23+ Sprachen.