Open-Source-KI-Radar: 19 GitHub-Repos (Juni 2026)

Die meisten Listen mit den "besten Open-Source-KI-Tools" recyceln immer dieselben bekannten Namen. Diese hier macht das Gegenteil: Sie verfolgt aufsteigende, nischige Repositories, die gerade jetzt schnell wachsen, aber noch nicht zur Standardantwort geworden sind. Sieh es als Radar für das, was an Höhe gewinnt, nicht als Museum für das, was schon gelandet ist.

Das ist die erste monatliche Ausgabe. Die Methode ist bewusst hybrid: eine messbare Vorauswahl aus der GitHub Search API (Star-Wachstum, jüngste Aktivität, KI-Relevanz), dann redaktionelle Auswahl durch Menschen und ehrliche Einordnung. Die vollständige Methodik lebt auf dem Open-Source-Radar-Hub.

Update (7. Juni 2026): Wir haben diese Ausgabe von 13 auf 19 Repos erweitert und drei neue Cluster ergänzt: Computer-Use-Agents, MCP-Server und Security-Agents, dazu frische Einträge bei Voice und Dokumenten-KI. Die sechs Ergänzungen sind alle OSI-open; ihre Star-Zahlen sind vom 7. Juni, die ursprünglichen 13 vom 5. Juni.

Eine Sache, die diese Ausgabe ernst nimmt und die die meisten Listen ignorieren: "Open Source" ist nicht eine einzige Sache. Ein Repo kann echt OSI-lizenziert sein, oder "open weight" mit Nutzungsbeschränkungen, oder lediglich source-available. Jedes Tool unten bekommt sein echtes Lizenz-Label, nicht ein pauschales "Open Source".

Die drei Lizenz-Stufen#

Stufe	Was es bedeutet	Beispiele in dieser Liste
OSI-open	Apache/MIT/BSD, frei für jede Nutzung inkl. kommerziell	graphify, claude-mem, VoxCPM, zvec, OpenMemory, dograh, deta Surf, Rapid-MLX, whichllm, chrome-devtools-mcp, langextract, UI-TARS-desktop, voicebox, strix, n8n-mcp
Open weight, mit Bedingungen	Weights herunterladbar, aber die Modell-Lizenz fügt Grenzen hinzu	chandra (Modell: OpenRAIL-M), supertonic (Modell: OpenRAIL-M)
Source-available	Code einsehbar, aber keine Lizenz zur freien Nutzung	OmniVoice Studio (FSL-1.1)

Alle Star- und Fork-Zahlen unten sind so, wie sie am 5. Juni 2026 auf GitHub angezeigt wurden (die sechs Ergänzungen von Mitte Juni: 7. Juni 2026). Die Fork-zu-Star-Verhältnisse waren durchweg gesund (4:1 bis 17:1), was gegen eine künstliche Star-Inflation spricht.

Lokale Inference und "was läuft auf meiner Maschine"

shimmy (Michael-A-Kuykendall/shimmy) - 5.3k Stars

Eine reine Rust-Inference-Engine mit einem OpenAI-API-kompatiblen Endpoint, ausgeliefert als einzelne Binary: kein Python, kein llama.cpp. Sie läuft auf Vulkan, D3D12 und Metal, CUDA ist also nicht erforderlich, und entdeckt Modelle automatisch aus HuggingFace, Ollama und LM Studio.

Pros

Einzelne Binary, kein Python- oder C++-Toolchain
Breite GPU-Abdeckung ohne CUDA-Abhängigkeit
Drop-in-OpenAI-API für lokale Modelle

Cons

Der Airframe-GPU-Core kann von der Öffentlichkeit nicht aus dem Quellcode gebaut werden, ein echter Vorbehalt für ein 'offenes' Tool
Ein Modell pro Server-Instanz, kein Multi-Model
MoE noch nicht implementiert; Performance-Behauptungen (Startup <100ms vs. Ollama) sind unverifizierte Projektangaben

Lizenz: Apache-2.0 laut den Badges (der README-Text sagt MIT, eine echte Inkonsistenz, die du prüfen solltest, bevor du dich darauf verlässt). Wann interessant: OpenAI-API-Drop-in auf gemischter GPU-Hardware ohne Python. Wann zu früh: wenn du den GPU-Core selbst auditieren oder bauen willst, oder Multi-Model-Serving brauchst.

Rapid-MLX (raullenchai/Rapid-MLX) - 2.7k Stars

Ein lokaler, OpenAI-kompatibler Inference-Server für Apple Silicon, gebaut auf MLX, ausgelegt darauf, sich in Coding-Agents wie Cursor und Claude Code einzuklinken. Er kommt mit Tool-Calling, Prompt-Caching und über 3.300 Tests.

Pros

Ernsthafte Engineering-Signale: über 3.300 Tests, ein Doctor-Diagnosetool, breite Modell-Unterstützung
Sauberer Ollama/llama.cpp-Ersatz auf Apple Silicon
Apache-2.0, voll OSI-open

Cons

Nur macOS / Apple Silicon, kein Linux, Windows oder NVIDIA
Offiziell Beta (PyPI development status 4) trotz hoher Versionsnummer
Die Schlagzeile '4.2x schneller als Ollama' nennt keine Benchmark-Bedingungen, und PyPI gibt bescheidenere '2-4x' an

Lizenz: Apache-2.0. Wann interessant: Apple-Silicon-Nutzer, die lokale Inference für Coding-Agents laufen lassen. Wann zu früh: jede Nicht-Apple-Hardware, oder wenn du reproduzierbare Geschwindigkeitsgarantien statt einer Marketing-Schlagzeile brauchst.

whichllm (Andyyyy64/whichllm) - 2.8k Stars

Ein CLI, das deine Hardware erkennt (GPU, CPU, RAM) und das lokale LLM rankt, das auf ihr tatsächlich gut läuft, bewertet anhand echter Benchmarks (LiveBench, Artificial Analysis, Aider, Arena ELO) statt allein nach Parameterzahl.

Pros

Evidenzbasiertes Ranking aus mehreren Leaderboards, keine Größen-Heuristik
Konfidenz-Marker (~ für geschätzt, ? für keine Daten), ehrlich gegenüber Unsicherheit
Skriptfähige JSON-Ausgabe, plus GPU-Simulation für Kaufplanung

Cons

Geschwindigkeitswerte sind Schätzungen, keine gemessenen Garantien
Ollama-Integration braucht manuelles Mapping der HuggingFace-ID
Frühe 0.x-Phase (v0.5.8)

Lizenz: MIT. Wann interessant: zu entscheiden, was du laufen lassen sollst, oder welche GPU du kaufen sollst, bevor du dich festlegst. Wann zu früh: wenn du gemessenen Durchsatz statt Schätzungen brauchst.

Offene Voice und Text-to-Speech

VoxCPM (OpenBMB/VoxCPM) - 26.1k Stars

Ein tokenizer-freies TTS-System von OpenBMB. VoxCPM2 (2B Parameter) deckt 30 Sprachen inklusive Deutsch ab, unterstützt Voice Design aus einer Textbeschreibung (kein Referenz-Audio) und streamt in Echtzeit.

Pros

Apache-2.0 inklusive der Weights, echt frei für kommerzielle Nutzung
30 Sprachen mit Voice Design und Cloning
Dedizierte Inference-Engines mit einem OpenAI-kompatiblen Audio-Endpoint

Cons

Braucht eine GPU (~8 GB VRAM, CUDA 12+); Linux ist das primäre Ziel
Das README selbst weist darauf hin, dass Voice-Design-Ergebnisse zwischen Durchläufen variieren
Der Echtzeit-Faktor hängt stark von der Hardware ab

Lizenz: Apache-2.0. Wann interessant: Self-Hoster mit GPU, die echte kommerzielle Freiheit wollen. Wann zu früh: reine CPU-Setups oder jeder, der eine managed API braucht.

supertonic (supertone-inc/supertonic) - 11.3k Stars

Ein sehr schnelles On-Device-TTS, das nativ über ONNX läuft, mit einem kompakten Modell von ~99M Parametern. Es deckt 31 Sprachen ab, läuft auf der CPU ohne GPU und macht sogar Browser-Inference via WebGPU.

Pros

Läuft auf der CPU: Raspberry Pi, Mobile, Browser, kein Netzwerk nötig
Echtzeit (eine ganze Webseite in unter einer Sekunde vorgelesen)
SDKs über Python, Node, Browser, Java, C++, Swift, iOS, Rust, Flutter hinweg

Cons

Kein eingebautes Voice Cloning in der offenen Variante (nur feste Stimme)
Das Modell ist OpenRAIL-M, also open weight mit Nutzungsbeschränkungen, nicht voll OSI-open
78 offene Issues zum Zeitpunkt des Schreibens

Lizenz: Code MIT, Modell OpenRAIL-M (open weight, mit Bedingungen). Wann interessant: Edge-, On-Device- oder Browser-TTS, wo Latenz und Privatsphäre zählen. Wann zu früh: wenn du Cloning out-of-the-box brauchst oder die OpenRAIL-M-Nutzungsklauseln kommerziell vermeiden willst. Das natürliche managed Upsell ist Supertone Play/API des Anbieters selbst.

OmniVoice Studio (debpalash/OmniVoice Studio) - 6.2k Stars

Eine Desktop-App für lokales Diktieren, Zero-Shot-Voice-Cloning aus einem 3-Sekunden-Clip und Video-Dubbing, alles On-Device. Sie vermarktet sich als 'die Open-Source-ElevenLabs-Alternative', und sie ist eine echte Multi-OS-App mit nativen Installern.

Pros

Fertige Desktop-App mit nativen Installern (macOS, Windows, Linux, Docker)
Voll lokal, keine API-Keys, breite Engine-Auswahl (CosyVoice, MLX-Audio, VoxCPM2)
Jedes Release wird zwei Jahre nach Veröffentlichung Apache-2.0

Cons

Aktive Beta (v0.3.5), Dinge brechen zwischen Releases nach eigenem Bekunden des Maintainers
Trotz des 'Open-Source'-Labels ist die Lizenz FSL-1.1: source-available, nicht OSI-open
Nicht-kommerziell / keine 'konkurrierende Nutzung' bis zur 2-Jahre-Apache-Umwandlung

Lizenz: FSL-1.1-ALv2, source-available, frei nur für private und nicht-kommerzielle Nutzung. Das ist die wichtigste Korrektur zur eigenen 'Open-Source'-Einordnung. Wann interessant: lokales, datensouveränes Dubbing und Diktieren ohne API-Kosten. Wann zu früh: jede kommerzielle Nutzung ohne gekaufte Lizenz, oder Produktionszuverlässigkeit.

dograh (dograh-hq/dograh) - 4.2k Stars

Eine Open-Source-, selbst hostbare Plattform zum Bauen von produktiven Voice Agents (eingehende und ausgehende Anrufe) über einen visuellen Workflow-Builder. Sie positioniert sich als self-hosted Alternative zu Vapi und Retell.

Pros

Selbst hostbar und kostenlos, kein Vendor-Lock-in gegenüber Vapi/Retell
Telefonie-Integrationen (Twilio, Vonage, Telnyx, Cloudonix)
BSD-2-Clause, permissiv und OSI-open

Cons

Docker-Setup erforderlich; Hardware-Specs sind nicht dokumentiert
Bringt keine eigene Engine mit, die Qualität hängt von deinen eigenen LLM/STT/TTS-Keys ab
Die Zuverlässigkeit des Voice Agents musst du selbst validieren

Lizenz: BSD-2-Clause. Wann interessant: Teams, die Voice Agents bauen, Datenkontrolle wollen und Docker betreiben können. Wann zu früh: wenn du Plug-and-Play ohne eigene Modell-Keys erwartest. Die kommerziellen Originale hier sind Vapi und Retell (mit keinem von beiden haben wir eine Affiliate-Beziehung).

voicebox (jamiepine/voicebox) - 29.5k Stars

Eine local-first 'Voice-Studio'-Desktop-App von Jamie Pine (Spacedrive), die Text-to-Speech, Zero-Shot-Voice-Cloning aus wenigen Sekunden Audio und Diktieren (globaler Hotkey plus Whisper-STT) vereint und einen MCP-/REST-Server bereitstellt, damit Agents in einer geklonten Stimme sprechen. Sie läuft komplett on-device über macOS, Windows und Linux mit sieben austauschbaren TTS-Engines.

Pros

MIT-Code mit überwiegend MIT/Apache-Modell-Weights, echt OSI-open und voll lokal
Deckt beide Hälften der Voice-Schleife ab: TTS-Ausgabe und Diktat/STT-Eingabe, mit nativer MCP-Integration für Agents
Breite Hardware-Unterstützung (Apple Silicon MLX, CUDA, ROCm, DirectML, Intel Arc, CPU)

Cons

Sehr jung: Repo im Januar 2026 erstellt, v0.5.0, 433 offene Issues, mehrere Kernfeatures noch auf der Roadmap
Voice-Cloning-Missbrauchsrisiko ohne Consent-Rahmen, die Homepage bewirbt nicht einwilligende Celebrity-Presets (Freeman, Johansson, Obama)
Performance- und Privacy-Behauptungen ('150x Echtzeit auf CPU', 'nichts verlässt dein Gerät') sind eigene, unverifizierte Projektangaben

Lizenz: MIT. Wann interessant: privates, on-device TTS, Cloning und Diktieren mit Agent-Integration. Wann zu früh: produktive Nutzung, oder überall dort, wo die Cloning-Ethik und eine vier Monate alte Codebase ein Problem sind. voicebox bezeichnet sich selbst als kostenlose, Open-Source-Alternative zu ElevenLabs, das oben für OmniVoice gezeigte managed Gegenstück gilt auch hier.

Agent-Memory und Code-Wissen

claude-mem (thedotmack/claude-mem) - 80.8k Stars

Eine persistente Memory-Schicht über Agent-Sessions hinweg. Ein Observer-Agent erfasst automatisch Tool-Nutzung und Entscheidungen, generiert semantische Zusammenfassungen und macht sie künftigen Sessions verfügbar, mit sichtbaren Token-Kosten und <private>-Tags für sensible Inhalte.

Pros

Apache-2.0, OSI-open
Installiert sich als Claude-Code-Plugin mit einem Befehl
Privacy-Tags und Token-Kosten-Transparenz eingebaut

Cons

Primär auf Claude Code abgestimmt; andere Agents sind mehr Marketing als Unterstützung
Schwerer Dependency-Stack: Node 18+, Bun, SQLite, Chroma, uv
Version 13.x deutet auf eine Geschichte von Breaking Changes hin

Lizenz: Apache-2.0. Wann interessant: intensive Claude-Code-Nutzer, die über Sessions hinweg Kontext verlieren. Wann zu früh: wenn du primär andere Agents nutzt, oder den Bun + Chroma + uv-Stack nicht willst. Es existiert keine kommerzielle Variante.

OpenMemory (CaviraOSS/OpenMemory) - 4.2k Stars

Ein lokaler, selbst gehosteter Langzeit-Memory-Store ('cognitive memory engine') für LLM-Apps, angepriesen als Alternative zu RAG. Er modelliert Memory in Sektoren (episodisch, semantisch, prozedural) mit einem temporalen knowledge graph und nachvollziehbaren Recall-Traces.

Pros

Local-first, self-hosted (SQLite oder Postgres), kein Lock-in
Connectors (GitHub, Notion, Drive) und Migration von Mem0/Zep
Python- und JS-SDKs, Integrationen mit LangChain, CrewAI, AutoGen, MCP

Cons

Die kleinste Community hier, und kein Release seit Dezember 2025, am wenigsten aktiv gepflegt
Die Homepage sagt MIT, aber es ist tatsächlich Apache-2.0 (schlampig, wenn auch geringfügig)
Vergleichs-Benchmarks stammen vom Projekt selbst

Lizenz: Apache-2.0. Wann interessant: eine lokale, nachvollziehbare Memory-Schicht mit fertigen Connectors. Wann zu früh: wenn dir aktive Pflege wichtig ist (sechs Monate ohne Release).

graphify (safishamsi/graphify) - 59.6k Stars

Ein Skill für KI-Coding-Assistenten, der einen Ordner aus Code, SQL-Schemas, Docs, PDFs und Bildern in einen abfragbaren knowledge graph verwandelt, aufgerufen mit /graphify über rund 20 Agents hinweg (Claude Code, Codex, Cursor, Gemini CLI, Aider und mehr).

Pros

Sehr breite Agent-Unterstützung, kein Neo4j oder Server nötig
Gibt HTML-Visualisierung, JSON-Graph, Obsidian-Vault und Architektur-Diagramme aus
MIT, OSI-open; lokale AST-Extraktion via tree-sitter

Cons

Der semantische Schritt sendet Daten an die Modell-API deines Agents (Kosten und Privatsphäre)
Pre-1.0 (v0.8.31), Formate und APIs können sich noch verschieben
Python 3.10+ erforderlich

Lizenz: MIT. Wann interessant: eine Codebase oder einen Dokumentensatz als Graph navigierbar machen, wenn du bereits einen der Agents nutzt. Wann zu früh: produktionskritische Pipelines, angesichts des Pre-1.0-Status. Eine kommerzielle Schicht (Penpax) steht auf einer Warteliste, ist aber noch nicht live.

Vektoren, Dokumente und Extraktion

zvec (alibaba/zvec) - 9.8k Stars

Eine leichtgewichtige, in-process vector database von Alibaba, eine Bibliothek, die du direkt einbettest, kein Server. Sie unterstützt dichte und spärliche Vektoren, hybrid search, Write-Ahead-Logging und Bindings für Python, Node und Dart/Flutter.

Pros

Kein Server oder Config, eine echte eingebettete vector DB
Multi-Language-Bindings, läuft überall von Notebooks bis Edge
Apache-2.0, und 'battle-tested innerhalb der Alibaba Group'

Cons

'Milliarden von Vektoren, Sub-Millisekunden-Latenz' ist eine Anbieterangabe, nicht unabhängig verifiziert
v0.4.0, früh, nur 7 Releases
Der C++-Core braucht auf manchen Plattformen evtl. ein Build-Toolchain

Lizenz: Apache-2.0. Wann interessant: eine eingebettete vector DB für Edge, Desktop-Apps oder lokales RAG. Wann zu früh: große produktive Vektor-Workloads, solange es noch v0.x ist.

chandra (datalab-to/chandra) - 11.1k Stars

Ein OCR-/Dokumentenmodell von den Machern von Marker und Surya (Datalab). Es wandelt Bilder und PDFs in strukturiertes HTML, Markdown oder JSON um und bewahrt dabei das Layout, über 90+ Sprachen hinweg, inklusive komplexer Tabellen, Formulare und Handschrift.

Pros

Sehr breit: Tabellen, Formulare, Handschrift, 90+ Sprachen
Nutzbar sowohl lokal (HuggingFace) als auch als gehostete API
Gestützt von einem etablierten Team (Marker/Surya)

Cons

Das Modell ist Modified OpenRAIL-M: frei nur für Forschung, persönliche Nutzung und Startups unter $2M, nicht uneingeschränkt OSI-open
Eine GPU ist für die lokale Nutzung faktisch erforderlich
Benchmark-Angaben sind selbst berichtet

Lizenz: Code Apache-2.0, Modell Modified OpenRAIL-M (open weight, mit einer Umsatz-/Nutzungsbedingung). Vor der kommerziellen Nutzung sorgfältig zu prüfen. Wann interessant: anspruchsvolle Dokumenten-Digitalisierung mit GPU oder via API. Wann zu früh: kommerzielle Eigennutzung oberhalb der $2M-Schwelle. Datalab bietet eine managed API (pay-per-page, $5 Gratis-Credits), aber wir fanden dafür kein öffentliches Affiliate-Programm.

langextract (google/langextract) - 36.8k Stars

Eine Python-Bibliothek von Google, die ein LLM nutzt, um strukturierte Information aus unstrukturiertem Text zu ziehen, und dann jede Extraktion an ihre exakte Stelle im Quelltext zurückbindet ('Source Grounding') plus eine interaktive HTML-Ansicht erzeugt. Sie ruft selbst kein Modell, du bringst einen Provider mit: Gemini (Default), OpenAI, oder lokale Modelle via Ollama (ohne API-Key).

Pros

Apache-2.0, permissiv und OSI-open, kein Copyleft
Provider-agnostisch: Cloud (Gemini/OpenAI/Vertex) oder voll lokal via Ollama ohne API-Key
Source-Grounding und eine HTML-Visualisierung out-of-the-box sind ein echtes Unterscheidungsmerkmal

Cons

Für Cloud-Modelle braucht sie eine externe LLM-API: laufende Token-Kosten, und dein Text verlässt die Maschine (lokal nur via Ollama)
Das README sagt klar 'this is not an officially supported Google product', kein SLA
Genauigkeit ist eine eigene Projektangabe und hängt vom gewählten Modell, Prompt und den Beispielen ab

Lizenz: Apache-2.0. Wann interessant: Dokumente, Berichte oder Notizen mit nachvollziehbarer Herkunft in strukturierte Daten verwandeln. Wann zu früh: wenn du ein unterstütztes Produkt mit Garantien brauchst, oder keinen Text an ein Cloud-Modell senden kannst und Ollama nicht lokal betreiben willst. Es existiert keine kommerzielle Variante, und die benötigten LLM-Provider haben kein Endkunden-Affiliate-Programm.

KI-Notebook

deta Surf (deta/deta Surf) - 3.4k Stars

Eine local-first 'AI notebook'-Desktop-App, die lokale Dateien und Web-Inhalte (Websites, YouTube, Tweets, PDFs) in Notebooks zieht, mit smarten Notizen, quellenverlinkten Zitaten und 'Surflets', KI-generierten interaktiven Mini-Apps.

Pros

Local-first: deine Daten bleiben auf deinem Gerät
Cross-Plattform (macOS, Windows, Linux) mit flexibler Modellwahl inkl. lokaler LLMs
Apache-2.0, Open Core auf GitHub

Cons

Open Beta (1.4.7-beta), nicht final
Kein Preis kommuniziert, das Monetarisierungsmodell ist also unklar
Marketing-Behauptungen ('Billionen von Seiten') sind nicht messbar

Lizenz: Apache-2.0. Wann interessant: Recherche und Notizen mit lokalen Daten und freier Modellwahl. Wann zu früh: produktionskritische Workflows, oder wenn langfristige Kostenplanung zählt.

Computer-Use und autonome Agents

UI-TARS-desktop (bytedance/UI-TARS-desktop) - 36.2k Stars

Eine native Desktop-App (Windows/macOS, plus Browser-Build) für einen GUI-/Computer-Use-Agent: Sie macht einen Screenshot, ein Vision-Language-Modell liest die Oberfläche, und der Agent steuert dann Maus und Tastatur aus einer Anweisung in natürlicher Sprache. Angetrieben wird sie vom Open-Weight-Modell UI-TARS (z.B. UI-TARS-1.5-7B, lokal betreibbar) oder ByteDances Seed-Serie und kommt zusammen mit Agent TARS, einem MCP-basierten CLI-/Web-Geschwister, das mit beliebigen Providern arbeitet.

Pros

App und Basismodell (UI-TARS-1.5-7B) sind beide echtes Apache-2.0, kommerziell frei und voll selbst hostbar
Große, aktive Community (36k+ Stars) mit einem peer-reviewten Paper im Rücken, und Cross-Plattform
Flexibel: lokal oder Cloud, plus der Agent-TARS-Stack mit MCP und freier Provider-Wahl

Cons

Das offene 7B-Modell ist Apache-2.0, aber die stärksten Modelle (Doubao-1.5-UI-TARS, Seed-1.5-VL) sind proprietär und kostenpflichtig über ByteDances VolcEngine-API, Top-Performance bedeutet Cloud-Lock-in, und der frei nutzbare Remote Operator wurde im August 2025 eingestellt
Computer-Use ist von Natur aus riskant: ein Agent mit voller Maus-/Tastatur-/Browser-Kontrolle ist Prompt-Injection und Fehlklicks ausgesetzt, betreibe ihn in einer Sandbox oder VM
Pre-1.0 (v0.3.0) mit 403 offenen Issues; lokale Hardware-Anforderungen für das 7B-Modell sind nicht dokumentiert

Lizenz: App und offenes Modell beide Apache-2.0 (OSI-open), aber die leistungsstärksten Modelle sind ein proprietäres, kostenpflichtiges Cloud-Backend. Wann interessant: ein offener, selbst hostbarer Computer-Use-Agent für Automatisierungs-Experimente. Wann zu früh: Einsatz ohne Sandbox oder produktiv, oder wenn du die Top-Modelle ohne kostenpflichtigen VolcEngine-Plan brauchst. Die kommerziellen Gegenstücke sind Anthropics Claude Computer Use und OpenAIs Operator (mit keinem von beiden haben wir eine Affiliate-Beziehung).

strix (usestrix/strix) - 25.9k Stars

Ein Framework autonomer 'KI-Hacker'-Agents, die eine Anwendung dynamisch testen, so wie es ein Pentester täte. Jeder Agent bekommt ein volles Toolkit (HTTP-Proxy, Playwright-Browser, Terminal, Python-Runtime, Recon) und meldet validierte Proof-of-Concepts für Probleme wie IDOR, SQL- und Command-Injection, SSRF, XSS, Auth- und JWT-Fehler sowie Business-Logik-Bugs. Es läuft lokal (Python 3.12+, eine Docker-Sandbox, strix --target ...) und braucht einen externen LLM-Key.

Pros

Validiert Befunde mit echten Proof-of-Concepts statt Signatur-Treffern, was laut Projekt False Positives reduziert (eigene Angabe)
Breite Tool- und Schwachstellen-Abdeckung out-of-the-box, mit Multi-Agent-Orchestrierung
Apache-2.0, lokale Ausführung, CI/CD-Integration und Provider-agnostische LLM-Unterstützung

Cons

PyPI markiert es als Development-Status Alpha trotz des 'v1.0'-Tags, behandle produktive Security-Gates mit Vorsicht
'KI-Hacker' und 'zero false positives' sind Projektangaben; autonome Offensiv-Tools brauchen weiterhin menschliche Validierung, und du darfst nur eigene oder freigegebene Systeme testen
Agentische Pentests verbrauchen viele Tokens (laufende LLM-Kosten, vom Projekt nicht beziffert) und brauchen Docker

Lizenz: Apache-2.0. Wann interessant: Entwickler, die kontinuierliche, PoC-gestützte Security-Tests selbst hosten wollen. Wann zu früh: als unbeaufsichtigtes produktives Gate, angesichts des Alpha-Status. Strix hat eine eigene kommerzielle Cloud (das offene Projekt ist die Lead-Gen-Schicht), aber wir fanden kein Affiliate-Programm; das etablierte AppSec-Gegenstück ist Snyk.

MCP-Server für Coding-Agents

chrome-devtools-mcp (ChromeDevTools/chrome-devtools-mcp) - 43.0k Stars

Ein MCP-Server vom Chrome-DevTools-Team, der Coding-Agents (Claude Code, Cursor, Copilot, Codex und mehr) die Kontrolle über eine echte, laufende Chrome-Instanz via Puppeteer gibt, plus Inspektion auf DevTools-Niveau: Performance-Traces, Netzwerk- und Konsolen-Analyse, source-mapped Stack-Traces und Screenshots. Installation via npx chrome-devtools-mcp@latest; es braucht Google Chrome oder Chrome for Testing.

Pros

Offizielles Chrome-DevTools-Team-Projekt mit sehr hoher Adoption (43k Stars, ~2,76 Mio npm-Downloads/Woche, tägliche Commits)
Gibt Agents echte DevTools-Fähigkeiten, Performance-Traces und Netzwerk-/Konsolen-Inspektion, nicht nur Klick-Automation
Breite Client-Unterstützung (Claude Code als CLI und Plugin, Cursor, Copilot, Codex, Cline) und Apache-2.0 ohne Nutzungsauflagen

Cons

Per Design exponiert es alle Browser-Inhalte gegenüber dem MCP-Client, inklusive potenziell sensibler Daten, sichere es bewusst ab
Telemetrie ist standardmäßig an (Usage-Stats; Performance-Tools können Trace-URLs an Googles CrUX-API senden), Opt-out über Flags
Offiziell nur Google Chrome / Chrome for Testing; andere Chromium-Browser sind nicht garantiert. 'Reliable automation' ist eine Projektangabe, kein unabhängiger Benchmark

Lizenz: Apache-2.0. Wann interessant: einem Coding-Agent echtes Browser-Debugging und Performance-Einblick geben. Wann zu früh: sensible Umgebungen, in denen das Exponieren von Browser-Inhalten gegenüber einem externen Client ohne Härtung inakzeptabel ist. Gratis-Tool, keine kommerzielle Variante.

n8n-mcp (czlonkowski/n8n-mcp) - 21.6k Stars

Ein MCP-Server (ein unabhängiges Projekt, nicht von n8n) der einem KI-Assistenten strukturierten Zugriff auf n8ns Node-Dokumentation, Properties und Operationen gibt, damit das Modell n8n-Workflows korrekt bauen, validieren und deployen kann. Er stellt Tools wie search_nodes und validate_workflow bereit, ist selbst hostbar (npx/Docker/Railway) und verbindet sich optional mit deiner eigenen n8n-Instanz fürs Management. Clients sind u.a. Claude Desktop und Code, Cursor, Windsurf, VS Code und Codex.

Pros

Saubere MIT-Lizenz auf dem Server-Code (die n8n Sustainable Use License gilt für die n8n-Plattform, nicht für diesen Server)
Sehr aktiv gepflegt und breit adoptiert (21,6k Stars, tägliche Commits, ein 6:1-Star/Fork-Verhältnis)
Breite Client-Unterstützung, plus eine Zero-Setup-gehostete Option zum Ausprobieren

Cons

Der meiste Mehrwert hängt an einer n8n-Instanz (mit ihrer eigenen Sustainable Use License), ohne sie bekommst du nur die Doku- und Validierungs-Tools
Die gehostete Variante ist Freemium (Free-Tier auf 100 Tool-Calls/Tag gedeckelt); der offene Server bleibt frei, aber Komfort ist monetarisiert
Abdeckungs-Metriken (1.851 Nodes, 99% Property-Coverage, 5.418 bestandene Tests) sind eigene Projektangaben

Lizenz: MIT. Wann interessant: n8n-Automationen aus einem Coding-Agent heraus bauen oder debuggen. Wann zu früh: wenn du nicht ohnehin n8n betreibst, da die Deploy-Funktionen eine Instanz brauchen. Das kommerzielle Gegenstück ist n8n selbst, dessen Cloud-Pläne sind, wo eine managed Alternative lebt.

Das managed Pendant zu den self-hosted Voice-Tools oben (voicebox, OmniVoice Studio) ist ElevenLabs - nützlich, wenn du eine gehostete API brauchst, statt Modelle selbst zu betreiben.

ElevenLabs

4.6

Info

Methodik und was dieser Post nicht abdeckt. Die Kandidaten kamen aus der GitHub Search API (junge Repos, Star-Wachstum, KI-Relevanz), dann redaktionelle Auswahl. Star- und Fork-Zahlen sind so, wie sie am 5. Juni 2026 auf GitHub angezeigt wurden (die sechs Ergänzungen von Mitte Juni am 7. Juni 2026), und sind nicht unabhängig auditiert. Wir haben die bekannten Platzhirsche bewusst ausgeschlossen (Ollama, ComfyUI, vLLM, llama.cpp), dieses Radar geht um das, was aufsteigt, nicht um das, was schon gewonnen hat. Performance-Werte, die einem Projekt zugeschrieben werden (z.B. "4.2x schneller"), sind die eigenen Angaben dieses Projekts, nicht unsere Messungen. Affiliate-Offenlegung: Dieser Post hat keine Affiliate-Beziehung zu einem der gelisteten Open-Source-Repos; der einzige kommerzielle Link geht zu ElevenLabs, gezeigt als managed Alternative zu einem self-hosted Voice-Tool. Lizenzen und Reife ändern sich schnell, also prüfe die aktuelle LICENSE und den Release-Status jedes Repos, bevor du dich darauf verlässt.

Die nächste Ausgabe folgt nächsten Monat. Wenn ein Repo hier reift oder kommerzialisiert wird, verfolgen wir auch das, frühe Berichterstattung ist der Sinn eines Radars.

Roland Hentschel

AI & Web Technology Expert

Web developer and AI enthusiast helping businesses navigate the rapidly evolving landscape of AI tools. Testing and comparing tools so you don't have to.

Open-Source-KI-Radar: 19 GitHub-Repos (Juni 2026)

Die drei Lizenz-Stufen#

Lokale Inference und "was läuft auf meiner Maschine"

shimmy (Michael-A-Kuykendall/shimmy) - 5.3k Stars

Pros

Cons

Rapid-MLX (raullenchai/Rapid-MLX) - 2.7k Stars

Pros

Cons

whichllm (Andyyyy64/whichllm) - 2.8k Stars

Pros

Cons

Offene Voice und Text-to-Speech

VoxCPM (OpenBMB/VoxCPM) - 26.1k Stars

Pros

Cons

supertonic (supertone-inc/supertonic) - 11.3k Stars

Pros

Cons

OmniVoice Studio (debpalash/OmniVoice Studio) - 6.2k Stars

Pros

Cons

dograh (dograh-hq/dograh) - 4.2k Stars

Pros

Cons

voicebox (jamiepine/voicebox) - 29.5k Stars

Pros

Cons

Agent-Memory und Code-Wissen

claude-mem (thedotmack/claude-mem) - 80.8k Stars

Pros

Cons

OpenMemory (CaviraOSS/OpenMemory) - 4.2k Stars

Pros

Cons

graphify (safishamsi/graphify) - 59.6k Stars

Pros

Cons

Vektoren, Dokumente und Extraktion

zvec (alibaba/zvec) - 9.8k Stars

Pros

Cons

chandra (datalab-to/chandra) - 11.1k Stars

Pros

Cons

langextract (google/langextract) - 36.8k Stars

Pros

Cons

KI-Notebook

deta Surf (deta/deta Surf) - 3.4k Stars

Pros

Cons

Computer-Use und autonome Agents

UI-TARS-desktop (bytedance/UI-TARS-desktop) - 36.2k Stars

Pros

Cons

strix (usestrix/strix) - 25.9k Stars

Pros

Cons

MCP-Server für Coding-Agents

chrome-devtools-mcp (ChromeDevTools/chrome-devtools-mcp) - 43.0k Stars

Pros

Cons

n8n-mcp (czlonkowski/n8n-mcp) - 21.6k Stars

Pros

Cons

ElevenLabs

Roland Hentschel

Tools aus diesem Beitrag

n8n Guide 2026

Dify Review 2026: Open-Source-LLM-App-Plattform im Test

Stable Diffusion Guide 2026

Weitere Beiträge aus dem Blog

Open-Source-KI-Radar: 99 GitHub-Repos (Juli 2026)

RunPod 2026: H100s im Sekundentakt, wenn du den Zähler im Blick behältst

Lindy AI 2026: 4,9 Sterne auf G2, 1,7 auf Trustpilot