Die meisten Listen mit den "besten Open-Source-KI-Tools" recyceln immer dieselben bekannten Namen. Diese hier macht das Gegenteil: Sie verfolgt aufsteigende, nischige Repositories, die gerade jetzt schnell wachsen, aber noch nicht zur Standardantwort geworden sind. Sieh es als Radar für das, was an Höhe gewinnt, nicht als Museum für das, was schon gelandet ist.
Das ist die erste monatliche Ausgabe. Die Methode ist bewusst hybrid: eine messbare Vorauswahl aus der GitHub Search API (Star-Wachstum, jüngste Aktivität, KI-Relevanz), dann redaktionelle Auswahl durch Menschen und ehrliche Einordnung. Die vollständige Methodik lebt auf dem Open-Source-Radar-Hub.
Update (7. Juni 2026): Wir haben diese Ausgabe von 13 auf 19 Repos erweitert und drei neue Cluster ergänzt: Computer-Use-Agents, MCP-Server und Security-Agents, dazu frische Einträge bei Voice und Dokumenten-KI. Die sechs Ergänzungen sind alle OSI-open; ihre Star-Zahlen sind vom 7. Juni, die ursprünglichen 13 vom 5. Juni.
Eine Sache, die diese Ausgabe ernst nimmt und die die meisten Listen ignorieren: "Open Source" ist nicht eine einzige Sache. Ein Repo kann echt OSI-lizenziert sein, oder "open weight" mit Nutzungsbeschränkungen, oder lediglich source-available. Jedes Tool unten bekommt sein echtes Lizenz-Label, nicht ein pauschales "Open Source".
Die drei Lizenz-Stufen#
| Stufe | Was es bedeutet | Beispiele in dieser Liste |
|---|---|---|
| OSI-open | Apache/MIT/BSD, frei für jede Nutzung inkl. kommerziell | graphify, claude-mem, VoxCPM, zvec, OpenMemory, dograh, deta Surf, Rapid-MLX, whichllm, chrome-devtools-mcp, langextract, UI-TARS-desktop, voicebox, strix, n8n-mcp |
| Open weight, mit Bedingungen | Weights herunterladbar, aber die Modell-Lizenz fügt Grenzen hinzu | chandra (Modell: OpenRAIL-M), supertonic (Modell: OpenRAIL-M) |
| Source-available | Code einsehbar, aber keine Lizenz zur freien Nutzung | OmniVoice Studio (FSL-1.1) |
Alle Star- und Fork-Zahlen unten sind so, wie sie am 5. Juni 2026 auf GitHub angezeigt wurden (die sechs Ergänzungen von Mitte Juni: 7. Juni 2026). Die Fork-zu-Star-Verhältnisse waren durchweg gesund (4:1 bis 17:1), was gegen eine künstliche Star-Inflation spricht.
Lokale Inference und "was läuft auf meiner Maschine"#
shimmy (Michael-A-Kuykendall/shimmy) - 5,3k Stars#
Eine reine Rust-Inference-Engine mit einem OpenAI-API-kompatiblen Endpoint, ausgeliefert als einzelne Binary: kein Python, kein llama.cpp. Sie läuft auf Vulkan, D3D12 und Metal, CUDA ist also nicht erforderlich, und entdeckt Modelle automatisch aus HuggingFace, Ollama und LM Studio.
Pros
- Einzelne Binary, kein Python- oder C++-Toolchain
- Breite GPU-Abdeckung ohne CUDA-Abhängigkeit
- Drop-in-OpenAI-API für lokale Modelle
Cons
- Der Airframe-GPU-Core kann von der Öffentlichkeit nicht aus dem Quellcode gebaut werden, ein echter Vorbehalt für ein 'offenes' Tool
- Ein Modell pro Server-Instanz, kein Multi-Model
- MoE noch nicht implementiert; Performance-Behauptungen (Startup <100ms vs. Ollama) sind unverifizierte Projektangaben
Lizenz: Apache-2.0 laut den Badges (der README-Text sagt MIT, eine echte Inkonsistenz, die du prüfen solltest, bevor du dich darauf verlässt). Wann es interessant ist: OpenAI-API-Drop-in auf gemischter GPU-Hardware ohne Python. Wann es zu früh ist: wenn du den GPU-Core selbst auditieren oder bauen willst, oder Multi-Model-Serving brauchst.
Rapid-MLX (raullenchai/Rapid-MLX) - 2,7k Stars#
Ein lokaler, OpenAI-kompatibler Inference-Server für Apple Silicon, gebaut auf MLX, ausgelegt darauf, sich in Coding-Agents wie Cursor und Claude Code einzuklinken. Er kommt mit Tool-Calling, Prompt-Caching und über 3.300 Tests.
Pros
- Ernsthafte Engineering-Signale: über 3.300 Tests, ein Doctor-Diagnosetool, breite Modell-Unterstützung
- Sauberer Ollama/llama.cpp-Ersatz auf Apple Silicon
- Apache-2.0, voll OSI-open
Cons
- Nur macOS / Apple Silicon, kein Linux, Windows oder NVIDIA
- Offiziell Beta (PyPI development status 4) trotz hoher Versionsnummer
- Die Schlagzeile '4.2x schneller als Ollama' nennt keine Benchmark-Bedingungen, und PyPI gibt bescheidenere '2-4x' an
Lizenz: Apache-2.0 (OSI-open). Wann es interessant ist: Apple-Silicon-Nutzer, die lokale Inference für Coding-Agents laufen lassen. Wann es zu früh ist: jede Nicht-Apple-Hardware, oder wenn du reproduzierbare Geschwindigkeitsgarantien statt einer Marketing-Schlagzeile brauchst.
whichllm (Andyyyy64/whichllm) - 2,8k Stars#
Ein CLI, das deine Hardware erkennt (GPU, CPU, RAM) und das lokale LLM rankt, das auf ihr tatsächlich gut läuft, bewertet anhand echter Benchmarks (LiveBench, Artificial Analysis, Aider, Arena ELO) statt allein nach Parameterzahl.
Pros
- Evidenzbasiertes Ranking aus mehreren Leaderboards, keine Größen-Heuristik
- Konfidenz-Marker (~ für geschätzt, ? für keine Daten), ehrlich gegenüber Unsicherheit
- Skriptfähige JSON-Ausgabe, plus GPU-Simulation für Kaufplanung
Cons
- Geschwindigkeitswerte sind Schätzungen, keine gemessenen Garantien
- Ollama-Integration braucht manuelles Mapping der HuggingFace-ID
- Frühe 0.x-Phase (v0.5.8)
Lizenz: MIT (OSI-open). Wann es interessant ist: zu entscheiden, was du laufen lassen sollst, oder welche GPU du kaufen sollst, bevor du dich festlegst. Wann es zu früh ist: wenn du gemessenen Durchsatz statt Schätzungen brauchst.
Offene Voice und Text-to-Speech#
Das war diesen Monat das stärkste Cluster auf dem Radar, und das mit echten kommerziellen Referenzpunkten.
VoxCPM (OpenBMB/VoxCPM) - 26,1k Stars#
Ein tokenizer-freies TTS-System von OpenBMB. VoxCPM2 (2B Parameter) deckt 30 Sprachen inklusive Deutsch ab, unterstützt Voice Design aus einer Textbeschreibung (kein Referenz-Audio) und streamt in Echtzeit.
Pros
- Apache-2.0 inklusive der Weights, echt frei für kommerzielle Nutzung
- 30 Sprachen mit Voice Design und Cloning
- Dedizierte Inference-Engines mit einem OpenAI-kompatiblen Audio-Endpoint
Cons
- Braucht eine GPU (~8 GB VRAM, CUDA 12+); Linux ist das primäre Ziel
- Das README selbst weist darauf hin, dass Voice-Design-Ergebnisse zwischen Durchläufen variieren
- Der Echtzeit-Faktor hängt stark von der Hardware ab
Lizenz: Apache-2.0, Code und Weights, sauber OSI-open. Wann es interessant ist: Self-Hoster mit GPU, die echte kommerzielle Freiheit wollen. Wann es zu früh ist: reine CPU-Setups oder jeder, der eine managed API braucht.
supertonic (supertone-inc/supertonic) - 11,3k Stars#
Ein sehr schnelles On-Device-TTS, das nativ über ONNX läuft, mit einem kompakten Modell von ~99M Parametern. Es deckt 31 Sprachen ab, läuft auf der CPU ohne GPU und macht sogar Browser-Inference via WebGPU.
Pros
- Läuft auf der CPU: Raspberry Pi, Mobile, Browser, kein Netzwerk nötig
- Echtzeit (eine ganze Webseite in unter einer Sekunde vorgelesen)
- SDKs über Python, Node, Browser, Java, C++, Swift, iOS, Rust, Flutter hinweg
Cons
- Kein eingebautes Voice Cloning in der offenen Variante (nur feste Stimme)
- Das Modell ist OpenRAIL-M, also open weight mit Nutzungsbeschränkungen, nicht voll OSI-open
- 78 offene Issues zum Zeitpunkt des Schreibens
Lizenz: Code MIT, Modell OpenRAIL-M (open weight, mit Bedingungen). Wann es interessant ist: Edge-, On-Device- oder Browser-TTS, wo Latenz und Privatsphäre zählen. Wann es zu früh ist: wenn du Cloning out-of-the-box brauchst oder die OpenRAIL-M-Nutzungsklauseln kommerziell vermeiden willst. Das natürliche managed Upsell ist Supertone Play/API des Anbieters selbst.
OmniVoice Studio (debpalash/OmniVoice-Studio) - 6,2k Stars#
Eine Desktop-App für lokales Diktieren, Zero-Shot-Voice-Cloning aus einem 3-Sekunden-Clip und Video-Dubbing, alles On-Device. Sie vermarktet sich als "die Open-Source-ElevenLabs-Alternative", und sie ist eine echte Multi-OS-App mit nativen Installern.
Pros
- Fertige Desktop-App mit nativen Installern (macOS, Windows, Linux, Docker)
- Voll lokal, keine API-Keys, breite Engine-Auswahl (CosyVoice, MLX-Audio, VoxCPM2)
- Jedes Release wird zwei Jahre nach Veröffentlichung Apache-2.0
Cons
- Aktive Beta (v0.3.5), Dinge brechen zwischen Releases nach eigenem Bekunden des Maintainers
- Trotz des 'Open-Source'-Labels ist die Lizenz FSL-1.1: source-available, nicht OSI-open
- Nicht-kommerziell / keine 'konkurrierende Nutzung' bis zur 2-Jahre-Apache-Umwandlung
Lizenz: FSL-1.1-ALv2, source-available, frei nur für private und nicht-kommerzielle Nutzung. Das ist die wichtigste Korrektur zur eigenen "Open-Source"-Einordnung. Wann es interessant ist: lokales, datensouveränes Dubbing und Diktieren ohne API-Kosten. Wann es zu früh ist: jede kommerzielle Nutzung ohne gekaufte Lizenz, oder Produktionszuverlässigkeit.
Wenn du eine unterstützte, managed Option statt des Self-Hostings einer Beta willst: Das kommerzielle Original, gegen das sie sich misst, ist ElevenLabs:
dograh (dograh-hq/dograh) - 4,2k Stars#
Eine Open-Source-, selbst hostbare Plattform zum Bauen von produktiven Voice Agents (eingehende und ausgehende Anrufe) über einen visuellen Workflow-Builder. Sie positioniert sich als self-hosted Alternative zu Vapi und Retell.
Pros
- Selbst hostbar und kostenlos, kein Vendor-Lock-in gegenüber Vapi/Retell
- Telefonie-Integrationen (Twilio, Vonage, Telnyx, Cloudonix)
- BSD-2-Clause, permissiv und OSI-open
Cons
- Docker-Setup erforderlich; Hardware-Specs sind nicht dokumentiert
- Bringt keine eigene Engine mit, die Qualität hängt von deinen eigenen LLM/STT/TTS-Keys ab
- Die Zuverlässigkeit des Voice Agents musst du selbst validieren
Lizenz: BSD-2-Clause (OSI-open). Wann es interessant ist: Teams, die Voice Agents bauen, Datenkontrolle wollen und Docker betreiben können. Wann es zu früh ist: wenn du Plug-and-Play ohne eigene Modell-Keys erwartest. Die kommerziellen Originale hier sind Vapi und Retell (mit keinem von beiden haben wir eine Affiliate-Beziehung).
voicebox (jamiepine/voicebox) - 29,5k Stars#
Eine local-first "Voice-Studio"-Desktop-App von Jamie Pine (Spacedrive), die Text-to-Speech, Zero-Shot-Voice-Cloning aus wenigen Sekunden Audio und Diktieren (globaler Hotkey plus Whisper-STT) vereint und einen MCP-/REST-Server bereitstellt, damit Agents in einer geklonten Stimme sprechen. Sie läuft komplett on-device über macOS, Windows und Linux mit sieben austauschbaren TTS-Engines.
Pros
- MIT-Code mit überwiegend MIT/Apache-Modell-Weights, echt OSI-open und voll lokal
- Deckt beide Hälften der Voice-Schleife ab: TTS-Ausgabe und Diktat/STT-Eingabe, mit nativer MCP-Integration für Agents
- Breite Hardware-Unterstützung (Apple Silicon MLX, CUDA, ROCm, DirectML, Intel Arc, CPU)
Cons
- Sehr jung: Repo im Januar 2026 erstellt, v0.5.0, 433 offene Issues, mehrere Kernfeatures noch auf der Roadmap
- Voice-Cloning-Missbrauchsrisiko ohne Consent-Rahmen, die Homepage bewirbt nicht einwilligende Celebrity-Presets (Freeman, Johansson, Obama)
- Performance- und Privacy-Behauptungen ('150x Echtzeit auf CPU', 'nichts verlässt dein Gerät') sind eigene, unverifizierte Projektangaben
Lizenz: MIT (OSI-open). Wann es interessant ist: privates, on-device TTS, Cloning und Diktieren mit Agent-Integration. Wann es zu früh ist: produktive Nutzung, oder überall dort, wo die Cloning-Ethik und eine vier Monate alte Codebase ein Problem sind. voicebox bezeichnet sich selbst als kostenlose, Open-Source-Alternative zu ElevenLabs, das oben für OmniVoice gezeigte managed Gegenstück gilt auch hier.
Agent-Memory und Code-Wissen#
claude-mem (thedotmack/claude-mem) - 80,8k Stars#
Eine persistente Memory-Schicht über Agent-Sessions hinweg. Ein Observer-Agent erfasst automatisch Tool-Nutzung und Entscheidungen, generiert semantische Zusammenfassungen und macht sie künftigen Sessions verfügbar, mit sichtbaren Token-Kosten und <private>-Tags für sensible Inhalte.
Pros
- Apache-2.0, OSI-open
- Installiert sich als Claude-Code-Plugin mit einem Befehl
- Privacy-Tags und Token-Kosten-Transparenz eingebaut
Cons
- Primär auf Claude Code abgestimmt; andere Agents sind mehr Marketing als Unterstützung
- Schwerer Dependency-Stack: Node 18+, Bun, SQLite, Chroma, uv
- Version 13.x deutet auf eine Geschichte von Breaking Changes hin
Lizenz: Apache-2.0 (OSI-open). Wann es interessant ist: intensive Claude-Code-Nutzer, die über Sessions hinweg Kontext verlieren. Wann es zu früh ist: wenn du primär andere Agents nutzt, oder den Bun + Chroma + uv-Stack nicht willst. Es existiert keine kommerzielle Variante.
OpenMemory (CaviraOSS/OpenMemory) - 4,2k Stars#
Ein lokaler, selbst gehosteter Langzeit-Memory-Store ("cognitive memory engine") für LLM-Apps, angepriesen als Alternative zu RAG. Er modelliert Memory in Sektoren (episodisch, semantisch, prozedural) mit einem temporalen knowledge graph und nachvollziehbaren Recall-Traces.
Pros
- Local-first, self-hosted (SQLite oder Postgres), kein Lock-in
- Connectors (GitHub, Notion, Drive) und Migration von Mem0/Zep
- Python- und JS-SDKs, Integrationen mit LangChain, CrewAI, AutoGen, MCP
Cons
- Die kleinste Community hier, und kein Release seit Dezember 2025, am wenigsten aktiv gepflegt
- Die Homepage sagt MIT, aber es ist tatsächlich Apache-2.0 (schlampig, wenn auch geringfügig)
- Vergleichs-Benchmarks stammen vom Projekt selbst
Lizenz: Apache-2.0 (OSI-open). Wann es interessant ist: eine lokale, nachvollziehbare Memory-Schicht mit fertigen Connectors. Wann es zu früh ist: wenn dir aktive Pflege wichtig ist (sechs Monate ohne Release).
graphify (safishamsi/graphify) - 59,6k Stars#
Ein Skill für KI-Coding-Assistenten, der einen Ordner aus Code, SQL-Schemas, Docs, PDFs und Bildern in einen abfragbaren knowledge graph verwandelt, aufgerufen mit /graphify über rund 20 Agents hinweg (Claude Code, Codex, Cursor, Gemini CLI, Aider und mehr).
Pros
- Sehr breite Agent-Unterstützung, kein Neo4j oder Server nötig
- Gibt HTML-Visualisierung, JSON-Graph, Obsidian-Vault und Architektur-Diagramme aus
- MIT, OSI-open; lokale AST-Extraktion via tree-sitter
Cons
- Der semantische Schritt sendet Daten an die Modell-API deines Agents (Kosten und Privatsphäre)
- Pre-1.0 (v0.8.31), Formate und APIs können sich noch verschieben
- Python 3.10+ erforderlich
Lizenz: MIT (OSI-open). Wann es interessant ist: eine Codebase oder einen Dokumentensatz als Graph navigierbar machen, wenn du bereits einen der Agents nutzt. Wann es zu früh ist: produktionskritische Pipelines, angesichts des Pre-1.0-Status. Eine kommerzielle Schicht (Penpax) steht auf einer Warteliste, ist aber noch nicht live.
Vektoren, Dokumente und Extraktion#
zvec (alibaba/zvec) - 9,8k Stars#
Eine leichtgewichtige, in-process vector database von Alibaba, eine Bibliothek, die du direkt einbettest, kein Server. Sie unterstützt dichte und spärliche Vektoren, hybrid search, Write-Ahead-Logging und Bindings für Python, Node und Dart/Flutter.
Pros
- Kein Server oder Config, eine echte eingebettete vector DB
- Multi-Language-Bindings, läuft überall von Notebooks bis Edge
- Apache-2.0, und 'battle-tested innerhalb der Alibaba Group'
Cons
- 'Milliarden von Vektoren, Sub-Millisekunden-Latenz' ist eine Anbieterangabe, nicht unabhängig verifiziert
- v0.4.0, früh, nur 7 Releases
- Der C++-Core braucht auf manchen Plattformen evtl. ein Build-Toolchain
Lizenz: Apache-2.0 (OSI-open). Wann es interessant ist: eine eingebettete vector DB für Edge, Desktop-Apps oder lokales RAG. Wann es zu früh ist: große produktive Vektor-Workloads, solange es noch v0.x ist.
chandra (datalab-to/chandra) - 11,1k Stars#
Ein OCR-/Dokumentenmodell von den Machern von Marker und Surya (Datalab). Es wandelt Bilder und PDFs in strukturiertes HTML, Markdown oder JSON um und bewahrt dabei das Layout, über 90+ Sprachen hinweg, inklusive komplexer Tabellen, Formulare und Handschrift.
Pros
- Sehr breit: Tabellen, Formulare, Handschrift, 90+ Sprachen
- Nutzbar sowohl lokal (HuggingFace) als auch als gehostete API
- Gestützt von einem etablierten Team (Marker/Surya)
Cons
- Das Modell ist Modified OpenRAIL-M: frei nur für Forschung, persönliche Nutzung und Startups unter $2M, nicht uneingeschränkt OSI-open
- Eine GPU ist für die lokale Nutzung faktisch erforderlich
- Benchmark-Angaben sind selbst berichtet
Lizenz: Code Apache-2.0, Modell Modified OpenRAIL-M (open weight, mit einer Umsatz-/Nutzungsbedingung). Vor der kommerziellen Nutzung sorgfältig zu prüfen. Wann es interessant ist: anspruchsvolle Dokumenten-Digitalisierung mit GPU oder via API. Wann Vorsicht geboten ist: kommerzielle Eigennutzung oberhalb der $2M-Schwelle. Datalab bietet eine managed API (pay-per-page, $5 Gratis-Credits), aber wir fanden dafür kein öffentliches Affiliate-Programm.
langextract (google/langextract) - 36,8k Stars#
Eine Python-Bibliothek von Google, die ein LLM nutzt, um strukturierte Information aus unstrukturiertem Text zu ziehen, und dann jede Extraktion an ihre exakte Stelle im Quelltext zurückbindet ("Source Grounding") plus eine interaktive HTML-Ansicht erzeugt. Sie ruft selbst kein Modell, du bringst einen Provider mit: Gemini (Default), OpenAI, oder lokale Modelle via Ollama (ohne API-Key).
Pros
- Apache-2.0, permissiv und OSI-open, kein Copyleft
- Provider-agnostisch: Cloud (Gemini/OpenAI/Vertex) oder voll lokal via Ollama ohne API-Key
- Source-Grounding und eine HTML-Visualisierung out-of-the-box sind ein echtes Unterscheidungsmerkmal
Cons
- Für Cloud-Modelle braucht sie eine externe LLM-API: laufende Token-Kosten, und dein Text verlässt die Maschine (lokal nur via Ollama)
- Das README sagt klar 'this is not an officially supported Google product', kein SLA
- Genauigkeit ist eine eigene Projektangabe und hängt vom gewählten Modell, Prompt und den Beispielen ab
Lizenz: Apache-2.0 (OSI-open). Wann es interessant ist: Dokumente, Berichte oder Notizen mit nachvollziehbarer Herkunft in strukturierte Daten verwandeln. Wann es zu früh ist: wenn du ein unterstütztes Produkt mit Garantien brauchst, oder keinen Text an ein Cloud-Modell senden kannst und Ollama nicht lokal betreiben willst. Es existiert keine kommerzielle Variante, und die benötigten LLM-Provider haben kein Endkunden-Affiliate-Programm.
KI-Notebook#
deta Surf (deta/surf) - 3,4k Stars#
Eine local-first "AI notebook"-Desktop-App, die lokale Dateien und Web-Inhalte (Websites, YouTube, Tweets, PDFs) in Notebooks zieht, mit smarten Notizen, quellenverlinkten Zitaten und "Surflets", KI-generierten interaktiven Mini-Apps.
Pros
- Local-first: deine Daten bleiben auf deinem Gerät
- Cross-Plattform (macOS, Windows, Linux) mit flexibler Modellwahl inkl. lokaler LLMs
- Apache-2.0, Open Core auf GitHub
Cons
- Open Beta (1.4.7-beta), nicht final
- Kein Preis kommuniziert, das Monetarisierungsmodell ist also unklar
- Marketing-Behauptungen ('Billionen von Seiten') sind nicht messbar
Lizenz: Apache-2.0 (OSI-open). Wann es interessant ist: Recherche und Notizen mit lokalen Daten und freier Modellwahl. Wann es zu früh ist: produktionskritische Workflows, oder wenn langfristige Kostenplanung zählt.
Computer-Use und autonome Agents#
Ein neues Cluster auf dem Radar: Tools, die nicht nur antworten, sondern handeln, eine GUI steuern oder eine App wie ein Angreifer abklopfen. Mächtig, und ehrlich gesagt riskanter als der Rest, weshalb die Reife- und Sicherheits-Vorbehalte hier mehr zählen.
UI-TARS-desktop (bytedance/UI-TARS-desktop) - 36,2k Stars#
Eine native Desktop-App (Windows/macOS, plus Browser-Build) für einen GUI-/Computer-Use-Agent: Sie macht einen Screenshot, ein Vision-Language-Modell liest die Oberfläche, und der Agent steuert dann Maus und Tastatur aus einer Anweisung in natürlicher Sprache. Angetrieben wird sie vom Open-Weight-Modell UI-TARS (z.B. UI-TARS-1.5-7B, lokal betreibbar) oder ByteDances Seed-Serie und kommt zusammen mit Agent TARS, einem MCP-basierten CLI-/Web-Geschwister, das mit beliebigen Providern arbeitet.
Pros
- App und Basismodell (UI-TARS-1.5-7B) sind beide echtes Apache-2.0, kommerziell frei und voll selbst hostbar
- Große, aktive Community (36k+ Stars) mit einem peer-reviewten Paper im Rücken, und Cross-Plattform
- Flexibel: lokal oder Cloud, plus der Agent-TARS-Stack mit MCP und freier Provider-Wahl
Cons
- Das offene 7B-Modell ist Apache-2.0, aber die stärksten Modelle (Doubao-1.5-UI-TARS, Seed-1.5-VL) sind proprietär und kostenpflichtig über ByteDances VolcEngine-API, Top-Performance bedeutet Cloud-Lock-in, und der frei nutzbare Remote Operator wurde im August 2025 eingestellt
- Computer-Use ist von Natur aus riskant: ein Agent mit voller Maus-/Tastatur-/Browser-Kontrolle ist Prompt-Injection und Fehlklicks ausgesetzt, betreibe ihn in einer Sandbox oder VM
- Pre-1.0 (v0.3.0) mit 403 offenen Issues; lokale Hardware-Anforderungen für das 7B-Modell sind nicht dokumentiert
Lizenz: App und offenes Modell beide Apache-2.0 (OSI-open), aber die leistungsstärksten Modelle sind ein proprietäres, kostenpflichtiges Cloud-Backend. Wann es interessant ist: ein offener, selbst hostbarer Computer-Use-Agent für Automatisierungs-Experimente. Wann es zu früh ist: Einsatz ohne Sandbox oder produktiv, oder wenn du die Top-Modelle ohne kostenpflichtigen VolcEngine-Plan brauchst. Die kommerziellen Gegenstücke sind Anthropics Claude Computer Use und OpenAIs Operator (mit keinem von beiden haben wir eine Affiliate-Beziehung).
strix (usestrix/strix) - 25,9k Stars#
Ein Framework autonomer "KI-Hacker"-Agents, die eine Anwendung dynamisch testen, so wie es ein Pentester täte. Jeder Agent bekommt ein volles Toolkit (HTTP-Proxy, Playwright-Browser, Terminal, Python-Runtime, Recon) und meldet validierte Proof-of-Concepts für Probleme wie IDOR, SQL- und Command-Injection, SSRF, XSS, Auth- und JWT-Fehler sowie Business-Logik-Bugs. Es läuft lokal (Python 3.12+, eine Docker-Sandbox, strix --target ...) und braucht einen externen LLM-Key.
Pros
- Validiert Befunde mit echten Proof-of-Concepts statt Signatur-Treffern, was laut Projekt False Positives reduziert (eigene Angabe)
- Breite Tool- und Schwachstellen-Abdeckung out-of-the-box, mit Multi-Agent-Orchestrierung
- Apache-2.0, lokale Ausführung, CI/CD-Integration und Provider-agnostische LLM-Unterstützung
Cons
- PyPI markiert es als Development-Status Alpha trotz des 'v1.0'-Tags, behandle produktive Security-Gates mit Vorsicht
- 'KI-Hacker' und 'zero false positives' sind Projektangaben; autonome Offensiv-Tools brauchen weiterhin menschliche Validierung, und du darfst nur eigene oder freigegebene Systeme testen
- Agentische Pentests verbrauchen viele Tokens (laufende LLM-Kosten, vom Projekt nicht beziffert) und brauchen Docker
Lizenz: Apache-2.0 (OSI-open). Wann es interessant ist: Entwickler, die kontinuierliche, PoC-gestützte Security-Tests selbst hosten wollen. Wann es zu früh ist: als unbeaufsichtigtes produktives Gate, angesichts des Alpha-Status. Strix hat eine eigene kommerzielle Cloud (das offene Projekt ist die Lead-Gen-Schicht), aber wir fanden kein Affiliate-Programm; das etablierte AppSec-Gegenstück ist Snyk.
MCP-Server für Coding-Agents#
Das Model Context Protocol wurde dieses Jahr zu einer der schnelllebigsten Ecken der Open-Source-KI: kleine Server, die Agents echte, strukturierte Fähigkeiten geben statt Raterei. Zwei stachen heraus.
chrome-devtools-mcp (ChromeDevTools/chrome-devtools-mcp) - 43,0k Stars#
Ein MCP-Server vom Chrome-DevTools-Team, der Coding-Agents (Claude Code, Cursor, Copilot, Codex und mehr) die Kontrolle über eine echte, laufende Chrome-Instanz via Puppeteer gibt, plus Inspektion auf DevTools-Niveau: Performance-Traces, Netzwerk- und Konsolen-Analyse, source-mapped Stack-Traces und Screenshots. Installation via npx chrome-devtools-mcp@latest; es braucht Google Chrome oder Chrome for Testing.
Pros
- Offizielles Chrome-DevTools-Team-Projekt mit sehr hoher Adoption (43k Stars, ~2,76 Mio npm-Downloads/Woche, tägliche Commits)
- Gibt Agents echte DevTools-Fähigkeiten, Performance-Traces und Netzwerk-/Konsolen-Inspektion, nicht nur Klick-Automation
- Breite Client-Unterstützung (Claude Code als CLI und Plugin, Cursor, Copilot, Codex, Cline) und Apache-2.0 ohne Nutzungsauflagen
Cons
- Per Design exponiert es alle Browser-Inhalte gegenüber dem MCP-Client, inklusive potenziell sensibler Daten, sichere es bewusst ab
- Telemetrie ist standardmäßig an (Usage-Stats; Performance-Tools können Trace-URLs an Googles CrUX-API senden), Opt-out über Flags
- Offiziell nur Google Chrome / Chrome for Testing; andere Chromium-Browser sind nicht garantiert. 'Reliable automation' ist eine Projektangabe, kein unabhängiger Benchmark
Lizenz: Apache-2.0 (OSI-open). Wann es interessant ist: einem Coding-Agent echtes Browser-Debugging und Performance-Einblick geben. Wann es zu früh ist: sensible Umgebungen, in denen das Exponieren von Browser-Inhalten gegenüber einem externen Client ohne Härtung inakzeptabel ist. Gratis-Tool, keine kommerzielle Variante.
n8n-mcp (czlonkowski/n8n-mcp) - 21,6k Stars#
Ein MCP-Server (ein unabhängiges Projekt, nicht von n8n) der einem KI-Assistenten strukturierten Zugriff auf n8ns Node-Dokumentation, Properties und Operationen gibt, damit das Modell n8n-Workflows korrekt bauen, validieren und deployen kann. Er stellt Tools wie search_nodes und validate_workflow bereit, ist selbst hostbar (npx/Docker/Railway) und verbindet sich optional mit deiner eigenen n8n-Instanz fürs Management. Clients sind u.a. Claude Desktop und Code, Cursor, Windsurf, VS Code und Codex.
Pros
- Saubere MIT-Lizenz auf dem Server-Code (die n8n Sustainable Use License gilt für die n8n-Plattform, nicht für diesen Server)
- Sehr aktiv gepflegt und breit adoptiert (21,6k Stars, tägliche Commits, ein 6:1-Star/Fork-Verhältnis)
- Breite Client-Unterstützung, plus eine Zero-Setup-gehostete Option zum Ausprobieren
Cons
- Der meiste Mehrwert hängt an einer n8n-Instanz (mit ihrer eigenen Sustainable Use License), ohne sie bekommst du nur die Doku- und Validierungs-Tools
- Die gehostete Variante ist Freemium (Free-Tier auf 100 Tool-Calls/Tag gedeckelt); der offene Server bleibt frei, aber Komfort ist monetarisiert
- Abdeckungs-Metriken (1.851 Nodes, 99% Property-Coverage, 5.418 bestandene Tests) sind eigene Projektangaben
Lizenz: MIT (OSI-open). Wann es interessant ist: n8n-Automationen aus einem Coding-Agent heraus bauen oder debuggen. Wann es zu früh ist: wenn du nicht ohnehin n8n betreibst, da die Deploy-Funktionen eine Instanz brauchen. Das kommerzielle Gegenstück ist n8n selbst, dessen Cloud-Pläne sind, wo eine managed Alternative lebt.
Methodik und was dieser Post nicht abdeckt. Die Kandidaten kamen aus der GitHub Search API (junge Repos, Star-Wachstum, KI-Relevanz), dann redaktionelle Auswahl. Star- und Fork-Zahlen sind so, wie sie am 5. Juni 2026 auf GitHub angezeigt wurden (die sechs Ergänzungen von Mitte Juni am 7. Juni 2026), und sind nicht unabhängig auditiert. Wir haben die bekannten Platzhirsche bewusst ausgeschlossen (Ollama, ComfyUI, vLLM, llama.cpp), dieses Radar geht um das, was aufsteigt, nicht um das, was schon gewonnen hat. Performance-Werte, die einem Projekt zugeschrieben werden (z.B. "4.2x schneller"), sind die eigenen Angaben dieses Projekts, nicht unsere Messungen. Affiliate-Offenlegung: Dieser Post hat keine Affiliate-Beziehung zu einem der gelisteten Open-Source-Repos; der einzige kommerzielle Link geht zu ElevenLabs, gezeigt als managed Alternative zu einem self-hosted Voice-Tool. Lizenzen und Reife ändern sich schnell, also prüfe die aktuelle LICENSE und den Release-Status jedes Repos, bevor du dich darauf verlässt.
Die nächste Ausgabe folgt nächsten Monat. Wenn ein Repo hier reift oder kommerzialisiert wird, verfolgen wir auch das, frühe Berichterstattung ist der Sinn eines Radars.
