OSI-openVektoren, Dokumente und Extraktion

semble

MinishLab

CPU-only semantische Code-Suche für Agenten: in natürlicher Sprache fragen, nur die relevanten Snippets zurückbekommen.

5.4k Stars(Stand 2026-06-26)Auf GitHub ansehen Homepage

Überblick

Was ist semble?

Ein Code-Suchtool für KI-Coding-Agents: du fragst in natürlicher Sprache und bekommst nur die relevanten Snippets zurück, statt ganze Dateien zu lesen oder zu grep'en. Es läuft komplett auf der CPU mit tree-sitter-Parsing, Model2Vec-Static-Embeddings und BM25, braucht keine API-Keys oder GPU und kommt als Python-Library, CLI und MCP-Server.

Analyse

Vor- & Nachteile

Pros

Zero-Setup lokal, keine API-Keys, GPU oder Cloud, vom Model2Vec/Potion-Team
Dreifache Distribution (Library, CLI und MCP-Server) passt zu Agent- und Mensch-Workflows
MIT-lizenziert mit Releases, Tests und Docs

Cons

Vor 1.0 (0.4.x), Schnittstellen können brechen
Plakative Effizienzzahlen (98% weniger Tokens, 218x schnelleres Indexing) sind unverifizierte Projekt-Benchmarks
Die Retrieval-Qualität der Static-Embeddings auf sehr großen oder ungewöhnlichen Codebases ist nicht unabhängig validiert

Lizenz

MIT (OSI-open)

Wann interessant

Coding-Agent-Nutzer, die mit einem lokalen CPU-Tool Kontext-Token-Kosten bei der Code-Suche senken wollen.

Wann zu früh

wenn du erst eine stabile 1.0-API oder belegte Retrieval-Qualität auf deinem konkreten Monorepo brauchst.

Kontext

Kommerzielle Alternative & Verwandtes

Kommerzielles Pendant: Greptile

Dieses Repo war in der Ausgabe 2026-07 des Open-Source-KI-Radars.

Ähnliche Repositories

langextract

google

36.8k

Python-Bibliothek von Google für LLM-gestützte strukturierte Extraktion mit Source Grounding.

OSI-openVektoren, Dokumente und Extraktion

LEANN

StarTrail-org

11.9k

RAG auf allem - graphbasierter Vektorindex mit behaupteten 97% Storage-Einsparungen für private On-Device-Suche.

OSI-openVektoren, Dokumente und Extraktion

turbovec

RyanCodrai

11.5k

Rust-Vektorindex mit TurboQuant-Kompression (ICLR 2026) - SIMD-Kernel, Online-Ingest.

OSI-openVektoren, Dokumente und Extraktion