LEANN
StarTrail-org
RAG auf allem - graphbasierter Vektorindex mit behaupteten 97% Storage-Einsparungen für private On-Device-Suche.
Was ist LEANN?
LEANN ist eine Python-Vektordatenbank, die Embeddings selektiv aus einem Graph neu berechnet statt alle zu speichern, und behauptet 97% Storage-Einsparungen gegenüber FAISS bei wettbewerbsfähigem Recall (eigene Angabe des Projekts). Sie indiziert PDFs, E-Mails, Browser-Verlauf, Chat-Logs und Code (AST-aware), integriert sich via MCP und ist durch ein peer-reviewed MLsys2026-Paper unterstützt.
Vor- & Nachteile
Pros
- Peer-reviewed MLsys2026-Paper validiert den Storage-Ansatz unabhängig
- Multi-Contributor-Team mit substanziellen Commits (CUDA, GPU, Apple Silicon)
- MCP-nativ mit Claude Code und AST-aware Code-Chunking
Cons
- Neuere Commits sind nur Fixes und CI, keine neuen Features
- v0.x signalisiert API-Instabilität; Storage-Einsparungen kosten Neuberechnungslatenz
- Erfordert Embedding-Modell-Setup - nicht plug-and-play für Nicht-ML-Entwickler
Lizenz
MIT (OSI-open)
Wann interessant
Privates On-Device-RAG über persönliche Daten (E-Mails, Chat-Logs, Code) ohne die Storage-Kosten traditioneller Vektor-DBs.
Wann zu früh
Latenzsensibler Produktions-Retrieval im großen Maßstab, bei dem Neuberechnungs-Overhead inakzeptabel ist.
Kommerzielle Alternative & Verwandtes
- Kommerzielles Pendant: Pinecone / Weaviate
Dieses Repo war in der Ausgabe 2026-07 des Open-Source-KI-Radars.
langextract
Python-Bibliothek von Google für LLM-gestützte strukturierte Extraktion mit Source Grounding.
turbovec
RyanCodrai
Rust-Vektorindex mit TurboQuant-Kompression (ICLR 2026) - SIMD-Kernel, Online-Ingest.
chandra
datalab-to
Hochgenaue Dokumenten-Digitalisierung (OCR/Layout) mit offenem Code und einem open-weight-Modell.