OSI-openVektoren, Dokumente und Extraktion

LEANN

StarTrail-org

RAG auf allem - graphbasierter Vektorindex mit behaupteten 97% Storage-Einsparungen für private On-Device-Suche.

11.9k Stars(Stand 2026-06-14)Auf GitHub ansehen

Überblick

Was ist LEANN?

LEANN ist eine Python-Vektordatenbank, die Embeddings selektiv aus einem Graph neu berechnet statt alle zu speichern, und behauptet 97% Storage-Einsparungen gegenüber FAISS bei wettbewerbsfähigem Recall (eigene Angabe des Projekts). Sie indiziert PDFs, E-Mails, Browser-Verlauf, Chat-Logs und Code (AST-aware), integriert sich via MCP und ist durch ein peer-reviewed MLsys2026-Paper unterstützt.

Analyse

Vor- & Nachteile

Pros

Peer-reviewed MLsys2026-Paper validiert den Storage-Ansatz unabhängig
Multi-Contributor-Team mit substanziellen Commits (CUDA, GPU, Apple Silicon)
MCP-nativ mit Claude Code und AST-aware Code-Chunking

Cons

Neuere Commits sind nur Fixes und CI, keine neuen Features
v0.x signalisiert API-Instabilität; Storage-Einsparungen kosten Neuberechnungslatenz
Erfordert Embedding-Modell-Setup - nicht plug-and-play für Nicht-ML-Entwickler

Lizenz

MIT (OSI-open)

Wann interessant

Privates On-Device-RAG über persönliche Daten (E-Mails, Chat-Logs, Code) ohne die Storage-Kosten traditioneller Vektor-DBs.

Wann zu früh

Latenzsensibler Produktions-Retrieval im großen Maßstab, bei dem Neuberechnungs-Overhead inakzeptabel ist.

Kontext

Kommerzielle Alternative & Verwandtes

Kommerzielles Pendant: Pinecone / Weaviate

Dieses Repo war in der Ausgabe 2026-07 des Open-Source-KI-Radars.

Ähnliche Repositories

langextract

google

36.8k

Python-Bibliothek von Google für LLM-gestützte strukturierte Extraktion mit Source Grounding.

OSI-openVektoren, Dokumente und Extraktion

turbovec

RyanCodrai

11.5k

Rust-Vektorindex mit TurboQuant-Kompression (ICLR 2026) - SIMD-Kernel, Online-Ingest.

OSI-openVektoren, Dokumente und Extraktion

chandra

datalab-to

11.1k

Hochgenaue Dokumenten-Digitalisierung (OCR/Layout) mit offenem Code und einem open-weight-Modell.

Open weight, mit AuflagenVektoren, Dokumente und Extraktion