Skip to main content
AI Tool Radar
OSI-openVektoren, Dokumente und Extraktion

LEANN

StarTrail-org

RAG auf allem - graphbasierter Vektorindex mit behaupteten 97% Storage-Einsparungen für private On-Device-Suche.

11.9k Stars(Stand 2026-06-14)Auf GitHub ansehen

Was ist LEANN?

LEANN ist eine Python-Vektordatenbank, die Embeddings selektiv aus einem Graph neu berechnet statt alle zu speichern, und behauptet 97% Storage-Einsparungen gegenüber FAISS bei wettbewerbsfähigem Recall (eigene Angabe des Projekts). Sie indiziert PDFs, E-Mails, Browser-Verlauf, Chat-Logs und Code (AST-aware), integriert sich via MCP und ist durch ein peer-reviewed MLsys2026-Paper unterstützt.

Vor- & Nachteile

Pros

  • Peer-reviewed MLsys2026-Paper validiert den Storage-Ansatz unabhängig
  • Multi-Contributor-Team mit substanziellen Commits (CUDA, GPU, Apple Silicon)
  • MCP-nativ mit Claude Code und AST-aware Code-Chunking

Cons

  • Neuere Commits sind nur Fixes und CI, keine neuen Features
  • v0.x signalisiert API-Instabilität; Storage-Einsparungen kosten Neuberechnungslatenz
  • Erfordert Embedding-Modell-Setup - nicht plug-and-play für Nicht-ML-Entwickler

Lizenz

MIT (OSI-open)

Wann interessant

Privates On-Device-RAG über persönliche Daten (E-Mails, Chat-Logs, Code) ohne die Storage-Kosten traditioneller Vektor-DBs.

Wann zu früh

Latenzsensibler Produktions-Retrieval im großen Maßstab, bei dem Neuberechnungs-Overhead inakzeptabel ist.

Kommerzielle Alternative & Verwandtes

  • Kommerzielles Pendant: Pinecone / Weaviate

Dieses Repo war in der Ausgabe 2026-07 des Open-Source-KI-Radars.