OpenKB
VectifyAI
CLI, das Dokumente in ein vernetztes, Obsidian-freundliches Wiki kompiliert, statt wie klassisches RAG neu abzufragen.
Was ist OpenKB?
Ein Open-Source-CLI, das Rohdokumente (PDF, Word, Markdown, PowerPoint, HTML, Excel, CSV, URLs) mit LLMs in eine strukturierte, vernetzte Wiki-Wissensbasis verwandelt. Statt das Wissen pro Anfrage neu abzuleiten wie klassisches RAG, kompiliert es Dokumente einmal in persistente Wiki-Seiten nach Googles Open Knowledge Format, mit automatischen Querverweisen, Obsidian-kompatiblem Markdown, Abfrage, Chat mit Zitaten und Graph-Visualisierung.
Vor- & Nachteile
Pros
- Apache-2.0-Python-Tool vom glaubwürdigen PageIndex/Vectify-Team, pip-installierbar und lokal
- Neuer Ansatz: ein persistentes, vernetztes, OKF-konformes Wiki statt Neu-Abfrage, vektorlos über PageIndex-Tree-Indexing
- Breite Eingabeformate plus multimodale Verarbeitung und Extras wie Graph-Visualisierung und Deck-Generierung
Cons
- Vor 1.0 (v0.4.2-rc1), Formate und APIs können sich noch verschieben
- Fortgeschrittene Features (OCR, schnelleres Indexing) brauchen einen PAGEINDEX_API_KEY für die kommerzielle Anbieter-Cloud
- Qualität und Kosten hängen vom mitgebrachten externen LLM ab, ohne formale Retrieval-Benchmarks
Lizenz
Apache-2.0 (OSI-open)
Wann interessant
einen Stapel Dokumente lokal in eine navigierbare, vernetzte, Obsidian-freundliche Wissensbasis verwandeln.
Wann zu früh
wenn du eine stabile 1.0 brauchst, die PageIndex-Abhängigkeit vermeiden willst oder belegte Retrieval-Benchmarks forderst.
Kommerzielle Alternative & Verwandtes
- Kommerzielles Pendant: PageIndex
Dieses Repo war in der Ausgabe 2026-07 des Open-Source-KI-Radars.
langextract
Python-Bibliothek von Google für LLM-gestützte strukturierte Extraktion mit Source Grounding.
LEANN
StarTrail-org
RAG auf allem - graphbasierter Vektorindex mit behaupteten 97% Storage-Einsparungen für private On-Device-Suche.
turbovec
RyanCodrai
Rust-Vektorindex mit TurboQuant-Kompression (ICLR 2026) - SIMD-Kernel, Online-Ingest.