forge
antoinezambelli
Python-Zuverlässigkeitsschicht, die self-hosted und kleine LLMs verlässlich im Tool-Calling macht, mit Guardrails.
Was ist forge?
Eine Python-Zuverlässigkeitsschicht für self-hosted LLM-Tool-Calling: du lieferst Tools, das Modell ruft sie in beliebiger Reihenfolge auf, mit Guardrails wie Rescue-Parsing fehlerhafter Tool-Calls, Retry- und Fehler-Tracking, Response-Validierung, einem synthetischen respond-Tool für kleine Modelle und Kontext-Compaction. Es deployt als transparenter OpenAI/Anthropic-kompatibler Proxy, als Workflow-Runner oder als kombinierbare Middleware und sagt ausdrücklich, dass es kein voller Agent-Orchestrator ist.
Vor- & Nachteile
Pros
- Zielt auf eine echte Nische: kleine und self-hosted Modelle verlässlich im Tool-Calling machen
- Starke Engineering-Signale: 865 Unit-Tests, eine Eval-Harness und drei Deployment-Modi
- Ehrliche Eingrenzung: es sagt offen, dass es Guardrails-Middleware ist, kein voller Orchestrator
Cons
- Ein enger Auftrag (eine einzelne Agentic-Schleife); die 'Multi-Step-Workflows'-Aussage übertreibt eine Zuverlässigkeitsschicht
- Plakative Genauigkeitsgewinne sind selbstberichtet auf der eigenen Benchmark des Autors, unverifiziert
- Python 3.12+ und ein self-hosted Backend erhöhen die Setup-Hürde
Lizenz
MIT (OSI-open)
Wann interessant
du fährst self-hosted oder kleine LLMs und brauchst verlässliches Tool-Calling, ohne ein schweres Agent-Framework zu übernehmen.
Wann zu früh
wenn du dich auf die genannten Genauigkeitszahlen verlässt oder volle Multi-Agent-Orchestrierung willst.
Dieses Repo war in der Ausgabe 2026-07 des Open-Source-KI-Radars.
Nanobot
HKUDS
Leichtgewichtiger persönlicher KI-Agent für Tools, Chats und Workflows - eine Binary, Multi-Channel.
DeepTutor
HKUDS
Agent-nativer personalisierter Lernarbeitsbereich - Tutoring, Quizze, Recherche und RAG-Wissensbasen.
OpenFang
RightNow-AI
Open-Source Agent Operating System in Rust - autonome Fähigkeiten, 40 Kanäle, WASM-Sandbox.