Skip to main content
AI Tool Radar
OSI-openAgent-Frameworks und Runtimes

forge

antoinezambelli

Python-Zuverlässigkeitsschicht, die self-hosted und kleine LLMs verlässlich im Tool-Calling macht, mit Guardrails.

2.1k Stars(Stand 2026-06-26)Auf GitHub ansehen

Was ist forge?

Eine Python-Zuverlässigkeitsschicht für self-hosted LLM-Tool-Calling: du lieferst Tools, das Modell ruft sie in beliebiger Reihenfolge auf, mit Guardrails wie Rescue-Parsing fehlerhafter Tool-Calls, Retry- und Fehler-Tracking, Response-Validierung, einem synthetischen respond-Tool für kleine Modelle und Kontext-Compaction. Es deployt als transparenter OpenAI/Anthropic-kompatibler Proxy, als Workflow-Runner oder als kombinierbare Middleware und sagt ausdrücklich, dass es kein voller Agent-Orchestrator ist.

Vor- & Nachteile

Pros

  • Zielt auf eine echte Nische: kleine und self-hosted Modelle verlässlich im Tool-Calling machen
  • Starke Engineering-Signale: 865 Unit-Tests, eine Eval-Harness und drei Deployment-Modi
  • Ehrliche Eingrenzung: es sagt offen, dass es Guardrails-Middleware ist, kein voller Orchestrator

Cons

  • Ein enger Auftrag (eine einzelne Agentic-Schleife); die 'Multi-Step-Workflows'-Aussage übertreibt eine Zuverlässigkeitsschicht
  • Plakative Genauigkeitsgewinne sind selbstberichtet auf der eigenen Benchmark des Autors, unverifiziert
  • Python 3.12+ und ein self-hosted Backend erhöhen die Setup-Hürde

Lizenz

MIT (OSI-open)

Wann interessant

du fährst self-hosted oder kleine LLMs und brauchst verlässliches Tool-Calling, ohne ein schweres Agent-Framework zu übernehmen.

Wann zu früh

wenn du dich auf die genannten Genauigkeitszahlen verlässt oder volle Multi-Agent-Orchestrierung willst.

Dieses Repo war in der Ausgabe 2026-07 des Open-Source-KI-Radars.