Die Klasse von 2023: Was aus AutoGPT

Der Frühling der Agenten#

Im März und April 2023 passierte ein Goldrausch auf GitHub. Innerhalb weniger Wochen erreichte AutoGPT eine Million Stars, BabyAGI wurde in jeder großen Tech-Publikation behandelt, AgentGPT startete einen polierten SaaS-Wrapper, und Dutzende Nachahmer erschienen. Die Prämisse aller war, dass GPT-4 kombiniert mit einer Rekursions-Schleife, die es planen und Tools aufrufen lässt, einen Allzweck-Arbeiter approximieren würde. Gib ihm ein Ziel, geh weg, komm zu einem fertigen Projekt zurück.

Für ein paar Wochen fühlte es sich an, als hätte sich etwas geändert. Ich verbrachte Wochenenden, wie viele Entwickler, damit, zuzusehen, wie diese Systeme Pläne generierten, Teilaufgaben ausführten, hängen blieben, sich befreiten.

Drei Jahre später sind die meisten dieser Projekte pivotiert oder still geworden. Die Überlebenden sehen anders aus. Und die Infrastruktur, die am Ende zählte, kam aus ganz anderen Richtungen. Das ist eine Retrospektive mit verifizierbarem aktuellem Stand für jedes große Projekt.

AutoGPT#

Damals: Gestartet am 30. März 2023 von Toran Bruce Richards. Das ikonische Projekt, das die Kategorie definierte.

Jetzt: Noch aktiv auf github.com/Significant-Gravitas/AutoGPT. Rund 183.000 Stars — hoch, aber plateauend. Das Projekt pivotierte zu "AutoGPT Platform", einem Low-Code-Workflow-Builder mit Agent Builder, Forge-Framework und der agbenchmark-Suite. Die ursprüngliche autonome-Schleife-Prämisse wurde durch konfigurierbare Agenten ersetzt, die in definierten Workflows laufen — strukturell das Gegenteil der 2023er-Vision.

Die Lektion: Das AutoGPT-Team iterierte ehrlich. Als die autonome-Ziel-Ausführungs-Prämisse kein verkaufbares Produkt ergab, bauten sie den Kern als Workflow-Tool mit KI-Schritten um, statt als autonomen Agenten. Das ist, was die meisten Nachahmer nicht machten.

BabyAGI#

Damals: Gestartet Ende März 2023 von Yohei Nakajima. Ein paar hundert Zeilen Python, die eine Task-Management-Schleife an GPT-4 verdrahteten.

Jetzt: Das Original-Repo ist archiviert als babyagi_archive (September-2024-Snapshot). Nakajima shippte BabyAGI 2 (functionz) im September 2024, aber die Aktivität war über 2026 minimal. Das Projekt ist effektiv eine Forschungsskizze, keine Produktions-Plattform.

Die Lektion: BabyAGI war immer eine Forschungsskizze, kein Produkt. Das war aus der Art, wie es geschrieben war, klar. Sein Einfluss liegt in den Mustern, die es beisteuerte (eine Task-Liste, eine Queue, eine Schleife), die in fast jedem späteren Agenten-Projekt auftauchten. Behandle es als wegweisendes Paper in Code-Form, nicht als gescheitertes Produkt.

AgentGPT / reworkd#

Damals: Eine saubere Web-UI für einen AutoGPT-artigen Agenten, gestartet April 2023 von reworkd. Erstes Mal, dass viele nicht-technische Leute Agenten-artige KI begegneten.

Jetzt: Die Firma pivotierte im Juli 2024 zu KI-gestütztem Web-Scraping. TechCrunch-Bericht berichtet, dass sie rund 2.000 Dollar pro Tag an API-Calls für AgentGPT ausgaben, ohne Profitabilität zu erreichen. Sie sammelten 2,75 Mio. Dollar von Paul Graham, Nat Friedman, Daniel Gross's AI Grant, SV Angel und General Catalyst, und verkaufen jetzt strukturierte Daten-Extraktion in Masse. AgentGPTs Legacy-Interface existiert noch auf agentgpt.reworkd.ai, ist aber nicht dort, wo der Umsatz ist.

Die Lektion: reworkd erkannte früh, dass ein Allzweck-Agenten-Produkt keine zahlenden Kunden finden würde, und pivotierte zu einem engen Datenextraktions-Use-Case, in dem das KI-Agenten-Muster tatsächlich funktionierte. Wohl das bestausgeführte Beispiel für "start mit dem Hype, ende mit dem Eng-und-Nützlich" dieser Kohorte.

MetaGPT#

Damals: Gestartet Mitte 2023 als Multi-Agenten-Software-Engineering-Framework ("weise verschiedenen Agenten verschiedene Rollen in einem Software-Team zu").

Jetzt: Noch sehr aktiv. github.com/FoundationAgents/MetaGPT (umbenannt von geekan/MetaGPT) hat rund 67.200 Stars und laufende Commits. Das Team launchte MGX (MetaGPT X) im Februar 2025, und ihr AFlow-Paper wurde bei ICLR 2025 als Oral-Präsentation akzeptiert (top 1,8% der Einreichungen). Das ist eine der Erfolgsgeschichten der Kohorte: Sie fanden eine spezifische Nische (Multi-Agenten-Software-Engineering-Forschung) und blieben fokussiert.

Die Lektion: Enger Fokus und akademische Strenge funktionierten. MetaGPT ist kein Consumer-Produkt, aber es wurde eine glaubwürdige Forschungs-Plattform, was ein echtes Ergebnis ist.

GPT-Engineer#

Damals: Gestartet Mitte 2023 von Anton Osika als Kommandozeilen-Code-Generierungs-Tool.

Jetzt: Das Original-Repo hat rund 55.200 Stars, aber das letzte Release war v0.3.1 im Juni 2024. Die README verweist jetzt auf lovable.dev (Osikas nächste Firma) oder aider als Alternativen. Das Repo ist effektiv im Maintenance-Mode; das community-geführte gpt-engineer-org existiert als Nachfolger-Shell, aber mit reduzierter Aktivität.

Die Lektion: Wenn der Gründer zu einem neuen Projekt wechselt, überlebt das Original meist nicht. Osika ging zu lovable.dev, das seine eigene Wachstumsbahn hat. gpt-engineer ist eingefroren als Legacy-Artefakt. Wir haben abgewogen, ob sich Lovable heute für dein MVP lohnt.

smol-ai / developer#

Damals: "smol developer" war ein minimaler, meinungsstarker Code-Generierungs-Agent, der Mitte 2023 trendete.

Jetzt: github.com/smol-ai/developer hat rund 12.200 Stars, aber nur 124 Commits gesamt und 69 offene Issues. Das smol.ai-Team verlagerte Aufmerksamkeit zu AI News, ihrem Newsletter und Publikation, die aktiv durch 2026 aktualisiert werden. Das Developer-Projekt selbst ist technisch verfügbar, aber effektiv dormant.

Die Lektion: Open-Source-Projekte brauchen anhaltende Maintainer-Aufmerksamkeit. Wenn die Aufmerksamkeit des Gründers wandert, friert das Projekt meist ein, außer eine engagierte Nachfolge-Community bildet sich. Für smol developer passierte keines in Skala.

Microsoft AutoGen#

Damals: Ende 2023 von Microsoft Research veröffentlicht als Multi-Agenten-Konversations-Framework. Wurde eines der meistgestarten Agenten-Frameworks.

Jetzt: github.com/microsoft/autogen hat rund 57.200 Stars, und das letzte Release war python-v0.7.5 am 30. September 2025. Das Repo-Banner sagt explizit "Maintenance Mode, keine neuen Features", und Microsoft empfiehlt das neue Microsoft Agent Framework (RC 1.0 am 19. Februar 2026) als Nachfolger. Die AutoGen-Community forkte das Projekt als AG2 (ag2ai/ag2) im November 2024 und entwickelt aktiv Richtung v1.0 weiter.

Die Lektion: Selbst gut ausgestattete Microsoft-Projekte können eingestellt werden, wenn interne Strategie sich verschiebt. Dass AutoGen jetzt im Maintenance-Mode ist, während das Agent Framework als Nachfolger positioniert ist, ist ein klares Signal, wohin Microsoft den Markt gehen sieht.

HuggingGPT / JARVIS#

Damals: Microsoft-Research-Paper, veröffentlicht bei NeurIPS 2023 (arXiv 2303.17580), demonstrierte ein LLM, das spezialisierte Modelle via Hugging Face orchestriert.

Jetzt: Das microsoft/JARVIS Repo existiert noch, hatte aber durch 2025-2026 keine großen Releases. Das Forschungsteam shippte Follow-ups (TaskBench im November 2023, EasyTool im Januar 2024), aber die HuggingGPT-Marke wurde kein Produkt. Das Paper selbst bleibt häufig in Tool-Routing-Forschung zitiert, es überlebte also als akademischer Beitrag, nicht als Artefakt.

Die Lektion: Akademie verarbeitete den Agenten-Moment anders als die Industrie. Die Papers steuerten echte Ideen bei, die in 2026 in verfeinerter Form überlebten. Die Industrieprojekte, die dieselben Ideen ohne akademischen Rahmen kopierten, überlebten meist nicht.

Was tatsächlich überlebte — aus anderen Wurzeln#

Keines der 2026er-Agent-förmigen-Geschäfte, die echtes Geld verdienen, verfolgt seine Linie zu AutoGPT oder BabyAGI zurück. Die erfolgreichen Muster kamen aus anderen Richtungen:

Cursor (2022 gegründet, 2023 auf KI-Coding refokussiert): über 2 Mrd. Dollar ARR, 1 Mio.+ tägliche aktive Nutzer (TechCrunch, März 2026).
Claude Code (Launch Februar 2025): rund 2,5 Mrd. Dollar Run-Rate bis Anfang 2026.
Replit Agent (Launch 2024): 240 Mio. ARR 2025, 9 Mrd. Dollar Bewertung 2026 berichtet.
GitHub Copilot: 20 Mio. Nutzer, etwa 800 Mio. Dollar ARR.
Devin (Launch März 2024, nach Upwork-Demo-Debunking zurückgerudert): wurde ein begrenzteres Produkt. Cognition berichtete über 73 Mio. Dollar ARR nach der Windsurf-Übernahme.

Das Muster, über das ich in Das stille Ende der KI-Agenten schrieb: enger Scope, menschliche Aufsicht, artefakt-produzierende Outputs. Die 2023er-Klasse versuchte, den generellen Fall zu bauen. Die Klasse von 2024 und später akzeptierte, dass der generelle Fall ein Forschungsproblem ist, und baute für spezifische, wertvolle Nischen.

Der nützliche Test für die nächste Welle#

Etwas Neues kommt später dieses Jahr oder nächstes. Die Zutaten sind da: bessere Modelle, bessere Tools, MCP als Infrastruktur, das GAIA-Leaderboard zeigt echten Fortschritt bei Agenten-Benchmarks. Wenn es passiert, der Test, den ich anlegen werde:

Ist der Scope begrenzt? Wenn der Pitch mit "Allzweck" beginnt, ist es wahrscheinlich wieder das 2023er-Muster.
Ist der Output ein Artefakt? Kann ein Mensch sehen, was der Agent produzierte, und es ablehnen? Wenn der "Output" Aktionen in externen Systemen sind, ist der Schadensradius von Fehlern zu breit.
Kann ein Mensch überwachen? Erwartet das Produkt, dass du in der Schleife bist, oder verspricht es, dass du weggehen kannst?
Sind die Ausfallmodi dokumentiert? Die besten 2026er-Agenten-Produkte (Claude Code, Computer Use) sind bemerkenswert offen über das, was nicht funktioniert.

Die Klasse von 2023 war kein Versagen. Sie war ein nützliches Experiment, das dem Feld beibrachte, was nicht funktioniert. Die Leute, die daraus lernten, bauten die Tools, die jetzt ehrlich nützlich sind. Die Leute, die versuchten, AutoGPT-artige Universal-Agenten weiter zum Laufen zu bringen, zogen meist weiter. Das ist ein nützliches Ergebnis, auch wenn es nicht das ist, was die frühen Posts versprachen.

Weiterlesen#

Das stille Ende der KI-Agenten für das detaillierte Argument, warum die Universal-Agent-Prämisse immer wieder scheitert.
Vibe Coding ist eine Lüge für die Daten zu KI-Coding-Produktivität, die eine verwandte Geschichte erzählen.
MCP ist wichtiger, als du denkst für die Infrastruktur-Verschiebung, die still die echte nächste Generation ermöglicht.

Quellen#

AutoGPT Repo: https://github.com/Significant-Gravitas/AutoGPT
BabyAGI Archive: https://github.com/yoheinakajima/babyagi_archive
BabyAGI 2: https://github.com/yoheinakajima/babyagi
Reworkd-Pivot, TechCrunch, Juli 2024: https://techcrunch.com/2024/07/24/reworkd-paul-graham-nat-friedman-daniel-gross-scrape-ai-agents/
MetaGPT Repo: https://github.com/FoundationAgents/MetaGPT
GPT-Engineer Repo: https://github.com/AntonOsika/gpt-engineer
smol-ai/developer: https://github.com/smol-ai/developer
Microsoft AutoGen: https://github.com/microsoft/autogen
Microsoft Agent Framework: https://github.com/microsoft/agent-framework
AG2 Community-Fork: https://github.com/ag2ai/ag2
HuggingGPT-Paper (arXiv 2303.17580): https://arxiv.org/abs/2303.17580
Microsoft JARVIS Repo: https://github.com/microsoft/JARVIS
Devin-Walkback, Pragmatic Engineer: https://newsletter.pragmaticengineer.com/p/the-pulse-90
Cursor 2 Mrd. ARR, TechCrunch März 2026: https://techcrunch.com/2026/03/02/cursor-has-reportedly-surpassed-2b-in-annualized-revenue/

Roland Hentschel

AI & Web Technology Expert

Web developer and AI enthusiast helping businesses navigate the rapidly evolving landscape of AI tools. Testing and comparing tools so you don't have to.

Die Klasse von 2023: Was aus AutoGPT

Der Frühling der Agenten#

AutoGPT#

BabyAGI#

AgentGPT / reworkd#

MetaGPT#

GPT-Engineer#

smol-ai / developer#

Microsoft AutoGen#

HuggingGPT / JARVIS#

Was tatsächlich überlebte — aus anderen Wurzeln#

Der nützliche Test für die nächste Welle#

Weiterlesen#

Quellen#

Roland Hentschel

Tools aus diesem Beitrag

Dify Review 2026: Open-Source-LLM-App-Plattform im Test

Zapier Guide 2026

Claude Guide 2026

Weitere Beiträge aus dem Blog

Generative Engine Optimization: Wie du deine Marke in der AI-Suche trackst

Lohnt sich Lovable für dein MVP 2026?

KI-Agenten und MCP werden Mainstream