Cloudflare revolutioniert AI-Entwicklung mit Agents SDK v0.5.0
Am 17. Februar 2026 hat Cloudflare das neue Agents SDK v0.5.0 veröffentlicht, das grundlegende Verbesserungen in der Entwicklung von künstlicher Intelligenz (AI) bietet. Dieses Update zielt darauf ab, die Einschränkungen traditioneller serverloser Architekturen für fortgeschrittene AI-Anwendungen zu beseitigen, indem es ein durchgehend integriertes Ausführungssystem bereitstellt, das Berechnung, Zustand und Inferenz am Netzwerkedge bündelt.
Neue Ansätze für die Entwicklung von AI-Agenten
Traditionell müssen AI-Agenten jeden LLM (Large Language Model)-Aufruf neu initialisieren, was die Latenz erhöht und die Token-Nutzung steigert. Das neue SDK ermöglicht es Entwicklern, Agenten zu erstellen, die über längere Zeiträume hinweg ihren Zustand beibehalten, wodurch einfache Anfrage-Antwort-Zyklen überwunden werden. Dies wird dank zweier Haupttechnologien erreicht: Durable Objects und Infire.
Stateful Management durch Durable Objects
Das Agents SDK verwendet Durable Objects (DO), um jedem Agenten eine dauerhafte Identität und Erinnerung zu geben. In konventionellen serverlosen Architekturen haben Funktionen keine Erinnerung an vorherige Ereignisse, es sei denn, sie interagieren mit einer externen Datenbank wie RDS oder DynamoDB. Diese Abläufe führen häufig zu zusätzlichen Latenzen von 50 bis 200 Millisekunden.
Durable Objects sind zustandsbehaftete Mikro-Server, die im Netzwerk von Cloudflare betrieben werden und über eigenen privaten Speicher verfügen. Jeder Agent, der mit dem Agents SDK instanziiert wird, erhält eine stabile ID, wodurch zukünftige Anfragen an dieselbe physische Instanz weitergeleitet werden. Das bedeutet, dass Agenten ihre Zustände in einem eingebetteten SQLite-Datenbankformat mit einer Speicherbegrenzung von 1 GB speichern können, wodurch sofortige Datenzugriffe möglich sind.
Diese Struktur ermöglicht es, mehrere Anfragen in einer Queue sequentiell zu verarbeiten, was die Konsistenz des Agentenstatus während komplexer Operationen sicherstellt.
Infire: Eine Effizienzsteigerung durch Rust
Für die Inferenzebene hat Cloudflare die Engine Infire entwickelt, die in Rust geschrieben ist und die vorher verwendeten Python-basierten Stacks wie vLLM ersetzt. Python-Engines sind oft durch die Global Interpreter Lock (GIL)-Problematik und Garbage Collection-Pausen limitiert. Infire maximiert die GPU-Nutzung auf H100-Hardware, während der CPU-Overhead um 82 % reduziert wird.
Die Architektur nutzt Granular CUDA Graphs und Just-In-Time (JIT)-Kompilierung, um die Effizienz weiter zu steigern. Anstatt GPU-Kernels sequenziell zu starten, wird für jede mögliche Batch-Größe ein CUDA-Graph in Echtzeit kompiliert. Benchmarks zeigen, dass Infire 7 % schneller als vLLM 0.10.0 ist und dabei lediglich 25 % CPU im Vergleich zu über 140 % bei Python verwendet.
Code-Modus für Token-Effizienz
Ein Standard AI-Agent verwendet typischerweise „Tool Calling“, was mehrfache Rückrufe zwischen dem LLM und der Ausführungsumgebung erfordert. Cloudflares „Code-Modus“ ändert dies, indem er das LLM anweist, ein TypeScript-Programm zu schreiben, das mehrere Tools gleichzeitig orchestriert. Dadurch wird die Token-Nutzung komplexer Aufgaben um 87,5 % reduziert, da Zwischenergebnisse innerhalb des sicheren V8-Isolats bleiben und nicht an das LLM zurückgesendet werden müssen, was den Prozess sowohl schneller als auch kosteneffektiver macht.
Zusätzlich verbessert der Code-Modus die Sicherheit durch „sichere Bindungen“, wobei das Sandbox-Umfeld keinen Internetzugang hat und nur über bestimmte Bindungen im Umgebungsobjekt mit den MCP-Servern interagieren kann.
Release v0.5.0: Neue Funktionen für Produktionsreife Agenten
Das February-Update führte mehrere nützliche Funktionen ein:
- this.retry(): Eine neue Methode für die automatische Wiederholung asynchroner Operationen mit exponentiellem Backoff und Jitter.
- Protokollunterdrückung: Entwicklern wurde ermöglicht, JSON-Nachrichtentexte auf einer Verbindungsbasis zu unterdrücken.
- Stabiler AI-Chat: Das
@cloudflare/ai-chatPaket umfasste nun auch eine Nachrichtenspeicherung in SQLite.
Fazit
Das Agenten-SDK v0.5.0 von Cloudflare revolutioniert die AI-Entwicklung, indem es persistente Zustände am Edge ermöglicht, die Effizienz von Rust-basierten Inferenzprozessen maximiert und innovative Ansätze zur Token-Nutzung einführt. Entwickler haben nun die Werkzeuge, um leistungsfähige und konsistente AI-Agenten zu gestalten, die in sicherem und wartbarem Code operieren.
Da Cloudflare weiterhin neue Höhen in der AI-Entwicklung anstrebt, ist das Agents SDK v0.5.0 ein entscheidender Schritt in die Zukunft.
Weitere technische Details finden Sie in der Cloudflare-Dokumentation.


