OpenClaw Multi-Agent-Orchestrierung 2026: Fan-Out und Pipelines
agentToAgent / Sub-Agent-Spawn und führt Ergebnisse zusammen. Nutzen Sie paralleles Fan-Out, wenn Teilaufgaben unabhängig sind (3 Reviewer, 3 Module). Nutzen Sie sequentielle Pipelines, wenn jede Stufe die Ausgabe der vorherigen braucht (Recherche → Entwurf → Audit). Planen Sie ~3,9 GB RAM für 3-Agenten-Fan-Out zusätzlich zum Basis-Daemon; rechnen Sie mit 24 GB, wenn Fan-Out neben Xcode oder Docker läuft. Installationsgrundlagen stehen im OpenClaw-Setup-Leitfaden — diese Seite behandelt nur Orchestrierung.
Warum Multi-Agent-Orchestrierung wichtig ist
Ein einzelner langlebiger Agenten-Kontext sammelt Rauschen: Recherche-Dumps, gescheiterte Versuche und Tool-Logs blähen das Fenster auf, bis die Qualität sinkt. OpenClaw behandelt Orchestrierung als erstklassiges Problem — der Parent-Agent plant und routet; Worker erhalten enge Prompts und isolierte Workspaces.
Teams setzen Multi-Agent-OpenClaw ein, wenn:
- CI/CD-Generierung mehrere Repos oder Services parallel berühren muss (Benchmark-Daten zeigen ~3,2× schnellere parallele Code-Generierung vs. Einzelagent-Claude Code bei vergleichbaren Aufgaben)
- Code-Review von unabhängigen Blickwinkeln profitiert (Sicherheit, Stil, Coverage), ohne dass ein Modell alle Rollen spielt
- Lange Dokumente einen Agenten nicht zwingen sollen, Recherche, Gliederung, Entwurf und Audit in einem Thread zu halten
Das Scheitern ist auch architektonisch: fünf „Agenten“, die alle in dieselben Memory-Keys schreiben ohne Isolation, erzeugen Race Conditions — die Orchestrierungsschicht muss Merge-Logik und Timeouts besitzen.
OpenClaw-Orchestrierungsmodell
Zur Laufzeit besteht OpenClaw aus einem Gateway-Daemon plus benannten Agenten-Identitäten in der Konfiguration. Multi-Agent-Flows nutzen:
| Primitive | Rolle |
|---|---|
Orchestrator (oft main oder internal) |
Zerlegt Aufgabe, spawnt Worker, merged Ausgaben — sollte keine schwere Tool-Arbeit selbst ausführen |
| Worker-Agenten | Scoped Skills, sandboxed Workspaces, erhalten nur aufgabenbezogenen Kontext |
agentToAgent-Tool |
Strukturierte Nachrichtenübergabe zwischen erlaubten Agenten-IDs |
| Sub-Agent-Spawn | Ephemere Worker für parallele Zweige; Label + Modell + Timeout pro Spawn |
| Dateibasierte Koordination | Viele Produktions-Setups nutzen Workspace-Dateien (z. B. brain/-Verzeichnisse) als Blackboard, wenn Live-Messaging nicht reicht |
Tiefen-Faustregel: Zwei Ebenen (Orchestrator → Worker) decken ~95 % der Workloads ab. Drei Ebenen (Orchestrator → Team Lead → Leaf) helfen nur, wenn Sub-Teams wirklich unabhängig sind — Debug-Kosten steigen stark.
Externe Referenz: OpenClaw GitHub und Community-Architektur-Hinweise zu maxSpawnDepth / Cascade-Stop-Verhalten.
Drei Orchestrierungsmuster
Muster 1 — Paralleles Fan-Out
Wann: Teilaufgaben hängen nicht voneinander ab.
Form: Orchestrator startet mehrere Spawns in einem Turn; Wall-Clock ≈ langsamster Worker, nicht Summe der Worker.
Beispiele:
- Drei Pakete gleichzeitig linten
- Drei Wettbewerber-URLs recherchieren
- Unit-Tests für drei Services generieren
Anti-Pattern: Fan-Out einer Pipeline (Recherche + Entwurf) — der Entwerfer startet mit leerem Input, während die Recherche noch läuft.
Orchestrator
├── spawn worker-a (scope: package-frontend)
├── spawn worker-b (scope: package-api)
└── spawn worker-c (scope: package-worker)
→ merge summaries → single PR plan
Muster 2 — Sequentielle Pipeline
Wann: Stufe B braucht das Artefakt von Stufe A.
Form: Recherche → Gliederung → Implementierung → Audit → Veröffentlichung. Jeder Worker erhält einen sauberen Kontext nur mit dem Deliverable der vorherigen Stufe.
Warum es gewinnt: Der Entwerfer trägt nie 3.000 Zeilen roher Recherche-Tokens; der Auditor sieht keine Pre-Audit-Entwurfshistorie.
Kosten: Wall-Clock ist additiv — nur nutzen, wenn Abhängigkeiten real sind.
Muster 3 — Fan-Out mit Validierung
Wann: Genauigkeit wichtiger als Geschwindigkeit (Compliance-Text, Infra-Diffs, Preistabellen).
Form: Gleicher Prompt an 2–3 Worker; Orchestrator oder ein Monitor-Agent vergleicht Ausgaben; Abweichungen lösen Retry oder menschliche Eskalation aus.
Kosten: ~2–3× Token-Ausgaben vs. ein Worker — nur für High-Stakes-Merges gerechtfertigt.
Konfigurations-Runbook
Voraussetzung: OpenClaw ist installiert — falls nicht, zuerst den Setup-Leitfaden abschließen.
Schritt 1 — Agenten-Roster in openclaw.json definieren
Typischer Pfad: ~/.openclaw/openclaw.json (für Ihre Version prüfen).
{
"agents": {
"list": [
{
"id": "orchestrator",
"default": true,
"workspace": "~/.openclaw/workspace-orchestrator",
"sandbox": { "mode": "off" }
},
{
"id": "coder",
"workspace": "~/.openclaw/workspace-coder",
"sandbox": { "mode": "all", "scope": "agent" },
"skills": ["git", "nodejs", "testing"]
},
{
"id": "researcher",
"workspace": "~/.openclaw/workspace-research",
"sandbox": { "mode": "all", "scope": "agent" },
"skills": ["web", "docs"]
}
]
},
"tools": {
"agentToAgent": {
"enabled": true,
"allow": ["orchestrator", "coder", "researcher"]
}
}
}
Schritt 2 — Workspaces pro Worker isolieren
Jede Worker-ID sollte ein eigenes Workspace-Verzeichnis haben. Niemals einen beschreibbaren Workspace zwischen parallelen Fan-Out-Workern teilen — Datei-Races korrumpieren Merges.
mkdir -p ~/.openclaw/workspace-{orchestrator,coder,researcher}
Schritt 3 — Orchestrator-System-Prompt mit Routing-Tabelle schreiben
Der Orchestrator-Prompt muss enthalten:
- Verfügbare Worker-IDs und Skills
- Wann Fan-Out vs. Pipeline
- Timeout pro Spawn (z. B. 120 s für Recherche, 300 s für Codegen)
- Fehlerpolitik: einmal retry, dann eskalieren
Sub-Agent-Kontext-Regel: Worker erhalten nur AGENTS.md + TOOLS.md + Task-Payload — nicht den vollen Orchestrator-Thread.
Schritt 4 — Sandbox für nicht vertrauenswürdige Worker aktivieren
Orchestrator sandbox.mode: off für Koordinations-Tools; Coder/Researcher mit mode: all sandboxen, wenn Worker Shell oder Netzwerk ausführen können.
Schritt 5 — Spawn-Limits setzen
maxChildren / maxSpawnDepth gemäß Ihrer OpenClaw-Version-Docs konfigurieren. Starten Sie mit max. 3 parallelen Children, bis RAM und API-Rate-Limits gemessen sind.
Schritt 6 — Mit openclaw doctor testen
openclaw doctor openclaw status
Doppelte Hooks oder widersprüchliche Agent-Bindings beheben, bevor Fan-Out unter CI läuft.
Schritt 7 — Kontrollierte Fan-Out-Aufgabe ausführen
Beispiel-Orchestrator-Anweisung (konzeptionell):
Task: Review modules auth/, billing/, notify/ in parallel. Spawn researcher once per directory with identical rubric. Merge into one markdown report with per-module sections. Timeout: 180s per worker. If one worker fails, continue with partial merge and flag gaps.
Peak-RSS während des Tests loggen — mit Benchmark-Footprints vergleichen.
Schritt 8 — CI-Trigger anbinden (optional)
Gateway lokal exponieren; per SSH + REST aus der Pipeline triggern. Artefakte unter task-scoped Pfaden speichern:
export TASK_ID="${GITHUB_RUN_ID}"
mkdir -p "/tmp/openclaw-runs/${TASK_ID}"
Speicher, Zustand und Merge-Disziplin
| Risiko | Mitigation |
|---|---|
| Parallele Schreibzugriffe auf dieselbe Datei | Task-scoped Keys: ${TASK_ID}/results/{worker}.md |
| Orchestrator-Kontext-Blähung | Worker liefern nur Zusammenfassungen — keine vollen Tool-Transkripte |
| Entgleisende Token-Kosten | Pro-Worker-Budget-Obergrenze; Spawns über N Tokens beenden |
| Veralteter Worker-Zustand | Ephemere Spawns für parallele Arbeit; langlebige Personas nur für dauerhafte Kanäle |
Merge-Vertrag: Orchestrator definiert Output-Schema vorab (JSON-Abschnitte, Pflicht-Überschriften). Worker validieren gegen Schema vor Übergabe.
Hardware- und RAM-Budget
Gemessen auf Apple-Silicon-M4-Klasse-Hosts (siehe Benchmark-Artikel):
| Modus | Zusätzliches RAM (Größenordnung) | Host-Empfehlung |
|---|---|---|
| Einzelner OpenClaw-Agent | ~480 MB idle, ~1,8 GB peak | 16 GB komfortabel |
| 3-Agenten-Fan-Out | ~3,9 GB peak für Worker + Basis | 16 GB knapp, wenn Docker/Xcode offen |
| 3-Agenten + Claude Code parallel | ~5,2 GB kombiniert | 24 GB bevorzugen |
Orchestrierung braucht keine GPU — Engpässe sind API-Rate-Limits und Disk-I/O beim Workspace-Sync. Knotengröße nach Region (nur API-Latenz): M4-Regionen-Matrix.
Fehlerbehandlung
Explizit im Orchestrator-Prompt definieren:
| Ereignis | Politik |
|---|---|
| Worker-Timeout | Einmal mit engerem Scope retry; sonst PARTIAL markieren |
| Worker-Fehler-JSON | Strukturierten Fehler loggen; nicht blind Fan-Out-Retry |
| Widersprüchliche Worker-Antworten | Auf Validierungsmuster oder Mensch eskalieren |
| Orchestrator-Schleife | Max. Spawn-Runden pro Aufgabe begrenzen (z. B. 2 Runden) |
Nächtliche CI-Fehler traceen oft auf fehlende Timeouts — Standard „ewig warten“ blockiert das Gateway.
Empfohlener Weg
| Ihre Situation | Empfehlung |
|---|---|
| Unabhängige Teilaufgaben (≥2) | Paralleles Fan-Out mit isolierten Workspaces |
| Jeder Schritt braucht vorheriges Artefakt | Sequentielle Pipeline |
| High-Stakes-Output | Fan-Out mit Validierung (2–3 Worker) |
| Erstes Mal mit OpenClaw | Einzelagent bis stabil, dann einen Worker hinzufügen |
| RAM ≤16 GB + Xcode | Max. 2 parallele Worker oder auf 24 GB wechseln |
| Claude Code bereits interaktiv im Einsatz | OpenClaw-Orchestrierung für Batch/CI; Claude Code fürs Pair Programming (Alternativen-Kontext) |
Wenn X → Y in einer Zeile: Braucht Worker Bs Prompt die Ausgabe von Worker A, dann Pipeline. Sonst Fan-Out.
FAQ
Wie viele Agenten kann OpenClaw parallel ausführen?
Es gibt keine feste globale Obergrenze — praktische Limits sind RAM, API-Rate-Limits und Merge-Komplexität. Starten Sie mit 3 parallelen Workern, messen Sie Peak-RSS mit ps oder Aktivitätsanzeige, dann skalieren.
Beschleunigt Fan-Out immer die Ausführung?
Nur wenn Aufgaben unabhängig sind. Falsch angewendetes Fan-Out bei abhängigen Stufen scheitert still (leere Entwürfe, doppelte Arbeit). Abhängigkeiten immer vor der Musterwahl abbilden.
Was ist der Unterschied zwischen agentToAgent und Sub-Agent-Spawn?
agentToAgent sendet Nachrichten an benannte persistente Agenten (Sales vs. Support). Sub-Agent-Spawn erzeugt ephemere Worker für einen einzelnen Aufgabenzweig. CI-Orchestrierung nutzt meist Spawn; Multi-Tenant-Chatbots agentToAgent plus Bindings.
Kann ich Orchestrierung auf einem Mac Mini ohne Cloud-Miete betreiben?
Ja. Jeder dauerhaft laufende Mac mit Node 22.19+, ausreichend RAM und stabilem Netz reicht. Teams nutzen dedizierte Mac minis — lokal oder gehostet — wenn Laptops schlafen und lange Gateway-Sitzungen abbrechen.
Wie hängt das mit TradingAgents oder MiroFish zusammen?
TradingAgents orchestriert eine Trading-Firmen-Debatte (LangGraph). MiroFish orchestriert Social Swarms für Prognosen. OpenClaw orchestriert Dev-Workflows (Code, CI, Review). Wählen Sie das Framework passend zur Domäne — sie ergänzen sich, sind nicht austauschbar.
Verwandte Leitfäden
Lesen Sie zuerst OpenClaw-Installation und Benchmark-Daten, bevor Sie Multi-Agent-Fan-Out auf Ihrem Apple-Silicon-Host skalieren.