Chain-of-Thought

// Beschreibung

Chain-of-Thought ist eine Prompting-Technik, bei der das KI-Modell aufgefordert wird, seine Denkschritte explizit darzulegen. Dies verbessert die Qualität bei komplexen Aufgaben wie Mathematik, Logik und mehrstufiger Analyse.

// Anwendungsbereiche

Komplexe Problemlösung
Mathematik
Logische Analyse
Entscheidungsfindung

// Deep Dive

Definition und Kerncharakter

Chain-of-Thought Prompting (kurz: CoT) ist eine der wichtigsten Prompting-Techniken in der modernen KI-Welt. Die Grundidee ist verblüffend einfach: Statt einem Large Language Model direkt eine Antwort abzuverlangen, fordert man es auf, seinen Denkprozess Schritt für Schritt offenzulegen — so wie ein Mathematik-Lehrer seine Schüler bittet, den Rechenweg aufzuschreiben.

Das Verfahren wurde 2022 von Jason Wei und Kollegen bei Google Research in dem bahnbrechenden Paper "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models" beschrieben. Die zentrale Erkenntnis: Ab einer bestimmten Modellgröße (typischerweise jenseits von 100 Milliarden Parametern) emergiert eine neue Fähigkeit — das Modell kann komplexe Probleme deutlich besser lösen, wenn es seinen Reasoning-Pfad ausführen darf, bevor es eine finale Antwort gibt.

Was CoT so wertvoll macht: Es funktioniert ohne aufwändiges Fine-Tuning, ohne Code-Änderungen am Modell, ohne zusätzliche Trainingsdaten. Ein einziger Satz im Prompt — etwa "Denke Schritt für Schritt" — kann die Genauigkeit auf Mathematik-Benchmarks von 18 auf 57 Prozent katapultieren. CoT ist damit ein zentrales Werkzeug im modernen Prompt Engineering.

Wie funktioniert Chain-of-Thought?

Technisch betrachtet ist CoT eine Form von In-Context Learning. Das Modell lernt aus dem Prompt selbst, wie es antworten soll — ohne dass seine Gewichte verändert werden. Die Reasoning-Schritte, die das Modell generiert, sind keine "echten" Gedanken, sondern Token-für-Token-Vorhersagen. Genau diese sequenzielle Generierung erlaubt dem Modell, eigene Zwischenergebnisse als Kontext für die nächsten Tokens zu nutzen — eine Art Arbeitsspeicher im Output-Stream.

Forscher unterscheiden mehrere CoT-Varianten:

Few-Shot-CoT: Der Prompt enthält mehrere ausgearbeitete Beispiele mit komplettem Lösungsweg, bevor die eigentliche Frage gestellt wird.
Zero-Shot-CoT: Kein Beispiel, nur der magische Zusatz "Let's think step by step" (Kojima et al. 2022). Funktioniert erstaunlich gut.
Self-Consistency: Das Modell generiert mehrere unabhängige Reasoning-Pfade und wählt die Mehrheits-Antwort.
Tree-of-Thoughts (ToT): Statt linear zu denken, exploriert das Modell mehrere Lösungspfade parallel, kann zurückspringen und besser bewerten.
ReAct: Verbindet Reasoning mit Acting — das Modell kann zwischen Denken und externen Tool-Aufrufen alternieren (z. B. Web-Suche, Rechner). Grundlage für moderne KI-Agenten.

Moderne Reasoning-Modelle wie Claude Opus 4.7 oder GPT-5 nutzen intern eine industrialisierte Form von CoT — sogenanntes Extended Thinking oder Deliberate Reasoning. Das Modell denkt minutenlang im Hintergrund, bevor es antwortet, und kann diese Denkkette teils sichtbar machen.

Anwendungsfälle in der Praxis

CoT brilliert überall dort, wo lineare oder mehrstufige Logik gefragt ist. In unserer Arbeit als Agentur sehen wir vor allem fünf Cluster, in denen Chain-of-Thought messbare Qualitätssprünge liefert:

Mathematische und finanzielle Berechnungen: ROI-Modelle, Investment-Cases, Steuerberechnungen, Rabatt-Logiken. Die Fehlerquote sinkt drastisch, wenn das Modell den Rechenweg offenlegt.
Logische Analyse: Vertragsprüfung, Compliance-Checks, Entscheidungsbäume. CoT macht nachvollziehbar, warum eine Klausel problematisch ist.
Code-Debugging: Statt direkt einen Fix vorzuschlagen, lässt man das Modell den Bug erst beschreiben, Hypothesen prüfen und dann fixen. In Claude Code ein Standard-Pattern.
Strategieberatung: Marktanalysen, Wettbewerbsbewertungen, GTM-Entscheidungen. CoT zwingt das Modell, Annahmen und Trade-offs offenzulegen.
Multi-Step-Workflows in KI-Agenten: Agenten, die mehrere Tools kombinieren (Web-Suche → Lesen → Zusammenfassen → Mailen), basieren fast immer auf einer Variante von ReAct + CoT.

In der KI-Beratung empfehlen wir CoT immer dann, wenn die Antwort des Modells nicht nur korrekt, sondern auch nachvollziehbar sein muss — etwa in regulierten Branchen oder bei Management-Entscheidungen.

Praktische Beispiele: Prompt-Snippets

So sieht ein typischer Zero-Shot-CoT-Prompt aus:

Ein Unternehmen verkauft 3 Produkte zu 12, 18 und 25 Euro.
Im Mai wurden 142, 78 und 33 Stueck verkauft.
Wie hoch war der Umsatz, und welches Produkt brachte den
hoechsten Deckungsbeitrag, wenn die variablen Kosten
40 / 55 / 70 Prozent betragen?

Denke Schritt für Schritt und zeige deinen Rechenweg.

Und ein Few-Shot-CoT-Pattern mit Beispiel:

F: Ein Kunde hat 1.200 EUR Budget und will 4 Anzeigen
   schalten. Die durchschnittlichen CPMs sind 8 EUR.
   Reicht das für 100.000 Impressions je Anzeige?
A: Schritt 1 - Gesamt-Impressions: 4 x 100.000 = 400.000.
   Schritt 2 - Kosten = 400.000 / 1000 x 8 = 3.200 EUR.
   Schritt 3 - Budget = 1.200 EUR < 3.200 EUR.
   Antwort: Nein, das Budget reicht nicht.

F: Ein Newsletter mit 24.000 Abonnenten hat 28% Open-Rate
   und 4,2% CTR auf den geoeffneten Mails. Wieviele Klicks?
A:

In der API-Praxis kombinieren wir CoT oft mit strukturiertem Output (JSON-Schema) — das Modell denkt frei, gibt aber die finale Antwort in maschinenlesbarer Form zurück.

Vergleich: CoT vs. Direct Prompting vs. Extended Thinking

Direct Prompting ist die Standardform: Frage rein, Antwort raus. Schnell, günstig, aber bei komplexen Aufgaben fehleranfällig. Klassische Benchmark-Tests zeigen Genauigkeiten unter 20 Prozent bei mehrstufigen Mathe-Aufgaben.

Chain-of-Thought erhöht die Token-Kosten um Faktor 3 bis 10 (mehr Output), liefert aber zwei- bis vierfach höhere Genauigkeit bei Reasoning-Tasks. Der Trade-off ist meistens klar positiv, wenn Qualität wichtig ist.

Extended Thinking (Claude) und Reasoning Tokens (OpenAI o-Serie, GPT-5) sind eine industrialisierte Form von CoT: Das Modell denkt im Hintergrund, ohne dass der User den Reasoning-Stream sehen muss. Die Denkschritte werden separat abgerechnet, sind aber bei Opus 4.7 günstiger als bei direktem CoT-Output. Für anspruchsvolle Aufgaben — Architektur-Entscheidungen, juristische Analysen, M&A-Modelle — ist Extended Thinking heute meist die bessere Wahl als manuelles CoT.

Wichtig: CoT ist nicht für alles gut. Bei kreativem Schreiben, Tonalitäts-Tasks oder einfachen Frage-Antwort-Szenarien kann erzwungenes Step-by-Step-Denken die Ergebnisse sogar verschlechtern. Faustregel: CoT bei Logik und Mathematik einsetzen, weglassen bei Kreativität und Stil.

// Haeufige Fragen

Was ist Chain-of-Thought Prompting?

Chain-of-Thought (CoT) ist eine Prompting-Technik, bei der das KI-Modell aufgefordert wird, seine Denkschritte explizit darzulegen, bevor es eine finale Antwort gibt. Dies verbessert die Qualität bei komplexen Aufgaben wie Mathematik, Logik und mehrstufiger Analyse drastisch.

Wer hat Chain-of-Thought erfunden?

Chain-of-Thought wurde 2022 von Jason Wei und Kollegen bei Google Research in dem Paper "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models" eingeführt. Das Paper zeigte, dass LLMs ab einer bestimmten Größe deutlich besser werden, wenn sie Schritt für Schritt argumentieren dürfen.

Was ist der Unterschied zwischen Zero-Shot-CoT und Few-Shot-CoT?

Few-Shot-CoT gibt dem Modell mehrere ausgearbeitete Beispiele inklusive Denkschritte. Zero-Shot-CoT funktioniert ohne Beispiele, indem man dem Prompt einfach "Let's think step by step" hinzufügt. Beide Varianten verbessern die Reasoning-Qualität deutlich.

Was ist Self-Consistency in CoT?

Self-Consistency ist eine Erweiterung von Chain-of-Thought, bei der das Modell mehrere unabhängige Denkpfade generiert und die häufigste Antwort als finale Lösung wählt. Diese Mehrheitsentscheidung erhöht die Genauigkeit besonders bei mathematischen und logischen Aufgaben.

Was ist Tree-of-Thoughts?

Tree-of-Thoughts (ToT) ist die Weiterentwicklung von Chain-of-Thought. Statt linear zu denken, exploriert das Modell mehrere Lösungspfade parallel, bewertet Zwischenschritte und kann zurückgehen. Das ähnelt menschlichem Problemlösen und ist besonders stark bei Planung und kreativen Aufgaben.

Brauchen moderne Modelle wie Claude oder GPT-5 noch CoT-Prompts?

Moderne Reasoning-Modelle wie Claude Opus 4.7 oder GPT-5 nutzen intern bereits Chain-of-Thought über Extended Thinking. Explizite CoT-Prompts sind seltener nötig, helfen aber weiterhin bei sehr komplexen oder ungewöhnlichen Aufgaben und sorgen für transparente, nachvollziehbare Antworten. Mehr zu nachvollziehbarer KI in unserer KI-Beratung.

// Verwandte Einträge

// Häufige Fragen

Was ist Chain-of-Thought Prompting?

Chain-of-Thought (CoT) ist eine Prompting-Technik, bei der das KI-Modell aufgefordert wird, seine Denkschritte explizit darzulegen, bevor es eine finale Antwort gibt. Dies verbessert die Qualität bei komplexen Aufgaben wie Mathematik, Logik und mehrstufiger Analyse drastisch.

Wer hat Chain-of-Thought erfunden?

Chain-of-Thought wurde 2022 von Jason Wei und Kollegen bei Google Research in dem Paper "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models" eingeführt. Das Paper zeigte, dass LLMs ab einer bestimmten Größe deutlich besser werden, wenn sie Schritt für Schritt argumentieren dürfen.

Was ist der Unterschied zwischen Zero-Shot-CoT und Few-Shot-CoT?

Few-Shot-CoT gibt dem Modell mehrere ausgearbeitete Beispiele inklusive Denkschritte. Zero-Shot-CoT funktioniert ohne Beispiele, indem man dem Prompt einfach "Let's think step by step" hinzufügt. Beide Varianten verbessern die Reasoning-Qualität deutlich.

Was ist Self-Consistency in CoT?

Self-Consistency ist eine Erweiterung von Chain-of-Thought, bei der das Modell mehrere unabhängige Denkpfade generiert und die häufigste Antwort als finale Lösung wählt. Diese Mehrheitsentscheidung erhöht die Genauigkeit besonders bei mathematischen und logischen Aufgaben.

Was ist Tree-of-Thoughts?

Tree-of-Thoughts (ToT) ist die Weiterentwicklung von Chain-of-Thought. Statt linear zu denken, exploriert das Modell mehrere Lösungspfade parallel, bewertet Zwischenschritte und kann zurückgehen. Das ähnelt menschlichem Problemlösen und ist besonders stark bei Planung und kreativen Aufgaben.

Brauchen moderne Modelle wie Claude oder GPT-5 noch CoT-Prompts?

Moderne Reasoning-Modelle wie Claude Opus 4.7 oder GPT-5 nutzen intern bereits Chain-of-Thought über Extended Thinking. Explizite CoT-Prompts sind seltener nötig, helfen aber weiterhin bei sehr komplexen oder ungewöhnlichen Aufgaben und sorgen für transparente, nachvollziehbare Antworten.

// Beschreibung

// Anwendungsbereiche

// Deep Dive

Definition und Kerncharakter

Wie funktioniert Chain-of-Thought?

Anwendungsfälle in der Praxis

Praktische Beispiele: Prompt-Snippets

Vergleich: CoT vs. Direct Prompting vs. Extended Thinking

// Haeufige Fragen

// Verwandte Einträge

// Häufige Fragen

// Verwandte Einträge

Brauchst du Hilfe mit Chain-of-Thought?