Halluzination
// Beschreibung
// Anwendungsbereiche
- Faktenprüfung
- Qualitätssicherung
- Risikobewertung
// Deep Dive
Definition und Praxis-Bezug
KI-Halluzinationen sind Aussagen, die ein LLM mit hoher Selbstsicherheit generiert, die aber faktisch falsch, frei erfunden oder logisch widersprüchlich sind. Der Begriff stammt aus der Psychologie und wurde übernommen, weil Modelle Dinge "sehen", die in den Daten nicht existieren — sie produzieren plausibel klingenden Output ohne echten Wirklichkeitsbezug.
In der Praxis sind Halluzinationen das größte Vertrauens- und Compliance-Problem produktiver KI-Systeme. Ein Chatbot, der falsche Stornobedingungen erfindet (Air Canada 2024, gerichtlich haftbar gemacht), ein Recherche-Assistent, der nicht existierende Studien zitiert, oder ein Coding-Tool, das nicht-existente Library-Funktionen aufruft — alle drei Beispiele kosten Unternehmen Geld, Reputation und Rechtsverfahren. Wer 2026 KI produktiv einsetzt, muss Halluzinationen aktiv managen.
Warum entstehen Halluzinationen? (technisch)
LLMs sind autoregressive Sprachmodelle — sie generieren Token für Token die statistisch wahrscheinlichste Fortsetzung. Sie haben keinen Faktencheck, keine externe Realitätsprüfung, keine echte Unterscheidung zwischen "weiß ich" und "ist plausibel". Die wichtigsten Ursachen:
1. Datenlücken im Training. Was im Training nicht oder nur dünn vorhanden war, wird vom Modell aus Patterns rekonstruiert — oft erfunden.
2. Sampling-Temperatur. Höhere Temperatur (0,7–1,2) führt zu kreativerem, aber riskanterem Output. Niedrige Temperatur (0,0–0,3) reduziert Halluzinationen, kostet aber Vielfalt.
3. Knowledge Cutoff. Modelle wissen nichts nach ihrem Trainings-Cutoff. Fragen zu aktuellen Ereignissen werden oft erfunden statt mit "weiß ich nicht" beantwortet.
4. Reinforcement Learning Bias. RLHF-trainierte Modelle tendieren zu selbstsicheren Antworten, weil unsichere Antworten in Human Feedback schlechter abschnitten — paradoxerweise erhöht das Halluzinationen.
5. Long-Context-Schwäche. In sehr langen Prompts verliert das Modell oft den Faden — sogenanntes "Lost in the Middle"-Phänomen führt zu kontextuellen Halluzinationen.
Typen von Halluzinationen
Faktische Halluzinationen: Erfundene Personen, Daten, Zahlen, Zitate, Studien. Beispiel: "Laut einer Studie von Stanford 2023..." — die Studie existiert nicht.
Logische Halluzinationen: Innere Widersprüche im Output. Beispiel: Das Modell behauptet im selben Text, ein Unternehmen sei 1995 und 2003 gegründet worden.
Kontextuelle Halluzinationen: Antwort widerspricht dem mitgelieferten Quellenmaterial. Besonders gefährlich in RAG-Systemen, weil das Modell die Quelle ignoriert.
Intrinsische Halluzinationen: Modell halluziniert selbst über mitgelieferte Quellen hinaus — erfindet zusätzliche, nicht-belegte Details.
Code-Halluzinationen: Coding-Assistenten erfinden nicht existente Funktionen, Libraries oder API-Endpunkte. "Slopsquatting" — Angreifer registrieren halluzinierte Package-Namen — ist 2025/2026 ein wachsendes Security-Risiko.
Mitigation — wie reduziert man Halluzinationen?
1. RAG mit Quellenangaben. Der wichtigste Hebel. Modell wird gezwungen, sich auf retrievierte Quellen zu stützen und diese zu zitieren. Reduziert Halluzinationen um 60–80 Prozent.
2. Niedrige Temperatur. Für faktische Aufgaben: Temperature 0,0–0,3, Top-P 0,9.
3. Chain-of-Thought-Prompting. Modell denkt vor der Antwort Schritt für Schritt nach — reduziert logische und mathematische Halluzinationen.
4. Self-Consistency. Mehrere Antworten generieren lassen, Mehrheitsentscheid. Teurer, aber wirksam.
5. Multi-Source-Verifikation. Fakten gegen mehrere unabhängige Quellen prüfen.
6. Constitutional AI. Modell anhand klarer Prinzipien trainieren (Claude-Ansatz von Anthropic). Reduziert besonders die "selbstsichere falsche Antwort".
7. Guardrails und Confidence-Scores. Tools wie Guardrails AI, NVIDIA NeMo Guardrails oder Lakera prüfen Output gegen Regeln und markieren unsichere Antworten.
8. "Ich weiß es nicht"-Training. Modelle explizit darauf trainieren, Unsicherheit auszudrücken statt zu erfinden. Modernes Fine-Tuning bezieht das aktiv ein.
Beispiele aus 2024–2026
Air Canada Chatbot (Februar 2024): Chatbot halluzinierte eine Trauerfall-Stornoregel. Gericht sprach dem Kunden Recht zu — Air Canada haftbar für AI-Aussagen.
Google AI Overviews (Mai 2024): Google AI empfahl, "Pizza mit Kleber zu bestreichen" und "einen Stein pro Tag zu essen". Reddit-Trainingsdaten wurden wörtlich wiedergegeben.
Anwalts-Erfindungs-Skandale (2023–2025): Mehrere US-Anwälte reichten Schriftsätze ein, die ChatGPT mit erfundenen Präzedenzfällen erstellt hatte. Sanktionen und Berufsverbote folgten.
Slopsquatting (2025): Angreifer registrieren PyPI- und npm-Pakete mit Namen, die LLMs häufig halluzinieren — und schleusen so Malware ein.
Halluzinations-Rate 2026: Aktuelle Top-Modelle (Claude Opus 4.7, GPT-5, Gemini 2.5 Pro) erreichen je nach Benchmark 3–12 Prozent. Mit RAG sinkt das auf 1–4 Prozent. Perplexity-Sonar mit integrierter Web-Suche liegt unter 2 Prozent.
Vergleich zu Alternativ-Ansätzen
Reines LLM-Prompting: Höchste Halluzinationsrate, sollte für faktische Aufgaben nie ohne weitere Maßnahmen genutzt werden.
RAG: Beste Mitigation für Wissensfragen. Setzt aber gute Retrieval-Pipeline voraus — schlechtes Retrieval erzeugt neue Halluzinationen.
Agentic Search (Perplexity, GPT mit Browsing): Sehr niedrige Halluzinationsrate, weil das Modell aktiv Quellen sucht und zitiert. Aber: höhere Kosten und Latenz.
Fine-Tuning auf Truthfulness: Modelle wie HHHH (Honest, Helpful, Harmless) reduzieren das Risiko. Skaliert aber nicht für jedes Thema.
Human-in-the-Loop: Bei hohem Risiko unverzichtbar. Modelle generieren Vorschläge, Mensch bestätigt.
Auswirkungen auf Business
Halluzinationen sind kein Nice-to-Know-Thema mehr, sondern handfestes Geschäftsrisiko. Unternehmen sollten 2026 für jeden produktiven KI-Use-Case eine Halluzinations-Risiko-Bewertung durchführen: Wo ist die Wahrheits-Toleranz null (Recht, Compliance, Medizin, Finanzen)? Wo akzeptabel mit Disclaimer (Brainstorming, Content-Drafts)? Wo egal (Bildgenerierung, kreatives Schreiben)?
Aus Compliance-Sicht: Der EU AI Act (verbindlich 2026) verlangt für Hochrisiko-KI dokumentierte Maßnahmen gegen "manifestly wrong outputs". Versicherer entwickeln "AI Liability Insurance"-Produkte, die Halluzinations-Schäden abdecken. Wer KI produktiv ohne Halluzinations-Strategie einsetzt, läuft 2026 ein erhebliches Risiko.
Unsere Empfehlung in der KI-Beratung: jedes Produktiv-System mit Confidence-Scoring, Quellenangaben und einem klar dokumentierten Eskalations-Pfad an Menschen ausstatten. Details in unserer KI-Implementierung sowie unter Kontextfenster und Claude für Modelle mit niedriger Halluzinationsrate.
// Haeufige Fragen
Was ist eine KI-Halluzination?
Warum halluzinieren LLMs?
Welche Arten von Halluzinationen gibt es?
Wie kann man Halluzinationen reduzieren?
Wie hoch ist die Halluzinationsrate moderner LLMs 2026?
Welche Geschäftsrisiken haben Halluzinationen?
// Verwandte Einträge
Brauchst du Hilfe mit Halluzination?
Wir beraten dich gerne zu Einsatz, Integration und Strategie.
Kontakt aufnehmen