Forschungssynthese9 Min.20. Mai 20261500 Wörter

Halluzinationen reduzieren: Empirische Evidenz, dass Retrieval-Augmentierung KI-Antworten verlässlicher macht

„Die KI hat sich das ausgedacht“ ist 2026 kein akzeptables Risiko mehr. Shuster, Poff, Chen, Kiela und Weston [1] haben 2021 bei EMNLP-Findings gezeigt, dass Retrieval-Augmentierung in Dialogen Halluzinationen signifikant reduziert — bei gleichbleibender Antwortqualität. Trivedi, Balasubramanian, Khot und Sabharwal [2] haben 2023 bei ACL mit IRCoT gezeigt, wie Retrieval und mehrschrittiges Reasoning verzahnt werden müssen.

1. Was Shuster et al. (2021) empirisch zeigen

Shuster, Poff, Chen, Kiela und Weston ^[1] haben in Findings of EMNLP 2021 zwei Fragen gestellt: Reduziert Retrieval Halluzinationen in offenen Dialogen? Und wenn ja: ohne die Antwortqualität zu opfern? Ihre Ergebnisse über mehrere Modelle (BART, T5, FiD) und Datensätze (Wizard of Wikipedia, CMU_DoG) sind eindeutig:

Retrieval-augmentierte Modelle halluzinieren in Konversationen messbar seltener als parametrische Baselines.
Die wahrgenommene Antwortqualität (Engagement, Kohärenz) sinkt nicht — sie steigt teils sogar.
Der Effekt skaliert: bessere Retriever führen direkt zu weniger Halluzinationen.

2. IRCoT — Retrieval reicht nicht, wenn die Frage mehrschrittig ist

Trivedi und Kolleg:innen ^[2] zeigen bei ACL 2023: Bei Fragen, die mehrere Schritte erfordern, bricht klassisches Single-Shot-Retrieval ein. Die Lösung: Interleaved Retrieval with Chain-of-Thought (IRCoT) — der Retriever wird nach jedem Denkschritt erneut konsultiert. Empirisch zeigen sie auf HotpotQA, 2WikiMultihopQA, MuSiQue und IIRC, dass IRCoT die Exact-Match-Genauigkeit gegenüber One-Shot-RAG um zweistellige Prozentpunkte verbessert.

3. Konsequenz für seriöse Unternehmens-KI

Retrieval ist kein Add-on, sondern Pflichtbestandteil.
Multi-Step-Retrieval muss möglich sein.
Quellen-Transparenz muss pro Schritt sichtbar sein.

Genau diese Architektur ist in BusFactor implementiert: Retrieval erfolgt nicht einmal pro Anfrage, sondern pro Reasoning-Schritt. Jeder Schritt zeigt die genutzten Quellen offen an.

4. Anschluss an die KM-Forschung

Argote und Ingram (2000) ^[3] zeigen, dass Wissensreservoirs nur dann tragen, wenn der Zugriff zuverlässig ist. Retrieval-Augmentierung ist die technische Antwort darauf — Shuster et al. plus Trivedi et al. liefern die empirische Grundlage.

Fazit

Halluzinationen sind kein unbeherrschbares Naturgesetz. Wer Retrieval einsetzt — pro Schritt, mit transparenten Quellen — kann ihre Häufigkeit empirisch belegt deutlich senken.

Quellen

[1]
Shuster, K., Poff, S., Chen, M., Kiela, D., & Weston, J. (2021). Retrieval augmentation reduces hallucination in conversation. Findings of EMNLP 2021, 3784–3803.
[2]
Trivedi, H., Balasubramanian, N., Khot, T., & Sabharwal, A. (2023). Interleaving retrieval with chain-of-thought reasoning for knowledge-intensive multi-step questions. Proceedings of ACL 2023, Vol. 1, 10014–10037.
[3]
Argote, L., & Ingram, P. (2000). Knowledge transfer: A basis for competitive advantage in firms. Organizational Behavior and Human Decision Processes, 82(1), 150–169.

Weiterlesen

Datenschutz

Wissensmanagement ohne Mitarbeiterüberwachung: Rechtlicher Rahmen, Designprinzipien und Akzeptanzfaktoren

Forschung & Methodik

Was LLMs bei implizitem Wissen können — und wo die Forschung eine harte Grenze zieht

Architektur & KI

Context-driven Feedback Architecture: Wie SME-Reviews verlässliche KI-Antworten erzeugen

Methodensynthese

RAG-Foundations: Warum Retrieval-Augmented Generation der wissenschaftliche Standard für vertrauenswürdige KI-Antworten ist

Wie steht es um Ihren Bus-Faktor?

Lassen Sie uns die kritischen Rollen in Ihrem Unternehmen gemeinsam identifizieren — strukturiert, rollenbezogen und ohne Mitarbeiterüberwachung.

Kostenlose Risikoanalyse anfragen