Context-driven Feedback Architecture: Wie SME-Reviews verlässliche KI-Antworten erzeugen
„Warum halluziniert die KI immer noch?” — Diese Frage zeigt, dass das eigentliche Problem nicht im Modell liegt, sondern in der *Architektur drumherum*. Drei wissenschaftliche Arbeiten aus 2024–2025 zeichnen eine bemerkenswert konvergente Antwort: Verlässliche KI-Wissenssysteme brauchen eine separate, versionierte Wissensschicht und einen kontrollierten SME-Review-Loop. Das ist keine Spekulation — es ist Stand der Architekturdiskussion.
1. Das wirkliche Problem: Architektur, nicht Modell
Wer ein generisches LLM auf Unternehmenswissen ansetzt, bekommt vorhersehbare Probleme: inkonsistente Antworten, Halluzinationen, fehlende Quellen, keine Zugriffskontrolle, keine Auditierbarkeit. Die übliche Reaktion ist Fine-Tuning. Darren Pulsipher (Intel, 2025) hält das in seinem Whitepaper Capturing Tacit Knowledge through Generative AI für die falsche Antwort:
Fine-Tuning sei oft „cost-prohibitive, resource-intensive, and inflexible" [1, S. 2].
Sein Gegenvorschlag: eine separate Kontextschicht — der Context Atlas — neben dem Modell. Das Wissen wandert nicht in Modellgewichte, sondern in eine strukturierte, versionierte, sicherheitsklassifizierte Schicht.
2. Der Context Atlas: Vier Map-Typen
Pulsipher gliedert den Context Atlas in vier Map-Typen [1, S. 3]:
| Map-Typ | Inhalt | KMU-Übersetzung | |---|---|---| | Base Map | Standardwissen, Rollenbasiswissen | Rollenprofile, Standardprozesse | | Interaction Map | SME-Korrekturen, Review-Kommentare | Expertenfeedback zu KI-Antworten | | Classification Map | Sensitivität, Zugriffsregeln | Permission-aware Retrieval | | Processing Map | Chunking-/Verarbeitungsstrategien | Wie Wissen für RAG vorbereitet wird |
Der Clou: Diese Maps sind versioniert und auditierbar. Pulsipher betont „granular security classification metadata" und „versioned interaction histories" [1, S. 3] — beides Voraussetzung für regulierte Branchen.
3. Der Feedback-Loop in fünf Schritten
Die Mechanik ist disziplinierter als gewohnte RAG-Pipelines [1, S. 2–4]:
- Nutzer:in stellt Anfrage.
- LLM generiert initiale Antwort unter Nutzung relevanter Maps.
- SME prüft Antwort, korrigiert oder bestätigt.
- Feedback wird in passende Maps geschrieben (Interaction/Classification/Processing).
- Zukünftige ähnliche Queries nutzen den geprüften Kontext.
Pulsipher formuliert es so: „SME corrections automatically scale across similar queries" [1, S. 6]. Das ist der Skalierungs-Hebel — eine einzelne Korrektur verbessert dutzende zukünftige Antworten.
4. Wo strukturierte Entscheidungslogik gehört: Text2Chat (Goossens & Vanthienen)
Alexandre Goossens und Jan Vanthienen (KU Leuven) zeigen in Text2Chat (HICSS 2024), dass reine LLM-Antworten für entscheidungsintensive Prozesse problematisch bleiben [2]. Ihre Argumentation:
- LLMs sind exzellente natürlichsprachliche Interfaces.
- Für Entscheidungslogik (Eskalationen, Förderberechtigung, Compliance-Regeln) sind sie Black Boxes, promptsensitiv und schwer auditierbar.
- DMN (Decision Model and Notation) bietet strukturierte, ausführbare Entscheidungslogik.
Ihr Hybrid: GPT als Intent-Interpreter, DMN als deterministische Reasoning-Engine. Empirisch belegt mit einer Survey von 108 Teilnehmenden: Der GPT-DMN-Chatbot beantwortete Entscheidungsfragen in 4 von 5 Reasoning-Szenarien häufiger korrekt als eine konventionelle Informationsseite [2, S. 5999].
Methodischer Hinweis ihrer Klassifikationsvorstufe: Process- vs. Decision-Sentence-Klassifikation erreicht mit SVM + TF-IDF eine Accuracy von 0,98 (n: 417 Process-Sätze, 809 Decision-Sätze) [2, S. 5995–5996]. Das ist Hinweis: Auch klassisches ML hat in dieser Architektur seinen Platz.
Konsequenz für KMU: Nicht jedes Wissensartefakt sollte Freitext bleiben. Entscheidungslogik (Eskalationsmatrizen, Sonderfälle, Compliance-Regeln) gehört in strukturierte Artefakte, die deterministisch ausgeführt werden können — und vom LLM nur interpretiert werden.
5. Die theoretische Grundlage: Human-AI SECI
Matsumoto, Nishikawa und Morimoto liefern in Human-AI-Collaboration SECI Model (KES-AMSTA 2024) die Theorieklammer [3]. Sie erweitern Nonaka & Takeuchis SECI-Modell (Socialization–Externalization–Combination–Internalization) um eine LLM-augmentierte Schleife:
- Externalization: SME liefert Wissen → KI strukturiert.
- Combination: KI nutzt Wissen → erzeugt Antworten/Artefakte.
- Reflection: SME prüft Output → korrigiert.
- Re-Externalization: Korrektur fließt zurück in die Wissensschicht.
Wichtig: Die Autor:innen argumentieren ebenfalls gegen Fine-Tuning für laufend veränderliches Expert:innenwissen — RAG erlaubt Wissensreflexion ohne Parameter-Update [3]. Begrifflich verwenden sie „digital twin of the expert"; in der Außenkommunikation ist das problematisch (Stichwort Datenschutz, BetrVG). Besser: Rollenwissensraum oder Knowledge Atlas.
6. Was diese drei Quellen gemeinsam ergeben
Eine konvergente Architektur für vertrauenswürdige KI-Wissenssysteme:
┌──────────────────────────────────────────────────────┐
│ Interaction Layer (Chat, Voice, Search) │
├──────────────────────────────────────────────────────┤
│ LLM Runtime (Intent, Sprache, Formulierung) │
├──────────────────────────────────────────────────────┤
│ Context Injection Engine │
│ + Permission-aware Retrieval │
│ + Decision Engine (DMN/Rule) für Entscheidungen │
├──────────────────────────────────────────────────────┤
│ Knowledge Atlas (Pulsipher: Context Atlas) │
│ ├─ Base Map (Rollenwissen) │
│ ├─ Interaction Map (SME-Reviews) │
│ ├─ Classification Map (Sensitivität) │
│ └─ Processing Map (Chunking, Embeddings) │
├──────────────────────────────────────────────────────┤
│ Capture Layer (Voice/Dialog → Artefakte) │
├──────────────────────────────────────────────────────┤
│ Governance & Audit (Versionierung, Audit Logs) │
└──────────────────────────────────────────────────────┘
Diese Architektur ist nicht spekulativ — sie ist die Schnittmenge von drei unabhängigen wissenschaftlichen Arbeiten.
7. Methodische Caveats
- Pulsipher (2025) ist ein Industrie-Whitepaper, nicht peer-reviewed. Die genannten Case-Zahlen (240x Speedup, 99,9 % SME-to-SME-Variation reduziert) sind methodisch nicht ausreichend dokumentiert und sollten nicht als Wirkungsnachweis kommuniziert werden.
- Goossens & Vanthienen (2024) validieren in einem spezifischen Use Case (administrative Entscheidungen); Übertragbarkeit auf alle Wissensdomänen ist nicht bewiesen.
- Matsumoto et al. (2024) liefern ein Modell, keine Evaluation in deutschen KMU.
Diese drei Quellen zusammen sind aber stark genug, um eine Architektur-These wissenschaftlich zu untermauern.
8. Was das für KMU heute heißt
a) Knowledge Atlas vor Modellwahl. Wer 2026 ein „KI-Wissenssystem" plant, sollte zuerst die Wissensschicht entwerfen, dann das Modell. Modelle sind austauschbar; gut strukturierte Wissensartefakte sind langlebig.
b) SME-Review als Pflichtschritt. Keine KI-Antwort sollte in produktiven Workflows ohne mindestens eine einmalige SME-Validierung ihres Wissensartefakts publiziert werden. Reviews skalieren — Capture allein nicht.
c) DMN/Rule-Engine für Entscheidungslogik. Eskalationsregeln, Sonderfälle, Förderlogik gehören in strukturierte, ausführbare Artefakte — nicht in Freitext-Dokumente.
d) Permission-aware Retrieval von Tag 1. Classification Maps sind Architektur, nicht Compliance-Feature. Wer sie nachträglich einbaut, baut das System neu.
Fazit
Verlässliche KI-Wissenssysteme sind keine Frage des besten Modells. Sie sind eine Frage der besten Architektur — und diese Architektur ist 2026 wissenschaftlich überraschend gut beschrieben. Wer sie ignoriert, baut Wikis mit Chatbot-Skin. Wer sie ernst nimmt, baut Systeme, die in regulierten Branchen tragen.
Quellen
- [1]Pulsipher, D. W. (2025). Capturing tacit knowledge through generative AI: A context-driven feedback architecture for reliable output. Intel Corporation, White Paper.
- [2]Goossens, A., & Vanthienen, J. (2024). From text to intelligent services in knowledge intensive decision processes: Text2Chat. Proceedings of the 57th Hawaii International Conference on System Sciences (HICSS), 5992–6001. https://hdl.handle.net/10125/107105
- [3]Matsumoto, T., Nishikawa, R., & Morimoto, C. (2024). Human-AI-Collaboration SECI model: The knowledge management model of the experts' tacit knowledges with augmented LLM-based AI. In G. Ježić et al. (Eds.), Agents and Multi-agent Systems: Technologies and Applications 2024 (Vol. 406). Springer. https://doi.org/10.1007/978-981-97-6469-3_12
- [4]Nonaka, I., & Takeuchi, H. (1995). The knowledge-creating company: How Japanese companies create the dynamics of innovation. Oxford University Press.
- [5]Finkel, P., & Wurster, P. (2026). Unlocking tacit knowledge in industrial production: Exploring barriers, practices, and LLM-driven potentials for knowledge management. Proceedings of the 59th HICSS, 4740–4749. https://doi.org/10.24251/HICSS.2026.567
Weiterlesen
Wie steht es um Ihren Bus-Faktor?
Lassen Sie uns die kritischen Rollen in Ihrem Unternehmen gemeinsam identifizieren — strukturiert, rollenbezogen und ohne Mitarbeiterüberwachung.
Kostenlose Risikoanalyse anfragen