Erklärbare KI verstehen – Methoden und Praxis

Die Entscheidung zwischen modellagnostisch und modellspezifisch trifft man oft zu früh im Projekt, nämlich dann, wenn man noch gar nicht weiß, welche Erklärungsqualität man braucht.

Ich habe das selbst falsch gemacht. Bei einem Computer-Vision-Projekt für Qualitätskontrolle in der Fertigung habe ich zuerst LIME eingesetzt, weil es flexibel ist und wir noch zwischen verschiedenen Architekturen gewechselt haben. Das war pragmatisch. Erst als wir uns auf EfficientNet-B3 festgelegt hatten, bin ich auf GradCAM umgestiegen, und der Qualitätsunterschied in den Erklärungen war erheblich.

Was modellspezifische Methoden besser können

GradCAM nutzt direkt die Gradienten der letzten Convolutional Layer. Das bedeutet: Die Erklärung ist keine Approximation eines externen Ersatzmodells, sondern entsteht aus der Modellstruktur selbst. Bei Bilddaten mit räumlichen Strukturen ist das ein klarer Vorteil. Die Lokalisierungsqualität ist präziser und die Erklärungen sind reproduzierbar ohne Stichprobenrauschen.

Der Nachteil: Wenn das Modell wechselt, muss auch die Erklärungsmethode neu evaluiert werden. Bei schnellen Iterationszyklen ist das ein echter Aufwand.

Wann modellagnostisch sinnvoll bleibt

Bei Ensembles aus heterogenen Modellen oder wenn das Team schnell Erkenntnisse braucht ohne sich auf eine Architektur festzulegen. SHAP für tabellarische Daten ist in vielen solchen Fällen der vernünftigste Kompromiss, weil TreeSHAP für baumbasierte Modelle trotzdem exakt rechnet, nicht approximiert.

Die Entscheidung hängt letztlich an drei Fragen: Wie stabil ist die Modellarchitektur, wer liest die Erklärungen, und wie viel Rechenbudget steht zur Verfügung.

Modellspezifisch oder modellagnostisch: Wann ich welchen Ansatz wähle

Was modellspezifische Methoden besser können

Wann modellagnostisch sinnvoll bleibt