Ein Projekt von:

Institut für Internet-Sicherheit - if(is)

Wie können wir der KI vertrauen?

Symbolbild zu Arbeit mit KI

Beitrag teilen:

Wie können wir der KI vertrauen? – Mechanismus für gute Ergebnisse

KI vertrauen

Mehr und mehr Unternehmen planen, KI weitreichend einzusetzen oder tun dies bereits. Vielen gelingt Dies jedoch nicht. Gründe hierfür können zum Einen die fehlenden zukunftssicheren Einsatzmöglichkeiten sein, welche den Nutzen schmälern. Zum Anderen besteht Unsicherheit über die Validität der KI-generierten Ergebnisse.
Nachfolgend geht es um die Mechanismen, die gute Ergebnisse sicherzustellen helfen.

Damit sowohl in Unternehmen als auch in der Gesellschaft eine breite Akzeptanz für KI herrscht, müssen einige Herausforderungen überwunden werden. Als Schlüssel zu diesem Erfolg wird die Vertrauenswürdigkeit der KI-Technologie gesehen. Doch wie kann diese aufgebaut werden?
Vertrauen bedeutet laut Definition die subjektive Überzeugung, dass Aussagen und Handlungen als Richtig zu bewerten sind. Dementsprechend wird ein KI-System generell als vertrauenswürdig eingestuft, wenn es sich immer, wie für den Zweck vorgesehen, wie erwartet verhält.
Daraus lässt sich folgern, dass Vertrauenswürdigkeit nachweisbar ist. Bezogen auf KI sind somit folgende Faktoren relevant, welche im Anschluss erläutert werden:

– Die Eingangsdaten der KI müssen qualitativ hochwertig für das Anwendungsgebiet sein.

– Sowohl das KI-System, als auch die gesamte IT-Anwendung sind von KI- und Anwendungsexperten erstellt, und manipulationssicher und vertrauenswürdig umgesetzt.

– Ergebnisse sollten nachvollziehbar sein.

– Ethische Grundsätze werden bei Entwicklung und Anwendung eingehalten.

Qualität der Eingangsdaten

Für das Trainieren des KI-Algorithmus sowie dessen Nutzung werden Daten benötigt. Somit berut die Entwicklung und auch der Einsatz KI-basierter Anwendungen grundsätzlich auf Daten. Unter Betrachtung dieses Aspekts ist eine differenzierte Analyse der Eingangsdaten – bezogen auf ihren Wert für ihre Aussagekraft im Sinne der Aufgabenstellung – ein notwendiger Schritt, um die Vertrauenswürdigkeit von KI-basierten Anwendungen sicherzustellen. Denn das Ergebnis wird maßgeblich durch deren Auswahl und Qualität bestimmt. Aus diesem Grund sollte es verpflichtend sein entsprechende Positionen, welche für die Datengewinnung und -nutzung sowie der Kontrolle der ordnungsgemäßen Umsetzung verantwortlich sind, in Unternehmen zu schaffen. Anhand vorgegebener Kriterien kann sich so der Standard der Datenqualität für KI-Systeme etablieren und validieren. Im Einzelnen sind dabei unter anderem Vollständigkeit, Repräsentativität, Nachvollziehbarkeit, Aktualität und Korrektheit zu berücksichtigen.

Vollständigkeit der Daten

Um als vollständig zu gelten, muss ein Datensatz alle notwendigen Attribute und Inhalte enthalten. Wenn die Vollständigkeit der Daten im Datensatz nicht garantiert werden kann, können sich daraus falsche und sogar diskriminierende Ergebnisse entwickeln. Ein Beispiel für ein solches Ergebnis tritt bei Predictive-Policing-Systemen auf: Werden bei der Datenerhebung zu Kriminalitätsdelikten vorwiegend bestimmte Stadtviertel kontrolliert und in diesem Kontext bestimmte Merkmale wie Herkunft und Alter erfasst, kann es im Laufe der Zeit zu einer stärkeren Überwachung bestimmter Bevölkerungsgruppen kommen, welches im Anschluss zu häufigeren Kontrollen führen kann. Dieses (vermeintliche) Ergebnis kann jedoch darauf basieren, dass entsprechende Vergleichswerte mit den gleichen Merkmalen aus anderen Stadtvierteln nicht im gleichen Maße aufgenommen wurden. Vollständigkeit bedeutet somit nicht, wahllos möglichst viele Daten zu sammeln – entscheidend ist die Auswahl.

Repräsentativität der Daten

Repräsentativität bedeutet, dass die Daten die tatsächliche Grundgesamtheit und somit die Realität, die im Sinne der Aufgabenstellung ist, abbilden. Folge aus nicht repräsentativen Daten ist ein resultierender Bias. Ein Beispiel für diesen Bias tritt im Recruiting von Führungskräften auf. Werden hierbei größtenteils Daten aus der Vergangenheit berücksichtigt, in welcher überwiegend Männer Führungspositionen bekleidet haben, könnte die KI-basierte Anwendung daraus folgern, dass Männer für diese Positionen qualifizierter sind. Durch Ergebnisse wie diesem wird deutlich, dass KI-Systeme nicht zwangsläufig objektiv handeln.

Nachvollziehbarkeit der Daten

Essentiell für die Überprüfung der Datenqualität ist die Möglichkeit nachzuvollziehen aus welchen Quellen die verwendeten Daten stammen. Nicht transparente – das heißt nicht nachvollziehbare, validierbare – Datensätze wirken sich negativ auf die Qualität dieser Daten aus. Die Definition entsprechender Vorgaben im Bezug der Bewertung und Messung von Datenqualität, der Qualität der Quellen sowie Verbesserungsmaßnahmen können bestmögliche Ergebnisse erzielen. Hierzu müssen die für den Prozess relevanten Kriterien, beispielsweise Konsistenz oder Einheitlichkeit, bestimmt werden.
Mithilfe dieser gewählten Kriterien können die erhobenen Daten dann auf ihre konsistente Qualität überprüft werden. Wichtig hierbei sind noch zwei Aspekte: Daten kommen häufig aus unterschiedlichen Quellen in verschiedenen Formaten, welche vor dem Einsatz auf ihren Nutzen hin überprüft werden müssen.

Außerdem kann die Nachvollziehbarkeit – besonders im Produktionsbereich – auch durch qualitativ hochwertige und sichere Sensoren abhängig sein.

Aktualität der Daten

Da die grundsätzliche Idee beim maschinellen Lernen oder KI die Extraktion von Wissen aus Daten ist, muss sichergestellt werden, dass sowohl die generierten, als auch die verwendeten Daten die richtigen Informationen und Erfahrungen beinhalten, um mithilfe der KI-Algorithmen das Problem korrekt und vertrauenswürdig zu lösen. In Abhängigkeit der Anwendung sollen möglichst die aktuellsten Daten verwendet werden, da veraltete Daten zu falschen Ergebnissen führen können.

Korrektheit der Daten

Die Daten müssen für die Anwendung korrekt sein und damit mit der Realität übereinstimmen. Aus diesem Grund ist die Auswahl der Daten mittels detaillierter Analyse erforderlich. Mapping gegen Daten, deren Korrektheit bestätigt ist, oder abgestimmte Plausibilitätsegeln können hier als Methoden eingesetzt werden. Auf diesem Weg lässt sich sicherstellen, dass keine Diskrepanz zwischen den genutzten Daten und der Realität besteht.

Fazit

Der Einsatz von KI eröffnet neue Möglichkeiten oder Verbesserungen im Bereich bestimmter Analysen, welche als Basis einer komplexen Urteilsfinding dienen. Da jedoch die Entscheidungen der KI in einer Blackbox ablaufen, ist es schwer nachzuvollziehen, wie die Ergebnisse zustande gekommen und ob diese valide sind. Besonders in Bezug auf die Gestaltung von Modellen zur Erfassung und Nutzung von Daten bedarf es einer hohen Methodenkompetenz in der Entwicklung und dem Einsatz KI-basierter Anwendungen. Beispiele bezüglich Verzerrungen oder der Manifestierung von Vorurteilen machen dies deutlich. Für die Vertrauenswürdigkeit der Anwendungen ist es verpflichtend, diese Herausforderungen zu lösen, denn nur so kann eine Akzeptanz der KI-Anwendung erreicht werden. Zusätzlich sollten auch durch alle beteiligten Parteien Aufklärungsarbeit bezüglich sowohl der Möglichkeiten, als auch der Risiken der KI-Technologie Transparenz und damit einhergehend Verständnis geschaffen werden. Ebenso notwendig ist die Berücksichtigung der Ethik – Unterstützung für die Umsetzung von KI-Systemen gemäß ethischer Kriterien wird mittlerweile auch Tool-basiert angeboten.

Artikel:

U. CoesterN. Pohlmann
„Wie können wir der KI vertrauen? – Mechanismus für gute Ergebnisse“,
IT & Production – Zeitschrift für erfolgreiche Produktion,
Technik-Dokumentations-Verlag,
Ausgabe 2020/21

Hier finden Sie den vollständigen Artikel:
Wie können wir der KI vertrauen? – Mechanismus für gute Ergebnisse

 – It’s all about Trust! –

Quelle:

Bild: Image by Freepik