SIGS DATACOM Fachinformationen für IT-Professionals

German Testing Day 2020

Die unabhängige Konferenz zu Software-Qualität
Frankfurt am Main, 01. - 02. September 2020

Sessionsdetails

Vortrag: GTD 1.2
Datum: Mi, 02.09.2020
Uhrzeit: 11:20 - 11:55

Qualitätssicherung von Künstlicher Intelligenz - Testen eines neuronalen Netzes

Uhrzeit: 11:20 - 11:55
Vortrag: GTD 1.2

 

Es stellen sich grundlegende Fragen zum Testvorgehen von neuronalen Netzen. Gängige Testmethoden mit Ausrichtung auf Blackbox oder Whitebox stoßen bei komplexen neuronalen Netzen auf Komplikationen, da sie ein festes quantifizierbares Ergebnis voraussetzen.  Whitebox-Tests gestalten sich herausfordernd, da die Komplexität der Vorgänge innerhalb der Netze in einer Vielzahl von komplexen Anwendungsfällen  schwer nachvollzogen werden kann. Die Kategorie der Blackbox-Tests scheitert bei bestimmten Ausprägungen von komplexen neuronalen Netzen, da das zu erwartende Ergebnis im Vorfeld nicht in jedem Fall eindeutig quantifiziert werden kann.

Zielpublikum: Tester, Entwickler, Testmanager
Vorraussetzungen:
Grundlegende Testerfahrungen, Whitebox-Test, Blackbox-Test, Neuronale Netze,
Schwierigkeitsgrad: Advanced

Extended Abstract:
Im Zuge der voranschreitenden Digitalisierung der Unternehmen werden verstärkt  neuronale Netze als künstliche Intelligenz (KI) für unterschiedlichste Problemstellungen eingesetzt. Diese Netze ermöglichen es, durch ihre Vorgehensweise bei komplexen Problemen und großen Datenmengen, neue Blickwinkel zu ergründen und schneller auf Veränderungen zu reagieren . Zeitgleich stehen Unternehmen und Mitarbeiter vor neuen Herausforderungen.    Den Anforderungen an die Qualität und der Dokumentation für neuronale Netze ist teilweise nur bedingt nachzukommen. In den neuronalen Netzen lässt sich schwer nachvollziehen, warum eine Entscheidung getroffen wurde, um zum erreichten Ergebnis zu kommen. Durch diese Hürden fehlt es an Transparenz für eine angemessene Qualitätssicherung.  Bestimmte Implementierungsarten von neuronalen Netzen sind nicht-deterministisch, was den Sachverhalt der Nachvollziehbarkeit zusätzlich verschärft.   In der Entwicklung wird die Fehlersuche erschwert, da die Wiederholung eines Vorgangs mit gleichen Eingabebedingungen zu unterschiedlichen Ergebnissen führen kann. Die Fehlererkennung und Behebung stellen daher eine Herausforderung dar.
Neuronale Netze gibt es in verschiedensten Ausprägungen. Die Struktur/Topologien unterscheiden sich grob in sequenziell und rekurrente Netze mit unterschiedlicher Tiefe. Die Art des Lernens ist untergliedert in überwachtes, unüberwachtes und bestärktes Lernen. Jede Kombination von Struktur und Lernart bringt eigene technische und organisatorische Herausforderungen mit sich.
Es stellen sich grundlegende Fragen zum Testvorgehen von neuronalen Netzen. Gängige Testmethoden mit Ausrichtung auf Blackbox oder Whitebox stoßen bei komplexen neuronalen Netzen auf Komplikationen, da sie ein festes quantifizierbares Ergebnis voraussetzen.  Whitebox-Tests gestalten sich herausfordernd, da die Komplexität der Vorgänge innerhalb der Netze in einer Vielzahl von komplexen Anwendungsfällen  schwer nachvollzogen werden kann. Die Kategorie der Blackbox-Tests scheitert bei bestimmten Ausprägungen von komplexen neuronalen Netzen, da das zu erwartende Ergebnis im Vorfeld nicht in jedem Fall eindeutig quantifiziert werden kann. In klassischen Anwendungen von neuronalen Netzen lassen sich die Ergebnisse quantifizieren. Es entstehen zunehmend Anwendungen, bei denen dies nicht mehr der Fall ist, wie der 'Neural Style Transfer'.
In dem Vortrag 'Qualitätssicherung von Künstlicher Intelligenz - Testen in neuronalen Netzen' werden die Handlungsfelder und Herausforderungen benannt sowie analysiert. Nach einer Einführung in die Thematik der neuronalen Netze und des Anwendungsfalls 'Neural Style Transfer', werden die verschiedenen technischen Rahmenbedingungen an die Qualitätssicherung vorgestellt. Bestehende Lösungsansätze werden skizziert und erläutert. Der Vortag endet mit einem Fazit der bisher verfolgten Lösungsmethoden und gibt einen Ausblick auf mögliche zukünftige Entwicklungen.