Die Künstliche Intelligenz gilt als eine der wichtigsten Zukunftstechnologien unseres Jahrhunderts. Durch sie ist die Verarbeitung großer Datenmengen in kurzer Zeit möglich, Ihre Fähigkeit eigenständig zu "lernen" und Bilddaten zu analysieren macht sie unerlässlich für die Umsetzung der Personalisierten Medizin. Alena-Kathrin Golla, M.sc. arbeitet gemeinsam mit Prof. Dr. med. Achim Gass an einem hochinnovativen Projekt, um die Therapiesteuerung von Patientinnen und Patienten mit Multipler Sklerose zu verbessern. Die Voxel-Guided Morphometry (VGM) ist eine Methode, die der Detektion und Analyse von Veränderungen von Gehirnläsionen über die Zeit dient. Mit dieser bisher nur in der Forschung angewandten Technik können VGM-Karten des Gehirns der betroffenen Patientin/des betroffenen Patienten angefertigt werden. Das Ziel ist es, eine sichere und individuelle Verlaufskontrolle sowie Therapiesteuerung der Patientinnen und Patienten zu gewährleisten. Ein Grund dafür, dass diese Methode bisher keinen Einzug in den klinischen Alltag genommen hat, ist der hohe Rechenaufwand, der mit der Analyse der morphologischen Daten verbunden ist. Das Ganze kann jedoch nun mittels der Rechenkapazität neuronaler Netzwerke um einiges beschleunigt werden. Den Weg dahin bereitet Frau Golla, welche an der Universität Heidelberg am Lehrstuhl für Computerunterstützte Klinische Medizin tätig ist und ihren PhD anstrebt.
esanum: Frau Golla, wie viele Trainingsdurchläufe benötigt der KI-Algorithmus, um eine sichere Therapiekontrolle bei Multipler Sklerose zu gewährleisten?
Golla: Für den Prototypen, den wir bisher entwickelt haben, benötigen wir über 100.000 Trainingsdurchläufe, um die gewünschte Qualität zu erreichen. Das Ziel ist es ja, dass sogar kleinste morphologische Veränderungen im Gehirn sichtbar werden. Die Ergebnisse sehen wir dann in den generierten VGM-Karten. Das Ganze basiert auf einem Datensatz, den wir von der Neurologischen Klinik der Universitätsmedizin Mannheim erhalten haben. Diese 100.000 Trainingsdurchläufe wären übersetzt in die Machine Learning Terminologie gleichzusetzen mit 200 Epochen. Das bedeutet, dass der Algorithmus 200-mal durch den Datensatz geht. Allerdings muss man dazu sagen, dass wir aus Optimierungszwecken auch andere Techniken zusätzlich hierzu anwenden.
esanum: Was genau können wir uns unter solchen anderen Techniken vorstellen, die die Ausbildung des Algorithmus unterstützen?
Golla: Bei den anderen Techniken handelt es sich um Datenargumentierungen. Diese werden verwendet, um eine größere Bandbreite an diversen Daten zu generieren. Auf diese Weise lernt der Algorithmus, auch mit neuen Daten umzugehen und besser zu generalisieren. So lernt der Algorithmus zuverlässig Daten zu analysieren, die nicht exakt den Trainingsdaten entsprechen.
esanum: Sie haben vorhin den Begriff Machine Learning erwähnt. Können Sie uns diesen Begriff kurz näher erläutern? Was kann man sich darunter vorstellen?
Golla: Bei einer klassischen Software ist es so, dass die Lösung von Problemen durch das Programm anhand vorher festgelegter Regeln erfolgt. Anders sieht das Ganze bei der Künstlichen Intelligenz aus. Machine Learning Algorithmen lernen eine Aufgabe zu lösen, indem sie die Lösung schrittweise auf Trainingsdaten verbessern. Eine Subgruppe dieser Algorithmen sind künstliche neuronale Netze.
Ein Netz besteht aus einer Vielzahl von künstlichen Neuronen, deren Aufbau an biologische Neuronen angelehnt ist. Die Neuronen sind in sogenannten Layern angeordnet. Diese Layer sind miteinander verbunden. Je mehr Layer so ein künstliches neuronales Netzwerk besitzt, desto komplexere Probleme können gelernt werden. Mit zunehmender Anzahl an Layern gewinnt das Netzwerk Tiefe. Moderne Netzwerke bestehen aus sehr vielen Layern, womit wir auch zu dem Begriff Deep Learning kommen.
esanum: Können Sie uns erklären, welche Bedeutung das Deep Learning als Unterkategorie des Machine Learning besitzt?
Golla: Deep Learning ist nicht nur in der Lage Entscheidungen zu lernen, sondern auch Merkmale aus den Bildern zu extrahieren. Dadurch können diese Netze lernen komplexe Probleme zu lösen ohne, dass menschliches Eingreifen nötig ist. Diese Netzwerke erreichen viel höhere Genauigkeiten als Machine Learning Algorithmen, die auf von Menschen designte Merkmalsbeschreibungen angewiesen sind.
esanum: Auf welche Weise "lernen" künstliche neuronale Netzwerke?
Golla: Der Lernprozess für neuronale Netze erfolgt über eine Minimierung des Vorhersagfehlers. Zu Beginn werden alle Gewichte des künstlichen neuronalen Netzwerks mit einem zufälligen Wert initialisiert. In jedem Trainingsschritt werden nun einige Trainingsbeispiele in das Netz eingeschleust. Das Netzwerk verarbeitet dann Layer für Layer diese Eingabe und gibt eine Vorhersage für jedes Beispiel aus. Dieses Ergebnis hat jedoch relativ wenig mit dem zu erwartenden Ergebnis auf die initial an das Netzwerk gestellte Frage zu tun. Künstliche neuronale Netzwerke werden überwacht trainiert. Das heißt, dass wir für jedes Trainingsbeispiel die korrekte Lösung bereits kennen. Die Vorhersage des Netzwerks wird nun mit der bekannten Lösung verglichen und daraufhin wird jeder einzelne Parameter des Netzwerks so verändert, dass der Fehler zwischen Vorhersage und Lösung verringert wird. Mit jeder Runde wird der Fehler minimiert und auf diese Weise "lernt" das künstliche neuronale Netzwerk.
esanum: Wie entstehen VGM-Karten des Gehirns aus der technischen Sicht?
Golla: Der Grundalgorithmus für VGM basiert auf 4 Schritten. Die ersten 3 Schritte sind größtenteils dazu da, zu garantieren, dass die Bilder vor der Berechnung dieser VGM-Karten exakt übereinander liegen. Das Ziel ist es ja, genau das Match zwischen dem ersten und dem zweiten Untersuchungszeitpunkt zu erhalten. Dazu werden die Bilder zunächst grob übereinandergelegt. Dann passt man die Intensitätswerte der MRT-Bilder an und dann wird noch weiterer Algorithmus verwendet, damit die Gehirne aus der ersten und zweiten Messung exakt lokal übereinstimmen. Für jeden Bildpunkt wird über mehrere Auflösungsstufen und Gitternetze berechnet, wie sich dieser Punkt zwischen den Bildern verändert hat. Diese quantitativen Werte, die dann in den VGM-Karten stehen geben uns die Auskunft darüber, ob ein Wert z.B. um 20% größer oder kleiner geworden ist. Das ist im Endeffekt die Magnitude der Veränderung, die über ein Vektorfeld in diesem 4. Schritt berechnet wird. Dieser 4. Schritt ist unglaublich rechenaufwendig. Genau hier kommt die Künstlichen Intelligenz ins Spiel, denn sie sorgt für die Approximation. Wir erhalten so die Information über eine morphologische Veränderung über die Zeit ohne diesen komplexen Rechenschritt selbst ausführen zu müssen. Dies geht mit einer enormen Zeitersparnis einher und ist innerhalb von Sekunden möglich.