Ohne menschliche Hilfe zur künstlichen Superintelligenz von Autodidakt AlphaGo Zero

Superintelligenz von AlphaGo Zero

Diese Woche hat das Team von Deepmind (die 2014 von Google gekauft wurden) beeindruckende neue Ergebnisse im Journal Nature (Paper) vorgestellt:
Eine KI die das Spiel Go besser beherrscht als jeder Mensch und jede Maschine zuvor, aber dabei nie von Menschen oder anderen Maschinen gelernt hat. Letztes Jahr war es eine große Errungenschaft, dass AlphaGo in dem komplexen Spiel den amtierenden Go-Weltmeister geschlagen hatte, obwohl das von kritischen Stimmen ein Jahrzent zuvor für unmöglich gehalten wurde. Die neue KI AlphaGo Zero hat im Gegensatz zu AlphaGo nie von Menschen gelernt, aber beim Training jeden menschlichen Zug mitentwickelt und weit darüber hinaus.

Menschliches Wissen als Einschränkung für die Superintelligenz

Technologisch basieren beide AlphaGo Maschinen auf einer ähnlichen Idee: Wiederholtes gegen sich selber Spielen und dabei Verbesserungspotenziale entdecken und implementieren. Der bedeutende Unterschied: AlphaGo wurde mit einer Datenbasis von Spielen menschlicher Spieler initialisiert, während AlphaGo Zero neben den Regeln (die strenggenommen unter den Algorithmus fallen) gar keine Daten zur Initialisierung bekommen hat. Die Maschine rät zufällige Spielzüge und verbessert sich durch Trial & Error. Das menschliche Go-Wissen wurde als Einschränkung (in der Mathematik spricht man von Annahmen die einschränkend sind) also entfernt.

In kürzester Trainingszeit zum Supererfolg

Der Lernfortschritt von AlphaGo Zero zeigt wie die Maschine sich zum Menschen verhält: 3 Stunden nach Trainingsbeginn (Training beschreibt u.a. den “Gegen sich selber Spielen und Lernen” Prozess) ist AlphaGo Zero in der Lage mit ähnlichen Strategien wie ein menschlicher Anfänger zu spielen. 19 Stunden nach Trainingsbeginn beherrscht AlphaGo Grundlagen fortgeschrittener Go Strategien. Und nach 70 Stunden ist AlphaGo auf superintelligentem (also übermenschlichem) Niveau mit Strategien die in tausenden Jahren Go Geschichte noch nicht von Menschen entwickelt wurden. Nach 40 Tagen und insgesamt 30 Millionen Spielen war AlphaGo Zero dann soweit, besser als alle bisherigen Maschinen zu sein: AlphaGo Zero hat AlphaGo (das letztes Jahr einen der weltbesten Spieler geschlagen hat) in 100 Spielen mit “zu-Null” geschlagen. Das Training einer KI ist generell ressourcenhungrig. Die neuen Algorithmen für Zero haben nicht nur den Erfolg sondern auch die Trainingszeit und Berechnungsaufwände drastisch reduziert. Maßgeblich beigetragen hat die Verschmelzung zweier neuronaler Netzwerke die bei AlphaGo am Werk waren — eine die den besten Spielzug vermutet und eine die diesen dann vergleichend evaluiert. Dadurch wurden u.a. 4 Tensorprozessoren (TPUs) statt 48 TPUs in früheren Versionen verwendet. Somit ist AlphaGo Zero in jeder Hinsicht ein sensationeller Durchbruch.

Chancen und Potenziale schwacher künstlicher Intelligenz bestätigen sich

Schnelles Voranschreiten verschiedener künstlichen Intelligenz Technologien zeigen wie immer weiter verschiedene Aufgaben in beeindruckender Weise von KIs gelöst werden. Bei Vergleich der Euphorie über den Sieg von AlphaGo in diesem äußerst komplexen, intuitiven Spiel mit riesigem Lösungsraum letztes Jahr, bestätigen sich positive Vorhersagen bzgl. der potenziellen Intelligenz die sich erreichen lässt.

Jedoch handelt es sich natürlich immer noch um eine sogenannte schwache KI, also einer KI die einen bestimmten, überschaubaren Aufgabenbereich beherrscht, insbesondere wird Deep Learning, die KI Technologie hinter AlphaGo Produkten für schwache KI verwendet. Bilderkennung, Spracherkennung oder sogar Assistenzsysteme die verschiedene AIs kombinieren wie Google Assistant, Apple Siri oder Microsoft Cortana sind weitere Beispiele schwacher KI. Eine generelle oder auch stark genannte KI hingegen, wäre eine Intelligenz die allerlei Aufgaben lösen kann. In diesem Feld hat die Forschung bisher weniger Fortschritt gemacht und es ist unklar ob und wie hier Durchbrüche gemacht werden können (in einer Episode des englischsprachigen Podcasts Let’s make the future werden Fragen thematisiert, ob der Durchbruch durch Ingenieure oder Forscher, Mathematik oder Biologie, oder durch schwache KIs folgen wird). Fest steht: eine superintelligente starke KI muss bedacht eingeführt werden, denn wenn der Mensch nicht mehr die intelligenteste Spezies auf diesem Planeten ist, sollten wir der superintelligenten Spezies besser wohlgesonnen sein.

Ich denke Robotik ist ein gutes Beispiel für was aktuell möglich ist. Wir haben ein paar Robitikunternehmen gekauft, aber die Möglichkeit Deep Learning darauf anzuwenden wird, vor allem durch Bilderkennung, eine sehr interessante und wichtige Richtung für die nächsten Jahre einschlagen 

Jeff Dean, Google Brain Team, 2016

Natürlich kann eine schwache KI im Gegensatz zur starken KI schon heute deutliche Vorteile bieten, wie man mit den obigen Beispielen sieht, und hat Potenziale kurzfristig beeindruckende Ergebnisse zu bringen  (man vergleiche Deepminds AlphaGo Produkt diesen Jahres mit dem letzten Jahres). Mit AlphaGo Zero’s Algorithmen kann nun weitere Forschung angestoßen werden, bei der Maschinen effizient trainiert werden können, die z.B. in der Proteinfaltung zur Entwicklung von Medikamenten, globaler Logistik, Quantenchemie, Robotik oder in der Werkstofftechnik Fortschritt erreichen können der für Menschen undenkbar wäre. Mit der “Weltherrschaft” in Go, demonstrierte Deepmind deutlich die Übermenschlichkeit bzw. Superintelligenz in komplexesten Spielen — nach dieser Demo kann nun ein Beispiel mit humanitärem Nutzen folgen.

AI Sicherheit: Risiken verdeutlichen sich

Ein großes Warnsignal sollte das ganze Spektakel aber doch hinterlassen: wir sehen eine Maschine, die ohne menschlichen Input lernt intelligenter als ein Mensch zu spielen und dabei unvorhergesehene Spielzüge entwickelt. Wir müssen in Zukunft das Ausmaß dieser unvorhergesehenen Auswirkungen (sogenannte breakouts) bis zu einem bestimmten Grade kontrollieren können. Zum Thema KI Sicherheit wird zurzeit äußerst wenig Forschung betrieben — dazu gibt es zurzeit nicht einmal einen englischsprachigen Wikipedia Artikel (AI safety, Stand 22.10.17, aber es gibt diesen), dabei wird es aktuell von einigen Experten, wie immer wieder von Elon Musk oder 80.000 hours, als dringlichstes Problem der Welt bezeichnet.

Schreibe einen Kommentar