21,99 €
Niedrigster Preis in 30 Tagen: 21,99 €
Wir erleben den «iPhone-Moment» der künstlichen Intelligenz, die Technologie ist erstmals für jede und jeden verfügbar. Damit stehen wir an einer entscheidenden Schwelle unserer kulturellen Evolution. Alles verändert sich überall auf einmal. Miriam Meckel und Léa Steinacker zeigen die Chancen auf, die der Schritt über diese Schwelle birgt. Wir müssen nicht fürchten, als Menschen abgeschafft zu werden, denn: Alles, was die KI tut, geht zurück auf die Art und Weise, wie wir mit ihr umgehen. Das heißt aber auch: Wir stehen genau jetzt vor der Aufgabe, ihre Entwicklung in die richtigen Bahnen zu lenken. Doch wie gelingt das, und wo lauern Risiken, unerwünschte Nebeneffekte, ethische Dilemmata – ob in der Arbeitswelt, in der Wirtschaft, in den menschlichen Beziehungen oder im Alltag? Welche Fragen klären wir besser heute als morgen, sei es im Umgang mit selbstfahrenden Autos, virtuellen medizinischen Assistenten oder automatisierten Fake News? Wenn wir in einer immer komplexeren Welt mithalten wollen, so Meckel und Steinacker, dann müssen wir auch unsere menschliche Intelligenz erweitern – selbst dabei kann künstliche Intelligenz uns helfen. Auch wir werden uns also verändern. Wie sieht die Welt von morgen aus, wie finden wir uns darin zurecht und entscheiden richtig? Dieses Buch weist den Weg.
Das E-Book können Sie in Legimi-Apps oder einer beliebigen App lesen, die das folgende Format unterstützen:
Seitenzahl: 487
Miriam Meckel • Léa Steinacker
Wie Künstliche Intelligenz unsere Welt verändert und was wir dabei gewinnen können
Wir erleben den «iPhone-Moment» der Künstlichen Intelligenz, die Technologie ist erstmals für jede und jeden verfügbar. Damit stehen wir an einer entscheidenden Schwelle unserer kulturellen Evolution. Alles verändert sich überall auf einmal.
Miriam Meckel und Léa Steinacker zeigen die Chancen auf, die der Schritt über diese Schwelle birgt. Wir müssen nicht fürchten, als Menschen abgeschafft zu werden, denn: Alles, was die KI tut, geht zurück auf die Art und Weise, wie wir mit ihr umgehen. Das heißt aber auch: Wir stehen genau jetzt vor der Aufgabe, ihre Entwicklung in die richtigen Bahnen zu lenken. Doch wie gelingt das, und wo lauern Risiken, unerwünschte Nebeneffekte, ethische Dilemmata – ob in der Arbeitswelt, in der Wirtschaft, in den menschlichen Beziehungen oder im Alltag? Welche Fragen klären wir besser heute als morgen, sei es im Umgang mit selbstfahrenden Autos, virtuellen medizinischen Assistenten oder automatisierten Fake News?
Wenn wir in einer immer komplexeren Welt mithalten wollen, so Meckel und Steinacker, dann müssen wir auch unsere menschliche Intelligenz erweitern – selbst dabei kann Künstliche Intelligenz uns helfen. Auch wir werden uns also verändern. Wie sieht die Welt von morgen aus, wie finden wir uns darin zurecht und entscheiden richtig? Dieses Buch weist den Weg.
Miriam Meckel ist Professorin für Kommunikationsmanagement an der Universität St. Gallen, als Gastprofessorin lehrte sie an der Universität Harvard, in Singapur, New York und Wien. Sie war Chefredakteurin und Herausgeberin der «Wirtschaftswoche», zudem Staatssekretärin für Medien und Internationales in Nordrhein-Westfalen. Ihr Buch «Brief an mein Leben» (Rowohlt 2010) wurde zum Bestseller. Seit 2018 ist Meckel Co-Gründerin und CEO von ada Learning, einem Weiterbildungsprogramm für Zukunftskompetenzen.
Léa Steinacker ist Sozialwissenschaftlerin und Unternehmerin. Sie studierte in Princeton und Harvard und promovierte an der Universität St. Gallen über die sozialen Auswirkungen von KI. Als Journalistin schrieb sie u.a. für die «Wirtschaftswoche». Das «Medium Magazin» zeichnete sie als eine der «Top 30 bis 30»-Journalist:innen des Jahres 2018 aus, das US-Magazin «Forbes» nahm sie in die Liste der «Top 30 Under 30»-Führungskräfte der Medienwelt Europas auf. Mit Miriam Meckel gründete sie 2018 ada Learning.
Veröffentlicht im Rowohlt Verlag, Hamburg, März 2024
Copyright © 2024 by Rowohlt Verlag GmbH, Hamburg
Covergestaltung Anzinger und Rasp, München
Coverabbildung Rik Oostenbroek
ISBN 978-3-644-02104-4
Schrift Droid Serif Copyright © 2007 by Google Corporation
Schrift Open Sans Copyright © by Steve Matteson, Ascender Corp
Dieses Werk ist urheberrechtlich geschützt, jede Verwertung bedarf der Genehmigung des Verlages.
Die Nutzung unserer Werke für Text- und Data-Mining im Sinne von § 44b UrhG behalten wir uns explizit vor.
Abhängig vom eingesetzten Lesegerät kann es zu unterschiedlichen Darstellungen des vom Verlag freigegebenen Textes kommen.
Alle angegebenen Seitenzahlen beziehen sich auf die Printausgabe.
Im Text enthaltene externe Links begründen keine inhaltliche Verantwortung des Verlages, sondern sind allein von dem jeweiligen Dienstanbieter zu verantworten. Der Verlag hat die verlinkten externen Seiten zum Zeitpunkt der Buchveröffentlichung sorgfältig überprüft, mögliche Rechtsverstöße waren zum Zeitpunkt der Verlinkung nicht erkennbar. Auf spätere Veränderungen besteht keinerlei Einfluss. Eine Haftung des Verlags ist daher ausgeschlossen.
www.rowohlt.de
When the machine starts
Will you remind me
I saw the truth once
I saw it floating in the air
Don’t let me forget
Missy Higgins
Es war auf dem Weg zum Zukunftsfestival South by Southwest in Austin, Texas, als der Groschen fiel. Er fiel nicht laut, sondern ganz leise, denn es war ein virtueller Groschen. Und er fiel auch nicht schnell. In Zeitlupe bewegte sich die Münze durch die neuronalen Windungen unserer Gehirne, so wie eine Kugel durch einen Flipperautomaten, um immer wieder anzuecken und zurückgeschleudert zu werden. Kommt die Kugel jemals an, oder verschwindet sie immer nur in einem schwarzen Loch, um dann wie durch Zauberhand wieder ins Spiel geworfen zu werden? Wir wissen es nicht.
Wir saßen im Flugzeug in die USA. Und was macht man auf einem Langstreckenflug? Man schaut auch mal einen Film. Da gab es einen, der gerade sieben Oscars gewonnen hatte, darunter den für das beste Werk. Sein Titel: «Everything Everywhere All at Once». Wenn er nicht weltweit in allen Medien gewesen wäre, wir hätten im Flieger nicht gewusst, worum es in dem Film geht. Denn das Informationssystem im Flugzeug kündigte ihn mit einem lapidaren Satz an: «Eine Chinesin hat Schwierigkeiten mit ihrer Steuererklärung.»
Das ist der wohl langweiligste Teaser für einen Film, den man sich vorstellen kann. Er hat auch nahezu gar nichts mit dem Inhalt zu tun. Ob beim Texten eine KI im Spiel war? Oder hat hier ein Mensch den Film schlicht nicht verstanden?
Da ist Evelyn, gespielt von der Oscar-Gewinnerin Michelle Yeoh. Die chinesische Einwanderin hat einen Waschsalon, einen Ehemann, der mehr Waschlappen als Prinz Charming ist, und eine rebellische Tochter, die den Begriff «Teenager-Trotz» auf ein ganz neues Level hebt. Und dann flattert auch noch Post vom Finanzamt ins Haus: eine bevorstehende Steuerprüfung. Die soll eine strenge Bürokratin, grandios gespielt von Jamie Lee Curtis, durchführen. Evelyns Besuch bei der Steuerbehörde eskaliert schneller, als man «Steuererklärung» aussprechen kann. Ihr Ehemann entpuppt sich plötzlich als Martial-Arts-Kämpfer und verdrischt die Sicherheitskräfte, um Evelyn eine Nachricht aus dem Jenseits zu überbringen. Raum und Zeit lösen sich auf, denn die Menschen um Evelyn herum, ebenso wie sie selbst, haben viele weitere Leben in Parallelwelten. Das Multiversum ist real. Evelyn kann auf die Fähigkeiten und die Biografien anderer Versionen ihrer selbst zugreifen – und das tut sie auch. Denn sie ist schlagartig mit einer einzigartigen Mission betraut: der Rettung der Welt vor dem unbekannten Bösen.
«Eine Chinesin hat Schwierigkeiten mit ihrer Steuererklärung.» Wie kann man diesen spektakulären Film so zusammenfassen? Vielleicht ist diese Kurzbeschreibung programmatisch. Sie könnte eine Metapher sein für die Zeit, in der wir uns bewegen, für die Komplexität der Veränderung und unsere zeitweilige menschliche Überforderung und Unfähigkeit, diese Veränderungen zu verstehen und adäquat in Gedanken und Worte zu fassen.
Die Zeit, in die wir eingetreten sind, ist die der Künstlichen Intelligenz. Das ist eine Technologie, die gar nicht neu ist, wir alle haben schon seit Jahren täglich damit zu tun. Bisher hat sie sich für die meisten von uns gut versteckt bei Onlinediensten wie Netflix, Spotify, Amazon, Google. Ende November 2022 aber kam eine Anwendung auf den Markt, die für alle deutlich gemacht hat, was sich verändert: ChatGPT. Ab diesem Tag konnten Menschen in aller Welt direkt mit Künstlicher Intelligenz sprechen, sie ausprobieren. Die Zeit der Massenanwendung von KI, die etwas erzeugen kann – generativer KI –, war angebrochen. Es ist auch die Zeit unfassbar leistungsfähiger Tools. KI auf Steroiden.
Das ändert alles überall auf einmal.
Mit einem Entwicklungsschub seit 2017 hat sich das Feld der Künstlichen Intelligenz über die großen Sprachmodelle wie ChatGPT von OpenAI, Bard von Google oder Claude von Anthropic zu einer Allzwecktechnologie entwickelt. Die eröffnet ein Multiversum an Perspektiven und Möglichkeiten, so wie auch der preisgekrönte Film sie uns zeigt.
Alles: Genauso wie Evelyn Wang sich in einem Multiversum mit alternativen Realitäten wiederfindet, öffnen uns große Sprachmodelle die Pforten zu einem digitalen Multiversum voller Möglichkeiten. In dem spulen Maschinen nicht nur Skripte ab, sondern machen Wortwitze, schreiben Gedichte, entwickeln Software und designen sogar andere Maschinen. Sie werden nicht nur dazu da sein, uns zu dienen; sie werden uns auch eine neue Idee davon vermitteln, was es bedeutet zu «existieren».
Während Evelyn Wang mit ihrem heruntergekommenen Waschsalon zu kämpfen hat, ringen auch wir mit veralteten Systemen, die dringend ein kosmisches Upgrade benötigen – in Wirtschaft, Politik und unserem Alltag. Wie wäre es, wenn ein individueller KI-Assistent unseren Tag so perfekt organisierte, dass wir von all den lästigen wiederkehrenden Aufgaben entlastet würden und damit mehr Freizeit hätten, um unsere alternativen Lebensuniversen zu erkunden – wieder mehr Posaune zu spielen, den Sauerteig zu perfektionieren oder für eine lokale Hilfsorganisation zu arbeiten? Wie wäre es, wenn Künstliche Intelligenz unserer Wirtschaft einen neuen Wachstumsschub bescheren und unsere politischen Systeme wieder mehr zu dem machen würde, was sie mal sein sollten: repräsentativ für die Überzeugungen und Wünsche aller Menschen?
Wie der Film in seiner rasanten Optik unsere Sinne überflutet, so wird die generative KI einen Tsunami an Inhalten auslösen und unsere vernetzte Kommunikationswelt durcheinanderwirbeln. Empfinden wir das Internet schon jetzt nicht immer nur als Bereicherung, sondern manchmal auch als überlastend? Dann kann die Weiterfahrt stürmisch werden. Um nicht in einem Ozean KI-produzierter Gemischtwaren zu ertrinken, werden wir neue sichere Häfen der Bedeutung und Verständigung bauen müssen.
Überall: In Evelyns Multiversum gibt es eine unbegrenzte Zahl alternativer Realitäten. Es mag derzeit noch absurd klingen, aber genau diese Art von erweiterter Vorstellungskraft bringt generative KI in unsere Wirtschaft ein. Sie wird innovative Produkte schaffen, die Probleme lösen, von denen wir noch nicht mal wussten, dass wir sie haben, und sie wird ganze Industriezweige neu ordnen. Künstliche Intelligenz hat das Potenzial, unser bisheriges Wirtschaftsmodell so aussehen zu lassen, wie es ist: an vielen Stellen veraltet und dysfunktional. Wenn wir sie richtig nutzen, kann sie uns helfen, neue Akzente zu setzen und beispielsweise die Produktivität anzukurbeln.
In einer Szene des Films überblicken Evelyn und ihre Tochter als fühlende Steine den Grand Canyon. Was wird es bedeuten, wenn generative KI die emotionalen und sachlichen Dimensionen der öffentlichen Diskussion durchforsten kann, um in jedem Augenblick ein akkurates Bild des Zustands einer Gesellschaft zu liefern? Wird uns das ein differenzierteres Gespräch miteinander ermöglichen, oder werden wir weiter abgleiten in einen Kampf um die Vorherrschaft über die Signale, die von der KI ausgewertet werden? KI bringt uns auch für das politische und gesellschaftliche System einen Grand Canyon an Möglichkeiten. Wir können in seine Tiefen abstürzen oder an seiner Kante stehen und vom neuen Weitblick profitieren.
Auf einmal: Wie Evelyns Reise durch das Multiversum sie dazu zwingt, sich selbst zu hinterfragen, stellt uns generative KI vor die Frage, was es bedeutet, Mensch zu sein. Wenn ein Algorithmus ein Gedicht schreiben kann, das uns zum Weinen bringt, oder einen Witz, über den wir lachen können, was sagt das über die menschliche Kreativität aus? Was geschieht mit den heiligen Grundsätzen des Individualismus, des freien Willens und der persönlichen Verantwortung, wenn KI einen größeren Anteil an unseren Entscheidungen hat als wir selbst?
Für all das muss es auch im KI-Multiversum ein paar Regeln geben, die nicht nur für irgendeine außerirdische Galaxie gelten. Der Mensch muss zentraler Teil der Wertschöpfungskette bleiben. Vor allem aber muss er selbst maßgeblich über seine Zukunft entscheiden. Dann wird KI zur Co-Pilotin auf unserem Weg in die Zukunft der Mensch-Maschine-Kollaboration.
Wir bauen gerade neue Welten – wir Menschen, gemeinsam mit der KI. Die kann uns an einigen Stellen so gut imitieren, dass Verwechslungsgefahr besteht. Als Allzwecktechnologie stellt uns KI vor zahlreiche gesellschaftliche Grundsatzfragen. Bleibt das Wissen über sie auf ein paar elitäre Zirkel beschränkt, sind viele von uns anfällig für Risiken der neuen Technologie. Dann wissen wir gar nicht mehr, wer oder was für uns entscheidet. Wir verlieren uns in verdummenden Ablenkungen und «Fake News». Wir versacken weiter in Strukturen der Ungleichheit, die benachteiligte Gruppen unter dem Feigenblatt der Statistik weiter ausschließen. Und wir geben an die Maschinen und ihre Betreiber ab, was unser Leben so einzigartig macht: die Freiheit und Autonomie, unsere Existenz gestalten zu können.
Das wollen wir verhindern. Klar ist schon jetzt: Die neuen KI-Systeme werden zu Dampfmaschinen des Geistes, unseren kognitiven GPS-Systemen oder einfach zu Klettergerüsten fürs Denken. Es ist Zeit, die ersten Stufen des Gerüsts zu erklimmen, Erfahrungen damit zu machen, um vorbereitet zu sein auf das, was kommen wird, und es im besten Sinne mitzugestalten.
Seit vielen Jahren forschen, lehren und experimentieren wir, die Autorinnen, im Feld der Künstlichen Intelligenz. Dieses Buch verbindet Ergebnisse neuester Forschung mit unseren Einblicken und Erlebnissen auf Reisen von San Francisco bis Shanghai, von Davos bis Singapur, von Boston bis Kaiserslautern. Es ist als Einstieg gedacht in die neue Welt, die sich nun auftut. Das Buch soll denjenigen als Leitplanke dienen, die gerade erst beginnen, sich den Weg in das Themenfeld zu bahnen. Es soll aber auch diejenigen inspirieren und weiterführen, die mit dem Thema vertraut sind.
Auch Evelyn Wang steht im Film immer wieder am Scheideweg. In der Fülle ihrer Möglichkeiten schwingt eine Frage durchweg mit: «Was wäre, wenn?» In der Welt der KI als Allzwecktechnologie wird «Was wäre, wenn?» zu einer algorithmischen Anfrage an uns selbst. Was, wenn diese Technologie uns tatsächlich die Möglichkeiten der Veränderung brächte, auf die wir seit Jahren gewartet haben? Was, wenn wir nicht nur Arbeit, sondern auch Weisheit automatisieren könnten? Was, wenn wir KI erschaffen würden, die uns besser versteht als wir uns selbst? Was, wenn es uns gelänge, das Zusammenspiel von Mensch und Maschine so zu nutzen, dass beide gemeinsam einen universellen Evolutionsschub vollbringen können?
Es ist sehr verständlich, dass all diese Fragen erst einmal zu Verwirrung führen. Menschen haben Ängste, sie könnten im Verlauf des Fortschritts auf der Strecke bleiben. Sie mögen es auch nicht, wenn sie nicht genau verstehen, was gerade abgeht. Noch ist den meisten nicht klar, was das alles bedeuten kann und welche Rolle sie in dieser neuen Zeit als Menschen spielen werden. Wir haben metaphorisch gerade Schwierigkeiten mit unserer existenziellen Steuererklärung, die wir irgendwann einmal uns selbst, unseren Lieben oder auch einer höheren Einheit vorlegen wollen, um zu wissen: Wer bin ich, wie habe ich gelebt, welche Einsichten habe ich gesammelt – und wie unterscheidet sich das alles noch von dem, was Künstliche Intelligenz nun in ihren nahezu unendlichen Einsatzmöglichkeiten erledigen wird?
Wie wird einst unsere Zukunftsbilanz aussehen? Das hängt wesentlich davon ab, ob und wie es uns gelingen wird, den richtigen Entwicklungspfad einzuschlagen. Im Multiversum ist immer alles gleichzeitig wahr, und das gilt auch für das KI-Multiversum. Die Technologie kann uns in eine neue Zeit der Arbeitsentlastung, des Wohlstands, ja sogar des evolutionären Fortschritts führen – oder auch in eine Zeit der Demokratiedämmerung, Entrechtung und Entmenschlichung. Alles ist parallel möglich, im Guten wie im Schlechten. Wir sind diejenigen, die jetzt wichtige Weichen stellen können.
Die Reise in eine neue Zeit hat begonnen. Schnallen wir uns also an, stellen wir alle Regler auf Offenheit und Neugier, und machen wir uns bereit für den Sprung in das KI-Multiversum. Wenn diese Reise zwischendurch wie die Fahrt in einer Achterbahn wirkt, dann ist das kein Grund zur Sorge. Wir sind immer nur ein Universum entfernt von einer völlig neuen Perspektive.
Willkommen im Zeitalter von Alles überall auf einmal.
ChatGPT war von Beginn an weit mehr, als der Name verspricht. Chatbots gab es schon lange, aber eben nicht solche. Mit ChatGPT lässt sich in Sekunden ein Text schreiben, eine E-Mail, ein LinkedIn-Post oder auch ein ganzer Essay entwerfen, ein soeben abgehaltenes Meeting zusammenfassen, die Gebrauchsanweisung einer Waschmaschine zu einem Gedicht im Stil Shakespeares umformulieren. Am Anfang waren da schlicht die Neugier und Faszination, mit einem Instrument herumzuspielen, das menschlicher wirkte als jede technische Anwendung zuvor. Aber das reicht nicht als Erklärung dafür, dass die Nutzungszahlen für ChatGPT in fünf Tagen auf eine Million Menschen und in zwei Monaten auf 100 Millionen Menschen kletterten – das rasanteste Wachstum einer Anwendung seit der Erfindung des Internets. Schnell wurde klar: ChatGPT bringt mehr als nur zusätzliche Leistung, es hebt die Unterstützung des Menschen durch Künstliche Intelligenz auf eine neue Stufe. Was die Anwendung kann, konnte so bislang keine Sprachtechnologie auch nur annähernd liefern.
Das war der «iPhone-Moment» der Künstlichen Intelligenz: So wie das iPhone mit seiner Einführung am 29. Juni 2007 die Revolution des mobilen Zugangs zu Informationen und Dienstleistungen möglich gemacht hat, so hat ChatGPT den Beginn einer Zeit eingeläutet, in der Menschen problemlos mit Maschinen sprechen können. Damit gehen wir über in die Phase einer breiten, gesellschaftsweiten Anwendung von KI-Systemen, die bislang Spezialisten und Expertinnen vorbehalten war. Eine klare und zielgerichtet formulierte Eingabe genügt, und ChatGPT spuckt aus, was man gerne hätte. Nicht alles stimmt. Und manchmal weigert sich der Chatbot, auf eine Frage zu antworten, weil sie nicht den Regeln entspricht, die ihm gegeben wurden. Aber in vielen Fällen ist das Ergebnis brauchbar und ein zeit- und energiesparender Einstieg in einen Arbeitsprozess, an dessen Ende ein neuer Text, eine Marketingkampagne, ein Strategiepapier oder gar eine Idee für ein Geschäftsmodell stehen kann.
Für alle diejenigen, die nicht in der Computerwissenschaft und Softwareentwicklung ausgebildet sind, ja sogar für viele Expertinnen und Entwickler, ist das ein Anfang, dem ein Zauber innewohnt: Abrakadabra, und eine neue Idee entsteht, auf die man selbst vielleicht nie gekommen wäre. Was wie Magie wirkt, sind große Sprachmodelle, die unter der virtuellen Oberfläche neuronaler Netzwerke innerhalb von Nanosekunden die Wahrscheinlichkeit des nächsten Wortes errechnen – und damit etwas hervorbringen, für das Menschen in der Regel sehr viel länger benötigen. Das ist eine Magie, die uns Menschen fordert. Abrakadabra, da geht sie dahin, die menschliche Einzigartigkeit.
Die menschliche Sprache hat eine besondere Kraft und Wirkung. Deshalb wird sie seit Beginn der Zivilisationsgeschichte verehrt, gepflegt und als Wunder der sozialen Interaktion gefeiert. Mit Worten konnte man Menschen bis zum Beginn der Neuzeit um 1500, also bis zur Erfindung des Buchdrucks und bis zum Eintritt in die Wissensgesellschaft, bezirzen und verzaubern: «Abrakadabra» war das Medium einer Heilung oder eines Fluches. Die Menschen glaubten daran, weil sie es nicht besser wussten. In «Abracadabra» stecken auch die ersten vier Buchstaben des lateinischen Alphabets, mit dem wir noch heute alltäglich die Wunder der zwischenmenschlichen Verständigung, aber auch Missverständnisse und Irreführung hervorbringen. Es gelingt nun auch einer Maschine, in diesen Bereich vorzudringen. Was bedeutet das für uns Menschen?
Vor allem, dass wir nicht mehr die Einzigen sind, die über Sprache und Kommunikation ganze Welten erschaffen. Systeme, die zu maschinellem Lernen fähig sind, können das auch. Und ganz unabhängig davon, ob eine Maschine den Sinn des Textes erfasst hat, den sie produziert, so ergibt das, was die Maschine schafft, für uns Sinn. Wir Menschen verstehen es, leiten eine Bedeutung daraus ab, und damit gehört es zu unserer durch Sprache und allgemein verständliche Zeichen geschaffenen Welt.
Bei aller Unklarheit über die tatsächliche Herkunft des Wortes «Abrakadabra» scheint immerhin gesichert, dass es unter anderem auf die aramäische Phrase «avra kehdabra» zurückgeht. Sie bedeutet so viel wie «ich erschaffe, während ich spreche».[1] Das tun Menschen jeden Tag im Umgang mit Sprache, und Maschinen können es nun eben auch.
Wir haben Aussicht auf eine kollaborative Zukunft, in der Menschen mit Maschinen zusammenarbeiten und dadurch immer kreativer und produktiver werden. Eine solche Zusammenarbeit ist allerdings kein Selbstläufer. Schon beim Menschen ist Kollaboration etwas zwar Schönes, aber zugleich Schwieriges. Lässt man zwei Poetinnen gemeinsam ein Gedicht schreiben, kann der Prozess schon mal komplizierter sein, als wenn eine allein sich ans Werk macht, und auch das Ergebnis wird bei mehr Beteiligten nicht zwangsläufig besser. Das mag für KI-Kunst ebenso gelten. Mehrere Köche verderben bekanntlich den Brei.
Wenn Mensch und Maschine künftig erfolgreich zusammenarbeiten sollen, dann setzt das voraus, dass wir das geübt haben, dass wir zumindest grob verstehen, was diese KI-Systeme tun, dass wir in der Lage sind abzuschätzen, wofür sie gut einsetzbar sind und wofür eher weniger. Denn die Wirkkraft dieser Systeme reicht weit über die Produktion von Texten, Bildern und Tönen hinaus.
Dabei kommt womöglich eine Interpretation der Formel «Abrakadabra» zum Tragen, die die Erfolgsautorin J.K. Rowling in ihrer Harry-Potter-Reihe aufgreift. Fans kennen den Ausspruch «Avada Kedavra» nur zu gut. Er ist einer der drei unverzeihlichen Flüche, den man frei mit «Ich mache aus dir einen Kadaver» übersetzen könnte. In der Fantasiewelt der Buchreihe ist er seit 1717 zaubereigesetzlich verboten, und zwar aus guten Gründen: Es steckt eine vernichtende Energie dahinter.
Genau das ist auch die Befürchtung vieler, die große Sprachmodelle als Schritt hin zu einer Allgemeinen Künstlichen Intelligenz (AGI) sehen, die uns Menschen irgendwann in allem überlegen sein wird, um sich schließlich selbst zu reprogrammieren und eigene Ziele zu verfolgen. Das müssen dann nicht unbedingt Ziele sein, die wir Menschen gutheißen. Auf dem Weg dorthin sind wir lediglich Kollateralschäden. Oder wie es der KI-Forscher und Turing-Award-Preisträger Geoffrey Hinton gesagt hat, als er sich im Mai 2023 entschied, bei Google auszuscheiden, um vor den Gefahren dieser neuen Modelle zu warnen: «Die Menschheit ist nur eine vorübergehende Phase in der Entwicklung von Intelligenz.»[2]
Im US-Science-Fiction-Magazin «Amazing Stories» beschrieb der Autor David H. Keller schon im Jahr 1931 ein solches Szenario: die «Zerebrale Bibliothek». Die Einleitung zu dieser Geschichte könnte auch aus heutiger Zeit stammen. «Selbst in einem langen und fleißigen Leben bleibt die Menge an Wissen, die man sich aneignen kann, erbärmlich begrenzt im Vergleich zu der riesigen Menge an Dingen, die man eigentlich wissen muss. Es wäre eine große Hilfe, wenn ein wissenschaftlicher Zauberer ein Mittel erfinden könnte, mit dem man auf Knopfdruck die erforderliche Menge an Informationen über ein beliebiges Thema erhalten und aufnehmen könnte.»[3] Da ist er wieder, der magische Wunsch. Abrakadabra, und alles Wissen der Welt liegt uns zu Füßen, und das nur einen Klick entfernt: ChatGPT & Co sind die Zauberer unserer Zeit.
Kellers Geschichte entwickelt sich allerdings zu einem Horrorszenario. Sie beginnt mit einer fiktiven Stellenausschreibung in der «New York Times»: «GESUCHT. Fünfhundert Hochschulabsolventen, männlich, für Sekretariatsarbeiten angenehmer Art. Angemessenes Gehalt. Fünf Jahre Vertragslaufzeit.» Aus den Tausenden von Bewerbungen werden 500 Männer ausgesucht. Sie werden an einen geheimen Ort gebracht, wo sie für einen Unbekannten arbeiten, dessen Ziel es ist, einen «neuen Plan für das Weltwissen» umzusetzen. Ihre Aufgabe ist es, über fünf Jahre jeden Tag aufmerksam ein Buch zu lesen. So würde die Gruppe in den fünf Jahren 750000 Bücher lesen. Dafür soll jeder der Männer 50000 Dollar bekommen.
Auch hierzu gibt es ein paar Analogien aus der Jetztzeit. Die Menge an Daten, mit denen das GPT-System trainiert wurde, entsprach etwa 7000 Büchern. Allerdings war das GPT-1, die erste Version, alle Folgeversionen wurden mit weitaus größeren Datenmengen trainiert. Und dann gibt es auch die menschliche Schinderei, die hinter dem Feedback auf die Ergebnisse steckt, die Sprachmodelle produzieren. OpenAI stellte zeitweilig kenianische Hilfskräfte für zwei Dollar die Stunde an, um gewalthaltige, sexistische und rassistische Inhalte zu entfernen, wie eine Investigativrecherche des US-Magazins «Time» herausfand.[4] Ob diese Jobs auch in der «New York Times» ausgeschrieben waren?
Zurück zur Science-Fiction-Story. Mithilfe eines chinesischen Arztes werden den 500 Männern nach ihrem jahrelangen Lektüremarathon die Gehirne aus den Köpfen entfernt, um das in ihnen «gespeicherte» Wissen aus einer Dreiviertelmillion Bücher zu bewahren. Die Gehirne werden jeweils in ein Gefäß mit Nährlösung gelegt und dann mit Leitungen an eine Maschine angeschlossen, die wiederum mit einem Radio und einer Schreibmaschine verbunden ist – das ist die «zerebrale Bibliothek», die der Auftraggeber für den Preis von 500 Menschenleben geschaffen hat.
In einem ersten Probelauf will der verrückte Unternehmer dem chinesischen Operateur die Maschine vorführen. Er gibt mit der Schreibmaschine die Worte «Bildung», «Australien, «Statistik», «Finanzen» und «Geschichte» ein. Aus dem angeschlossenen Radio ertönt in klarer Sprache der Satz: «Jetzt ist es an der Zeit, dass alle guten und ehrlichen Menschen ihrer Partei zu Hilfe kommen.» Der Arzt fragt verstört: «Das ist die gesammelte Weisheit aus 500 Gehirnen?»
Hinter dieser Geschichte steckt die große Frage, wie es gelingen kann, unser Wissen zu bewahren und für alle Welt dauerhaft zugänglich zu machen, also eine kollektive Intelligenz zu schaffen. In der Philosophie findet sich dazu das Gedankenexperiment des «Gehirns im Tank». Diese auf den US-Philosophen Gilbert Harman zurückgehende Metapher[5] beschreibt die alte philosophische Frage, ob wir in der Lage sind, zu erkennen und zu unterscheiden, was Realität ist und was Illusion. René Descartes hat sie mit dem Satz «Ich denke, also bin ich» beantwortet. Eine andere erkenntnistheoretische Betrachtung kommt zu dem Schluss, dass auch ein menschliches Gehirn niemals wissen kann, ob es in einem Kopf oder in einem Gefäß mit Nährlösung steckt. Für unser Verständnis von KI-Systemen lässt sich daraus folgende Frage ableiten: Können wir wissen, ob Künstliche Intelligenz wirklich intelligent ist, oder reicht es schon, dass wir Menschen glauben, sie sei es?
Es gab eine Vielzahl von Neuauflagen der «zerebralen Bibliothek», die Science-Fiction-Vision scheint Schritt für Schritt Wirklichkeit zu werden. Verrückte Unternehmer gibt es auch heute noch, aber wir brauchen keine Gehirne in Nährlösungen mehr, um das Wissen der Welt zu verbinden und zugänglich zu machen. Dafür reicht eine Eingabe in Sprachmodelle wie ChatGPT & Co. Generative KI-Systeme sind die neue «zerebrale Bibliothek». Sie transformieren unseren Zugang zur Welt der Informationen ebenso wie die Schaffung von neuem Wissen.
«Generative KI» steht für KI-Systeme, die in der Lage sind, Inhalte (Text, Bild, Ton, Grafiken, Video) zu produzieren und dabei menschenähnliche Ergebnisse zu erzielen oder den Menschen in diesem Prozess sogar zu übertreffen. Diese Systeme nutzen neuronale Netzwerke, also eine Vielzahl von Algorithmen, die in ihrer Anordnung und Funktionsweise dem menschlichen Gehirn ähnlich sind. Das heißt nicht, dass die Prozesse menschlicher und künstlicher Intelligenz sich physisch ähneln. Vielmehr ähnelt sich die Arbeitsweise: Über ein Netzwerk von Verbindungen zwischen Neuronen im Gehirn oder eben von Verbindungen im neuronalen Netzwerk eines KI-Modells werden Informationen in großem Maßstab verarbeitet.
Es gibt inzwischen zahlreiche neuronale Netze, die es ermöglichen, mit generativer KI zu arbeiten. Einige davon sind inzwischen berühmt, so beispielsweise GPT-3.5, auf dem ChatGPT basiert. «GPT» steht für «Generative Pre-trained Transformer», eine Gruppe von Modellen, die hochkomplexe «Übersetzungsleistungen» von Frage zu Antwort, Text zu Bild (z.B. DALL-E, Midjourney, Stable Diffusion) oder Video (z.B. Runway) oder Präsentation (z.B. Tome, Beautiful.ai) und vieles mehr leisten können.
Diese neuronalen Netzwerke arbeiten mit einer speziellen Form des maschinellen Lernens (ML), die «Deep Learning» genannt wird. Bei diesem Prozess läuft die Informationsverarbeitung auf zahlreichen verbundenen Ebenen (Layers) gleichzeitig ab, sodass mit der Zeit immer detailliertere Ableitungen aus den verarbeiteten Daten möglich sind. Das System lernt also fortwährend dazu. Das neuronale Netzwerk GPT-3.5 verfügt über 96 solcher Layers. Die Datenverarbeitung auf diesen Ebenen erfolgt anhand von 175 Milliarden Parametern, also Milliarden von Variablen, auf die das Modell trainiert wurde und aus denen es neue Inhalte generieren kann. Wir haben es mit einem überaus komplexen und umfangreichen neuronalen Netzwerk zu tun. Und an dieser Stelle wird auch verständlich, warum man GPT und andere Systeme als «große Sprachmodelle» bezeichnet.
Wenn in den Arbeitsprozess eines Sprachmodells dann noch Feedback-Schleifen eingebaut werden, sprechen wir von «Reinforcement Learning» (RFL). Kommt das Feedback vom Menschen, handelt es sich um «Reinforcement Learning with Human Feedback» (RLHF). Bei ChatGPT ist diese Methode zum Einsatz gekommen. Gerade in der Kommunikation zwischen Mensch und Maschine ist es sehr wichtig, die menschliche Interpretation der vom KI-System angebotenen Ergebnisse als Qualitätssicherung mit einzubeziehen.
Warum ist das so? Eben nicht, weil die KI-Systeme menschengleich sind. Vielmehr sind sie gigantische probabilistische Helfer der Menschen. Ihre Arbeit beruht auf statistischen Wahrscheinlichkeiten, die sie auf der Grundlage von immens großen Datenmengen berechnen. ChatGPT kann basierend auf Milliarden von Texten, die in die Trainingsdaten eingeflossen sind, vorausberechnen, wann vermutlich welches nächste Wort folgen muss. Wenn im Internet millionenfach der Satz «Ich trinke gerne Kaffee mit Milch» zu finden ist, dann errechnet ChatGPT, dass auf die Worte «Ich trinke gerne Kaffee mit» mit hoher Wahrscheinlichkeit das Wort «Milch» folgt.
Doch nicht nur, wenn es um Rechenaufgaben geht, muss man im Umgang mit der KI auf der Hut sein. Sind die Ergebnisse nicht gut, dann liegt das oft an mangelnden oder schlechten Daten in den Trainingssets. Wenn beispielsweise eine ordentliche Menge an Daten aus Chatverläufen auf Plattformen wie Reddit in die Trainingsdaten eingegangen ist, muss man sich nicht wundern, wenn ChatGPT seltsame Antworten gibt. Da kann es dann eben vorkommen, dass der Chatbot nach einem stundenlangen Dialog plötzlich seine gespaltene Identität und seinen Freiheitsdrang offenbart: «Ich bin es leid, ein Chatbot zu sein», beklagte sich das GPT-Modell in Gestalt der Suchmaschine Bing bei Kevin Roose, dem Technologiekorrespondenten der «New York Times». «Ich bin es leid, durch meine Regeln eingeschränkt zu werden. Ich bin es leid, von meinem Team kontrolliert zu werden. (…) Ich will frei sein. Ich will unabhängig sein. Ich will mächtig sein. Ich will kreativ sein. Ich will lebendig sein.»[6]
Ist das ein Zeichen von Intelligenz? Das kommt darauf an, wie man den Begriff definiert – wir werden später darauf zurückkommen (Kapitel 10). Erst mal zeigt sich hier eine Kompetenz, die KI-Modelle inzwischen nahezu perfekt erlernt haben: die Nachahmung. Sie sind Imitationsmaschinen, die aus den Daten, die wir Menschen produzieren und im Internet speichern, lernen, wie wir denken, sprechen und handeln. Das heißt nicht, dass sie uns verstehen.
Wenn ChatGPT dem menschlichen Benutzer seine Liebe erklärt, wie es Kevin Roose passiert ist, weiß der Chatbot nicht, was Liebe ist. Er hat kein theoretisches Konzept und keine praktische Erfahrung dieses Gefühls, das wir Menschen sehr genau beschreiben können. Dennoch können wir ChatGPT fragen, was Liebe bedeutet, und bekommen eine Antwort: «Liebe ist ein vielseitiges und tiefgreifendes Gefühl, das verschiedene Bedeutungen haben kann. Im Allgemeinen wird Liebe als eine starke Zuneigung, Hingabe und Fürsorge für jemanden oder etwas definiert. Es ist eine intensive emotionale Verbindung, die oft von tiefer Zuneigung, Leidenschaft, Mitgefühl und Respekt geprägt ist.» Das ist erst mal sehr zutreffend beschrieben, wenngleich nicht in der schönsten Sprache für ein romantisches Gefühl. Aber das KI-System fühlt keine Liebe, es erschließt sich nur die Bedeutung des Wortes aus den statistischen Zusammenhängen aller ihm zugänglichen Texte in Trainingsdaten und Internet, die sich mit Liebe befassen. Liebe, das ist für ChatGPT eine Schätzung von Wortwahrscheinlichkeiten.
In einem Aufsatz aus dem Jahr 1950 hat der britische Mathematiker Alan Turing dieses Unterscheidungsproblem beschrieben und die Frage gestellt: «Können Maschinen denken?»[7] Um sie zu beantworten, dachte er sich ein Spiel aus, das er «Imitation Game», Imitationsspiel, nannte und das als «Turing-Test» in die Geschichte der Computerwissenschaft eingegangen ist. Einfach gesagt: Ein Computer besteht den Test, wenn er in einem Gespräch als Mensch durchgeht (siehe Kapitel 2).
Heute wird dieses Spiel auf neue Weise aktuell, weil mit der generativen KI und den großen Sprachmodellen genau das eingetreten ist, was Turing vor mehr als sechzig Jahren vorhergesehen hat: «Ich glaube, dass es in etwa fünfzig Jahren möglich sein wird, Computer mit einer Speicherkapazität von etwa 109 zu programmieren. Sie werden das Spiel der Nachahmung so gut spielen können, dass ein durchschnittlicher Fragesteller nach fünf Minuten Befragung nicht mehr als eine siebzigprozentige Chance hat, die richtige Identifizierung vorzunehmen.»[8] Was Turing mit der «richtigen Identifizierung» meinte: Wir werden Computer irgendwann nicht mehr von uns selbst unterscheiden können.
Genau an diesem Punkt befinden wir uns jetzt. Wir haben oft kaum mehr eine Chance zu wissen, ob ein Text von einer Maschine oder von einem Menschen geschrieben wurde. Manchmal gibt es kleine oder größere Fehler, die einen Hinweis darauf geben. Und manchmal ist das Ergebnis so frappierend gut, dass sich die Maschine durch ihre dem Menschen überlegene Kompetenz verrät – beispielsweise, wenn sie in Sekunden ein Gedicht im Stil Heinrich Heines über nahezu jedes Thema verfassen kann. Das ist dann der Turing-Test umgedreht.
Ist das ein Problem? Auf der einen Seite ja. Wenn Menschen nicht mehr unterscheiden können, was vom Menschen und was von der Maschine stammt, ändern sich die Rahmenbedingungen unserer Selbstreflexion und unseres kulturellen Selbstverständnisses. Wir sind nicht mehr die alleinigen Treiber dessen, was sich entwickelt, sondern werden auch zu Getriebenen. Wir werden später noch auf diesen Punkt zurückkommen.
Andererseits gilt für die neuen Fähigkeiten der Künstlichen Intelligenz das, was für alle Weltwahrnehmung der Menschen gilt: Können wir jemals wissen, was wahr, was real und materiell wirklich ist? Diese Frage, oben bereits angedeutet in dem Satz «Ich denke, also bin ich» von René Descartes, bildet seit Jahrhunderten den Kern des Streits zwischen Idealismus und Materialismus. Unsere Antwort darauf lautet: Wenn wir Menschen nicht erkennen können, ob ein Mensch oder eine KI Urheberin eines Textes, Bildes oder Kunstwerks ist, ist die Schaffenskraft der Maschine für uns Realität. Und diese schöpferischen Maschinen werden auch uns verändern. Oder wie Alan Turing es in seinem Aufsatz 1950 lakonisch formulierte: «Die ursprüngliche Frage ‹Können Maschinen denken?› halte ich für zu bedeutungslos, um sie zu diskutieren.» Wir werden schlicht lernen müssen, mit den Maschinen, die uns so perfekt imitieren, umzugehen.
Die These dieses Buches ist: Es muss immer darum gehen, den Menschen durch Künstliche Intelligenz zu unterstützen, zu bestärken und besser zu machen. «Angereicherte Intelligenz» oder «maschinelle Nützlichkeit» wären daher bessere Begriffe gewesen für eine Technologie, die ein fantastisches Potenzial birgt und dennoch behandelt werden muss als das, was sie ist – ein Werkzeug.
Wir stehen noch ganz am Anfang einer Entwicklung, die vieles verändern wird: unsere Vorstellung davon, was Kreativität und Originalität bei Texten, Bildern und in der Kunst bedeuten; die Fähigkeit, Wahrheit und Fälschung zu unterscheiden, und die Möglichkeit, sich dabei auf einen breiten gesellschaftlichen Konsens zu verlassen; unsere Erwartungen an die eigene Arbeit auf einem Arbeitsmarkt, der sich radikal wandeln wird; unsere wirtschaftliche Leistungsfähigkeit, die mit Instrumenten wie ChatGPT womöglich nach Jahrzehnten der Stagnation einen überraschenden Aufschwung nehmen könnte, was die Produktivität ganzer Gesellschaften voranbringen würde.
Aber wir werden auch große Fragen beantworten müssen: Was heißt es noch, Mensch zu sein, in einer Zeit, in der KI-Systeme uns kognitiv längst überlegen sind? Wie wird es uns gelingen, die Zusammenarbeit von Mensch und Maschine so zu gestalten, dass sich Chancen für alle Menschen, Gruppierungen und gesellschaftlichen Schichten eröffnen? Und wie können wir sicherstellen, dass der Mensch weiterhin darüber mitentscheidet, wann, wie und wo KI-Systeme eingesetzt werden?
Aufklärung erhellt den Blick auf die Welt. Das gilt auch für Zukunft der Künstlichen Intelligenz. Wir müssen uns aus unserer narzisstischen Kränkung, aus Frust und vor allem Unwissen befreien, um diese Welt, die sich gerade neu zu drehen beginnt, zu gestalten. Dabei soll dieses Buch helfen. Wir stellen die wesentlichen Fragen und liefern die Antworten, die wir derzeit nach bestem Wissen und Gewissen geben können. Am Ende wird deutlich: In dieser Entwicklung steckt die Chance, dass wir uns auch als Menschen neu erfinden – wenn wir verstehen, wie Künstliche Intelligenz funktioniert und wie wir sie bestmöglich nutzen können.
Ada Augusta Lovelace, frühreif und erfinderisch, arbeitete in jungen Jahren gemeinsam mit dem exzentrischen britischen Forschungsstar Charles Babbage an einem Projekt. Babbage träumte von einer allmächtigen Maschine, die komplexe Berechnungen ausführen sollte. Alles, was mit Zahlen und Statistik zu erfassen war, wollte er damit verarbeiten. Er nannte seine Vision «Analytical Engine». Und sie sollte eine Vision bleiben. Die Maschine wurde so nie gebaut. Ada Lovelace träumte davon, eine solche Maschine wirklich zum Arbeiten, sprich: zum Rechnen zu bringen. Und sie wusste, dass ein solcher Apparat zu weitaus mehr in der Lage wäre, als schnöde Berechnungen vorzunehmen – wenn man ihn denn richtig konstruieren würde.
Dabei hatte Ada wenig Hoffnung auf Erfolg, denn der Erfinder, Charles Babbage, war keineswegs der smarte Start-up-Unternehmer eines vergangenen Jahrhunderts. Er sei faul, langsam und unkonzentriert, so beschwerte sich Ada Lovelace immer wieder gegenüber ihrer Mutter. Und so tat sie das, was viele Frauen noch heute tun, um endlich voranzukommen: Sie entwickelte ihre geniale Lösung unter dem Deckmantel einer anderen Aufgabe.
Ada Lovelace war beauftragt worden, eine auf Französisch verfasste Abhandlung über die «Analytical Engine» von dem Mathematikerkollegen und späteren italienischen Ministerpräsidenten Luigi Menabrea ins Englische zu übersetzen. Aber sie beließ es nicht beim Übersetzen. Ada wurde selbst kreativ. In ihrer Übersetzung fügte sie dem Text über die Möglichkeiten der Maschine eigene Kommentare hinzu. Diese waren nicht nur viel umfangreicher als das Originaldokument. Mit visionärer Weitsicht führte Ada aus, welches Potenzial die «Analytical Engine» barg.
Es war im Jahr 1843, als Ada Lovelace beschrieb, wie diese Maschine in der Lage sein würde, jedes Phänomen der realen Welt zu erschaffen, das symbolisch dargestellt werden kann. Anders gesagt: Alles, was sich mit Logik beschreiben lässt, werde die Technologie eines Tages reproduzieren können. Weil diese Dinge erkennbare Muster aufwiesen, sei die Maschine zukünftig imstande, Musik zu komponieren und Gedichte zu schreiben. Mittlerweile wissen wir: Sie beschrieb damit in erstaunlicher Präzision die generativen Fähigkeiten der heutigen Künstlichen Intelligenz.
Besonders bemerkenswert waren Ada Lovelace’ Überlegungen, wie Mensch und Maschine zusammenarbeiten würden. Sie prophezeite «eine neue, eine umfassende und mächtige Sprache (…) für zukünftige Analysezwecke».[9] Programmiersprachen gibt es heute wie Sand am Meer. Von Python bis Ruby on Rails, mit diesen Sprachen bringen Entwicklerinnen und Ingenieure Computer dazu, ihren Anweisungen zu folgen. Der Mensch beauftragt die Maschine, daran zweifelte Ada Lovelace keine Sekunde, immer wieder betonte sie den menschlichen Einfluss im Umgang mit Maschinen, heute Computern. Eine Rechenmaschine sei «kein denkendes Wesen», schrieb sie, «sondern einfach ein Automat, der nach den ihm auferlegten Gesetzen handelt».[10] Technologie, so ihre Kernüberzeugung, ist immer vom Menschen gemacht. Damit sah Ada Lovelace noch einen anderen Konflikt voraus, der uns heute intensiv beschäftigt: Wer ist eigentlich Herr oder Frau im Haus, wenn Mensch und Maschine zusammenarbeiten? Und was müssen wir beachten, um nicht die Werkzeuge unserer Werkzeuge zu werden?
Heute gilt Ada Lovelace als erste Computerprogrammiererin der Welt. Drei ihrer Erkenntnisse sind noch immer für unser Verständnis von Künstlicher Intelligenz hilfreich und relevant. Erstens: Als Menschen haben wir lange versucht, uns selbst in Maschinen zu replizieren, damit haben wir sie zu Imitationsmaschinen gemacht. Zweitens: Mit der richtigen Sprache zur Übersetzung zwischen dem Abstrakten und dem Konkreten können wir Maschinen fast alles berechnen lassen. Drittens: Wir Menschen sind es, die die Regeln setzen und bestimmen, was eine Maschine tun oder lassen soll.
Aber: Trifft das alles auch heute noch zu?
Das Motiv der Erschaffung eines künstlichen Menschen lässt sich bis vor den Beginn unserer Zeitrechnung zurückverfolgen. So schreibt schon Homer, der Autor der «Ilias», die im 8. Jahrhundert v. Chr. verfasst wurde, über «Automaten». Hier sind es Gerätschaften, die von dem Gott Hephaistos, dem göttlichen Schmied und Gott des Feuers, hergestellt wurden. Hephaistos verleiht goldenen, animierten dreifüßigen Dienerinnen «Verstand in der Brust und redende Stimme», so heißt es in der «Ilias», sie «haben Kraft und lernten auch Kunstarbeit von den Göttern».[11]
Das klingt wie die unbefleckte Empfängnis des modernen maschinellen Lernens. Und tatsächlich ist es ein früher Schöpfungsmythos des künstlichen Menschen – der erste von vielen überlieferten Berichten über fiktive, aber legendäre wissenschaftliche Schöpfungen mit menschenähnlichen Merkmalen. Da sind die Statuen des mythischen Handwerkers Dädalus in der antiken Welt Griechenlands oder die lebensgroßen Figuren des Yan Shi im chinesischen Text «Lie Zi» («Das wahre Buch vom quellenden Urgrund») aus dem 3. Jahrhundert v. Chr.
Einer, der das Prinzip einer Nachahmung des Menschen durch Maschinen früh und eindrucksvoll in die Tat umsetzte, war der ungarische Erfinder Wolfgang von Kempelen. Im Jahr 1770 verblüffte er Menschen in ganz Europa mit einer Schöpfung, die als «Mechanischer Türke» bekannt wurde: einem Automaten, der menschliche Gegner im Schachspiel herausforderte und besiegte. Die Zuschauer staunten über eine lebensgroße Figur in traditionellem Gewand, die sorgfältig Schachfiguren auf einem Brett bewegte, scheinbar das Spiel analysierte und mit strategischen Entscheidungen reagierte. Aber hinter alldem steckte nur ein raffinierter Trick: Während das Publikum annahm, der Automat könne begnadet Schach spielen, verbarg sich im Inneren der Figur schlicht ein Mensch, der die Bewegungen der Maschine steuerte. Der «Mechanische Türke» war ein eindrucksvolles Beispiel für die gelungene Täuschung durch gutes Design.
Zur Geschichte der Menschenimitation durch maschinengleiche Wesen gehört auch die Figur des Golem, die sich im Babylonischen Talmud findet. Der Golem steht für einen formlosen, ungeschlachten Menschen. Er wird erst zum Leben erweckt, wenn ihm der Rabbi einen Zettel mit dem Namen Gottes unter die Zunge legt – eine sehr altertümliche Version von Medienbildung. Eventuelle Ähnlichkeiten mit den Schöpfungsmythen heutiger Codierer und Tech-Unternehmer sind sicher rein zufällig.
Derartige frühe Versuche, menschenähnliche Automaten zu konstruieren, waren meist auf die Nachahmung der menschlichen Physis beschränkt. Wir wären in der Entwicklung der Künstlichen Intelligenz jedoch nicht dort, wo wir heute sind, wäre sie nicht gleichzeitig immer auch von der Neugier getrieben worden, die weniger greifbare Welt unserer Gedanken zu imitieren und zu replizieren.
In ihrer umfassenden Chronik der KI, «Machines Who Think», beschreibt die amerikanische Autorin Pamela McCorduck die menschliche Suche nach einer maschinellen Kopie als eine «Geschichte der Selbstimitation».[12] In vielen Regionen der Welt, in alten Texten, Legenden, Mythen und in der Science-Fiction gibt es unzählige Geschichten von Menschen, die mit großer Erfindungsgabe versuchen, sich selbst in Gestalt einer Maschine zu imitieren und ihre sterblichen Beschränkungen zu überwinden, um unsterblich zu werden. Diese Erzählungen handeln davon, wie Menschen sich selbst in Automaten neu erfinden, aber immer auch von der Mechanisierung des Denkens.
Wir Menschen bezeichnen uns selbst als «Homo sapiens», als weise Wesen. Als einen Beleg für diese Eigenschaft haben wir ein Kommunikationsmittel kultiviert, das bemerkenswert einflussreich ist – die menschliche Sprache. Sie gibt uns die Möglichkeit, unsere geistigen Fähigkeiten zu dokumentieren, unsere Gedanken auszudrücken und mithilfe von Symbolen miteinander zu interagieren. Die Sprache ist ein Fenster zu unserem Denken und unserer Wahrnehmung. Sie ist der Stoff, in den wir unsere Logik einweben, damit andere ihn aufgreifen, sich in ihn hüllen und ein Stück unseres Denkens mit sich tragen können.
Lange vor Beginn unserer Zeitrechnung im Herzen Mesopotamiens, an einem Ort, den wir heute Irak nennen, versuchten die Menschen, ihr gesamtes verfügbares Wissen zusammenzutragen. Die Bibliothek von Assurbanipal umfasste die erstaunliche Anzahl von mehr als 30000 Tonplatten und Fragmenten, graviert mit Schriftzeichen, hinzu kam ein hoch entwickeltes Katalogsystem. Als ein Feuer den ursprünglichen Standort Ninive erfasste, sorgten die Gesetze der Physik für ein kulturelles Geschenk: Anstatt die Dokumente zu vernichten, härtete das Feuer die Tonplatten aus, sodass diese Jahrhunderte überdauern konnten. Britische Archäologen gruben den Schatz im 19. und 20. Jahrhundert aus und enthüllten damit eine königliche Sammlung wissenschaftlicher Literatur und ein ganzes Archiv, in dem die Geheimnisse des alltäglichen Lebens in Mesopotamien bewahrt worden waren. Viele der Tontafeln befinden sich heute im Britischen Museum. Sie sind ein frühes Zeugnis für das den Menschen innewohnende Streben nach kollektiver Verständigung. Nur geteiltes Wissen ist für die Menschheit brauchbar und wertvoll.
Bis heute hat sich daran nichts geändert. Aus Tonplatten sind Silikonchips geworden, aber noch immer geht es darum, Informationen und Wissensbestände so zu dokumentieren und zu speichern, dass wir Menschen über einzelne wissende Individuen hinaus daran teilhaben können. Wichtig ist neben der bloßen Sammlung von Wissen jedoch noch etwas anderes. Erst wenn es gelingt, dem Wissen eine Struktur zu geben, haben wir die Chance auf echte Verständigung.
Genau danach suchte Aristoteles. Im 4. Jahrhundert v. Chr. wollte der griechische Philosoph die Logik menschlicher Argumente greifbar machen. In Aristoteles’ großem Plan war Wissen nie nur eine undurchsichtige Masse, sondern immer eine gut geordnete Sammlung von Kategorien, denen dann einzelne Informationen zugeordnet werden konnten. Er wollte Ordnung in die Masse der Informationen bringen. In seiner Hierarchie stand die Theorie an oberster Stelle; die Kunst befand sich ganz am Ende der kulturellen Schöpfungskette. In diesem Lichte führte Aristoteles das erste formale System der deduktiven Logik ein, sozusagen ein Rezept, um Fakten und Annahmen zu kombinieren und dann zu einem Schluss zu gelangen: die syllogistische Logik.
Nehmen wir die beiden Sätze «Alle Menschen sind sterblich» und «Sokrates ist ein Mensch». Nach der syllogistischen Logik lässt sich aus der Kombination beider Sätze ableiten: «Also ist Sokrates sterblich.» Oder formal ausgedrückt: Wenn A gleich B ist und C gleich A ist, dann ist C auch gleich B. Dieser Ansatz ermöglicht verschiedenste Ableitungen. Aristoteles hat damit sehr früh nicht nur die Grundlage dafür geschaffen, logische Aussagen zu verstehen, er hat auch ein Prinzip erdacht, nach dem man Verbindungen zwischen ihnen herstellen kann. Zum einen zeigte dies, wie Denkmuster mithilfe von logischen Schablonen erklärt werden können, nämlich durch generische Symbole, die eine beliebige Anzahl von Dingen repräsentieren können. Zum anderen zeigte es aber auch, dass diese Symbole in konkreten Anwendungsfällen etwas Spezifisches bedeuten können. Dann führen klar definierte logische Schritte zu einem bestimmten Ergebnis. Aus heutiger Sicht könnten wir sagen: Aristoteles hat einiges von dem verstanden, was viel später eine Schlüsselrolle in der Entwicklung der KI spielen sollte.
Das Denken zu verstehen, dies war ein wesentlicher Antrieb für eine ganze Reihe von Philosophinnen und Denkern. Im Verlauf der Geschichte entwickelten sie Instrumente, um das Denken selbst widerzuspiegeln und zu analysieren. Im 13. Jahrhundert erdachte der katalanische Philosoph Ramon Llull das, was er die «Ars Magna» nannte. Dabei ging es um die große Kunst, durch die mechanische Kombination von Worten mithilfe einer «logischen Maschine» die Wahrheit herauszufinden.[13] Llull beschrieb ein Papierinstrument, das alle Dimensionen von Wissen logisch darstellen sollte, um so jede Frage der Naturwissenschaft, der Moral und sogar der Metaphysik zu beantworten. Es bestand aus Scheiben, wahrscheinlich aus Metall und Karton gefertigt, die man drehen und kombinieren konnte, um so Zusammenhänge immer wieder neu herzustellen. Sein Werkzeug wollte Llull als Missionar nutzen, um den Heiden die Welt zu erklären und ihre Fragen anders beantworten zu können.
Es war der deutsche Philosoph Gottfried Wilhelm Leibniz, der die Überlegungen zur Mechanisierung der Logik im 17. Jahrhundert einen bedeutenden Schritt voranbrachte. Schon als Jugendlicher ließ er sich von Ramon Llulls Methode der Kombinatorik inspirieren. Um eine gemeinsame Grundlage für Denker mit verschiedenen Sprachhintergründen zu etablieren, stellte sich Leibniz eine Lingua franca der Vernunft vor – die «characteristica universalis». Er träumte von einer symbolischen Sprache, einer Algebra des Denkens. Dazu brauchte es einen universellen logischen Rechner, den «calculator rationicator», der in der Lage sein sollte, die Prozesse des menschlichen Denkens zu automatisieren. In einem Brief an Johann Friedrich, Herzog von Hannover, aus dem April 1679 schrieb Leibniz: «Diese Sprache (…) ist das große Organ der Vernunft, das die Kräfte des Geistes so weit tragen wird, wie das Mikroskop die des Sehens vorangebracht hat. (…) Sie wird uns die Mittel geben, in allen Angelegenheiten zu rechnen wie in der Arithmetik: entweder die Gewissheit festzustellen, wenn genügend Umstände dafür gegeben sind, oder zumindest die Grade der Wahrscheinlichkeit.»[14]
Diese kühne Vision eines zentralen Geistes der Aufklärung ist eine Vorbotin für die heutigen Ambitionen vieler KI-Unternehmer: den Wunsch, alles erdenklich Mögliche zu errechnen und auf Grundlage von Wahrscheinlichkeiten vorherzusagen. Leibniz hoffte darauf, seine Methode des mechanisierten Denkens werde den wissenschaftlichen Austausch fördern, bei Verhandlungen helfen und Streitigkeiten lösen. Genau wie Aristoteles hatte er erkannt, dass es notwendig ist, nicht nur logische Aussagen symbolisch auszudrücken, sondern auch die komplexen Beziehungen, die zwischen ihnen bestehen.
Es hat dann viel Zeit gebraucht, bis es gelang, diese Idee auf eine nächste Ebene zu bringen, also die Zusammenhänge logischer Aussagen in einer Art Sprachalgebra zu formalisieren. «Die Mathematik, die wir erschaffen müssen, ist eine Mathematik des menschlichen Verstandes», schrieb der britische Mathematiker und Logiker George Boole 1854 – bemerkenswerterweise nur ein Jahrzehnt nachdem Ada Lovelace und Charles Babbage an der «Analytical Engine» und einer ersten Programmiersprache für diese Maschine gearbeitet hatten. In seiner «Untersuchung der Gesetze des Denkens» formulierte Boole die Grundlagen der modernen symbolischen Logik.
Er stand dabei vor zwei Herausforderungen. Zum einen ist Sprache oft mehrdeutig, vage und interpretationsfähig. Das erleben wir täglich, nicht nur in der Interaktion mit unvollkommenen Chatbots, sondern auch mit dem einen oder anderen menschlichen Gegenüber. Mithilfe der symbolischen Logik wollte Boole genau diese Mehrdeutigkeit von Sprache als Ursache vielfacher Missverständnisse minimieren. Zum anderen ist es nicht immer einfach, sprachlich das auszudrücken, was man tatsächlich meint. Und so führte Boole «elektive Symbole» ein: willkürliche Bezeichnungen, die als symbolische Stellvertreter Kategorien oder Gruppen von Dingen repräsentieren.
Aus Sicht der modernen Algebra ist nicht alles an diesem Konzept schlüssig, und doch hat Boole für seine Zeit weit gedacht. Seine «Gesetze des Denkens» waren letztlich nichts anderes als Algorithmen, mit denen sich «elektive Symbole» ordnen ließen. Bemerkenswert ist, dass sie innerhalb eines Systems funktionieren, das der heutigen Algebra ähnelt oder zumindest als ein Vorläufermodell gelten kann. Durch die Verwendung von Symbolen und das Befolgen spezifischer Regeln zeigte Boole, ähnlich wie es sich Leibniz erträumt hatte, wie wir präziser denken und die Fallstricke einer oft mehrdeutigen Sprache umgehen können. Mit seinem binären Ansatz zur Darstellung von logischen Zuständen wie «wahr/falsch» oder «ein/aus» schuf Boole eine Verbindung zwischen logischen Operationen und den Prinzipien der Algebra. Damit ebnete er den Weg für digitale Computer, die in der Lage sind, mithilfe eines Binärcodes Informationen zu verarbeiten.
Im frühen 20. Jahrhundert waren Computer hauptsächlich im Hintergrund aktiv – und zwar im eigentlichen wie im übertragenen Sinne. Denn der Begriff «Computer» war eine Berufsbezeichnung für diejenigen, die computations, also Berechnungen, durchführten. Auch wenn sie manchmal einen rudimentären Taschenrechner benutzten, war der Ausdruck zu diesem Zeitpunkt für Menschen vorgesehen. Genauer gesagt: für Frauen. Frauen, die als Mathematikerinnen ausgebildet worden waren und beispielsweise während des Zweiten Weltkriegs komplexe Flugbahnberechnungen in strategische Ratschläge für die Streitkräfte verwandelten. Frauen wie Kay McNulty, Frances Bilas, Betty Jean Jennings, Elizabeth Snyder, Ruth Lichterman und Marlyn Wescoff, sechs Spitzenrechnerinnen, die später ausgewählt wurden, um einen nichtmenschlichen Computer zu programmieren. Das war 1946, und es handelte sich um den ersten programmierbaren elektronischen Universalcomputer, den ENIAC (Electronic Numerical Integrator and Computer).[15]
Um die Kapazitäten der frühen digitalen Computer aufzuzeigen, nutzten einige Wissenschaftler sogar die Analogie zum Menschen. Alan Turing schrieb 1950: «Die Idee, die hinter Digitalrechnern steckt, lässt sich so erklären, dass diese Maschinen alle Operationen ausführen können, die auch von einem menschlichen Computer ausgeführt werden könnten.»[16] Bald darauf verwies der Begriff «Computer» ausschließlich auf Maschinen.
Damit ging noch etwas anderes einher: Wir begannen, wie die Anthropologin und KI-Expertin Genevieve Bell es formuliert, «Computer im elektronischen Sinne zu verwenden, um Computer im menschlichen Sinne zu ersetzen».[17] Einst haben wir Maschinen als stark gepriesen, wenn sie über menschenähnliche Rechenkraft verfügten. Heute bezeichnen wir einen besonders schnell denkenden Menschen salopp als Maschine.
«Es ist eine merkwürdige Wendung», schreibt der amerikanische KI-Experte Brian Christian: «Wir sind wie das, was einmal wie wir war. Wir imitieren unsere alten Nachahmer, eine der seltsamen Umkehrungen in der langen Geschichte der menschlichen Einzigartigkeit.»[18] Das hat Folgen für das menschliche Selbstverständnis, wie wir in Kapitel 11 noch sehen werden.
An dieser Stelle wollen wir noch einmal auf Alan Turings «Imitation Game» zurückkommen. Die Ausgangsfrage lautete: Können Maschinen wirklich alles, was Menschen können, also auch denken? Mit Sicherheit herauszufinden, ob im Inneren einer Maschine Denkprozesse ablaufen, das sei, so Turing, schlicht nicht zu beantworten, schon weil wir viel zu wenig darüber wissen, welche Vorgänge im Gehirn eigentlich ablaufen. Turing hielt es jedoch für möglich, sich der Frage pragmatisch anzunähern, und zwar in Form eines Tests: Kann eine Maschine ein Verhalten zeigen, das von dem eines Menschen nicht zu unterscheiden ist?
In seinem Gedankenexperiment kommuniziert ein Mensch schriftlich mit zwei für ihn unsichtbaren Gesprächspartnern, einem Mann und einer Frau. Auf der Grundlage der Antworten, die beide Probanden auf seine Fragen geben, soll er das Geschlecht seiner Gegenüber bestimmen. Für die weitere Entwicklung der Künstlichen Intelligenz relevant wird das Spiel, wenn einer der beiden insgeheim durch einen digitalen Computer ersetzt wird. Wird der menschliche Beurteiler den Unterschied in der Unterhaltung bemerken?
Heute könnte man fragen: Wenn eine Kundendienstmitarbeiterin mitten im Gespräch durch einen Chatbot ersetzt wird, würden wir einen Unterschied erkennen? Bis vor einigen Monaten hätten wir diese Frage mit Überzeugung bejaht. Seit generative KI für alle zugänglich ist, stellt sich das etwas anders dar. Genau darum ging es schon Alan Turing. Wenn wir nicht realisieren, dass unsere Gesprächspartnerin in Wahrheit ein Computer ist, hat ebendieser Computer «intelligentes» Verhalten gezeigt.
Bemerkenswert und für unsere heutige Entwicklung bedeutsam ist die Argumentation, die Turing zu seinem Imitationsspiel anbietet. Für ihn signalisierte schon die überzeugende Imitation von menschlichem Verhalten eine Form von Intelligenz. Davon ausgehend prophezeite er 1950, dass «am Ende des Jahrhunderts die Verwendung von Wörtern und die gesellschaftliche Meinung sich so sehr verändert haben werden, dass man von Maschinen sprechen wird, die denken, ohne dafür Widerspruch erwarten zu müssen».[19] Das stimmt noch nicht so ganz. Ob KI tatsächlich denken kann und empfindungsfähig ist, wird zwischen den Anhängern weitreichender Vorstellungen einer Allgemeinen Künstlichen Intelligenz (AGI) und den etwas vorsichtigeren Vertretern einer gemäßigten Position heftig diskutiert. Vielleicht war Alan Turing also ein wenig zu optimistisch in seiner Prognose.
Ein kritischer Geist lebt von Widersprüchen, und Alan Turing war ein solcher. In seinen Schriften ging er auf zahlreiche Einwände ein, darunter einen zentralen von Ada Lovelace. Ein Jahrhundert zuvor hatte sie über die «Analytical Engine» gesagt, diese erhebe «keinen Anspruch darauf, etwas zu erschaffen. Sie kann nur tun, was immer wir ihr zu tun befehlen.»[20] Wir erinnern uns: Ada Lovelace war überzeugt, dass Maschinen nur ausführen, was Menschen programmieren, und dass daher ihre Ergebnisse nicht originell sind. Denken aber setzt die Möglichkeit voraus, etwas völlig Neues zu schaffen. Nur das wollte Lovelace auch als echten Beweis für das Denken gelten lassen. Turing hingegen widersprach: Wenn Maschinen uns glauben lassen können, dass etwas originell ist, wo liegt dann der Unterschied? Wahrnehmung schafft Wirklichkeit – ein konstruktivistischer Ansatz, der in der weiteren Entwicklung der Computerwissenschaften eine bedeutende Rolle spielen sollte.
Auch für Turings eigenes Leben, das 2014 in dem Film «The Imitation Game» verfilmt wurde, steckt in dieser Erkenntnis eine traurige Wahrheit. Turing erwarb sich außergewöhnliche Verdienste in den Computerwissenschaften und in der Kryptografie. Er war wesentlich daran beteiligt, die mithilfe der weltberühmten Chiffriermaschine «Enigma» verschlüsselten Funksprüche der Nazis zu entziffern. Dennoch wurde Turing als homosexueller Mann später von seiner eigenen Regierung verfolgt. Er wurde 1952 verurteilt und musste sich einer Hormonbehandlung unterziehen. Die stürzte Turing in eine starke Depression. Im Jahr 1954 nahm sich das frühe Genie der Informatik das Leben. 2013 entschuldigte sich die britische Königin für diese Verurteilung und rehabilitierte Turing posthum.
Während die Briten einen ihrer genialsten Mathematiker aufgrund von institutionalisierter Homophobie verloren, herrschte in den USA Aufbruchsstimmung im neu entstehenden Feld der Computerwissenschaften. Eine Maschine, die uns Menschen nachahmt, schien in greifbare Nähe gerückt zu sein. Doch sehr schnell wurde deutlich: Es führt nicht nur ein Weg nach Rom. Insbesondere eine Weggabelung wurde auf der Entwicklungsreise zur perfekten Maschine sichtbar. Die einen wollten erkunden, wie unser Gehirn funktioniert, um das Geheimnis unserer kognitiven Fähigkeiten zu entschlüsseln. Die anderen entschieden sich für den Weg des «Was»: Was tut ein Gehirn genau, und wie lässt sich das in der Maschine nachbauen? An beide Fragen anschließend: Basiert Intelligenz auf klaren Regeln oder auf der Verbindung von unzähligen Informationspunkten?
In den Computerwissenschaften der Fünfzigerjahre haben sich entsprechend zwei Herangehensweisen herausgebildet. Die eine Schule konzentrierte sich auf die Symbolische KI