8,99 €
Wie lernen KI-Modelle? Wie sorgen Entwickler dafür, dass KI nicht außer Kontrolle gerät? Verlieren bald alle wegen KI ihre Jobs? Und was sind die Gründe für den plötzlichen KI-Boom? Künstliche Intelligenz ist in aller Munde. Während auf der einen Seite Untergangsängste geschürt werden, beschwört die andere Seite eine utopische Zukunft. Doch wenn wir ehrlich sind, gibt es bei diesem hochkomplexen Thema mehr Fragen als Gewissheiten. Höchste Zeit also, sich mit den wichtigsten und interessantesten davon auseinanderzusetzen – und zwar in der leicht verständlichen Form, die die beliebte Reihe Erklärs mir, als wäre ich 5 gewährleistet. Dieses Buch nimmt Berührungsängste und erklärt auf anschauliche Weise die komplexen Zusammenhänge rund um das Thema Künstliche Intelligenz – sodass alle sie verstehen. Warum ist menschliches Feedback für KI so wichtig? Was ist ein KI-Winter? Wem gehören von KI erzeugte Werke wie Bilder, Texte und Musik?
Das E-Book können Sie in Legimi-Apps oder einer beliebigen App lesen, die das folgende Format unterstützen:
Seitenzahl: 95
Petra Cnyrim Jonathan Kemper
ERKLÄRS MIR, ALS WÄRE ICH 5
Künstliche Intelligenz
Petra Cnyrim Jonathan Kemper
ERKLÄRS MIR, ALS WÄRE ICH 5
Künstliche Intelligenz
Wie alt ist die Idee der Künstlichen Intelligenz? Was hat KI für einen Einfluss auf die Umwelt? Sind KIs politisch neutral?
riva
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie. Detaillierte bibliografische Daten sind im Internet über https://dnb.de abrufbar.
Für Fragen und Anregungen
Wichtiger Hinweis
Ausschließlich zum Zweck der besseren Lesbarkeit wurde auf eine genderspezifische Schreibweise sowie eine Mehrfachbezeichnung verzichtet. Alle personenbezogenen Bezeichnungen sind somit geschlechtsneutral zu verstehen.
Originalausgabe
3. Auflage 2025
© 2024 by riva Verlag, ein Imprint der Münchner Verlagsgruppe GmbH
Türkenstraße 89
80799 München
Tel.: 089 651285-0
Alle Rechte, insbesondere das Recht der Vervielfältigung und Verbreitung sowie der Übersetzung, vorbehalten. Kein Teil des Werkes darf in irgendeiner Form (durch Fotokopie, Mikrofilm oder ein anderes Verfahren) ohne schriftliche Genehmigung des Verlages reproduziert oder unter Verwendung elektronischer Systeme gespeichert, verarbeitet, vervielfältigt oder verbreitet werden. Wir behalten uns die Nutzung unserer Inhalte für Text und Data Mining im Sinne von § 44b UrhG ausdrücklich vor.
Redaktion: Silke Panten
Umschlaggestaltung: Isabella Dorsch
Umschlagabbildung: Shutterstock.com/buffaloboy
Satz: Andreas Linnemann
eBook by tool-e-byte
ISBN Print 978-3-7423-2665-2
ISBN E-Book (PDF) 978-3-7453-1952-1
ISBN E-Book (EPUB, Mobi) 978-3-7453-1989-7
Weitere Informationen zum Verlag finden Sie unter
www.rivaverlag.de
Beachten Sie auch unsere weiteren Verlage unter www.m-vg.de
INHALT
VORWORT
EINFÜHRUNG
Was ist Künstliche Intelligenz?
Was ist ein Algorithmus
Ist maschinelles Lernen das Gleiche wie Deep Learning
Warum stellt ChatGPT einen so großen Durchbruch dar
Woher hat ChatGPT sein Wissen
Können wir ChatGPT und anderen Sprachmodellen vertrauen
GESCHICHTE
Was sind wichtige Meilensteine in der KI-Entwicklung?
Wie alt ist die Idee der Künstlichen Intelligenz?
Wie hat sich unser Verständnis von KI im Laufe der Zeit entwickelt
Welche Unternehmen treiben die KI-Entwicklung voran
Was steckt hinter dem Turing-Test?
Warum hielt die Welt einen Google-Ingenieur für verrückt?
Warum musste Microsoft seinen KI-Avatar »Tay« schnell wieder vom Netz nehmen
Wie lässt sich die Leistung von KI messen
Welche Länder spielen eine führende Rolle bei der KI-Entwicklung
Welche Regeln will die EU für die KI aufstellen?
Warum gab es plötzlich einen KI-Boom
Und was ist ein »KI-Winter«?
Welche Rolle spielen Open-Source-Projekte und gemeinschaftliche Entwicklungen in der KI?
TECHNIK
Worin unterscheiden sich KI-Modelle?
Was ist ein Foundation Model?
Mit welcher Sprache wird KI programmiert
Warum zählt ein Sprachmodell keine Wörter, sondern Tokens?
Wie lernt ein KI-Modell, was es weiß
Wie bestimmen Parameter die Leistungsfähigkeit eines KI-Modells?
Warum ist menschliches Feedback für ein KI-Modell so wichtig?
Wird eine KI schlauer, je mehr Daten sie hat
Wie werden KI-Modelle für individuelle Anwendungsfälle optimiert?
Was hat eine KI mit einem Papagei zu tun
Wie generiert KI Bilder und Musik mit Diffusion?
Warum warten Wissenschaftler auf die Singularität
Wie sorgen Entwickler dafür, dass KI nicht außer Kontrolle gerät
Wie viel Ingenieur muss man als Prompt Engineer sein?
ETHIK
Was sind Deepfakes
Können wir noch irgendeinem Foto trauen?
Was ist, wenn ein KI-gesteuertes Auto einen Unfall baut
Wem gehören KI-erzeugte Werke wie Bilder, Texte und Musik
Wie viel Mensch steckt in KI?
Welchen Einfluss hat KI auf die Umwelt?
Verlieren bald alle wegen KI ihre Jobs
Werden wir mit KI unsterblich
Sind KIs politisch neutral
Kann KI alle Krankheiten heilen
Kann KI Lehrkräfte unterstützen oder sogar ersetzen
Können wir mit KI das Problem des Therapeutenmangels lösen?
Welche Personen aus der KI-Industrie sollte man kennen
Was sind wichtige Forschungsstandorte der KI
ANWENDUNG
Warum macht der Sprachassistent nicht, was wir wollen
Wie erkennt das Smartphone das Gesicht oder den Fingerabdruck des Nutzers
Wie macht eine KI süchtig nach Social Media?
Steckt in jedem NPC in einem Videospiel eine KI?
Wie erweckt die Filmindustrie verstorbene Menschen zum Leben?
Können wir dank KI mit Tieren sprechen?
Kann KI unsere Gesetze gerechter machen?
Braucht man für KI einen schnellen Computer?
Was bedeutet KI für die Zukunft der Suchmaschinen?
Lassen sich mit KI Gedanken lesen
TIPPS
Wo könnte man KI mal ganz konkret im Alltag einsetzen
Wie kommuniziert man am besten mit einem Sprachmodell
Welche Prompt-Strategien sollte man unbedingt mal ausprobieren?
Wie malt eine KI genau das Bild, das man sich vorstellt
ÜBER DIE AUTOREN
Von Jonathan Kemper
Ein Buch über Künstliche Intelligenz (KI) zu schreiben, ist aus gleich mehreren Gründen eine herausfordernde Aufgabe. Einerseits ist das Thema ganz schön komplex, weil es viele Teilgebiete aus Informatik und Mathematik vereint. Selbst wer hauptberuflich an der Entwicklung von KI-Modellen beteiligt ist, wird kaum alle Aspekte der neuen Technologie vollumfänglich erfassen, verstehen und - noch weniger - verständlich erklären können.
Zudem entwickelt sich die KI so rasant, dass ein gedrucktes Buch eher kontraproduktiv ist. Es kann nicht wie eine dynamische Website jede Woche oder gar jeden Tag um neue Informationen aus Wirtschaft, Politik und Forschung ergänzt werden. Dieses Buch versucht deshalb, die grundlegenden, unveränderlichen Eigenschaften von KI leicht zugänglich zu erklären. Dadurch geht es aber auch weniger auf konkrete aktuelle Entwicklungen ein.
Zu guter Letzt ist KI ein so radikaler Technologiefortschritt, dass kaum ein Lebensbereich von ihm unberührt bleibt. Egal ob Medizin, Bildung, Militär oder Unterhaltung (um nur einige wenige zu nennen) - KI wird in den nächsten Jahren an jeder Ecke eine noch größere Rolle spielen, als sie es bereits heute tut. Hier lassen sich auf begrenzter Seitenzahl nur einige prominente Beispiele herauspicken, aber eben nicht alle Bereiche in Gänze abdecken. Sie geben aber einen guten Ein- und Überblick in die Welt der Künstlichen Intelligenz, wie sie funktioniert, wie sie sich entwickelt hat und wie sie uns in unserem alltäglichen Leben immer wieder bewusst oder unbewusst begegnet.
Viel Spaß beim Lesen wünscht
Jonathan Kemper
Eigentlich beschäftigen sich alle nachfolgenden Kapitel mit dieser Frage in verschiedenen Facetten, denn schließlich gibt es darauf nicht nur eine einzige und vor allem keine einfache Antwort. Zum grundlegenden Verständnis ist ein grober Überblick aber sinnvoll. KI beschreibt eine faszinierende und komplexe Sammlung von Technologien, die unseren Alltag und die Arbeitswelt zunehmend prägt. Vor allem Durchbrüche im Bereich der generativen KI, die mal mehr, mal weniger menschenähnlich Texte, Bilder, Videos, Stimmen oder Musik erschafft, haben diese Technologien immer weiter aus der wissenschaftlichen Nische in die breite Masse katapultiert.
Ziel der KI-Entwicklung ist eine Artificial General Intelligence, also eine künstliche allgemeine Intelligenz (kurz AGI), die die Fähigkeit besitzt, intellektuell anspruchsvolle Aufgaben auf dem Niveau eines menschlichen Wesens auszuführen. Das umfasst eine breite Palette an Funktionen, wie etwa Sprache zu verstehen, Muster oder Bilder zu erkennen, aus Erfahrungen zu lernen und eigenständig Entscheidungen zu treffen. So weit sind wir noch nicht. Stattdessen reden wir heute eher von »schwachen« KI-Systemen, die für eine bestimmte Aufgabe geschaffen wurden. Dabei werden KI-Modelle zunehmend multimodal, können also nicht nur ein Format wie Text ein- und ausgeben, sondern verstehen und generieren beispielsweise auch gesprochene Sprache oder Bilder.
Ein Kernaspekt von KI-Systemen ist das Machine Learning, also das maschinelle Lernen (ML), eine Methode, bei der Computerprogramme aus Daten lernen und sich verbessern, ohne explizit programmiert zu werden. Ein spezielles Feld innerhalb des ML ist das Deep Learning, das auf komplexen neuronalen Netzwerken basiert und es Maschinen ermöglicht, menschenähnliche Erkenntnisleistungen zu vollbringen. Auf diese Grundlagen gehen die folgenden Kapitel zunächst ein.
»Algorithmus« klingt zwar nach komplizierter Mathematik, aber muss nicht unbedingt etwas mit Zahlen zu tun haben. Ein Algorithmus bezeichnet eine eindeutige Anleitung zur Lösung bestimmter Probleme und besteht aus einer festen Anzahl gut überlegter Einzelschritte. Damit können Algorithmen einerseits zur Ausführung in ein Computerprogramm implementiert, aber genauso gut auch in menschlicher Sprache formuliert werden. Bei der Problemlösung wird vereinfacht gesagt eine bestimmte Eingabe in eine bestimmte Ausgabe überführt. Das muss jedoch nicht heißen, dass die gleiche Eingabe auch immer die gleiche Ausgabe hat (s. Seite 37).
Beispiele für Algorithmen, die man aus dem Alltag kennt, sind etwa:
Kochrezept für einen KuchenAnweisungen für die Montage eines MöbelstücksFormel, um eine Quadratwurzel zu ziehenMaschinelles Lernen ist ein Teilgebiet der KI, das sich mit der Entwicklung von Algorithmen beschäftigt, die aus Daten lernen können. Beim maschinellen Lernen werden Algorithmen mit Daten gefüttert, aus denen sie Muster und Zusammenhänge lernen. Diese Muster und Zusammenhänge können dann verwendet werden, um Aufgaben zu erledigen, die zuvor von Menschen erledigt werden mussten, zum Beispiel Bild- und Spracherkennung, E-Mail-Spam-Filterung oder Krankheitsdiagnosen.
Deep Learning, also »tiefes Lernen«, ist wiederum ein Teilbereich des maschinellen Lernens, und auch hier geht es darum, Computern ohne explizite Programmierung das Lernen aus Daten zu ermöglichen. Der Schlüssel zum Verständnis liegt in der Art, wie sie Daten verarbeiten.
Maschinelles Lernen nutzt meist einfache Modelle, die auf mathematischen Formeln basieren. Diese Modelle können sich in begrenztem Maße als nützlich erweisen, aber sie haben ihre Grenzen, besonders wenn es um komplexere Daten geht. Deep Learning hingegen geht einen Schritt weiter. Es nutzt künstliche neuronale Netzwerke (KNN), die von der menschlichen Gehirnstruktur inspiriert sind. Ihre wahre Stärke zeigen sie besonders im Umgang mit unstrukturierten Daten - also Informationen, die nicht in einer vordefinierten Form vorliegen, wie Bilder, Töne und Videos.
Grundsätzlich besteht ein KNN aus drei Schichten oder vielmehr drei Arten von Schichten: Eine Eingabeschicht (Input), eine Ausgabeschicht (Output) sowie mehrere versteckte Schichten (Hidden Layer) dazwischen. Die Werte der Hidden Layer werden zunächst völlig zufällig bestimmt und sind dafür da, das Eingabesignal zu modifizieren. Hat das Signal das Netzwerk durchlaufen, wird die Ausgabe mit der Eingabe verglichen und es geht wieder von vorn los. Durch viele Wiederholungen nähern sich Ein- und Ausgabe immer mehr aneinander an.
Die Vorstellung von ChatGPT am 30. November 2022 durch das US-Unternehmen OpenAI gilt als wichtiger Stichtag in der KI-Welt. Plötzlich war KI nicht mehr nur einer kleinen Gruppe an Technikpionieren ein Begriff, sondern stand kostenlos der ganzen Menschheit mit Internetanschluss zur Verfügung. Das Tool wurde in den folgenden Wochen und Monaten von allen möglichen Leuten weit über die KI-Elite hinaus diskutiert und teilweise als Heilsbringer gefeiert. Durch die Macht großer Sprachmodelle sollten sich langweilige Alltagsaufgaben doch mit Leichtigkeit automatisieren lassen, oder?
Der Begriff Generative Pre-trained Transformer (GPT) wurde zwar von OpenAI geprägt, steht symbolisch aber für eine weitreichende Entwicklung in der KI-Forschung. Generative bedeutet, dass das Modell fähig ist, eigenständig Inhalte zu erzeugen. Durch das Pre-training auf umfangreichen Daten lernt es, Texte zu generieren, die menschlich wirken. Der Transformer ist eine Architektur, die dank sogenannter Aufmerksamkeitsmechanismen den Kontext eines Wortes im Satz unabhängig von seiner Position versteht. Dieses Prinzip ist nicht nur bei OpenAI zu finden, sondern auch bei Entwicklungen anderer Firmen, weshalb OpenAI »GPT« bislang zudem nicht als Marke eintragen konnte. Der Transformer wurde im Übrigen nicht von OpenAI, sondern 2017 von Google Brain vorgestellt. Die erste Version von ChatGPT war aus heutiger Sicht gar nicht sonderlich kompetent. Zum Start wurde ChatGPT von einer Abwandlung von GPT-3.5 angetrieben, dessen Training Anfang 2022 fertiggestellt wurde. Auf den ersten Blick schienen die Texte so gut wie aus menschlicher Feder, auf den zweiten verfiel der Chatbot aber immer wieder in bekannte Formulierungsmuster, konnte einfache Logikrätsel nicht lösen und fantasierte angebliche Fakten herbei. Mit GPT-4 kam kurze Zeit später ein Modell auf den Markt, das komplexere Aufgaben bewältigen kann als frühere Modelle. Wichtig zu verstehen: ChatGPT bezeichnet kein konkretes KI-Modell, sondern eine Softwareoberfläche, die per Webbrowser oder Smartphone-App zugänglich ist, für eine Sammlung verschiedener Modelle wie eben GPT-4 zur Textgenerierung, DALL-E 3 zur Bildgenerierung oder Whisper zur Spracherkennung.