Was passiert, wenn der KI-Hype endet?

Anderthalb Jahre nach der Veröffentlichung von ChatGPT finde ich mich in einer ungewohnten Situation wieder. Ich probiere leidenschaftlich gern neue Software-Tools aus (das ist mein Produktivitäts-Killer Nummer 1) und habe in den letzten 18 Monaten sehr viel Zeit in ChatGPT und andere GenAI-Tools versenkt. Das Ergebnis ist ernüchternd.

Auf der einen Seite gibt es Aufgaben, in denen Generative KI richtig gut ist: Code schreiben, Texte zusammenfassen, Hausaufgaben erledigen, Stock-Fotos erstellen. Für mich sind diese Anwendungsfälle weitgehend uninteressant.

Auf der anderen Seite verspricht mir KI Dinge, auf die ich brenne: Daten auswerten und Charts daraus bauen, Illustrationen nach genauen Vorstellungen erstellen, Texte aus losen Gedankensammlungen erstellen. Nichts davon funktioniert für mich gut genug.

Nun bin ich als Early Adopter technische Kinderkrankheiten wirklich gewöhnt. Aber es deutet sich an, dass die beschriebenen Probleme eher lebenslange Erbkrankheiten sind. Konzeptionelle Bestandteile der Technologie also.

Eine inhärente Schwäche von Large Language Models ist zum Beispiel der Reversal Curse. Ein LLMs, das „gelernt“ hat, dass „A = B“ ist, weiß deswegen noch lange nicht, dass B auch A ist. Wenn es also die Frage „In welcher Action-Film-Reihe ist Tom Cruise der Star?“ richtig mit „Mission Impossible“ beantwortet, kann es vielleicht bei der Frage „Wer ist der Star in Mission Impossible?“ nur die Schultern zucken. Wobei es das nicht tun wird. Es wird sich eine Antwort ausdenken. Was zum nächsten Problem führt: Large Language Models sagen immer Dinge, die sich plausibel anhören. Meistens sind sie auch wahr, aber nicht immer.

Das Marktforschungsunternehmen Gartner hat das bekannte Modell eines „Hype Cycle“ entwickelt, den laut Gartner die meisten Hochtechnologien durchlaufen. Zu Beginn ist unklar, welche der Fehler und Schwächen kurzfristig behebbar sind (die Fans sagen: alle!) und deswegen werfen wir all unsere Hoffnungen und Wünsche auf die Technologie. Irgendwann ist der „Gipfel der überzogenen Erwartungen“ erreicht und die Technologie rutscht in das „Tal der Desillusionierung“. Laut Gartner hat Generative KI diesen Gipfel erreicht. Jetzt kommt das Tal der Enttäuschungen. Wie wird es sich anfühlen?

Spitzere Zielgruppen

Wenn ich von begeisterten KI-Promptern höre, deren Leben durch ChatGPT verändert wurde, muss ich an diesen alten Werbespot von Lotus 1-2-3 denken.

Wenige Jahre vor diesem Machwerk hatte der Student Dan Bricklin erkannt, dass man die Tabellen, die Buchhalter täglich auf Papier ausfüllten, in Software abbilden konnte. Er entwickelte VisiCalc, die erste erfolgreiche Tabellenkalkulation und programmierte sich damit in die Herzen aller Buchhalter. Firmen kauften 12.000 $ teure Apple II-Geräte, nur um VisiCal zu benutzen, und mit dem PC-Konkurrenten Lotus 1-2-3 explodierten die Nutzerzahlen dann so richtig. Schon im zweiten Jahr erzielte Lotus 156 Mio. Dollar Umsatz – das schaffen selbst heutige SaaS-Startups nicht – und Lotus gilt heute als die erste „Killer-Applikation“ des PCs. Es hatte deutlich mehr Strahlkraft als die ersten Vorläufer von PowerPoint und Paint.

Und trotzdem war das Programm für die meisten Leute uninteressant. Denn die meisten Leute sind keine Buchhalter.

Gerade hat ChatGPT keine bestimmte Zielgruppe. Es verkauft sich als „General Purpose Technology“, die von Reiseplanung bis Genom-Sequenzierung alles kann, und das sogar über das gleiche Interface. Mit dieser Strategie schaffen es die Macher, dass möglichst viele Zielgruppen die Technologie für möglichst viele Anwendungsfälle ausprobieren.

Im kommenden „Tal der Enttäuschung“ wird sich ein Großteil dieser Anwender zurückziehen. Übrig bleiben die, die genauso begeistert sind, wie vor Jahrzehnten die Buchhalter von VisiCalc. Vielleicht haben sie sich sogar abhängig von dem Tool gemacht. Schwächen der Technik, wie zum Beispiel, dass die generierten Texte plausibel, aber nicht wahr sind, sind für sie kein Problem, sondern eher eine Lösung. Wer zum Beispiel einen Schwung von Werbeslogans braucht oder eine sinnvolle Auswahl an möglichen Wirkstoffen, die es zu erproben gilt, sucht nicht Wahrheit, sondern Inspiration.

Die neue Kernzielgruppe bevölkert den Gartnerschen „Pfad der Erleuchtung“ (Stufe 3 des Cycle), und sie nutzt das Tool für immer mehr Anwendungsfälle, „missbraucht“ sie sogar. Mitten im Hype um die ersten Spreadsheet-Programme schrieb der Journalist Steven Levy: „Es hat sich ein regelrechter Kult um die Tabellenkalkulation gebildet, mit Gurus und Eingeweihten, detaillierten Überlieferungen, geheimnisvollen Ritualen – und dem unerschütterlichen Glauben, dass sich die Funktionsweise der Welt in Zeilen und Spalten von Zahlen und Formeln darstellen lässt.“ Man kann so ziemlich jede B2B-Software der letzten zwanzig Jahre als einen Abkömmling von Excel bezeichnen:

Unsichtbare Features

Schon vor dem Hype rund um Generative KI galt: Die erfolgreichsten KI-Features sieht man nicht. Wenn KI einfach funktioniert, handelt es sich – zumindest in der öffentlichen Wahrnehmung – gar nicht mehr um KI, sondern einfach nur um Technik. Das ist der sogenannte AI Effect.

Seit Jahren beeinflussen KI-gestützte Algorithmen unsere Suchergebnisse, die Route unseres Navigationsgeräts und die Qualität unserer Fotos. Das ist die gängige Strategie etablierter Tech-Unternehmen: sie machen eine neue Technologie einfach zum Feature.

Eine große Stärke Generativer KI ist es zum Beispiel, aus Bildern und dem gesprochenen Wort Inhalte zu machen. Schon jetzt bieten die großen Videokonferenzen eine automatische Zusammenfassung der Videocalls an, Telefonanlagen verschriftlichen die geführten Telefonate. Was ist der nächste Schritt? Vielleicht wird eines Tages das Gespräch, das ein Arzt mit mir führt, automatisch aufgenommen, transkribiert und die Zusammenfassung in meiner Patientenaktie gespeichert – statt dass der Arzt selbst mühevoll ein Protokoll verfasst, das immer möglichst kurz sein wird. Die in dieser Woche von Microsoft vorgestellte Suchfunktion “Recall” zeigt in diese Richtung. Mit der können Nutzer alles durchsuchen, was sie auf dem PC gesehen und gehört haben, von besuchten Webseiten bis Videocalls.

Jetzt wird’s spannend

Der Gartner-Hype-Cycle soll eine Technologie nicht diskreditierten oder ihr den zukünftigen Erfolg absprechen. Er beschreibt einfach die Entwicklung auf dem Weg zur produktiv genutzten Technologie (ich hatte hier einmal mal den Sinn von Hypes erklärt). „Generative KI durchläuft den Hype-Zyklus schneller als jede andere Technologie, an die ich mich erinnern kann“, sagt Gartner’s Chief of Research Chris Howard und fügt hinzu: „Der Tiefpunkt der Desillusionierung bedeutet einfach, dass jetzt die harte Arbeit beginnt.“

Das Tal der Enttäuschung wird ein Tal der positiven Überraschungen werden.