- Neue KI-Technologien müssen deutlich besser als bestehende Lösungen sein, um vom Markt angenommen zu werden.
- Zuverlässigkeit ist bei KI-Systemen genauso entscheidend wie Leistungsfähigkeit, wird aber von vielen Unternehmen unterschätzt.
- Die Auswirkung von KI in unserem Alltag misst sich nicht an ihrer theoretischen “Intelligenz”, sondern an ihrer Akzeptanz durch die Nutzer.
Seit seiner Veröffentlichung hat ChatGPT immer wieder Nutzerrekorde gebrochen, aber erst im März 2025 erreichte die App einen scheinbar überfälligen Meilenstein: für einige Wochen war ChatGPT die am häufigsten heruntergeladene App der Welt.
Vordergründig ist dieser Erfolg ein Beweis dafür, dass Social-Media-Trends nach wie vor funktionieren. Dank des neuen Bildgenerators von ChatGPT konnte man sich in den letzten Wochen vor Familienfotos im Ghibli-Stil und personalisierten Action-Puppen kaum retten. TikTok und Instagram befeuerten den Trend so stark, dass sie sich selbst vom Thron stießen – zum ersten Mal seit Ewigkeiten nehmen nicht sie selbst und auch kein anderes Soziales Netzwerk den ersten Platz der Download-Charts, sondern ChatGPT.
Jemand, der wie ich die KI-Entwicklung seit Jahren beobachtet, kann darüber nur den Kopf schütteln. ChatGPT übertrifft in zahlreichen Leistungstests menschliche Experten, kann medizinische Diagnosen erstellen und juristische Dokumente erstellen – aber was ChatGPT endgültig ins öffentliche Bewusstsein gebracht hat, ist das hier?! ⬇️
Tatsächlich lehren uns die Actionfiguren und Muppets, wie neue Technologien ihren Weg in den Massenmarkt finden.
Warum “etwas besser” nicht reicht
Damit Verbraucher eine neue technologische Lösung annehmen, muss diese nicht nur etwas besser sein als die alte Lösung – sondern deutlich besser. Diese Zurückhaltung wurzelt nicht nur in kognitiven Verzerrungen wie der „Verlustaversion“ (wir schätzen das, was wir schon besitzen mehr als das, was wir noch nicht besitzen); vielmehr hat sie häufig ganz rationale Gründe. Es ist einfach nicht sinnvoll, zu einem Produkt zu wechseln, das nur geringfügig besser ist.
QUERTY, das Standard-Layout von Tastaturen, wird zum Beispiel häufig als ein Versagen des Marktes gehandelt: Milliarden Menschen nutzen täglich eine Tastatur, die nicht auf möglichst wenige Fingerbewegen optimiert ist, sondern darauf, mechanische Blockaden bei Schreibmaschinen zu verhindern. Ergonomischere Layouts wie die „Dvorak-Tastatur“ können sich aber nicht gegen den großen, veralteten Standard durchsetzen. Unfair? Mitnichten. Die Dvorak-Tastatur ist einfach nicht so viel besser, als dass sich ein Wechsel im großen Stil lohnen würde (manche Studien hinterfragen, ob sie überhaupt besser ist 1).
Auch die großen Veränderungen der Industriellen Revolution gingen sehr unterschiedlich vonstatten, je nachdem welche Vorteile unmittelbar auf dem Tisch lagen. Die Elektrifizierung revolutionierte zwar die Beleuchtung in Städten und Haushalten, aber es brauchte Jahrzehnte, bis elektrische Motoren eine ähnliche Veränderung anstießen. Der Grund dafür war, dass elektrische Dynamos den Fabrikbesitzern zunächst kaum Vorteile gegenüber Dampfmaschinen boten. Beim elektrischen Licht sah das anders aus: konstante Helligkeit ohne Flackern, keine Geruchsbelästigung, kein Sauerstoffverbrauch und ein deutlich geringeres Brandrisiko waren handfeste Vorteile.
Wandel wird von echter, deutlicher Verbesserung getrieben. Viele Figuren des Silicon Valley operieren deswegen nach dem Grundsatz, eine neue Lösung müsse zehnmal besser sein als die bestehende. In welchem Kontext ist KI jetzt schon zehnmal besser als klassische Algorithmen oder das menschliche Gehirn? Das ist schwer zu sagen.
Benchmark-Tests suggerieren, dass es ChatGPT schon jetzt mit Medizinstudierenden und erfahrenen Softwareentwicklern aufnehmen kann, doch das Design dieser Tests stammt immer aus der Vergangenheit und versucht häufig, falsche Dinge herauszubekommen. Der berühmte Turing-Test ist dafür ein perfektes Beispiel: Jahrzehntelang galt er als ultimative Messlatte, weil man annahm, eine KI, die ihn besteht, müsse menschenähnliche Fähigkeiten aufweisen. Doch moderne Sprachmodelle können den Test bestehen, ohne die damit verbundenen Erwartungen zu erfüllen. Arvind Narayanan vergleicht die Situation mit dem Bergsteigen: Mit jeder gelösten Aufgabe entdecken wir, dass wir nur einen Vorgipfel erklommen haben, nicht den eigentlichen Berg.
Unsere treffsicherste Benchmark ist deswegen der Markt. Erst wenn KI als Lösung oder Ergänzung angenommen wird, erfüllt sie wirklich die wichtigen Kriterien.
Das unterschätzte Killer-Feature
Neue Produkte müssen die Arbeit nicht nur deutlich besser erledigen als ihre Vorgänger, sondern auch mindestens genauso zuverlässig.
Auf den ersten Blick klingen „Zuverlässigkeit“ und „Sicherheit“ wie notwendige Nebenbedingungen, die eben auch erfüllt sein müssen – neben der eigentlichen Idee. Aber die Geschichte der Technologien kennt zahlreiche Erfindungen, die sich nur durchsetzen, weil sie zuverlässig waren.
Als der Erfinder Elisha Graves Otis im Jahr 1853 den von ihm erfundenen Personenaufzug präsentierte, sah die Welt nicht zum ersten Mal eine Plattform, die sich auf- und abbewegen könnte. Dampf- und Hydraulikaufzüge waren längst im Einsatz, kleine Warenlifte gab es seit der Antike. Otis’ bahnbrechende Erfindung war jedoch die Sicherheitsbremse, die den Fahrstuhl im Fall eines Kabelbruchs oder Seilrisses selbstständig abbremste. Erst diese Erfindung – und Otis’ spektakuläre Präsentationen2 – überzeugte Menschen, einen Aufzug zu besteigen, der viele Etagen in die Höhe fuhr.
Die großen KI-Unternehmen ignorieren diesen Faktor und fokussieren sich darauf, ihre Modelle mächtiger und schneller zu machen. Dabei besteht der größte Innovationsbedarf darin, dass sie zuverlässiger werden. Wenn mich eine Technologie in einem von hundert Fällen anlügt, kann das für einige Anwendungsfälle in Ordnung sein. Für andere ist sie damit genauso aus dem Rennen wie ein Aufzug, der abstürzen kann3.
Von Muppets zum Massenmarkt
Das neueste Reichweitenwachstum von ChatGPT lässt sich anhand der beiden Vektoren „Überlegenheit“ und „Kontrolle“ sehr gut nachvollziehen. Ob die Menschheit von ChatGPTs neuem Bildgenerator profitiert ist fraglich, aber die Technologie schafft Dinge, die vorher nicht möglich waren. Gleichzeitig ist das Risiko dieser Anwendung äußerst begrenzt. Wenn ich meine Familienmitglieder zu Muppets mache, gebe ich damit keine Kontrolle ab – zumindest deutlich weniger, als wenn ich das gleiche Tool meine Hausarbeit schreiben lasse.
Die Auswirkungen von KI in unserem Alltag messen sich schon jetzt nicht mehr in ihrer „Intelligenz“, sondern in der Akzeptanz – dem Ausmaß, in dem sich Personen und Unternehmen von KI unterstützen lassen. Was ist der nächste Innovationssprung, über den ChatGPT noch mehr in unseren Alltag findet?
-
Behauptet wird, u.a. die Dvorak-Tastatur verhindere das RSI-Syndrom oder Sehnenscheidenentzündungen, aber dafür gibt es keine gesicherten Daten. Dvoraks eigene Studien zur Überlegenheit seiner Tastatur weisen handwerkliche Fehler auf und auch die vielzitierten US-Marine-Experimente sind mit Vorsicht zu genießen, denn Dvorak war selbst beteiligt. (Quelle: The Fable of the Keys (Stan J. Liebowitz, Stephen E. Margolis, 1990)) ↩︎
-
Zur Demonstration ließ sich Otis 1853 bei der Vorstellung des Aufzugs in die Höhe fahren und durchtrennte anschließend den Seilzug. (Quelle: Zur Geschichte des Aufzugs – von Otis bis Twin (aufzug24.net, abgerufen 2025)) ↩︎
-
Tatsächlich wissen nicht, ob die „Fehlerquote“ von Large Language Models jemals auf Null sinken wird. Es könnte sein, dass manche Produktarten deswegen für immer ausscheiden – siehe dieser lesenswerte Essay von Benedict Evans: The Deep Research problem — Benedict Evans ↩︎
Kommentare
Keine Kommentare vorhanden. Sei der Erste, der einen Kommentar hinterlässt!