Wo KI nichts bringt, und wo der Markt etwas anderes behauptet

“Was wäre, wenn wir KI darauf anwenden würden?” Der Satz geistert seit drei Jahren durch die Demos. Er funktioniert überall, weil man einen LLM tatsächlich an alles anschließen kann. Anschließbar bedeutet nicht gleich nützlich. In den meisten Fällen, in denen sie verwendet wird, erledigen ein Regex, eine Geschäftsregel oder ein SQL-Join bereits die Arbeit, besser und tausendmal billiger.

Fünf Situationen, in denen ich KI-Projekte durchlaufen sehe, für die es keinen Grund gab.

Klassifizierung, wenn die Kategorien stabil sind

Ihre Kundenbetreuung erhält E-Mails und muss sie an die richtigen Stellen weiterleiten. Ein Vertriebsmitarbeiter bietet Ihnen eine LLM an, um die E-Mails zu klassifizieren.

Die Frage, die man stellen muss: Sind die Kategorien stabil und gut definiert? Wenn ja, erledigt ein auf 200-500 gelabelten Beispielen trainierter Klassifikator (oder sogar ein Regelwerk nach Schlüsselwörtern) die Arbeit mit einer Genauigkeit von 90-95%, fast keinen Kosten für Inferenzen und vollständiger Erklärbarkeit (Sie wissen genau, warum eine E-Mail in diese oder jene Kategorie eingeordnet wurde).

Ein LLM kostet 10- bis 100-mal mehr pro Anfrage für ein ähnliches Ergebnis. Und Sie haben weniger Kontrolle über das Verhalten an den Grenzen.

Generative KI ist für die Klassifizierung nützlich, wenn die Kategorien unklar oder zahlreich sind oder sich häufig ändern. Bei stabilen und klar definierten Kategorien sind klassische Lösungen besser.

Die Extraktion von strukturierten Daten auf bekanntes Format

Beträge, Daten und Namen aus Dokumenten extrahieren.

Ein strukturierter Regex oder Parser macht das bei bekannten Formaten perfekt. Er ist vorhersehbar, testbar und deterministisch. Ein LLM kann das auch, aber mit dem Risiko von Halluzinationen bei bestimmten numerischen Werten (Daten, Beträge) und höheren Kosten.

Die Ausnahme sind unstrukturierte Dokumente mit sehr unterschiedlichen Formaten (Verträge, die in natürlicher Sprache verfasst wurden, E-Mails). Hier bringt der LLM einen Mehrwert. Bei Rechnungen oder Formularen mit einem bekannten Format ist ein strukturierter Parser überlegen.

Eine Suche in einer bereits gut strukturierten Datenbank

Ihr Produktkatalog hat 10.000 Referenzen. Jemand schlägt Ihnen vor, dort eine LLM für die Suche einzutragen.

Wenn sich Ihre Referenzen in einer relationalen Datenbank mit wohldefinierten Attributen (Kategorie, Farbe, Größe, Preis) befinden, ist eine SQL- oder Elasticsearch-Suche schneller, genauer, transparenter und unendlich viel billiger.

Die LLM bringt Wert für die natürlichsprachliche Suche nach unstrukturierten Inhalten (Dokumentation, Artikel, E-Mails). Für die Suche nach strukturierten Attributen gewinnt die klassische Suchmaschine.

Volumeninhalte ohne menschliches Korrekturlesen generieren

Ihr Marketingteam möchte “Produktbeschreibungen mithilfe von KI erstellen”, um die Produktion zu beschleunigen.

Legitimer Nutzungsfall, wenn ein Mensch vor der Veröffentlichung Korrektur liest. Riskanter Nutzungsfall, wenn die Ausgabe direkt online geht. Der Unterschied zwischen den beiden liegt nicht im Werkzeug, sondern im nachgelagerten Korrekturleseprozess, den es gibt oder nicht gibt. Ohne diesen Schritt veröffentlichen Sie faktische Fehler in Ihren eigenen Produkten, ohne es überhaupt zu wissen.

Die Falle: Messen Sie den Produktivitätsgewinn bei der Generierung, ohne die Kosten für das Korrekturlesen und die Korrekturen zu messen. Oft ist der Nettogewinn geringer, als die Demo suggeriert hat.

Der RAG-Chatbot auf einer bereits schlecht gepflegten Dokumentation

“Setzen wir einen Chatbot auf unsere Wissensdatenbank, damit die Mitarbeiter die Informationen leichter finden können.”

Wenn Ihre Wissensdatenbank gut strukturiert und gepflegt ist, ist eine effiziente Suchmaschine (Elasticsearch, Typesense) oft genauer, kostengünstiger und vorhersehbarer als ein RAG. RAG-Chatbots sind nützlich, wenn die Dokumentation umfangreich und vielfältig ist und die Fragen offen sind. Sie sind weniger nützlich, wenn die Fragen sachlich sind und die Antworten in eindeutig identifizierbaren Dokumenten zu finden sind.

Und wenn Ihre Wissensdatenbank nicht gut gepflegt ist, wird der RAG-Chatbot die Inkonsistenzen reproduzieren und verstärken. Das ist ein Problem der Organisation, nicht der Technologie.

KI als letzter Ausweg

KI ist der letzte Ausweg. Nicht aus Prinzip: aus Prüfungsdisziplin. Bevor wir ein Projekt unterzeichnen, müssen wir zwei Alternativen ausgeschlossen haben. Die deterministische Geschäftsregel, die seit dreißig Jahren bei der gleichen Art von Problemen funktioniert. Und die Prozessreorganisation, die das Thema manchmal ohne eine einzige Zeile Code löst. Wenn diese beiden Alternativen anhand von Unterlagen geprüft und ausgeschlossen wurden, dann ist die LLM eine Erwähnung wert. Andernfalls machen Sie KI um der KI willen, und Sie zahlen doppelt: die API-Rechnung plus die technische Schuld, dass Sie nicht nach etwas Einfacherem gesucht haben.

Klassifizierung, wenn die Kategorien stabil sind#

Die Extraktion von strukturierten Daten auf bekanntes Format#

Eine Suche in einer bereits gut strukturierten Datenbank#

Volumeninhalte ohne menschliches Korrekturlesen generieren#

Der RAG-Chatbot auf einer bereits schlecht gepflegten Dokumentation#

KI als letzter Ausweg#

Verwandte Artikel

Die 3 Fragen vor jedem KI-Einsatz