KI-Glossar

KI-Begriffe, ohne unnötigen Jargon.

Algorithmus: Folge von formalen Anweisungen zur Lösung eines Problems. Geht der KI voraus und bleibt auch ohne sie allgegenwärtig.; Ein Algorithmus ist eine endliche und eindeutige Folge von Anweisungen zur Lösung eines Problems. Die meisten Systeme, die Sie im Alltag verwenden (Sortieren, Suchen, einfache Empfehlungen), basieren auf deterministischen Algorithmen, nicht auf KI im Sinne von Machine Learning.; mechanics
Machine learning: Der Computer lernt anhand von Beispielen, ohne hart codierte Regeln.; Machine Learning (maschinelles Lernen) ist ein Teilbereich der KI, bei dem das System Regeln aus Daten ableitet, anstatt explizite Anweisungen zu befolgen. Es umfasst Regression, Klassifizierung, Clustering etc.; mechanics
Deep learning: Machine Learning mit tiefen neuronalen Netzen (Multi-Layer).; Deep Learning verwendet künstliche neuronale Netze mit mehreren verborgenen Schichten. Es hat die jüngsten Durchbrüche in der Bild- und Spracherkennung sowie in der maschinellen Übersetzung ermöglicht.; mechanics
Neuronales Netz: Rechenarchitektur, die (sehr vage) vom biologischen Gehirn inspiriert ist.; Ein künstliches neuronales Netz ist ein Graph aus Knoten (Neuronen), die in Schichten organisiert sind und über Parameter (Gewichte), die während des Trainings angepasst werden, einen Input in einen Output umwandeln. Die Analogie zum Gehirn ist pädagogisch nützlich, aber inhaltlich irreführend: Es gibt kein Bewusstsein, kein Verständnis.; mechanics
Modell: Ein Programm, das auf Daten trainiert wird, um eine Ausgabe zu erzeugen. Das ist keine Intelligenz.; Im Kontext der KI ist ein Modell das Ergebnis des Trainings mit einem Datensatz. Es codiert statistische Korrelationen. GPT-4, Mistral und Llama sind Modelle. Sie produzieren wahrscheinliche Ausgaben, keine Argumentationen.; mechanics
Training: Phase, in der das Modell aus den Daten lernt. Langwierig, teuer, nur einmal (oder selten) zu machen.; Beim Training werden die Parameter (Gewichte) eines neuronalen Netzes so angepasst, dass der Fehler in einem Datensatz minimiert wird. Bei großen Sprachmodellen kann dies Tausende von Grafikprozessoren wochenlang binden und zig Millionen Dollar kosten.; mechanicseconomics
Datensatz: Die Sammlung von Beispielen, an denen das Modell trainiert.; Ein Datensatz (Dataset) ist das Rohmaterial für das Lernen. Seine Qualität, Größe und Repräsentativität bestimmen direkt die Qualität des Modells. Die KI lernt nur, was in den Daten enthalten ist.; mechanics
Einstellungen: Interne Zahlenwerte, die während des Trainings angepasst werden. Werden oft in Milliarden ausgedrückt.; Parameter (oder Gewichte) sind die internen Variablen eines Modells. Ein LLM mit 70 Milliarden Parametern speichert 70 Milliarden Gleitkommazahlen. Je mehr Parameter ein Modell hat, desto komplexere Muster kann es modellieren - aber es verbraucht auch mehr Speicher und Rechenleistung.; mechanics
Überlernen: Das Modell hat die Trainingsdaten zu gut gelernt und verallgemeinert schlecht.; Überlernen (Overfitting) tritt auf, wenn sich ein Modell Trainingsbeispiele merkt, anstatt allgemeine Regeln daraus zu extrahieren. Es schneidet bei den gesehenen Daten gut ab, versagt aber bei neuen Daten. Ein Zeichen für einen zu kleinen Datensatz oder ein zu komplexes Modell.; mechanicsrisks
Infragestellung: Die Verwendung des trainierten Modells, um eine Antwort zu produzieren. Kontinuierliche Kosten.; Inferenz ist die operative Phase: Man unterzieht dem Modell eine Eingabe und erhält eine Ausgabe. Im Gegensatz zum Training (einmalige Kosten) findet die Inferenz bei jeder Abfrage statt und verursacht je nach Umfang der Nutzung variable Kosten.; mechanicseconomics
Token: Einheit der Textzerlegung für einen LLM. Etwa 3/4 eines englischen Wortes.; Ein Token ist die Verarbeitungseinheit eines Sprachmodells. Texte werden vor der Verarbeitung in Token aufgeteilt. Die Preise für APIs werden pro Token (Eingabe + Ausgabe) berechnet. 1 000 Token ≈ 750 Wörter in Englisch, etwas weniger in Französisch.; mechanicseconomics
LLM: Großes Sprachmodell: GPT-4, Claude, Llama, Mistral... Sagt das nächste wahrscheinliche Token voraus.; Ein Large Language Model (großes Sprachmodell) ist ein neuronales Netz, das mit riesigen Textkorpora trainiert wird, um das nächste Token vorherzusagen. GPT-4, Claude, Llama und Mistral sind Beispiele dafür. Es handelt sich um statistische Vervollständigungssysteme, nicht um verstehende Intelligenzen.; mechanics
Einbetten: Numerische Darstellung eines Textes in einem Vektorraum.; Ein Embedding ist die Umwandlung eines Textes (Wort, Satz, Dokument) in einen digitalen Vektor. Semantisch verwandte Texte haben verwandte Vektoren. Embeddings sind das Herzstück von semantischen Suchmaschinen und RAG-Systemen.; mechanics
Vektorisierung: Der Prozess der Umwandlung von Daten in digitale Vektoren.; Die Vektorisierung wandelt unstrukturierte Daten (Text, Bilder, Töne) in mathematisch manipulierbare digitale Darstellungen um. Grundlegend für die semantische Suche, den Ähnlichkeitsvergleich und Empfehlungssysteme.; mechanics
RAG: Retrieval-Augmented Generation: Man sucht nach Dokumenten, gibt sie der LLM zur Beantwortung.; RAG (Retrieval-Augmented Generation) kombiniert eine Vektor-Suchmaschine mit einer LLM. Anstatt alles in den Kontext zu setzen, werden die relevanten Passagen on the fly abgerufen. Reduziert Halluzinationen bei spezialisierten Korpora, eliminiert sie aber nicht.; mechanicsusage
Fine-tuning: Zusätzliches Training eines bestehenden Modells auf bestimmte Daten.; Beim Fine-Tuning wird ein vortrainiertes Modell übernommen und das Training mit einem gezielteren Datensatz (Bereich, Stil, Format) fortgesetzt. Weniger kostspielig als ein vollständiges Training, aber teurer als Prompting. Nur relevant, wenn das Format oder Vokabular nicht durch Prompting erfasst werden kann.; mechanicseconomics
Halluzination: Die Vorlage behauptet etwas Falsches mit Zuversicht. Eigentum durch Design, kein Fehler, der korrigiert werden muss.; Eine Halluzination ist eine faktisch inkorrekte Ausgabe, die von einem Modell souverän produziert wird. Sie ist kein Bug: Sie ist eine direkte Folge der Funktionsweise durch Vorhersagen. Das Modell erzeugt das, was statistisch wahrscheinlich ist, nicht das, was wahr ist. Sie wird auch mit den nächsten Versionen nicht verschwinden.; mechanicsrisks
Agent: Ein LLM, der Werkzeuge einsetzen und Handlungen verknüpfen kann.; Ein KI-Agent ist ein System, das mithilfe einer LLM entscheidet, welche Aktionen (API-Aufruf, Websuche, Schreiben von Dateien) durchgeführt werden sollen, und diese dann nacheinander ausführt. Nützlich, um komplexe Aufgaben zu automatisieren, verstärkt aber auch die Fehleranfälligkeit: Halluzinationen verbreiten sich in der Handlungskette.; mechanicsrisks
Argumentation (Reasoning): Was in neueren Modellen als "thinking" bezeichnet wird: inszenierte Vervollständigung, nicht Denken.; Die "reasoning"-Muster (o1, o3, R1 ...) erzeugen vor der endgültigen Antwort eine Kette von Zwischen-Tokens. Dies ist eine weiterentwickelte Vervollständigungstechnik, kein Reasoning im menschlichen Sinne. Das Modell hat keine interne Repräsentation der Welt: Es generiert bei jedem Schritt wahrscheinlichen Text.; mechanicsreality
GPU: Massiv paralleler Grafikprozessor. Die grundlegende Hardware zum Trainieren und Inferieren von KI-Modellen.; Ein Grafikprozessor (Graphics Processing Unit, GPU) führt Tausende von Operationen parallel aus und eignet sich daher für rechenintensive Matrixberechnungen beim maschinellen Lernen. NVIDIA H100/A100 Grafikprozessoren dominieren den KI-Markt. Chronische Knappheit seit 2022.; mechanicssovereignty
APU: Prozessor, der CPU und GPU auf demselben Chip integriert. Ermöglicht es, Modelle lokal laufen zu lassen.; Eine APU (Accelerated Processing Unit) vereint CPU und GPU auf demselben Die. Beispiele dafür sind die Apple Silicon (M-Serie) und AMD Ryzen AI. Sie ermöglichen es, Modelle mit 7 bis 30 Milliarden Parametern lokal laufen zu lassen, und das bei einem angemessenen Stromverbrauch.; mechanicssovereignty
On-Premise: Die Infrastruktur läuft auf Ihrem Gelände und unter Ihrer Kontrolle.; On-Prem (oder On-Prem) bezeichnet einen IT-Einsatz in der eigenen Infrastruktur einer Organisation, im Gegensatz zur Cloud. Für die KI bedeutet dies, dass man GPU/APU-Hardware besitzen oder mieten muss. Einzige Option, um sicherzustellen, dass die Daten den Perimeter nicht verlassen.; sovereignty
open weights: Die Gewichte des Modells sind öffentlich, aber nicht unbedingt der Trainingscode oder die Daten.; Ein Open-Weights-Modell (Llama, Mistral, DeepSeek...) veröffentlicht seine Gewichte, sodass man es herunterladen und lokal laufen lassen kann. Das ist NICHT das Gleiche wie Open Source: Der Trainingscode und die Daten können proprietär bleiben. Die Grenze zählt: Einige "Open"-Modelle verbieten die kommerzielle Nutzung.; sovereignty
Open Source: Code, Daten und Gewichte sind öffentlich und frei wiederverwendbar.; Streng genommen veröffentlicht ein echtes Open-Source-KI-Modell den Trainingscode, die Trainingsdaten UND die Gewichte. Nur sehr wenige Modelle erreichen dieses Niveau. Die Mehrheit der als "open" bezeichneten Modelle sind in Wirklichkeit nur open weights.; sovereignty
Souveränität: Fähigkeit, ihre KI-Tools ohne kritische Abhängigkeit von Dritten zu beherrschen.; Digitale Souveränität über KI bezeichnet die Fähigkeit einer Organisation (oder eines Staates), ihre KI-Systeme zu kontrollieren: Zugang zu Daten, Modellen, Infrastruktur. Sie bedeutet nicht, alles selbst zu bauen, sondern keine unzumutbaren Abhängigkeiten von dritten Akteuren zu schaffen.; sovereignty
Schrägstrich: Systematischer Fehler in den Ausgaben eines Modells, der von den Daten oder dem Design vererbt wird.; Ein Bias in einem KI-Modell ist eine systematische Tendenz, falsche oder diskriminierende Ergebnisse für bestimmte Gruppen oder Kontexte zu produzieren. Er kann von den Trainingsdaten, der Architektur oder dem Abgleichsprozess herrühren. Sie kann nicht vollständig eliminiert, sondern nur reduziert und dokumentiert werden.; risks