Lexique IA

Les termes de l'IA, sans le jargon inutile.

Algorithme: Suite d'instructions formelles pour résoudre un problème. Précède l'IA et reste omniprésent sans elle.; Un algorithme est une séquence finie et non ambiguë d'instructions permettant de résoudre un problème. La plupart des systèmes que vous utilisez au quotidien (tri, recherche, recommandation simple) reposent sur des algorithmes déterministes, pas sur de l'IA au sens machine learning.; mechanics
Machine learning: L'ordinateur apprend à partir d'exemples, sans règles codées en dur.; Le machine learning (apprentissage automatique) est un sous-domaine de l'IA où le système déduit des règles à partir de données, plutôt que de suivre des instructions explicites. Il comprend la régression, la classification, le clustering, etc.; mechanics
Deep learning: Machine learning avec des réseaux de neurones profonds (multi-couches).; Le deep learning utilise des réseaux de neurones artificiels à plusieurs couches cachées. Il a permis les percées récentes en reconnaissance d'image, de parole et en traduction automatique.; mechanics
Réseau de neurones: Architecture de calcul inspirée (très vaguement) du cerveau biologique.; Un réseau de neurones artificiel est un graphe de nœuds (neurones) organisés en couches, qui transforment une entrée en sortie via des paramètres (poids) ajustés pendant l'entraînement. L'analogie avec le cerveau est utile pédagogiquement mais trompeuse sur le fond : il n'y a pas de conscience, pas de compréhension.; mechanics
Modèle: Un programme entraîné sur des données pour produire une sortie. Ce n'est pas une intelligence.; Dans le contexte de l'IA, un modèle est le résultat d'un entraînement sur un jeu de données. Il encode des corrélations statistiques. GPT-4, Mistral, Llama sont des modèles. Ils produisent des sorties vraisemblables, pas des raisonnements.; mechanics
Entraînement: Phase pendant laquelle le modèle apprend à partir de données. Long, coûteux, à faire une seule fois (ou rarement).; L'entraînement consiste à ajuster les paramètres (poids) d'un réseau de neurones pour minimiser l'erreur sur un jeu de données. Pour les grands modèles de langage, cela peut mobiliser des milliers de GPU pendant des semaines et coûter des dizaines de millions de dollars.; mechanicseconomics
Jeu de données: La collection d'exemples sur laquelle le modèle s'entraîne.; Un jeu de données (dataset) est la matière première de l'apprentissage. Sa qualité, sa taille et sa représentativité déterminent directement la qualité du modèle. L'IA n'apprend que ce qui est dans les données.; mechanics
Paramètres: Les valeurs numériques internes ajustées pendant l'entraînement. Souvent exprimés en milliards.; Les paramètres (ou poids) sont les variables internes d'un modèle. Un LLM de 70 milliards de paramètres stocke 70 milliards de nombres à virgule flottante. Plus un modèle a de paramètres, plus il peut modéliser des patterns complexes — mais plus il consomme de mémoire et de calcul.; mechanics
Surapprentissage: Le modèle a trop bien appris les données d'entraînement, et généralise mal.; Le surapprentissage (overfitting) se produit quand un modèle mémorise les exemples d'entraînement au lieu d'en extraire des règles générales. Il performe bien sur les données vues, mais échoue sur de nouvelles données. Signe d'un jeu de données trop petit ou d'un modèle trop complexe.; mechanicsrisks
Inférence: L'utilisation du modèle entraîné pour produire une réponse. Coût continu.; L'inférence est la phase opérationnelle : on soumet une entrée au modèle et on obtient une sortie. Contrairement à l'entraînement (coût ponctuel), l'inférence se produit à chaque requête et génère des coûts variables selon le volume d'utilisation.; mechanicseconomics
Token: Unité de découpage du texte pour un LLM. Environ 3/4 d'un mot anglais.; Un token est l'unité de traitement d'un modèle de langage. Les textes sont découpés en tokens avant d'être traités. Les prix des API sont facturés par token (entrée + sortie). 1 000 tokens ≈ 750 mots en anglais, un peu moins en français.; mechanicseconomics
LLM: Grand modèle de langage : GPT-4, Claude, Llama, Mistral... Prédit le prochain token probable.; Un Large Language Model (grand modèle de langage) est un réseau de neurones entraîné sur d'immenses corpus de texte pour prédire le token suivant. GPT-4, Claude, Llama, Mistral en sont des exemples. Ce sont des systèmes de complétion statistique, pas des intelligences qui comprennent.; mechanics
Embedding: Représentation numérique d'un texte dans un espace vectoriel.; Un embedding est la conversion d'un texte (mot, phrase, document) en un vecteur numérique. Des textes sémantiquement proches ont des vecteurs proches. Les embeddings sont au cœur des moteurs de recherche sémantique et des systèmes RAG.; mechanics
Vectorisation: Le processus de conversion de données en vecteurs numériques.; La vectorisation transforme des données non structurées (texte, images, sons) en représentations numériques manipulables mathématiquement. Fondamentale pour la recherche sémantique, la comparaison de similarité et les systèmes de recommandation.; mechanics
RAG: Retrieval-Augmented Generation : on cherche des documents, on les donne au LLM pour qu'il réponde.; RAG (Retrieval-Augmented Generation) combine un moteur de recherche vectorielle avec un LLM. Au lieu de tout mettre dans le contexte, on récupère les passages pertinents à la volée. Réduit les hallucinations sur des corpus spécialisés, mais ne les élimine pas.; mechanicsusage
Fine-tuning: Entraînement complémentaire d'un modèle existant sur des données spécifiques.; Le fine-tuning consiste à reprendre un modèle pré-entraîné et à continuer l'entraînement sur un jeu de données plus ciblé (domaine, style, format). Moins coûteux qu'un entraînement complet, mais plus coûteux que le prompting. Pertinent uniquement si le format ou le vocabulaire ne peut pas être capturé par un prompt.; mechanicseconomics
Hallucination: Le modèle affirme quelque chose de faux avec confiance. Propriété par conception, pas bug à corriger.; Une hallucination est une sortie factuellement incorrecte produite avec aplomb par un modèle. Ce n'est pas un bug : c'est une conséquence directe du mode de fonctionnement par prédiction. Le modèle génère ce qui est statistiquement probable, pas ce qui est vrai. Elle ne disparaîtra pas avec les prochaines versions.; mechanicsrisks
Agent: Un LLM qui peut utiliser des outils et enchaîner des actions.; Un agent IA est un système qui utilise un LLM pour décider des actions à effectuer (appel d'API, recherche web, écriture de fichiers) et les exécute en séquence. Utile pour automatiser des tâches complexes, mais amplifie aussi les risques d'erreur : les hallucinations se propagent dans la chaîne d'actions.; mechanicsrisks
Raisonnement (Reasoning): Ce que les modèles récents appellent « thinking » : de la complétion mise en scène, pas de la pensée.; Les modèles de "reasoning" (o1, o3, R1...) génèrent une chaîne de tokens intermédiaires avant la réponse finale. C'est une technique de complétion plus développée, pas un raisonnement au sens humain. Le modèle n'a pas de représentation interne du monde : il génère du texte vraisemblable à chaque étape.; mechanicsreality
GPU: Processeur graphique massivement parallèle. Le matériel de base pour entraîner et inférer des modèles IA.; Un GPU (Graphics Processing Unit) exécute des milliers d'opérations en parallèle, ce qui le rend adapté aux calculs matriciels intensifs du machine learning. Les GPU NVIDIA H100/A100 dominent le marché IA. Pénurie chronique depuis 2022.; mechanicssovereignty
APU: Processeur intégrant CPU et GPU sur la même puce. Permet de faire tourner des modèles localement.; Un APU (Accelerated Processing Unit) combine CPU et GPU sur le même die. Les Apple Silicon (M-series) et AMD Ryzen AI en sont des exemples. Ils permettent de faire tourner des modèles de 7 à 30 milliards de paramètres en local, avec une consommation électrique raisonnable.; mechanicssovereignty
On-premise: L'infrastructure tourne dans vos locaux, sous votre contrôle.; On-premise (ou on-prem) désigne un déploiement informatique dans l'infrastructure propre de l'organisation, par opposition au cloud. Pour l'IA, cela implique de posséder ou louer du matériel GPU/APU. Seule option pour garantir que les données ne quittent pas le périmètre.; sovereignty
Open weights: Les poids du modèle sont publics, mais pas forcément le code d'entraînement ni les données.; Un modèle open weights (Llama, Mistral, DeepSeek...) publie ses poids, permettant de le télécharger et de le faire tourner localement. Ce n'est PAS la même chose qu'open source : le code d'entraînement et les données peuvent rester propriétaires. La frontière compte : certains modèles « open » interdisent les usages commerciaux.; sovereignty
Open source: Code, données et poids sont publics et librement réutilisables.; Au sens strict, un modèle IA véritablement open source publie le code d'entraînement, les données d'entraînement ET les poids. Très peu de modèles atteignent ce niveau. La majorité des modèles dits « open » sont en réalité open weights seulement.; sovereignty
Souveraineté: Capacité à maîtriser ses outils IA sans dépendance critique à un tiers.; La souveraineté numérique sur l'IA désigne la capacité d'une organisation (ou d'un État) à contrôler ses systèmes IA : accès aux données, aux modèles, à l'infrastructure. Elle n'implique pas de tout construire soi-même, mais de ne pas créer de dépendances inacceptables vis-à-vis d'acteurs tiers.; sovereignty
Biais: Erreur systématique dans les sorties d'un modèle, héritée des données ou de la conception.; Un biais dans un modèle IA est une tendance systématique à produire des résultats incorrects ou discriminatoires pour certains groupes ou contextes. Il peut venir des données d'entraînement, de l'architecture ou du processus d'alignement. Il ne peut pas être entièrement éliminé, seulement réduit et documenté.; risks