Le prototype impressionne. Les tokens ne se voient pas. Les erreurs restent rares. Puis vient la mise en production, et la facture change de nature. Klarna l'a appris à ses dépens en 2025.
Souvent, un regex, une règle métier ou un tri suffit. L'IA est parfois vendue comme réponse universelle à des problèmes qui ont des solutions plus simples, plus fiables, moins chères. Tour d'horizon des cas où le marché vous vend ce dont vous n'avez pas besoin.
Construire son propre modèle, acheter une solution verticale, ou utiliser une API : trois stratégies avec des profils de risque, de coût et de souveraineté radicalement différents. L'angle souveraineté change souvent la décision.
Pas toutes les décisions de déploiement IA ne méritent un projet de 6 mois. Trois questions permettent de filtrer les cas d'usage pertinents des cas d'usage marketing en moins de 30 minutes.
Le devis d'intégration IA ne montre que la surface. En dessous : les coûts de tokens en production, l'infrastructure, la préparation des données, la maintenance des prompts, la relecture humaine, et la dette technique. La vraie TCO est souvent 3 à 5 fois le budget initial.
Chaque éditeur a désormais une offre 'IA'. La majorité sont des wrappers d'API avec un logo ChatGPT dessus, vendus à prix de solution sur-mesure. Guide pour lire un pitch IA sans se laisser impressionner par la démo.
Quand vous utilisez une API IA, où vont vos données ? Sont-elles utilisées pour entraîner les modèles ? Que dit le RGPD ? Ce que l'AI Act change. Les questions que votre DPO devrait poser avant tout déploiement.
L'IA suit le même cycle que les dotcoms, l'impression 3D, la blockchain et le métavers. La courbe de Gartner est prédictive. Savoir où vous êtes sur cette courbe est la première compétence d'un dirigeant face à une technologie émergente.
Un LLM affirme avec la même confiance une vérité et une invention. Ce n'est pas un défaut de la version actuelle que la prochaine corrigera. C'est une conséquence structurelle du fonctionnement par prédiction. Voici ce que ça implique en production.
Vision par ordinateur, systèmes de recommandation, détection de fraude, prédiction de pannes : l'IA n'a pas commencé avec ChatGPT. Elle tourne depuis des années dans des infrastructures que vous utilisez au quotidien.
Llama vs GPT, Mistral vs Claude, open weights vs API : la distinction n'est pas idéologique, elle est stratégique. Comprendre ce que vous contrôlez vraiment dans chaque cas.
o1, o3, DeepSeek-R1, Gemini Thinking : une nouvelle génération de modèles vend sa capacité à 'réfléchir'. Les benchmarks s'améliorent vraiment. Mais appeler ça du raisonnement, c'est choisir un mot qui fait vendre plus qu'il ne décrit.
Pas besoin d'un datacenter pour faire tourner un LLM local. Un serveur avec un GPU consommateur ou même un Mac M-series peut héberger des modèles de 7 à 70 milliards de paramètres. Ce qui est possible, ce qui ne l'est pas, et pourquoi ça compte.
Tokens, contexte, température, hallucination par conception : comprendre comment fonctionne un grand modèle de langage sans un seul symbole mathématique. Pour décider quoi lui confier et quoi ne pas lui confier.
ChatGPT a mis l'IA sur la carte en novembre 2022. Mais les fondations ont 70 ans. Comprendre la généalogie, c'est comprendre pourquoi un LLM a besoin d'une base pour apprendre et pourquoi le miracle n'est pas apparu de nulle part.