Glossario IA

Termini IA, senza gergo inutile.

Algoritmo: Una sequenza di istruzioni formali per risolvere un problema. Precede l'IA e rimane onnipresente anche senza di essa.; Un algoritmo è una sequenza finita e non ambigua di istruzioni per risolvere un problema. La maggior parte dei sistemi che si utilizzano quotidianamente (ordinamento, ricerca, semplici raccomandazioni) si basano su algoritmi deterministici, non sull'intelligenza artificiale nel senso dell'apprendimento automatico.; mechanics
Apprendimento automatico: Il computer impara dagli esempi, senza regole codificate.; L'apprendimento automatico è un sottocampo dell'IA in cui il sistema infonde regole dai dati, piuttosto che seguire istruzioni esplicite. Comprende regressione, classificazione, clustering, ecc.; mechanics
Apprendimento profondo: Apprendimento automatico con reti neurali profonde (multistrato).; L'apprendimento profondo utilizza reti neurali artificiali con diversi strati nascosti. Ha portato a recenti progressi nel riconoscimento delle immagini, nel riconoscimento vocale e nella traduzione automatica.; mechanics
Rete neurale: Architettura informatica ispirata (molto vagamente) al cervello biologico.; Una rete neurale artificiale è un grafo di nodi (neuroni) organizzati in strati, che trasformano un input in un output attraverso parametri (pesi) regolati durante l'addestramento. L'analogia con il cervello è utile da un punto di vista pedagogico, ma fuorviante da un punto di vista sostanziale: non c'è coscienza, non c'è comprensione.; mechanics
Modello: Un programma addestrato sui dati per produrre un risultato. Non è intelligenza.; Nel contesto dell'IA, un modello è il risultato di un addestramento su un insieme di dati. Codifica le correlazioni statistiche. GPT-4, Mistral e Llama sono modelli. Producono risultati plausibili, non ragionamenti.; mechanics
Formazione: Fase in cui il modello apprende dai dati. Richiede tempo, è costosa e deve essere eseguita solo una volta (o raramente).; L'addestramento consiste nel regolare i parametri (pesi) di una rete neurale per ridurre al minimo l'errore su un set di dati. Per i modelli linguistici di grandi dimensioni, questa operazione può coinvolgere migliaia di GPU per settimane e settimane e costare decine di milioni di dollari.; mechanicseconomics
Set di dati: L'insieme di esempi su cui viene addestrato il modello.; Un set di dati è la materia prima per l'apprendimento. La sua qualità, dimensione e rappresentatività determinano direttamente la qualità del modello. L'intelligenza artificiale impara solo ciò che è presente nei dati.; mechanics
Parametri: Valori numerici interni regolati durante l'addestramento. Spesso espressi in miliardi.; I parametri (o pesi) sono le variabili interne di un modello. Un LLM con 70 miliardi di parametri memorizza 70 miliardi di numeri in virgola mobile. Più parametri ha un modello, più complessi sono i modelli che può modellare, ma più memoria e calcoli consuma.; mechanics
Sovrapprendimento: Il modello ha appreso troppo bene i dati di addestramento e generalizza in modo errato.; L'overfitting si verifica quando un modello memorizza gli esempi di addestramento anziché estrarne le regole generali. Il modello funziona bene con i dati che ha visto, ma fallisce con i nuovi dati. Questo è un segno che il set di dati è troppo piccolo o che il modello è troppo complesso.; mechanicsrisks
Inferenza: Utilizzo del modello addestrato per produrre una risposta. Costo continuo.; L'inferenza è la fase operativa: si sottopone un input al modello e si ottiene un output. A differenza dell'addestramento (un costo una tantum), l'inferenza avviene a ogni richiesta e genera costi variabili in base al volume di utilizzo.; mechanicseconomics
token: Unità di suddivisione del testo per un LLM. Circa 3/4 di una parola inglese.; Un token è l'unità di elaborazione di un modello linguistico. I testi vengono scomposti in token prima di essere elaborati. I prezzi API sono calcolati per token (input + output). 1.000 token ≈ 750 parole in inglese, un po' meno in francese.; mechanicseconomics
LLM: Modello linguistico di grandi dimensioni: GPT-4, Claude, Llama, Mistral... Prevede il prossimo token probabile.; Un Large Language Model è una rete neurale addestrata su enormi corpora di testo per prevedere il token successivo. GPT-4, Claude, Llama e Mistral ne sono un esempio. Si tratta di sistemi di completamento statistico, non di intelligenze che capiscono.; mechanics
Incorporazione: Rappresentazione numerica di un testo in uno spazio vettoriale.; Un embedding è la conversione di un testo (parola, frase, documento) in un vettore digitale. Testi semanticamente simili hanno vettori simili. Gli embedding sono alla base dei motori di ricerca semantici e dei sistemi RAG.; mechanics
Vettorizzazione: Il processo di conversione dei dati in vettori digitali.; Il vettoriale trasforma i dati non strutturati (testo, immagini, suoni) in rappresentazioni digitali matematicamente manipolabili. È fondamentale per la ricerca semantica, il confronto di similarità e i sistemi di raccomandazione.; mechanics
RAG: Generazione aumentata: cerchiamo i documenti e li forniamo al LLM in modo che possa rispondere.; RAG (Retrieval-Augmented Generation) combina un motore di ricerca vettoriale con un LLM. Invece di inserire tutto nel contesto, i passaggi rilevanti vengono recuperati al volo. Riduce le allucinazioni sui corpora specializzati, ma non le elimina.; mechanicsusage
fine-tuning: Formazione complementare di un modello esistente su dati specifici.; La messa a punto consiste nel prendere un modello pre-addestrato e continuare l'addestramento su un set di dati più mirato (dominio, stile, formato). È meno costoso dell'addestramento completo, ma più costoso del prompt. È rilevante solo se il formato o il vocabolario non possono essere catturati da un prompt.; mechanicseconomics
Allucinazione: Il modello afferma qualcosa di falso con sicurezza. Proprietà progettuale, nessun bug da correggere.; Un'allucinazione è un risultato di fatto errato prodotto con disinvoltura da un modello. Non è un bug: è una conseguenza diretta della modalità di funzionamento predittiva. Il modello genera ciò che è statisticamente probabile, non ciò che è vero. Non scomparirà con le versioni future.; mechanicsrisks
Agente: Un LLM che sappia utilizzare gli strumenti e collegare le azioni tra loro.; Un agente di intelligenza artificiale è un sistema che utilizza un LLM per decidere quali azioni eseguire (chiamare un'API, cercare sul web, scrivere file) e le esegue in sequenza. Questo è utile per automatizzare compiti complessi, ma aumenta anche il rischio di errore: le allucinazioni si diffondono lungo la catena di azioni.; mechanicsrisks
Ragionamento: Quello che i modelli più recenti chiamano "pensiero": completamento a tappe, non pensiero.; I modelli di ragionamento (o1, o3, R1...) generano una catena di token intermedi prima della risposta finale. Si tratta di una tecnica di completamento più sviluppata, non di un ragionamento in senso umano. Il modello non ha una rappresentazione interna del mondo: genera un testo plausibile in ogni fase.; mechanicsreality
GPU: Processore grafico massicciamente parallelo. L'hardware di base per l'addestramento e l'inferenza dei modelli di intelligenza artificiale.; Una GPU (Graphics Processing Unit) esegue migliaia di operazioni in parallelo, rendendola adatta a calcoli matriciali intensivi nell'apprendimento automatico. Le GPU NVIDIA H100/A100 dominano il mercato dell'AI. Carenza cronica dal 2022.; mechanicssovereignty
APU: Processore che integra CPU e GPU sullo stesso chip. Consente l'esecuzione di modelli in locale.; Un'APU (Accelerated Processing Unit) combina CPU e GPU sullo stesso die. L'Apple Silicon (serie M) e l'AMD Ryzen AI ne sono un esempio. Consentono di eseguire localmente modelli con 7-30 miliardi di parametri, con un consumo energetico ragionevole.; mechanicssovereignty
on-premise: L'infrastruttura viene eseguita presso la vostra sede, sotto il vostro controllo.; Per "on-premise" si intende l'implementazione dell'IT all'interno dell'infrastruttura di un'organizzazione, in contrapposizione al cloud. Per l'IA, ciò significa possedere o noleggiare hardware GPU/APU. Questa è l'unica opzione per garantire che i dati non escano dal perimetro.; sovereignty
open weights: I pesi del modello sono pubblici, ma non necessariamente il codice di addestramento o i dati.; Un modello a pesi aperti (Llama, Mistral, DeepSeek...) pubblica i suoi pesi, consentendo di scaricarlo ed eseguirlo localmente. Non è la stessa cosa dell'open source: il codice di addestramento e i dati possono rimanere proprietari. I limiti sono importanti: alcuni modelli "aperti" vietano l'uso commerciale.; sovereignty
open source: Codice, dati e pesi sono pubblici e liberamente riutilizzabili.; In senso stretto, un modello di intelligenza artificiale veramente open source pubblica il codice di addestramento, i dati di addestramento e i pesi. Pochissimi modelli raggiungono questo livello. La maggior parte dei modelli cosiddetti "aperti" sono in realtà solo pesi aperti.; sovereignty
Sovranità: Capacità di padroneggiare i propri strumenti di intelligenza artificiale senza dipendere in modo critico da terzi.; La sovranità digitale sull'IA si riferisce alla capacità di un'organizzazione (o di uno Stato) di controllare i propri sistemi di IA: accesso a dati, modelli e infrastrutture. Non significa costruire tutto da soli, ma piuttosto evitare di creare dipendenze inaccettabili da terzi.; sovereignty
Pregiudizio: Errore sistematico nell'output di un modello, ereditato dai dati o dalla progettazione.; Un bias in un modello di intelligenza artificiale è una tendenza sistematica a produrre risultati errati o discriminatori per determinati gruppi o contesti. Può derivare dai dati di addestramento, dall'architettura o dal processo di allineamento. Non può essere completamente eliminato, ma solo ridotto e documentato.; risks