Build / Buy / API: la decisione che nessuno pone correttamente

La domanda sbagliata è “quale IA scegliere”. Quella giusta è “chi controlla l’inferenza”. Tre famiglie di arbitrati, che non hanno gli stessi giocatori alla fine, gli stessi impegni contrattuali e la stessa esposizione normativa di diciotto mesi.

L’API proprietaria di un giocatore americano

Si chiama un’API. Si paga per token. Non dovete preoccuparvi dell’infrastruttura, della manutenzione del modello o degli aggiornamenti.

In pratica, ciò significa che esternalizzate il livello di intelligenza dei vostri processi a un operatore americano. Non avete alcun controllo sulle modifiche dei modelli, sui prezzi, sulla disponibilità o sulle politiche di utilizzo. Avete uno SLA contrattuale, ma se OpenAI cambia la sua politica di formazione dei dati o i suoi prezzi, voi vi adattate o cambiate.

Quando è opportuno: prototipazione rapida, uso non critico, dati non sensibili, assenza di vincoli normativi sull’ubicazione. Il budget Opex è preferibile al capex.

Il rischio sottovalutato: la dipendenza dai fornitori. La migrazione da un modello all’altro è fattibile, ma costa. L’ingegneria tempestiva sviluppata per il GPT-4 non può essere trasferita in modo identico a Claude o a Llama. Esiste un vero e proprio debito di migrazione.

Una soluzione verticale acquistata da un editore di terze parti

Acquistate una soluzione da un editore che ha realizzato un’applicazione AI per il vostro settore: CRM con AI integrata, strumento di generazione legale, assistente di assistenza clienti.

In pratica, si tratta quasi sempre di un wrapper API (GPT, Claude o altro) con un livello applicativo. Il valore aggiunto sta nell’interfaccia, nel prompt del sistema ed eventualmente nella messa a punto dei dati specifici del settore.

Quando è appropriato: non ci sono risorse tecniche interne, la soluzione copre esattamente il vostro caso d’uso e la dipendenza dal fornitore è accettabile.

Quello che la gente dimentica di guardare: avete una doppia dipendenza. Dall’editore della soluzione. E dal modello sottostante. Se l’editore scompare, cambia modello o modifica i prezzi, la vostra capacità di migrare è limitata dalla realtà dei contratti che avete firmato.

Il modello dei pesi aperti sulla propria infrastruttura

Si distribuisce un modello a pesi aperti (Llama 3, Mistral, Mixtral, Qwen, ecc.) sulla propria infrastruttura. Controllate l’inferenza, i dati e le versioni.

Cosa richiede: costi capex dell’infrastruttura (GPU/APU) o cloud GPU, più competenze MLOps interne. Le prestazioni sono inferiori ai modelli di frontiera proprietari su compiti generici, ma spesso paragonabili su compiti specializzati dopo la messa a punto.

Quando è opportuno: dati sensibili, vincoli normativi (RGPD, segreto industriale, segreto della difesa), elevati volumi di inferenze che rendono redditizio il capex, desiderio di controllo a lungo termine.

Costo: un server con 2 GPU H100 per dedurre un modello di 70 miliardi di parametri costa da 50 a 70.000 euro. L’ammortamento in 3 anni può essere inferiore ai costi equivalenti delle API se il volume è sufficiente.

La variabile mancante: la sovranità

La maggior parte dei confronti tra build/buy/api si ferma ai costi. Dimenticano la questione della sovranità.

Se la vostra differenziazione competitiva si basa sui vostri dati proprietari, l’invio di questi dati a un’API di terzi per la messa a punto (anche con una garanzia contrattuale di non riutilizzo) crea un rischio che dovete valutare consapevolmente. La dipendenza critica da un’API statunitense crea anche un’esposizione a decisioni normative (controlli sulle esportazioni, restrizioni settoriali), guasti e cambiamenti di politica. Questo rischio ha una bassa probabilità, ma un impatto potenzialmente elevato.

Il RGPD, gli obblighi della legge sull’AI e le normative specifiche del settore (sanità, finanza) possono imporre vincoli sulla localizzazione e sul trattamento dei dati che rendono non conformi alcune architetture API.

L’arbitrato giusto

Il giusto compromesso non è una risposta, ma una griglia. Sensibilità dei dati, volume di inferenza, risorse interne, tolleranza alla dipendenza, esposizione normativa a 36 mesi. Non ci sono due aziende che rispondono a tutte e cinque le dimensioni allo stesso modo. Una cosa è costante: scegliere l’API più conosciuta perché è quella di cui parla il vostro fornitore, senza aver esaminato l’opzione dei pesi aperti sulla vostra infrastruttura, significa che non avete preso una decisione. Avete lasciato che qualcun altro la prendesse per voi.

L’API proprietaria di un giocatore americano#

Una soluzione verticale acquistata da un editore di terze parti#

Il modello dei pesi aperti sulla propria infrastruttura#

La variabile mancante: la sovranità#

L’arbitrato giusto#

Sullo stesso tema

Il vero costo di un progetto IA: quello che il preventivo non mostra

L’API proprietaria di un giocatore americano

Una soluzione verticale acquistata da un editore di terze parti

Il modello dei pesi aperti sulla propria infrastruttura

La variabile mancante: la sovranità

L’arbitrato giusto