// TOM'S HARDWARE ITALIA — INTELLIGENZA ARTIFICIALE

Chi affitta l'intelligenza e chi se la porta dentro: la divisione che ridisegnerà le aziende

Published: 06/23/2026, 06:05 AM

Il frame che organizza le decisioni infrastrutturali del 2026 è semplice: affittare intelligenza o possederla. Da un lato le aziende che dipendono dai grandi provider cloud per ogni inferenza, ogni chiamata API, ogni risposta dei propri sistemi AI. Dall'altro quelle che stanno riportando i modelli dentro i propri datacenter o direttamente sui margini della rete. La distinzione sembra tecnica. Non lo è. Per cinque anni il cloud-first ha dominato il dibattito sull'AI aziendale per ragioni comprensibili: accesso immediato ai modelli più potenti, zero investimento iniziale in hardware, scalabilità elastica per i picchi di calcolo. Tutto vero fino al 2024, quando i carichi di lavoro AI sono passati dalla sperimentazione alla produzione e le bollette cloud hanno cominciato a pesare nei bilanci. Il costo per milione di token, in un'organizzazione che usa l'AI in modo intensivo su processi core, non è una voce marginale. L'analisi del costo totale di possesso mette in crisi il presupposto che il cloud sia sempre più conveniente. Secondo i dati raccolti da Lenovo nel confronto TCO 2026, il costo per milione di token su infrastruttura on-premise può essere fino a 18 volte inferiore rispetto alle API dei grandi provider di modelli-come-servizio, nei carichi di lavoro ad alta frequenza d'uso. Il breakeven rispetto all'investimento in hardware si raggiunge in meno di quattro mesi per chi gestisce workload intensivi. Questi numeri non valgono per tutti. Un'azienda che usa l'AI sporadicamente, per task non critici, non ha motivo di investire in GPU proprie. Ma l'economia si ribalta non appena l'AI diventa infrastruttura di processo piuttosto che strumento occasionale. Quattro mesi di breakeven significano che già nel quinto mese si spende meno dell'alternativa cloud. Su tre anni, il risparmio complessivo è strutturale. Il mercato si sta già muovendo in questa direzione. IDC stima che entro il 2027 il 75% delle grandi organizzazioni adotterà architetture ibride, con una distribuzione tri-partita bilanciata tra cloud pubblico, cloud privato o on-premise, e dispositivi edge. Il 2026 segna la transizione da un modello a gravità cloud verso una distribuzione del carico di lavoro AI pensata in base alla natura del singolo workload. Chi fa questa transizione in ordine mantiene il controllo dell'architettura. Chi la subisce insegue i costi. La distinzione per tipo di carico di lavoro è netta. L'addestramento di modelli di grandi dimensioni e i picchi compute rimangono terreno cloud per ragioni strutturali: la richiesta di calcolo è discontinua, l'elasticità del cloud ha senso, comprare GPU ferme nove mesi su dodici per coprire i picchi è inefficiente. L'inferenza in produzione su dati operativi interni, invece, cambia la matematica. Qui il volume è costante, il dato è sensibile, la latenza conta. I settori regolamentati hanno capito prima degli altri che mandare dati su API cloud è un problema di governance, non solo di costo. Banche, ospedali, studi legali: i dati operativi non possono lasciare il perimetro aziendale senza generare rischi di conformità che nessun accordo contrattuale con un provider cloud elimina davvero. GDPR, direttive settoriali, audit interni: il dato che esce è un dato esposto. Questo ha spinto molte organizzazioni a riconsiderare l'ipotesi on-premise non come un passo indietro tecnologico, ma come scelta di sovranità. C'è però un secondo problema, meno discusso ma altrettanto rilevante: il lock-in da modello. Chi costruisce applicazioni business sopra le API di un grande provider cloud dipende dal comportamento specifico di quella versione del modello. Gli aggiornamenti unilaterali dei modelli, frequenti e spesso non comunicati con anticipo sufficiente, cambiano il comportamento dell'applicazione senza preavviso. Un sistema di classificazione documenti calibrato su GPT-4o di marzo si comporta in modo diverso con GPT-4o di settembre. La dipendenza dall'API diventa dipendenza dal capriccio del fornitore. Nutanix definis