// TOM'S HARDWARE ITALIA — INTELLIGENZA ARTIFICIALE

I token AI ormai stanno costando quasi quanto pagare le persone

Published: 06/26/2026, 02:18 PM

I token AI stanno diventando una voce di costo comparabile al personale. Non è un'iperbole: è la previsione di Gartner, che ha calcolato che entro il 2028 le spese per i token AI supereranno lo stipendio medio di un singolo sviluppatore nei team tech più integrati — circa 2.000 dollari al mese come soglia di riferimento. Il problema non è il costo assoluto dei token, che continua a scendere per singola unità: è il volume di consumo che cresce più velocemente della riduzione dei prezzi, spinto dall'adozione degli agenti AI che consumano ordini di grandezza in più rispetto ai chatbot standard. I dati attuali che Gartner raccoglie mostrano che la situazione non è futura: è già in corso per una quota significativa del mercato. La tokenpocalypse — il termine che il settore usa per il momento in cui i costi dei token superano il valore prodotto — non è più una proiezione: è già la realtà operativa di una parte crescente delle aziende. Il 23% dei responsabili tecnici intervistati spende già tra 200 e 500 dollari al mese per sviluppatore in token AI. Il 6% supera già i 2.000 dollari mensili per sviluppatore — oltre lo stipendio medio globale di un junior developer, senza che questo produca necessariamente un output proporzionale di valore. Il caso estremo documentato da Gartner è quello di OpenClaw, startup che ha speso 1,3 milioni di dollari in un singolo mese per token AI, cifra che supera di un ordine di grandezza il costo mensile dell'intero team di sviluppo. Come analizza anche CIO Dive, questa dinamica è destinata ad accelerare con la transizione ai modelli a consumo. Il passaggio dai chatbot agli agenti AI non è un incremento lineare del consumo di token: è un salto di ordine di grandezza. Un chatbot consuma token per generare una risposta singola a una domanda singola. Un agente consuma token per ogni passaggio del ragionamento, per ogni chiamata agli strumenti esterni, per ogni verifica dei risultati, per ogni iterazione nella catena di task che compone un workflow complesso. Il consumo medio per interazione agentica è 1.000 volte superiore a quello di una chat semplice, secondo le analisi che Gartner ha condotto sui pattern di utilizzo delle aziende enterprise. Nitish Tyagi, analista Gartner, ha sintetizzato il punto con precisione: "La disciplina sui token non emergerà spontaneamente dalla scelta dei developer." È un'affermazione che va contro la narrativa prevalente sull'adozione AI, in cui ogni decisione tecnica viene presentata come razionale per default. La realtà documentata da Gartner è diversa: i developer scelgono il modello più potente disponibile anche quando un modello più piccolo sarebbe sufficiente per il task, consumano token in prototyping che non viene mai deprovisionato correttamente, e usano context window enormi anche per query che potrebbero essere soddisfatte con un frammento di contesto molto più piccolo. Il problema è strutturale: senza visibilità sui costi a livello di singola query o di singolo workflow, i developer non hanno il feedback necessario per ottimizzare il consumo. Pagare i token con carta di credito aziendale senza una breakdown granulare per task o per team produce esattamente il comportamento che Accenture, Uber e Amazon hanno già documentato: consumo che esplode fino a quando la bolletta non diventa abbastanza grande da attirare l'attenzione del CFO. Gartner ha identificato tre categorie principali di spreco nel consumo di token enterprise. La prima è il context bloat: sistemi che passano l'intera storia della conversazione, o l'intero documento, a ogni chiamata al modello — anche quando solo una piccola parte del contesto è rilevante per la query specifica. Context engineering — la disciplina di selezionare e comprimere il contesto rilevante invece di passare tutto — può ridurre il consumo di token del 60-80% su workflow standard, senza degradazione apprezzabile della qualità dell'output. La seconda è l'assenza di task routing: usare il modello più potente disponibile — tipicam