// TOM'S HARDWARE ITALIA — INTELLIGENZA ARTIFICIALE

NVIDIA prepara il suo stack al boom degli agenti AI

Published: 06/18/2026, 01:54 PM

NVIDIA sta rafforzando il proprio stack hardware e software per affrontare la crescita degli agenti AI, una categoria di sistemi che non si limita a rispondere a una richiesta, ma pianifica attività, genera sotto-compiti e coordina più processi in parallelo. Il punto non è soltanto avere chip più potenti: quando gli agenti lavorano tra loro, il volume di dati processati aumenta rapidamente e mette sotto pressione tutta la catena, dall'inferenza al software di orchestrazione. Al centro di questa fase c'è Kari Briski, vicepresidente per i prodotti software di intelligenza artificiale generativa, che coordina il lavoro sulle componenti necessarie a gestire meglio i token prodotti e consumati dai modelli. Ogni richiesta, risposta, ragionamento intermedio o passaggio tra agenti diventa carico computazionale, e in scenari multi-agente il numero di operazioni può crescere in modo molto meno lineare rispetto alle classiche chatbot. La strategia conferma perché NVIDIA continui a difendere il proprio vantaggio non solo con nuove schede, ma con un ecosistema completo. CUDA resta una delle leve principali: permette agli sviluppatori di controllare in modo fine come i carichi AI vengono distribuiti sulle GPU, riducendo sprechi e colli di bottiglia. Per gli agenti, però, l'ottimizzazione deve salire di livello e coinvolgere anche librerie, runtime, modelli e strumenti di deployment. Il messaggio è chiaro: la corsa all'AI agentica non si vincerà soltanto con più transistor. NVIDIA sta spingendo una logica full-stack AI, che parte dal silicio e arriva fino alle architetture di riferimento per costruire applicazioni agentiche. Questi schemi servono a dare agli sviluppatori una base tecnica già ottimizzata, invece di lasciare ogni azienda a risolvere da zero problemi di latenza, scalabilità e gestione del contesto. La stessa impostazione si vede anche nel mondo consumer e gaming, dove l'azienda sta portando l'AI dentro flussi di lavoro sempre più concreti: non è un caso che l'arrivo degli agenti AI in RTX Remix segua la medesima direzione, cioè usare modelli e strumenti automatizzati per ridurre attività complesse e ripetitive. Nel data center, però, la posta in gioco è più alta, perché ogni miglioramento può tradursi in minori costi operativi e maggiore capacità disponibile. Per NVIDIA, sviluppare internamente modelli e sistemi AI non serve solo a entrare in competizione con chi vende chatbot o abbonamenti enterprise. Serve soprattutto a capire in anticipo quali carichi arriveranno sui futuri data center AI e quali caratteristiche dovranno avere chip, memoria, interconnessioni e software. Restare vicini alla ricerca sui modelli consente di progettare piattaforme che non inseguano il mercato, ma lo anticipino. Il passaggio agli agenti rende quindi più evidente il vantaggio competitivo dell'azienda: non basta comprare acceleratori, bisogna avere un ambiente capace di farli lavorare in modo efficiente su flussi dinamici, ramificati e continui. Se l'AI generativa classica ha premiato chi poteva addestrare e servire grandi modelli, la prossima fase premierà chi saprà gestire milioni di decisioni intermedie senza far esplodere consumi, latenza e complessità operativa.