// TOM'S HARDWARE ITALIA — INTELLIGENZA ARTIFICIALE
Gli scanner AI perdono la fiducia degli esperti di cybersecurity
La fiducia negli strumenti di testing completamente automatici basati su AI sta crollando tra i professionisti della cybersecurity: il Cobalt State of Pentesting Report 2026 indica che solo il 9% degli intervistati si affida ancora in modo esclusivo a questi sistemi per cercare vulnerabilità. Un anno prima la quota era al 29%, segno di un cambio rapido verso modelli più controllati e meno dipendenti dall'automazione pura.
Il dato più pesante riguarda gli errori mancati: secondo il report, il 78% dei professionisti coinvolti ha visto strumenti di vulnerability scanning completamente automatici non intercettare falle critiche. Il campione comprende circa 450 figure della sicurezza, confrontate attraverso due rilevazioni condotte tra 2025 e 2026, con l'obiettivo di misurare quanto il settore si fidi davvero del testing automatizzato applicato alle superfici d'attacco moderne.
Il problema non è l'uso dell'intelligenza artificiale in sé, ma il modo in cui viene delegata la validazione. Le vulnerabilità legate agli LLM sono spesso dipendenti dal contesto, dalla logica applicativa e dall'architettura del prodotto: elementi che uno scanner generico fatica a interpretare. È lo stesso terreno in cui, in modo diverso, si inserisce anche il lavoro sulle falle OpenSSL individuate anche con l'AI, dove l'automazione aiuta ma non sostituisce l'analisi tecnica.
I numeri del report mostrano quanto la superficie d'attacco stia cambiando. Circa un terzo dei risultati emersi da un AI pentest viene classificato ad alto rischio, una frequenza indicata come 2,7 volte superiore alla media del software convenzionale. Al momento dell'analisi, meno del 40% delle vulnerabilità su AI e LLM risultava corretto, mentre il 62% restava aperto.
Anche i tempi di remediation peggiorano: il MTTR medio per i problemi di sicurezza legati ad AI e LLM è passato da 19 a 36 giorni. Questo allungamento pesa soprattutto nelle organizzazioni che hanno già integrato agenti, chatbot o funzioni generative nei flussi interni, perché una falla non corretta può restare esposta mentre il sistema continua a interagire con dati, credenziali e logiche operative sensibili.
La risposta più diffusa è il modello ibrido. Circa il 47% dei team dichiara di preferire una combinazione tra automazione e competenze umane, con una crescita del 22% anno su anno. La stessa percentuale utilizza l'automazione soprattutto negli ambienti a basso rischio, lasciando agli specialisti la verifica delle vulnerabilità più complesse, dei falsi negativi e delle debolezze legate alla logica di business.
Il messaggio per il settore è netto: gli scanner AI restano strumenti utili per accelerare alcune attività, ma non sono ancora abbastanza affidabili per diventare arbitri unici della sicurezza. Più aumenta la complessità delle applicazioni basate su intelligenza artificiale generativa, più cresce il bisogno di test guidati da persone capaci di leggere contesto, impatto e catene di attacco reali.