// TOM'S HARDWARE ITALIA — INTELLIGENZA ARTIFICIALE

Un database di nuova generazione riduce le allucinazioni AI del 78%

Published: 06/20/2026, 09:32 AM

Un team di KAIST e della startup GraphAI Co., Ltd. ha sviluppato un sistema di database che riduce le allucinazioni dei modelli di linguaggio del 78% rispetto ai sistemi RAG tradizionali. Il sistema si chiama AkasicDB ed è stato presentato il 2 giugno 2026 alla conferenza ACM SIGMOD di Bengaluru, una delle vetrine scientifiche più selettive nel campo dei database. La notizia non riguarda il modello linguistico. Riguarda l'architettura dei dati che lo alimenta — e questa è la distinzione che la maggior parte delle discussioni sull'AI in azienda continua a ignorare. Il RAG — "Retrieval-Augmented Generation" — è diventato lo standard de facto per connettere i modelli linguistici alle basi di conoscenza aziendali. Il funzionamento è semplice in teoria: prima di generare una risposta, il sistema recupera i documenti più rilevanti tramite ricerca semantica vettoriale e li passa al modello come contesto. Il modello risponde basandosi su quei documenti, non solo sul suo addestramento. Il limite del RAG classico è strutturale, non implementativo: la ricerca vettoriale è efficace quando la domanda ha una risposta contenuta in un singolo frammento di testo. Diventa inadeguata quando la risposta richiede di attraversare relazioni tra entità ("tutti i fornitori del cliente X che hanno avuto ritardi negli ultimi sei mesi"), applicare filtri strutturati ("mostrami solo i contratti con clausola di esclusiva"), o combinare semantica con logica relazionale. I database vettoriali sono eccellenti nel trovare la vicinanza semantica, ma non sono nati per gestire grafi di relazioni o interrogazioni SQL strutturate. Il risultato pratico è che un agente AI che usa RAG vettoriale su dati aziendali complessi sbaglia sistematicamente — non perché il modello sia scadente, ma perché il contesto recuperato è incompleto o scorretto. Le allucinazioni in produzione, quelle che costano, nascono quasi sempre da un dato mancante o mal recuperato, non da un'invenzione del modello a freddo. AkasicDB affronta questo problema alla radice. Il sistema progettato dal prof. Min-Soo Kim (autore corrispondente) e da Geonho Lee (primo autore, dottorando) non è un wrapper che collega database esistenti. È un DBMS che integra nativamente tre paradigmi: ricerca vettoriale, traversal su grafo e filtraggio relazionale, eseguiti come singolo piano di query. Il metodo si chiama Omni RAG. In un sistema tradizionale, gestire questi tre tipi di interrogazione richiederebbe di interrogare separatamente un database vettoriale, un graph database e un database relazionale, raccogliere i risultati e riconciliarli — con latenza cumulativa, rischio di incoerenza e complessità ingegneristica significativa. AkasicDB collassa le tre operazioni in un'unica esecuzione, il che riduce sia il tempo di risposta sia la probabilità che il contesto assemblato sia frammentato o contraddittorio. I numeri pubblicati nel paper sono netti. Le query complesse — quelle che richiedono tutti e tre i tipi di recupero — scendono da 21,3 secondi a meno di un secondo. Un miglioramento di circa venti volte che non deriva da hardware migliore o da ottimizzazioni di modello, ma dalla scelta di non separare ciò che non dovrebbe essere separato. L'accuratezza delle risposte generate aumenta del 78% rispetto al RAG vettoriale puro, misurata su benchmark che includono query miste. Il dato è particolarmente rilevante perché il benchmark non testa casi limite costruiti ad arte: testa il tipo di domande che un agente AI in produzione riceve effettivamente su basi di conoscenza aziendali strutturate. La latenza sotto il secondo non è solo un miglioramento di esperienza utente: è la soglia sotto la quale gli agenti AI diventano utilizzabili in flussi di lavoro sincroni. A 21 secondi per query, un agente che effettua più recuperi consecutivi diventa inutilizzabile in produzione. A meno di un secondo, diventa uno strumento.