// TOM'S HARDWARE ITALIA — INTELLIGENZA ARTIFICIALE
Databricks lancia Lakebase e sfida i database tradizionali
Databricks ha presentato Lakebase, un database serverless Postgres pensato per ripensare l'architettura OLTP partendo dallo storage. L'obiettivo è superare alcuni limiti storici dei database monolitici, nei quali motore, log delle transazioni e file dati convivono sulla stessa macchina, rendendo più complessi scalabilità, disponibilità e isolamento dei carichi.
Il punto di partenza è una constatazione tecnica: nei database tradizionali come Postgres, MySQL e Oracle classico, il commit di una transazione passa prima dal write ahead log, scritto in modo sequenziale su disco, mentre i file dati vengono aggiornati in seguito. Questo modello ha reso veloci e affidabili molte applicazioni, ma lega ancora durabilità e prestazioni alle caratteristiche del nodo che ospita database engine e storage.
Lakebase cambia questa impostazione rendendo le istanze di calcolo Postgres stateless ed esternalizzando log e dati in servizi separati. In pratica, il compute può essere trattato come una risorsa elastica, mentre la persistenza viene spostata verso componenti progettati per il cloud moderno, con storage a oggetti durevole e capacità di scalare senza dipendere da una singola macchina fisica.
La scelta si inserisce in una direzione già visibile nell'evoluzione delle piattaforme dati: anche nelle architetture componibili per l'impresa digitale il valore sta nel separare i blocchi critici, così da aggiornare, scalare e proteggere ogni livello senza trascinare l'intero stack. Con Lakebase, questa logica entra direttamente nel database transazionale.
Uno dei problemi affrontati è la replica fisica. Nei database monolitici, aumentare le letture o preparare l'alta disponibilità richiede spesso una copia completa del database, che deve ricevere e riprodurre il log dal nodo primario. Su dataset grandi, questo significa tempi lunghi, costi infrastrutturali più alti e maggiore complessità operativa, soprattutto quando si cerca di evitare perdita di dati in caso di guasto.
Il nuovo approccio punta anche al modello LTAP, cioè alla possibilità di eseguire carichi transazionali e analitici sulla stessa copia dei dati. Databricks lo presenta come alternativa ai flussi basati su CDC, mirroring o repliche dedicate, che introducono ritardi, duplicazione dei dati e costi aggiuntivi. L'idea è ridurre la distanza tra applicazioni operative e analytics in tempo reale.
Il tema è centrale anche per i carichi AI, perché applicazioni e agenti richiedono sempre più spesso dati aggiornati, query rapide e infrastrutture capaci di assorbire picchi senza interventi manuali continui. Un database transazionale che si comporta come servizio elastico può diventare un tassello importante nelle pipeline moderne, dove dati strutturati, dati non strutturati e machine learning convivono nello stesso ambiente.
Resta da vedere come Lakebase si comporterà nei deployment reali, dove compatibilità Postgres, latenza, costi e strumenti operativi pesano quanto l'architettura. La direzione, però, è chiara: Databricks vuole portare nel mondo OLTP la stessa separazione tra compute e storage che ha già trasformato data lake, warehouse e piattaforme analytics cloud.