// MACITYNET — HARDWARE & GADGET
Sorpresa: nascosto dentro il Pi greco c’è un sistema di storage infinito
Questo sito contiene link di affiliazione per cui può essere compensato
Chi naviga tra le curiosità informatiche prima o poi incontra PiFS, il “content-free file system” descritto per la prima volta nel 1999. Steve Steinberg lo immagina come un sistema in cui il sistema di archiviazione (SSD) non contiene più i file reali, ma solo due numeri: l’offset dentro le cifre del pi greco dove inizia la sequenza cercata, e la sua lunghezza.
Proviamo a capirlo in un altro modo. Qualsiasi file è, dal punto di vista del computer, una sequenza di numeri, che possono essere espressi in modi diversi (in base due, in base dieci, in base sedici e via dicendo). Che ci siano lettere e altri glifi non è determinante perché la codifica di tutti i diversi tipi di alfabeto avviene in maniera concordata con Unicode, che assegna valori numerici ai caratteri; le codifiche come UTF-8 trasformano quei valori in sequenze di byte.
Quindi, se ogni file del computer è solo una sequenza di numeri X di una determinata lunghezza Y (la lunghezza del file), il problema è trovare all’interno dell’infinito susseguirsi di numeri del Pi greco (3,14 e via all’infinito con gli altri decimali) dove inizia e dove finisce il segmento con la sequenza giusta.
La premessa matematica regge: Pi greco è congetturato essere un numero normale, cioè una sequenza in cui ogni stringa finita di cifre compare prima o poi con frequenza uniforme. Se la congettura è vera, ogni file mai creato, scegliendo una qualsiasi base numerica, esiste già da qualche parte dentro le infinite cifre dopo la virgola.
Detto in un altro modo: “dentro” il Pi greco (che, essendo una costante, è definito matematicamente, anche se mai esplorato davvero in profondità perché nessuno può conoscerne tutte le cifre) ci sono tutti i possibili file del mondo con tutte le loro possibili variazioni. Praticamente come la biblioteca infinita di Borges, solo che non serve la biblioteca, basta la costante matematica che rappresenta il rapporto tra la lunghezza di una circonferenza e il suo diametro.
Da quella premessa nasce il progetto open source πfs, pubblicato su GitHub e ancora consultabile oggi, che implementa l’idea per gioco usando la formula di Bailey-Borwein-Plouffe per calcolare singole cifre esadecimali di Pi greco senza dover generare tutte quelle precedenti. Il file non viene mai spostato né copiato: resta “dentro” la costante, e il disco custodisce solo le coordinate per ritrovarlo. È un’archiviazione che sembra gratuita, perché Pi greco è un bene comune, calcolabile da chiunque e ovunque, senza bisogno di trasferire un solo byte di dati reali.
Ma allora è vero? Funziona? La cosa bella dell’informatica è che non solo ci porta questo tipo di ipotesi paradossali, ma ci propone subito anche il motivo per cui non sono possibili.
Infatti, il problema emerge non appena si prova a usarlo su file di dimensioni concrete, e qui la storia smette di essere solo un gioco. Per individuare una sequenza specifica e abbastanza lunga dentro Pi greco serve in media scavare molto in profondità, ed esponenzialmente più in profondità quanto più la sequenza è lunga e priva di ripetizioni interne. L’offset necessario, espresso in bit, finisce per essere grande quanto il file stesso, se non di più. Lo confermano gli stessi sviluppatori di πfs nella documentazione, dove ammettono con ironia che il sistema funziona benissimo, a patto di non aspettarsi che comprima davvero qualcosa.
Dietro la battuta si nasconde un risultato serio della teoria dell’informazione: nessun algoritmo può comprimere tutti i file possibili, perché i puntatori brevi disponibili sono sempre meno numerosi dei file che dovrebbero indicizzare. È il principio del conteggio applicato alla compressione, lo stesso che rende impossibile un archivio universale a costo zero, in Pi greco come in qualsiasi altra sequenza infinita e normale.