I Big Data: rivoluzione tra scienza e conoscenza

Sc
SCENARI
Articolo tratto dalla rivista Oxygen (www.oxygen.enel.com)
I Big Data: rivoluzione
tra scienza e conoscenza
articolo di Mario Rasetti
Fisico e presidente della ISI Foundation
progetto fotografico di White
L’efficienza energetica è un concetto concreto, che anima i
dibattiti fra gli scienziati. Perché chi si occupa di fisica ogni
giorno si trova ad affrontare cambiamenti immensi, come
la rivoluzione dell’informazione contemporanea, quella che
crea ogni giorno più dati di quanto non si possa immaginare.
Dati che vanno gestiti, in maniera efficiente: una nuova sfida
per la fisica e l’energia.
Efficienza ed energia sono concetti che appartengono al bagaglio della scienza, in particolare della fisica, sin dai suoi primordi. La nozione
di energia è stata uno dei fattori portanti dello
sviluppo della fisica classica di Galileo, Newton, Lagrange, così come di quella relativistica di Einstein e quantistica di Schrödinger e
Heisenberg. Con il concetto di efficienza essa è
stata il pilastro portante nella costruzione della
termodinamica di Carnot e Boltzmann e della
meccanica statistica di Maxwell e Gibbs.
L’acceso dibattito politico, tecnologico, scientifico che da anni si dipana su energia ed efficienza tocca uno fra i problemi più delicati
della società industriale contemporanea: dover coniugare un bisogno energetico esponenzialmente crescente con la sempre maggiore
scarsità delle riserve e delle risorse e con la necessità di garantire la sostenibilità ambientale. È tuttavia ancora poco considerato un altro
aspetto del ruolo che questi due concetti hanno
oggi, che di nuovo coinvolge la fisica nei suoi
aspetti più avanzati.
Nella scienza contemporanea è incontrovertibile l’affermarsi dell’“informazione” come
grandezza fisica caratterizzante gli stati della
110
Globalizzazione significa
una società sempre più
interconnessa, dove ogni giorno
si scambiano 294 miliardi di
e-mail e 20 miliardi di SMS,
e su Facebook si postano 250
milioni di fotografie. Un vero e
proprio mondo di dati
materia, al pari e accanto a grandezze come
massa o energia; della materia in tutte le sue
forme, microscopica come macroscopica, inerte come vivente. In quest’ultimo caso il concetto d’informazione è basilare: distinguere fra
materia vivente e inerte significa comprendere come una molecola possa operare come un
messaggio, che è il bivio al quale la materia si
differenzia in due percorsi così diversi pur entro un unico insieme di leggi dinamiche.
La risposta a questa domanda inquietante sta
in quello che è ormai un paradigma: la “complessità”. La scienza dei sistemi complessi fa
riferimento all’esistenza di una sottile quanto
profonda consapevolezza di una metrica imprevista nella struttura concettuale dei modelli interpretativi e predittivi dei fenomeni che
osserviamo. In sistemi costituiti di tantissime
parti mutuamente correlate, le leggi che regolano la dinamica delle parti possono non essere
sufficienti a descrivere il modo in cui il sistema
complessivo evolve, perché emerge un insieme
collettivo globale di comportamenti che non
è contenuto in maniera semplice in quello dei
singoli costituenti, e anzi non esiste in assenza
delle loro interazioni. Inoltre, spesso i sistemi
111
oxygen | 22 — 02.2014
complessi hanno una caratteristica che li differenzia da quelli cui la scienza riduzionista tipicamente si riferisce: la loro fenomenologia può
non risultare da esperimenti ripetibili, ma essere rappresentata dai “dati” delle osservazioni
che su di essi compiamo.
Globalizzazione d’altra parte significa una
società sempre più interconnessa, dove ogni
giorno si scambiano 294 miliardi di e-mail e
20 miliardi di SMS, e su Facebook si postano
250 milioni di fotografie. Un vero e proprio immenso mondo di dati. Questa crescente complessità del tessuto tecno-sociale nasconde
non solo inaspettate opportunità, ma anche
rischi potenziali. Disastri recenti, ad esempio
nell’economia e nella finanza, hanno mostrato
come la vulnerabilità più pericolosa si nasconda proprio nelle interdipendenze che connettono trasversalmente sistemi differenti. Perciò la
società richiede una capacità predittiva sempre
maggiore, che permetta di anticipare, valutare
e correlare i rischi e al contempo di raggiungere
una comprensione profonda della complessità
sistemica di quel mondo cui le nuove tecnologie stanno dando vita.
In questo contesto si colloca lo tsunami dei dati,
i “Big Data”, la rivoluzione che dalla fine del
secolo scorso dobbiamo fronteggiare: scienza
e conoscenza non sono più spinte soltanto da
nuove scoperte o teorie, ma soprattutto dalla
disponibilità senza precedenti di dati, in gran
parte ancora da esplorare. Dati che sono spesso
il risultato di attività che non sono esperimenti scientifici pianificati e ripetibili. In questi si
annidano le leggi e le regolarità alla base del
comportamento e, dunque, della nostra capacità di comprendere sistemi naturali, sociali,
tecnologici, economici. Oggi disponiamo di
un “catalogo” di cinquemila miliardi di miliardi di oggetti stellari, ma anche ogni due giorni
vengono prodotti più dati socioeconomici che
in tutta la storia precedente dell’umanità. E da
anni il numero dei dati generati supera la capacità di immagazzinarli e conservarli.
Alle tecnologie dell’informazione si chiede di
fronteggiare la quinta rivoluzione da quando sono così prepotentemente entrate nella
nostra vita: dopo quella dei mainframe, dei
PC, di internet e del web 1.0 e della telefonia
mobile e del web 2.0, oggi è l’era dei Big Data.
Alla scienza e alla tecnologia si chiede di manipolare informazione nella misura di Exabyte
(ciascuno una quantità d’informazione circa
uguale a 4000 volte tutta l’informazione nella
Library of Congress di Washington!), perché
ormai ogni minuto la società genera 1,7 milioni di miliardi di byte di dati, l’equivalente
di 360.000 DVD, e la natura ne fornisce un miliardo di volte tanto.
Tutto questo ha a che fare con l’energia e con
l’efficienza, in forme e in prospettive nuove
e inattese. Un laptop o un personal computer
operano alla scala dei gigabyte e quando lavoriamo sentiamo che si scaldano rapidamente;
112
I BIG DATA: RIVOLUZIONE TRA SCIENZA E CONOSCENZA |
La prossima frontiera
sarà combinare
tecnologie capaci di
creare nano-circuiti
integrati “attenti
all’energia” con
l’implementazione di
modalità innovative di
conversione energetica,
ispirate dalla biologia e
dall’evoluzione naturale
oxygen
pensiamo all’energia necessaria per estrarne
una potenza di calcolo di exabyte, un miliardo
di volte più grande!
Le applicazioni coperte dalle più avanzate tecnologie al silicio – rese straordinarie dall’aggressiva scalabilità dei nuovi transistor, testimoniata anche dall’incredibile riduzione del
loro costo unitario, sceso dai circa 45 dollari
degli anni Cinquanta al milionesimo di centesimo di euro dei giorni nostri, performance
mai ottenuta da alcuna tecnologia moderna
– devono anch’esse affrontare un enorme problema di energia ed efficienza.
La prossima frontiera sarà combinare tecnologie capaci di creare nano-circuiti integrati “attenti all’energia” con l’implementazione di modalità innovative di conversione energetica, ispirate dalla biologia e dall’evoluzione naturale. Dispositivi in grado di imitare, in forma nanotecnologica, i princìpi di conversione dell’energia
in natura, dove i sistemi viventi trovano le loro
fonti nell’ambiente senza violarne gli equilibri.
Si potrà così pensare ad esempio a nuovi data
center a basso consumo. Già oggi i data center
nel mondo – spina dorsale di internet – utilizzano dall’ 1 al 2% dell’elettricità disponibile e,
per l’inefficienza delle loro infrastrutture, sono
responsabili dello 0,5% circa delle emissioni
complessive di carbonio. Occorrono data center globali “verdi”, per manipolare senza rischi
energetici la grande onda dei Big Data. Internet
ha certo ridotto l’emissione di carbonio, sostituendo medium fisici carbon-intensive (libri,
CD, giornali e riviste e, soprattutto, la posta)
con i loro equivalenti digitali; ma estrarre in
modo efficiente informazione da grandi insiemi di dati avrà costi energetici drammatici.
La natura tuttavia ci mette a disposizione esempi che la scienza della complessità, la fisica
quantistica e la nanotecnologia sono in grado
di imitare. Molti organismi fotosintetici hanno
sviluppato strutture semplici ed efficienti per
“mietere la luce” del sole e usarne l’energia per
pilotare le loro reazioni metaboliche; ad esempio le unità fotosintetiche dei batteri: due complessi proteici, uno che funge da antenna cattura la luce, ne raccoglie l’energia e la trasferisce
all’altro, un centro di reazione dove tale energia viene convertita in energia chimica.
Alcuni batteri (il cyanobacterium sulphureum)
che vivono in condizioni estreme, acque profonde e scure dove devono catturare un fotone
alla volta, sono maestri nel mietere luce: in essi
praticamente tutta l’energia raccolta nell’assorbimento di un fotone viene trasferita al centro di reazione, senza violare il secondo principio della termodinamica, ma sfruttando la
velocità del processo per mettere all’opera i più
sofisticati meccanismi della fisica quantistica e
ottenere quell’incredibile efficienza.
Imitandoli, la nostra società della conoscenza
potrà vincere la sfida di energia ed efficienza,
ma solo se saprà vedere e apprendere quello
che la natura le insegna.
113