La matematica dei network - DISMA Dipartimento di Scienze

La matematica dei
network
struttura e dinamiche di
informazione
Fabio Fagnani
[email protected]
http://calvino.polito.it/∼fagnani/
Dipartimento di Matematica
Politecnico di Torino
– p. 1
L’era dei network
INTERNET: la madre di tutti i network.
∼ 600 milioni di computer
19 miliardi di pagine web
– p. 2
L’era dei network
Network infrastrutturali:
internet
reti di distribuzione elettrica
reti stradali, ferroviarie
reti di sensori (smart dust)
– p. 3
L’era dei network
Network sociali:
WEB,
facebook, twitter, skype,
rete delle amicizie in una comunità
– p. 4
L’era dei network
Network biologici:
reti neuronali
reti di interazione genica
– p. 5
Come rappresentare i
network
Lo scheletro di un network: il grafo.
Un insieme di vertici detti nodi
Un’insieme di archi che collegano i nodi.
Un arco tra il nodo i ed il nodo j significa che i può ’inviare
informazioni’ a j.
Archi tutti bi-direzionali: grafo non diretto.
– p. 6
I grafi
Il concetto di grafo appare nella metà del 700
introdotto da Eulero, per studiare il problema dei
ponti di Königsberg.
– p. 7
I grafi
grafo connesso: si può andare da un nodo ad un
qualunque altro nodo
distanza tra due nodi u e v : minimo numero di archi da
attraversare per andare da u a v.
diametro: massima distanza tra due nodi del grafo
grado di un nodo: numero di archi (uscenti o entranti).
– p. 8
I grafi
Grafo non connesso.
Due componenti connesse
– p. 9
Come rappresentare i
network
L’utilità dell’astrazione: un solo modello
matematico, il grafo, per tanti oggetti reali di
natura estremamente eterogenea.
Internet: i nodi sono i router, un arco tra due router se
vi è un collegamento diretto di linea tra i due. (grafo non
diretto)
Rete stradale: i nodi sono gli incroci, un arco è una
strada (sensi unici, grafo diretto)
– p. 10
Come rappresentare i
network
WEB: i nodi sono le pagine web. Un arco dalla pagina
i alla pagina j se da i c’è un ’hyperlink’ alla j. (grafo
diretto)
Facebook: i nodi sono gli iscritti, gli archi indicano
amicizia e sono sempre bidirezionali (grafo non diretto)
Rete delle amicizie: i nodi sono le persone, un arco
tra due persone significa amicizia. (grafo non diretto)
– p. 11
Come rappresentare i
network
Rete degli attori: i nodi sono gli attori
cinematografici, un arco tra due attori significa che
hanno lavorato nello stesso film. (grafo non diretto)
Rete dei matematici: i nodi sono i matematici, un
arco tra due matematici significa che hanno scritto un
lavoro insieme (grafo non diretto)
– p. 12
Perchè studiare i
network?
Sia i network infrastrutturali che quelli sociali permeano il
nostro mondo; il loro funzionamento condiziona in modo
sensibile la nostra vita.
I network sociali, sia quelli ’naturali’ sia quelli basati sulla
piattaforma internet condizionano le nostre scelte, la
possibilità di trovare lavoro, le cose che compriamo, le
opinioni che ci formiamo, le malattie che possiamo
contrarre.
– p. 13
Perchè studiare i
network?
Struttura ←→ Funzionamento
Come si propagano le informazioni?
Come si formano le opinioni?
Come si propagano le epidemie?
Cosa succede se alcuni nodi vengono
distrutti?
– p. 14
La struttura dei
network
Alcune proprietà dei network complessi:
small world: due nodi qualunque del grafo sono
collegati tra loro da un numero molto basso di archi
(diametro piccolo).
triangoli: nel grafo ci sono molti triangoli.
legge di potenza: p(k) la frazione dei nodi che hanno
grado k si ha che:
1
p(k) ∼ γ
k
– p. 15
La struttura dei
network
Alcune proprietà dei network complessi:
small world: due nodi qualunque del grafo sono
collegati tra loro da un numero molto basso di archi
(diametro piccolo).
triangoli: nel grafo ci sono molti triangoli.
legge di potenza: p(k) la frazione dei nodi che hanno
grado k si ha che:
1
p(k) ∼ γ
k
– p. 16
Small World
L’esperimento di Stanley Milgram (1967): ad
alcune centinaia di persone scelte a caso in Omaha
(Nebraska) fu data loro una lettera da far pervenire ad un
agente di borsa di Boston. La regola del gioco era che si
poteva solo passare manualmente la lettera ad una
persona di propria conoscenza.
Il 35% delle lettere arrivarono a destinazione con una
media di 5,5 passaggi.
Grafo delle amicizie: diametro piccolo (∼6)
Da questo lo slogan: ’i 6 gradi di separazione’.
– p. 17
Small World
WEB: diametro ∼ 19
Rete degli attori: diametro ∼ 6
Rete dei matematici: diametro ∼ 8
Small world: grafo con diametro ’piccolo’ rispetto al
numero totale di nodi N .
Più quantitativamente: diametro ∼ log N .
N = 100.000 ⇒ log N = 5
N = 1.000.000 ⇒ log N = 6
– p. 18
La struttura dei
network
Alcune proprietà dei network sociali:
small world: due nodi qualunque del grafo sono
collegati tra loro da un numero molto basso di archi
(diametro piccolo).
triangoli: nel grafo ci sono molti triangoli.
legge di potenza: p(k) la frazione dei nodi che hanno
grado k si ha che:
1
p(k) ∼ γ
k
– p. 19
La struttura dei
network
Alcune proprietà dei network complessi:
small world: due nodi qualunque del grafo sono
collegati tra loro da un numero molto basso di archi
(diametro piccolo).
triangoli: nel grafo ci sono molti triangoli.
legge di potenza: p(k) la frazione dei nodi che hanno
grado k si ha che:
1
p(k) ∼ γ
k
– p. 20
La legge di potenza
Legge verificata sperimentalmente in molti network
complessi:
WEB: γin = 2.1, γout = 2.7
INTERNET γ = 2.3.
rete degli attori: γ = 2.3
rete dei matematici: γ = 2.4
– p. 21
La legge di potenza
ma anche in contesti molto diversi:
percentuale di utilizzo delle varie parole in un libro
percentuale di città che hanno una certa grandezza
percentuale di persone che hanno una certa ricchezza
Legge di potenza:
molti nodi con grado elevato,
molte persone molto ricche...
– p. 22
La struttura dei
network
Perchè i network (sociali) presentano queste
caratteristiche?
Ci sono dei meccanismi simili alla base che ne
determinano l’evoluzione?
Queste caratteristiche, in che modo ne
determinano il funzionamento?
– p. 23
I modelli matematici
I network che ci interessano sono estremamente
complessi con spesso milioni di nodi.
Si costruiscono modelli matematici trattabili per
studiarne le proprietà.
Il punto di partenza è ottenere ’artificialmente’
grafi che esibiscano le tre proprietà: diametro
piccolo, molti triangoli, legge di potenza.
– p. 24
Il modello di Erdos
Erdos-Renyi (1950)
Si considerano N nodi.
Per ciascuna coppia i e j di essi, si decide che c’è un
arco non diretto con probabilità p, e che non c’è nessun
arco con probabilità 1 − p.
Questo è un primo esempio di grafo aleatorio: la
costruzione non è deterministica ma affidata al
caso.
– p. 25
Il modello di Erdos
Se pN > 1, con ’alta probabilità’ il grafo costruito
avrà una componente gigante con diametro
∼ log N . ⇒ small world
Il modello di Erdos
Se pN > 1, con ’alta probabilità’ il grafo costruito
avrà una componente gigante con diametro
∼ log N . ⇒ small world
Non ci sono abbastanza triangoli: il fatto che ci sia un arco
tra i e j e tra j e k non altera la probabilità che ci sia anche
un arco tra i e k.
Il modello di Erdos
Se pN > 1, con ’alta probabilità’ il grafo costruito
avrà una componente gigante con diametro
∼ log N . ⇒ small world
Non ci sono abbastanza triangoli: il fatto che ci sia un arco
tra i e j e tra j e k non altera la probabilità che ci sia anche
un arco tra i e k.
Non vale la legge di potenza; decrescenza esponenziale.
– p. 26
Il modello di Erdos
n = 300, p = 0, 03.
– p. 27
Il modello di Erdos?
– p. 28
Amicizia
– p. 29
Il modello ad attacco
preferenziale
Barabasi- Albert (1999)
1. Si parte da un piccolo grafo.
2. Si aggiunge un nuovo nodo e si connette con d
(esempio 3) archi ai nodi già presenti: la scelta di quali
connessioni fare è casuale con probabilità direttamente
proporzionale al grado di un nodo (insomma ci si
connette preferenzialmente ai nodi con già molte
connessioni)
3. Si ripete il punto 2.
– p. 30
Il modello ad attacco
preferenziale
E’ small world, (ha i triangoli), vale la legge di
potenza con γ = 3.
Dimostrazioni matematiche rigorose!
E’ considerato un buon modello evolutivo per i network
sociali: chi ha tante conoscenze tende ad acquisirne
sempre di più.
Con opportune modifiche si ottiene qualunque γ tra 2 e 3.
SIMULA
– p. 31
Internet 1969
– p. 32
Internet 1972
– p. 33
Internet 1977
– p. 34
Epidemie sui network
Il modello SIR (susceptible-infected-resistant)
Se un nodo suscettibile ha un vicino infetto, diventa
infetto con probabilità p;
Un nodo infetto, guarisce e diventa resistente
all’infezione con probabilità q.
Partendo da pochi nodi infetti, con quale probabilità
l’infezione si estenderà a buona parte del network?
Che ruolo giocano le probabilità di trasmissione p e di
guarigione q?
– p. 35
Epidemie sui network
In un network con legge di potenza (2 < γ < 3),
un infezione SIR si propaga con alta probabilità a
buona parte del network, indipendentemente da
quanto è piccola p e quanto è grande q!
Il motivo è l’esistenza di nodi con grado elevato che la
diffondono con facilità.
SIMULA
– p. 36
Epidemie sui network
Quanti nodi vanno immunizzati per assicurare il blocco del
contagio?
Su un network come internet anche immunizzando il 95% dei nodi
(scelti a caso) non si garantirebbe di bloccare l’infezione. E’ necessario
immunizzare i nodi in modo selettivo
Su un network come internet anche distruggendo il 95% dei nodi (scelti
a caso) si continuerebbe ad avere una componente connessa gigante
– p. 37
La formazione delle
opinioni
Ogni nodo possiede un’opinione iniziale: un numero x
tra 0 e 10.
Quando comunica con un altro nodo, si scambiano le
opinioni x e y. Se differiscono meno di una soglia r, i
due nodi cambiano la loro opinione nella media
(x + y)/2. Altrimenti rimangono con la loro opinione.
Cosa succederà man mano che il tempo passa?
Convergeranno tutti verso un’opinione comune (consenso)
oppure no?
– p. 38
La formazione delle
opinioni
E’ un modello estremamente complicato da
analizzare.
Se la soglia r è piccola in genere non si
raggiunge il consenso....
r=5
r=1
– p. 39
Conclusioni
Lo studio dei network diventerà una questione
strategica nei prossimi decenni.
Attirerà sempre di più le attenzioni di
matematici, fisici, biologi, ingegneri,
economisti.....
La matematica dei network è agli albori ed è
probabile che siano necessarie rivoluzioni
paradigmatiche per trovare gli strumenti giusti.
Sarà sicuramente uno dei grandi argomenti di
questo secolo.
– p. 40
UN NETWORK 500
ANNI FA
– p. 41