La matematica dei network struttura e dinamiche di informazione Fabio Fagnani [email protected] http://calvino.polito.it/∼fagnani/ Dipartimento di Matematica Politecnico di Torino – p. 1 L’era dei network INTERNET: la madre di tutti i network. ∼ 600 milioni di computer 19 miliardi di pagine web – p. 2 L’era dei network Network infrastrutturali: internet reti di distribuzione elettrica reti stradali, ferroviarie reti di sensori (smart dust) – p. 3 L’era dei network Network sociali: WEB, facebook, twitter, skype, rete delle amicizie in una comunità – p. 4 L’era dei network Network biologici: reti neuronali reti di interazione genica – p. 5 Come rappresentare i network Lo scheletro di un network: il grafo. Un insieme di vertici detti nodi Un’insieme di archi che collegano i nodi. Un arco tra il nodo i ed il nodo j significa che i può ’inviare informazioni’ a j. Archi tutti bi-direzionali: grafo non diretto. – p. 6 I grafi Il concetto di grafo appare nella metà del 700 introdotto da Eulero, per studiare il problema dei ponti di Königsberg. – p. 7 I grafi grafo connesso: si può andare da un nodo ad un qualunque altro nodo distanza tra due nodi u e v : minimo numero di archi da attraversare per andare da u a v. diametro: massima distanza tra due nodi del grafo grado di un nodo: numero di archi (uscenti o entranti). – p. 8 I grafi Grafo non connesso. Due componenti connesse – p. 9 Come rappresentare i network L’utilità dell’astrazione: un solo modello matematico, il grafo, per tanti oggetti reali di natura estremamente eterogenea. Internet: i nodi sono i router, un arco tra due router se vi è un collegamento diretto di linea tra i due. (grafo non diretto) Rete stradale: i nodi sono gli incroci, un arco è una strada (sensi unici, grafo diretto) – p. 10 Come rappresentare i network WEB: i nodi sono le pagine web. Un arco dalla pagina i alla pagina j se da i c’è un ’hyperlink’ alla j. (grafo diretto) Facebook: i nodi sono gli iscritti, gli archi indicano amicizia e sono sempre bidirezionali (grafo non diretto) Rete delle amicizie: i nodi sono le persone, un arco tra due persone significa amicizia. (grafo non diretto) – p. 11 Come rappresentare i network Rete degli attori: i nodi sono gli attori cinematografici, un arco tra due attori significa che hanno lavorato nello stesso film. (grafo non diretto) Rete dei matematici: i nodi sono i matematici, un arco tra due matematici significa che hanno scritto un lavoro insieme (grafo non diretto) – p. 12 Perchè studiare i network? Sia i network infrastrutturali che quelli sociali permeano il nostro mondo; il loro funzionamento condiziona in modo sensibile la nostra vita. I network sociali, sia quelli ’naturali’ sia quelli basati sulla piattaforma internet condizionano le nostre scelte, la possibilità di trovare lavoro, le cose che compriamo, le opinioni che ci formiamo, le malattie che possiamo contrarre. – p. 13 Perchè studiare i network? Struttura ←→ Funzionamento Come si propagano le informazioni? Come si formano le opinioni? Come si propagano le epidemie? Cosa succede se alcuni nodi vengono distrutti? – p. 14 La struttura dei network Alcune proprietà dei network complessi: small world: due nodi qualunque del grafo sono collegati tra loro da un numero molto basso di archi (diametro piccolo). triangoli: nel grafo ci sono molti triangoli. legge di potenza: p(k) la frazione dei nodi che hanno grado k si ha che: 1 p(k) ∼ γ k – p. 15 La struttura dei network Alcune proprietà dei network complessi: small world: due nodi qualunque del grafo sono collegati tra loro da un numero molto basso di archi (diametro piccolo). triangoli: nel grafo ci sono molti triangoli. legge di potenza: p(k) la frazione dei nodi che hanno grado k si ha che: 1 p(k) ∼ γ k – p. 16 Small World L’esperimento di Stanley Milgram (1967): ad alcune centinaia di persone scelte a caso in Omaha (Nebraska) fu data loro una lettera da far pervenire ad un agente di borsa di Boston. La regola del gioco era che si poteva solo passare manualmente la lettera ad una persona di propria conoscenza. Il 35% delle lettere arrivarono a destinazione con una media di 5,5 passaggi. Grafo delle amicizie: diametro piccolo (∼6) Da questo lo slogan: ’i 6 gradi di separazione’. – p. 17 Small World WEB: diametro ∼ 19 Rete degli attori: diametro ∼ 6 Rete dei matematici: diametro ∼ 8 Small world: grafo con diametro ’piccolo’ rispetto al numero totale di nodi N . Più quantitativamente: diametro ∼ log N . N = 100.000 ⇒ log N = 5 N = 1.000.000 ⇒ log N = 6 – p. 18 La struttura dei network Alcune proprietà dei network sociali: small world: due nodi qualunque del grafo sono collegati tra loro da un numero molto basso di archi (diametro piccolo). triangoli: nel grafo ci sono molti triangoli. legge di potenza: p(k) la frazione dei nodi che hanno grado k si ha che: 1 p(k) ∼ γ k – p. 19 La struttura dei network Alcune proprietà dei network complessi: small world: due nodi qualunque del grafo sono collegati tra loro da un numero molto basso di archi (diametro piccolo). triangoli: nel grafo ci sono molti triangoli. legge di potenza: p(k) la frazione dei nodi che hanno grado k si ha che: 1 p(k) ∼ γ k – p. 20 La legge di potenza Legge verificata sperimentalmente in molti network complessi: WEB: γin = 2.1, γout = 2.7 INTERNET γ = 2.3. rete degli attori: γ = 2.3 rete dei matematici: γ = 2.4 – p. 21 La legge di potenza ma anche in contesti molto diversi: percentuale di utilizzo delle varie parole in un libro percentuale di città che hanno una certa grandezza percentuale di persone che hanno una certa ricchezza Legge di potenza: molti nodi con grado elevato, molte persone molto ricche... – p. 22 La struttura dei network Perchè i network (sociali) presentano queste caratteristiche? Ci sono dei meccanismi simili alla base che ne determinano l’evoluzione? Queste caratteristiche, in che modo ne determinano il funzionamento? – p. 23 I modelli matematici I network che ci interessano sono estremamente complessi con spesso milioni di nodi. Si costruiscono modelli matematici trattabili per studiarne le proprietà. Il punto di partenza è ottenere ’artificialmente’ grafi che esibiscano le tre proprietà: diametro piccolo, molti triangoli, legge di potenza. – p. 24 Il modello di Erdos Erdos-Renyi (1950) Si considerano N nodi. Per ciascuna coppia i e j di essi, si decide che c’è un arco non diretto con probabilità p, e che non c’è nessun arco con probabilità 1 − p. Questo è un primo esempio di grafo aleatorio: la costruzione non è deterministica ma affidata al caso. – p. 25 Il modello di Erdos Se pN > 1, con ’alta probabilità’ il grafo costruito avrà una componente gigante con diametro ∼ log N . ⇒ small world Il modello di Erdos Se pN > 1, con ’alta probabilità’ il grafo costruito avrà una componente gigante con diametro ∼ log N . ⇒ small world Non ci sono abbastanza triangoli: il fatto che ci sia un arco tra i e j e tra j e k non altera la probabilità che ci sia anche un arco tra i e k. Il modello di Erdos Se pN > 1, con ’alta probabilità’ il grafo costruito avrà una componente gigante con diametro ∼ log N . ⇒ small world Non ci sono abbastanza triangoli: il fatto che ci sia un arco tra i e j e tra j e k non altera la probabilità che ci sia anche un arco tra i e k. Non vale la legge di potenza; decrescenza esponenziale. – p. 26 Il modello di Erdos n = 300, p = 0, 03. – p. 27 Il modello di Erdos? – p. 28 Amicizia – p. 29 Il modello ad attacco preferenziale Barabasi- Albert (1999) 1. Si parte da un piccolo grafo. 2. Si aggiunge un nuovo nodo e si connette con d (esempio 3) archi ai nodi già presenti: la scelta di quali connessioni fare è casuale con probabilità direttamente proporzionale al grado di un nodo (insomma ci si connette preferenzialmente ai nodi con già molte connessioni) 3. Si ripete il punto 2. – p. 30 Il modello ad attacco preferenziale E’ small world, (ha i triangoli), vale la legge di potenza con γ = 3. Dimostrazioni matematiche rigorose! E’ considerato un buon modello evolutivo per i network sociali: chi ha tante conoscenze tende ad acquisirne sempre di più. Con opportune modifiche si ottiene qualunque γ tra 2 e 3. SIMULA – p. 31 Internet 1969 – p. 32 Internet 1972 – p. 33 Internet 1977 – p. 34 Epidemie sui network Il modello SIR (susceptible-infected-resistant) Se un nodo suscettibile ha un vicino infetto, diventa infetto con probabilità p; Un nodo infetto, guarisce e diventa resistente all’infezione con probabilità q. Partendo da pochi nodi infetti, con quale probabilità l’infezione si estenderà a buona parte del network? Che ruolo giocano le probabilità di trasmissione p e di guarigione q? – p. 35 Epidemie sui network In un network con legge di potenza (2 < γ < 3), un infezione SIR si propaga con alta probabilità a buona parte del network, indipendentemente da quanto è piccola p e quanto è grande q! Il motivo è l’esistenza di nodi con grado elevato che la diffondono con facilità. SIMULA – p. 36 Epidemie sui network Quanti nodi vanno immunizzati per assicurare il blocco del contagio? Su un network come internet anche immunizzando il 95% dei nodi (scelti a caso) non si garantirebbe di bloccare l’infezione. E’ necessario immunizzare i nodi in modo selettivo Su un network come internet anche distruggendo il 95% dei nodi (scelti a caso) si continuerebbe ad avere una componente connessa gigante – p. 37 La formazione delle opinioni Ogni nodo possiede un’opinione iniziale: un numero x tra 0 e 10. Quando comunica con un altro nodo, si scambiano le opinioni x e y. Se differiscono meno di una soglia r, i due nodi cambiano la loro opinione nella media (x + y)/2. Altrimenti rimangono con la loro opinione. Cosa succederà man mano che il tempo passa? Convergeranno tutti verso un’opinione comune (consenso) oppure no? – p. 38 La formazione delle opinioni E’ un modello estremamente complicato da analizzare. Se la soglia r è piccola in genere non si raggiunge il consenso.... r=5 r=1 – p. 39 Conclusioni Lo studio dei network diventerà una questione strategica nei prossimi decenni. Attirerà sempre di più le attenzioni di matematici, fisici, biologi, ingegneri, economisti..... La matematica dei network è agli albori ed è probabile che siano necessarie rivoluzioni paradigmatiche per trovare gli strumenti giusti. Sarà sicuramente uno dei grandi argomenti di questo secolo. – p. 40 UN NETWORK 500 ANNI FA – p. 41