Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi e Confronto di Architetture Peer to Peer per la Gestione di Database Distribuiti Relatore: Prof. Sonia Bergamaschi Correlatore: Matteo Magni Candidato: Matteo Giovanni Caruso tesi e presentazione disponibili all’indirizzo http://www.dbgroup.unimo.it/tesi/indexNod.html 1 Obiettivi • Studio delle principali applicazioni sviluppate su reti P2P • Analisi di due architetture P2P che possano essere utili nell’ambito dei PDMS: - Chord - HyperCuP 2 Peer Data Management Systems (PDMS) • Sistemi di gestione delle informazioni nelle reti P2P • Consentono la condivisione di dati eterogenei in modo distribuito e scalabile in un ambiente decentralizzato utilizzando mapping semantici PROBLEMI PRINCIPALI • Estensione delle reti P2P • Dinamicità dei peer • Autonomia ed efficienza nella ricerca dei dati • Sicurezza 3 Applicazioni P2P • Topologia di rete di base decentralizzata: FreeNet, Gnutella1, Gnutella2 • Topologia di rete ibrida centralizzata a cluster: Napster • Topologia di rete ibrida decentralizzata a cluster: KaZaA 4 Ricerca di file in architettura P2P Chord • Architettura P2P in cui i nodi sono disposti ad anello • Gli elementi principali della rete sono: - Chiave - Valore - NodeID • Dato un nodo n, le operazioni sono: - insert(chiave,valore) - lookup(chiave) - update(chiave, nuovo-valore) - join(n) - leave( ) 5 Lookup(k) 2 KEY INT SUCC. 2+2^0 3 {3,4} 5 2+2^1 4 {4,6} 5 2+2^2 6 {6,10} 7 2+2^3 10 {10,2} 10 10 KEY INT SUCC. 10+2^0 11 {11,12} 11 10+2^1 12 {12,14} 15 10+2^2 14 {14,2} 15 10+2^3 2 {2,10} 2 6 Lookup(k) 2 KEY INT SUCC. 2+2^0 3 {3,4} 5 2+2^1 4 {4,6} 5 2+2^2 6 {6,10} 7 2+2^3 10 {10,2} 10 10 KEY INT SUCC. 10+2^0 11 {11,12} 11 10+2^1 12 {12,14} 15 10+2^2 14 {14,2} 15 10+2^3 2 {2,10} 2 7 Architettura P2P basata sull’ontologia HyperCuP • Architettura P2P in cui i nodi sono disposti a ipercubo o hypercube • Il cubo di base consiste di N = b^(Lmax +1) nodi, i quali hanno (b - 1) * (Lmax +1) vicini • Caratteristiche: - gli spigoli sono contrassegnati dal livello di vicinanza che va da 0 a Lmax - gli spigoli sono indiretti - ogni peer può avere solo un vicino per ogni livello di vicinanza 8 Routing con ontologia • Le informazioni contenute nei peer vengono organizzate in categorie per esprimere un concetto generale • I concetti, a loro volta, vengono raccolti in una ontologia globale • La rete può supportare combinazioni logiche dei concetti dell’ontologia durante le query • Il meccanismo di routing è diviso in due fasi: 1) invio query verso uno specifico cluster 2) processo broadcast verso tutti i peer del cluster 9 Esempio • Selezionare gli utenti che vendono biglietti aerei 10 Conclusioni Caratteristiche negative delle applicazioni P2P sono: • ridondanza dei dati • ridirezione HyperCuP si rivela più interessante di Chord Lavoro Futuro • Approfondimento sullo studio della implementazione di HyperCuP per quanto riguarda la: - comunicazione e scambio di dati fra peer - sicurezza dei dati 11 Grazie per l’attenzione 12