La Social Network Analysis applicata alla ricerca semantica

La Social Network Analysis
applicata alla ricerca semantica
Ernesto Lastres
Sistemi Territoriali S.r.l.
Cascina (Pisa), Italy
Il Progetto ODINet è realizzato con il
determinante contributo della Regione Toscana a
valere sul Programma Operativo Regionale
cofinanziato dal FESR per l’obiettivo
“Competitività regionale e occupazione” anni
2007-2013.
Workshop ODINet, CNR – Pisa, 24 Marzo 2015
Rete o Grafo
• La rete esprime la connettività, cioè come le “cose” sono
collegate
• Studio del grafo come oggetto matematico/informatico
• Nella grafo possiamo individuare molte misure (indicatori di rete)
che possono caratterizzare i dati (nella rete).
• Sono difficilmente estraibili se non con tecniche di analisi di reti
• I problemi sulle reti sono notoriamente molto complessi
Workshop ODINet, CNR – Pisa, 24 Marzo 2015
Cos’è una rete sociale?
• Una Rete Sociale (Social Network) consiste in un gruppo
di entità/oggetti connessi tra loro da legami di tipo
sociale, tematico, infrastrutturale, ecc.
• Lo scopo dell'Analisi delle Reti Sociali è quello di
individuare e analizzare i legami (connessioni) tra le
entità per individuare i nodi con un ruolo o
significatività particolare secondo un criterio dato:
Centralità
Coesione
Vicinanza
Influenza reciproca
Workshop ODINet, CNR – Pisa, 24 Marzo 2015
Le Reti Sociali
Relazioni Patrimoniali e Famigliari
Attori
• Persone
• Famiglie
• Immobili
• Società
• Terreni
• Macchine
• Barche
Relazioni
• Amicizia
• Uso
• Scambio
• Proprietà
• Collaborazione
• Condivisione
• Appartenenza
• Contratto
Workshop ODINet, CNR – Pisa, 24 Marzo 2015
La Nostra Rete Sociale
Attori
• Concetti
• Termini (literals)
• Datasets
• Cartelle
• Siti Web
• Persone e
Organizzazioni
Relazioni
• Tematiche (keywords)
• Semantiche (concettuali)
• Links (URL/RDF)
• Sociali
Autore
Pubblicatore
Utilizzatore
Feedback
Workshop ODINet, CNR – Pisa, 24 Marzo 2015
Cosa differenza la rete sociale da altri tipi di rete?
es. Rete Idrica o una Rete Stradale
Workshop ODINet, CNR – Pisa, 24 Marzo 2015
Small World e 6 Gradi di Separazione
• Small World Network
– Sono reti che hanno pochi archi e tanti nodi connessi
– Ci sono tantissimi nodi con un solo arco e pochi con
molti archi (distribuzione esponenziale)
– Pochi gradi di separazione tra due nodi qualsiasi
• Queste reti hanno un riscontro in tanti
aspetti del mondo reale
–
–
–
–
–
Società
Economia
Sistemi biologici
Mercati
Trasporti, ….
• Per questo motivo le proprietà di queste
reti vengono studiate molto
L ~ log(|V|)
Workshop ODINet, CNR – Pisa, 24 Marzo 2015
Indici di Centralità
• Degree
 Il più semplice di tutti. Indice locale in funzione di quanti
archi ha il nodo in ingresso e/o uscita
• Eigenvector
 È una misura di quanto centrale è il nodo in relazione alla sua
influenza (link) con i vicini. Il PageRank di Google è una
variante di questo indice
• Betweenness
 Indica quanto centrale è il nodo in relazione al passaggio di
informazione che lo attraversa proveniente dal resto del
grafo
• Closeness
 Indica mediamente quanto vicino (in gradi di separazione) è
il nodo dal resto del grafo
Workshop ODINet, CNR – Pisa, 24 Marzo 2015
Indici di Centralità
alta
bassa
alta
bassa
Eigenvector
Betweenness
Workshop ODINet, CNR – Pisa, 24 Marzo 2015
SNA nel Ranking dei Dati
• PageRank (quello di Google), ma applicato al grafo di dataset e
concetti
• Assunzione: Un dataset è più rilevante per una ricerca se ha più
link entranti provenienti da entità «importanti» del grafo.
• Come funziona: conta il numero e l’importanza dei link a
un’entità del grafo per fare una stima di quanto un dataset è
importante nel contesto di una ricerca
Se l’amico della mia amica
è un tipo importante
probabilmente qualcosa
«arriverà» a me.
Workshop ODINet, CNR – Pisa, 24 Marzo 2015
La Social Network Analysis e ODINet
• Creazione di un grafo di conoscenza formato dai concetti delle ontologie
tematiche di riferimento e dai dataset
• Indici di centralità e di flusso in funzione di un criterio
 Individuare nodi (sia dataset che concetti) della rete con le caratteristiche
indicate.
 Ottenere indici di centralità
 Dare rilevanza ai risultati in funzione dei criteri di ricerca prefissati
 Ordinare i risultati
Workshop ODINet, CNR – Pisa, 24 Marzo 2015
Grazie per l’attenzione
Workshop ODINet, CNR – Pisa, 24 Marzo 2015