Rappresentazione dell`Informazione Semantica Lezione 1: Temi e

annuncio pubblicitario
Rappresentazione dell’Informazione Semantica
Lezione 1: Temi e Overview
Malvina Nissim
[email protected]
6 Febbraio 2013
1
Introduzione
1.1
Orari
Orari
• Lezioni
mercoledi
giovedi
venerdi
15–18
13–16
13–16
laboratorio informatico, via Zamboni 34
laboratorio informatico, via Zamboni 34
laboratorio informatico, via Zamboni 34
• Ricevimento (Dip. di Filologia Classica e Italianistica, via Zamboni 32, II piano, studio
25) nel periodo del corso
mercoledi
su appuntamento
1.2
11:30–12:30
(email)
Organizzazione
Organizzazione
• Lezioni
– slides + handouts
– attività durante la lezione
– attività pratiche su corpora
• Letture
– raccolta di letture (preparata da me e disponibile in dipartimento a partire da venerdi
pomeriggio)
1
– letture “pratiche” per lavorare sui dati (manuali)
– letture aggiuntive su richesta
NB: tutti i materiali relativi alle lezioni sono disponibili online:
corpora.dslo.unibo.it/People/Nissim/teaching.html
Letture facoltative di base (semantica)
• Federica Casadei (2003). Lessico e Semantica. Carocci, Roma
• Elisabetta Ježek (2005). Lessico. Il Mulino.
• John Lyons (1981). Lezioni di Linguistica. Laterza.
1.3
Contenuti
Contenuti del Corso
• Breve accenno alla nozione di significato
• Rappresentazione
– intra-linguistica
– meta-linguistica
∗ formalizzazione/classificazione/strutturazione
∗ arricchimento/esplicitazione
2
Significato
Semantica: definizione e campo di indagine
La semantica è la branca della linguistica che si occupa dello studio del significato
• studio del significato delle parole (semantica lessicale)
• studio di come le parole si combinano tra loro per dare significato alla frase (semantica
frasale e del discorso)
NB: 6= lessicografia: studio della progettazione, compilazione, utilizzo e valutazione delle risorse
lessicali (dizionari)
parleremo anche di questo
2
Cos’è il significato?
• intuitivamente semplice capire cosa vuol dire che le parole hanno un significato
• tecnicamente complesso definire il significato
il significato è l’informazione trasmessa da un’espressione linguistica; il linguaggio è lo strumento
per parlare del mondo extra-linguistico
Ogden & Richards (1923)
Studio del significato
• singole parole
→ lessicologia, lessicografia e semantica lessicale
• combinazione di parole per formare singole frasi
→ semantica frasale (semantica formale)
• combinazione di frasi per formare un discorso
→ semantica del discorso
3
Rappresentazione
3
4
3.1
Linguistica
Strumenti linguistici per esprimere il significato
Quali strumenti ha la lingua per codificare il significato?
Quali distinzioni possiamo voler marcare?
• morfologia
• lessico
• sintassi (sintagma/frase)
• discorso
• gestualità
Morfologia e Lessico
Morfologia/Lessico
• cane vs cani
• grande vs grandissimo (più grande)
• uomo vs donna
• bello vs carino
5
• il cane di mia sorella vs quel barboncino nero
• ...
⇒ qual è la differenza tra i primi tre esempi e il quarto/quinto?
Excursus: Senso e Riferimento
Frege: Sinn (senso) und Bedeutung (significato/riferimento)
• (Harry Potter è) Harry Potter
• (Harry Potter è) Il personaggio più famoso di J.K. Rowling
• (Harry Potter è) Il nemico di Voldemort
Le tre espressioni hanno lo stesso significato perché denotano la stessa entità (hanno lo
stesso referente), ma hanno un senso diverso: presentano la stessa entità da punti di vista
diversi
Estensione e intensione (Leibniz/Carnap)
• riferimento ' estensione = insieme delle entità a cui è applicabile un’espressione
• senso ' intensione = insieme delle proprietà che individuano la suddetta entità
Molteplicità di espressioni e molteplicità di referenti
• più espressioni per indicare uno stesso oggetto
ma pensiamo anche alla situazione “inversa”...
• più oggetti indicati dalla stessa espressione!
⇒ omonimia
⇒ polisemia
Sintagma/Frase
Sintagma nominale
• qual è la differenza tra “cane” o “barboncino” e “il barboncino di mia sorella”?
• non solo una distinzione di senso: con “il barboncino di mia sorella” siamo entrati nella
morfosintassi
6
• nominali complessi
informazione semantica
possesso
materia
tema
funzione
...
realizzazione linguistica
il barboncino di mia sorella
coltello di plastica
suonatore di chitarra
coltello da pane
...
• le descrizioni qui sopra individuano oggetti, ma la lingua ci consente anche di parlare di
eventi
Struttura argomentale
• Gino e Gina ballano → monovalente
• Gino costruisce un muro → bivalente
• il verbo esprime relazioni tra espressioni: queste espressioni sono gli argomenti del verbo
argomenti: partecipanti all’azione o stato espresso dal verbo
• Gino ha costruito un muro
• Paolo ha rotto una tazza
Struttura argomentale
argomenti
vs
aggiunti
• argomenti: costituenti obbligatori (interni al SV)
– * Ernesta ha costruito
– * Paolo ha rotto
• aggiunti: costituenti opzionali (forniscono informazioni aggiuntive)
– Ernesta ha costruito una casa in collina nel 1992
– Paolo ha rotto una tazza con un martello in cantina
Struttura tematica
specifica la relazione semantica tra il verbo e i propri argomenti identificandone i ruoli: ruoli
tematici
• Gino ha costruito un muro
• Paolo ha rotto una tazza
7
• costruire ⇒ “costruttore” & “costruito”
• rompere ⇒ “rompitore” & “rotto”
cosa hanno in comune i rompitori e i costruttori?
Ruoli tematici
i ruoli tematici hanno lo scopo di catturare la ‘similarità’ semantica tra rompitori e costruttori
• i soggetti di entrambi i verbi sono agenti: agente è il ruolo tematico che esprime una
“causa volitiva”
• gli oggetti diretti di entrambi i verbi sono prototipicamente oggetti inanimati che sono
colpiti dall’azione: tale elemento è il paziente (o tema)
il contorno argomentale del verbo codifica le relazioni semantiche
Discorso
Connettivi
• Ho fame...
– perché non ho fatto colazione.
– anche se ho fatto una lauta colazione.
• È una splendida giornata di sole...
– e quindi sono uscito.
– però sono rimasto a casa.
Definitezza/Unicità
• ? guarda il cane!
• dov’è la chiave?
• guarda la luna! (definiti semantici )
8
3.2
Meta-linguistica
Rappresentazione meta-linguistica
• traduzione/formalizzazione
• esplicitazione/arricchimento
Formalizzazione/Classificazione/Strutturazione
strutturare, classificare le informazioni
• principi di classificazione
• dizionari (elettronici)
• risorse lessicali complesse
– WordNet
– VerbNet
– FrameNet
• qualia structure (generative lexicon)
Esempio: Dizionario
Esplicitazione/Arricchimento
Esistono condizioni in cui la lingua ci consente di lasciare una parte dell’informazione “nascosta”
(implicita) senza perdere potere comunicativo
• omonimia o ambiguità di senso
→ riso/riso, parco/parco, senso, fresco
• sottospecificazione
→ N+P+N (”coltello da pane”, ”faccia da schiaffi”, ”bicchiere di
vino”, ”forchetta di plastica”)
• opacità
→ metafore, metonimie, polirematiche in generale
⇒ Livello linguistico: informazione implicita
⇒ Livello meta-linguistico: informazione esplicita
Arricchimento
• Aggiunta di meta-informazione ai dati linguistici: annotazione
• HTML: HyperT Markup Language
http://www.w3schools.com/Html/tryit.asp?filename=tryhtml_basic
• XML: eXtensible Markup Language
9
• usa tags per l’annotazione
• diversamente dall’HTML
– è un linguaggio estendibile: si possono creare nuove “tags”
– l’annotazione riflette il significato dei dati e non il loro aspetto
XML
• questa presentazione è un file
• contiene vari elementi “diapositiva”
• ogni elemento “diapositiva” contiene alcuni attributi:
– titolo
– numero
– ...
• ogni elemento “diapositiva” contiene ulteriori elementi (liste, figure, . . . ...)
XML
Struttura argomentale
• Gino ha costruito un muro
• Il muro è stato costruito da Gino
⇒ argomenti del verbo diversi ⇒ ruoli tematici (relazione semantica) equivalenti
10
FrameNet: annotazione del contorno tematico
http://framenet.icsi.berkeley.edu/
Wikipedia
11
Wiki semantici
Wiki semantici: ambienti collaborativi arricchiti con annotazione di tipo semantico, per ottimizzare la ricerca, l’organizzazione e la condivisione del loro contenuto
”’Bologna”’ [...] is the capital city of [[is-capital-of: Emilia-Romagna]] in northern
[[located-in: Italy]], in the Po Valley ([[Pianura Padana]] in Italian), between the [[Po River]]
and the [[Apennine Mountains|Apennines]], exactly between the [[Reno River]] and the [[Sàvena
River]]. Home of the oldest university in the world, [[host-to: ‘‘Alma Mater Studiorum"]],
founded in 1088,
Giocare con il significato
check www.wordrobe.org
12
Scarica