Rappresentazione dell`Informazione Semantica Lezione 1: Temi e

annuncio pubblicitario
Rappresentazione dell’Informazione Semantica
Lezione 1: Temi e Overview
Malvina Nissim
[email protected]
02 Febbraio 2009
1
1
Introduzione
1.1
Orari
Orari
• Lezioni
lunedi
mercoledi
11–13
11–13
aula informatica, via Centotrecento 18
aula informatica, via Centotrecento 18
• Ricevimento (DSLO, Studio 1)
martedi
1.2
14:30–16:00 (e su appuntamento)
Organizzazione
Organizzazione
• Lezioni
– slides
– attività durante la lezione
– attività pratiche su corpora
• Letture
– raccolta di letture (preparata da me e disponibile in dipartimento)
– manuale cqp (query language per corpora)
– letture aggiuntive su richesta
Letture facoltative di base (semantica)
• Federica Casadei (2003). Lessico e Semantica. Carocci, Roma
• Elisabetta Ježek (2005). Lessico. Il Mulino.
1.3
Contenuti
Contenuti del Corso
• Breve accenno alla nozione di significato
• Nozioni di rappresentazione
– intra-linguistica
– meta-linguistica
∗ traduzione/rappresentazione
∗ arricchimento/esplicitazione
2
Significato
Semantica: definizione e campo di indagine
La semantica è la branca della linguistica che si occupa dello studio del significato
• studio del significato delle parole (semantica lessicale)
• studio di come le parole si combinano tra loro per dare significato alla frase (semantica
frasale e del discorso)
NB: 6= lessicografia: studio della progettazione, compilazione, utilizzo e valutazione delle risorse
lessicali (dizionari)
Cos’è il significato?
• intuitivamente semplice capire cosa vuol dire che le parole hanno un significato
• tecnicamente complesso definire il significato
il significato è l’informazione trasmessa da un’espressione linguistica; il linguaggio è lo strumento
per parlare del mondo extra-linguistico
Ogden & Richards (1923)
3
Rappresentazione
3.1
Linguistica
Strumenti linguistici per esprimere il significato
Quali strumenti ha la lingua per codificare il significato?
Quali distinzioni possiamo voler marcare?
• morfologia
• lessico
• sintassi (sintagma/frase)
• discorso
• gestualità
2
Morfologia e Lessico
Morfologia/Lessico
• cane vs cani
• grande vs grandissimo (più grande)
• uomo vs donna
• bello vs carino
• il cane di mia sorella vs quel barboncino nero
• ...
⇒ qual è la differenza tra i primi tre esempi e il quarto/quinto?
Excursus: Senso e Riferimento
Frege: Sinn (senso) und Bedeutung (significato/riferimento)
• (Harry Potter è) Harry Potter
• (Harry Potter è) Il personaggio più famoso di J.K. Rowling
• (Harry Potter è) Il nemico di Voldemort
Le tre espressioni hanno lo stesso significato perché denotano la stessa entità (hanno lo
stesso referente), ma hanno un senso diverso: presentano la stessa entità da punti di vista
diversi
Estensione e intensione (Leibniz/Carnap)
• riferimento ' estensione = insieme delle entità a cui è applicabile un’espressione
• senso ' intensione = insieme delle proprietà che individuano la suddetta entità
Oggettività e Soggettività
• “Quel barboncino nero è veramente brutto”
questa è un’espressione soggettiva. Per Frege il senso è una denotazione oggettiva, condivisibile. Le definizioni soggettive sono rappresentazioni. Il senso (Sinn) è quindi diverso
dalla rappresentazione (Vorstellung)
3
Sintagma/Frase
Sintagma nominale
• qual è la differenza tra ”cane” o ”barboncino” e ”il barboncino di mia sorella”?
• non solo una distinzione di senso: con ”il barboncino di mia sorella” siamo entrati nella
sintassi
• nominali complessi
informazione semantica
possesso
materia
tema
funzione
...
realizzazione linguistica
il barboncino di mia sorella
coltello di plastica
suonatore di chitarra
coltello da pane
...
• le descrizioni qui sopra individuano oggetti, ma la lingua ci consente anche di parlare di
eventi
Struttura argomentale
• Gino e Gina ballano → monovalente
• Gino costruisce un muro → bivalente
• il verbo esprime relazioni tra espressioni: queste espressioni sono gli argomenti del verbo
argomenti: partecipanti all’azione o stato espresso dal verbo
• Gino ha costruito un muro
• Paolo ha rotto una tazza
Struttura argomentale
argomenti
vs
aggiunti
• argomenti: costituenti obbligatori (interni al SV)
– * Ernesta ha costruito
– * Paolo ha rotto
• aggiunti: costituenti opzionali (forniscono informazioni aggiuntive)
– Ernesta ha costruito una casa in collina nel 1992
– Paolo ha rotto una tazza con un martello in cantina
4
Struttura tematica
specifica la relazione semantica tra il verbo e i propri argomenti identificandone i ruoli: ruoli
tematici
• Gino ha costruito un muro
• Paolo ha rotto una tazza
• costruire ⇒ “costruttore” & “costruito”
• rompere ⇒ “rompitore” & “rotto”
cosa hanno in comune i rompitori e i costruttori?
Ruoli tematici
i ruoli tematici hanno lo scopo di catturare la ‘similarità’ semantica tra rompitori e costruttori
• i soggetti di entrambi i verbi sono agenti: agente è il ruolo tematico che esprime una
“causa volitiva”
• gli oggetti diretti di entrambi i verbi sono prototipicamente oggetti inanimati che sono
colpiti dall’azione: tale elemento è il paziente (o tema)
il contorno argomentale del verbo codifica le relazioni semantiche
Discorso
Connettivi
• Ho fame...
– perché non ho fatto colazione.
– anche se ho fatto una lauta colazione.
• È una splendida giornata di sole...
– e quindi sono uscito.
– però sono rimasto a casa.
5
Definitezza/Unicità
• ? guarda il cane!
• dov’è la chiave?
• guarda la luna! (definiti semantici )
3.2
Meta-linguistica
Traduzione/Rappresentazione
Rappresentazione meta-linguistica
• utilizzare un linguaggio preciso, formale, per tradurre (rappresentare) il linguaggio naturale
– logica del prim’ordine / logica dei predicati
– montague semantics / lambda calculus
– discourse representation theory
– mondi possibili
– spazi mentali
– qualia structure (generative lexicon)
• riordinare, cioè classificare le informazioni
– principi di classificazione
– dizionari (elettronici)
– risorse lessicali complesse
Esempio: lambda calculus
• lambda calculus, inventato da Church negli anni ’30
• portato in linguistica da Richard Montague
•
[λx.[λy.y costruisce x]]
6
Esplicitazione/Arricchimento
Esplicitazione
Esistono condizioni in cui la lingua ci consente di lasciare una parte dell’informazione “nascosta”
(implicita) senza perdere potere comunicativo
• omonimia o ambiguità di senso
→ riso/riso, parco/parco, senso, fresco
• sottospecificazione
→ N+P+N (”coltello da pane”, ”faccia da schiaffi”, ”bicchiere di
vino”, ”forchetta di plastica”)
• opacità
→ metafore, metonimie, polirematiche in generale
⇒ Livello linguistico: informazione implicita
⇒ Livello meta-linguistico: informazione esplicita
Arricchimento
• Aggiunta di meta-informazione ai dati linguistici: annotazione
• HTML: HyperT Markup Language
http://www.w3schools.com/Html/tryit.asp?filename=tryhtml_basic
• XML: eXtensible Markup Language
• usa tags per l’annotazione
• diversamente dall’HTML
– è un linguaggio estendibile: si possono creare nuove “tags”
– l’annotazione riflette il significato dei dati e non il loro aspetto
XML
• questa presentazione è un file
• contiene vari elementi “diapositiva”
• ogni elemento “diapositiva” contiene alcuni attributi:
– titolo
– numero
– ...
• ogni elemento “diapositiva” contiene ulteriori elementi (liste, figure, . . . ...)
7
XML
Struttura argomentale
• Gino ha costruito un muro
• Il muro è stato costruito da Gino
⇒ argomenti del verbo diversi ⇒ ruoli tematici (relazione semantica) equivalenti
FrameNet: annotazione del contorno tematico
http://framenet.icsi.berkeley.edu/
8
Scarica