Rappresentazione dell’Informazione Semantica Lezione 1: Temi e Overview Malvina Nissim [email protected] 02 Febbraio 2009 1 1 Introduzione 1.1 Orari Orari • Lezioni lunedi mercoledi 11–13 11–13 aula informatica, via Centotrecento 18 aula informatica, via Centotrecento 18 • Ricevimento (DSLO, Studio 1) martedi 1.2 14:30–16:00 (e su appuntamento) Organizzazione Organizzazione • Lezioni – slides – attività durante la lezione – attività pratiche su corpora • Letture – raccolta di letture (preparata da me e disponibile in dipartimento) – manuale cqp (query language per corpora) – letture aggiuntive su richesta Letture facoltative di base (semantica) • Federica Casadei (2003). Lessico e Semantica. Carocci, Roma • Elisabetta Ježek (2005). Lessico. Il Mulino. 1.3 Contenuti Contenuti del Corso • Breve accenno alla nozione di significato • Nozioni di rappresentazione – intra-linguistica – meta-linguistica ∗ traduzione/rappresentazione ∗ arricchimento/esplicitazione 2 Significato Semantica: definizione e campo di indagine La semantica è la branca della linguistica che si occupa dello studio del significato • studio del significato delle parole (semantica lessicale) • studio di come le parole si combinano tra loro per dare significato alla frase (semantica frasale e del discorso) NB: 6= lessicografia: studio della progettazione, compilazione, utilizzo e valutazione delle risorse lessicali (dizionari) Cos’è il significato? • intuitivamente semplice capire cosa vuol dire che le parole hanno un significato • tecnicamente complesso definire il significato il significato è l’informazione trasmessa da un’espressione linguistica; il linguaggio è lo strumento per parlare del mondo extra-linguistico Ogden & Richards (1923) 3 Rappresentazione 3.1 Linguistica Strumenti linguistici per esprimere il significato Quali strumenti ha la lingua per codificare il significato? Quali distinzioni possiamo voler marcare? • morfologia • lessico • sintassi (sintagma/frase) • discorso • gestualità 2 Morfologia e Lessico Morfologia/Lessico • cane vs cani • grande vs grandissimo (più grande) • uomo vs donna • bello vs carino • il cane di mia sorella vs quel barboncino nero • ... ⇒ qual è la differenza tra i primi tre esempi e il quarto/quinto? Excursus: Senso e Riferimento Frege: Sinn (senso) und Bedeutung (significato/riferimento) • (Harry Potter è) Harry Potter • (Harry Potter è) Il personaggio più famoso di J.K. Rowling • (Harry Potter è) Il nemico di Voldemort Le tre espressioni hanno lo stesso significato perché denotano la stessa entità (hanno lo stesso referente), ma hanno un senso diverso: presentano la stessa entità da punti di vista diversi Estensione e intensione (Leibniz/Carnap) • riferimento ' estensione = insieme delle entità a cui è applicabile un’espressione • senso ' intensione = insieme delle proprietà che individuano la suddetta entità Oggettività e Soggettività • “Quel barboncino nero è veramente brutto” questa è un’espressione soggettiva. Per Frege il senso è una denotazione oggettiva, condivisibile. Le definizioni soggettive sono rappresentazioni. Il senso (Sinn) è quindi diverso dalla rappresentazione (Vorstellung) 3 Sintagma/Frase Sintagma nominale • qual è la differenza tra ”cane” o ”barboncino” e ”il barboncino di mia sorella”? • non solo una distinzione di senso: con ”il barboncino di mia sorella” siamo entrati nella sintassi • nominali complessi informazione semantica possesso materia tema funzione ... realizzazione linguistica il barboncino di mia sorella coltello di plastica suonatore di chitarra coltello da pane ... • le descrizioni qui sopra individuano oggetti, ma la lingua ci consente anche di parlare di eventi Struttura argomentale • Gino e Gina ballano → monovalente • Gino costruisce un muro → bivalente • il verbo esprime relazioni tra espressioni: queste espressioni sono gli argomenti del verbo argomenti: partecipanti all’azione o stato espresso dal verbo • Gino ha costruito un muro • Paolo ha rotto una tazza Struttura argomentale argomenti vs aggiunti • argomenti: costituenti obbligatori (interni al SV) – * Ernesta ha costruito – * Paolo ha rotto • aggiunti: costituenti opzionali (forniscono informazioni aggiuntive) – Ernesta ha costruito una casa in collina nel 1992 – Paolo ha rotto una tazza con un martello in cantina 4 Struttura tematica specifica la relazione semantica tra il verbo e i propri argomenti identificandone i ruoli: ruoli tematici • Gino ha costruito un muro • Paolo ha rotto una tazza • costruire ⇒ “costruttore” & “costruito” • rompere ⇒ “rompitore” & “rotto” cosa hanno in comune i rompitori e i costruttori? Ruoli tematici i ruoli tematici hanno lo scopo di catturare la ‘similarità’ semantica tra rompitori e costruttori • i soggetti di entrambi i verbi sono agenti: agente è il ruolo tematico che esprime una “causa volitiva” • gli oggetti diretti di entrambi i verbi sono prototipicamente oggetti inanimati che sono colpiti dall’azione: tale elemento è il paziente (o tema) il contorno argomentale del verbo codifica le relazioni semantiche Discorso Connettivi • Ho fame... – perché non ho fatto colazione. – anche se ho fatto una lauta colazione. • È una splendida giornata di sole... – e quindi sono uscito. – però sono rimasto a casa. 5 Definitezza/Unicità • ? guarda il cane! • dov’è la chiave? • guarda la luna! (definiti semantici ) 3.2 Meta-linguistica Traduzione/Rappresentazione Rappresentazione meta-linguistica • utilizzare un linguaggio preciso, formale, per tradurre (rappresentare) il linguaggio naturale – logica del prim’ordine / logica dei predicati – montague semantics / lambda calculus – discourse representation theory – mondi possibili – spazi mentali – qualia structure (generative lexicon) • riordinare, cioè classificare le informazioni – principi di classificazione – dizionari (elettronici) – risorse lessicali complesse Esempio: lambda calculus • lambda calculus, inventato da Church negli anni ’30 • portato in linguistica da Richard Montague • [λx.[λy.y costruisce x]] 6 Esplicitazione/Arricchimento Esplicitazione Esistono condizioni in cui la lingua ci consente di lasciare una parte dell’informazione “nascosta” (implicita) senza perdere potere comunicativo • omonimia o ambiguità di senso → riso/riso, parco/parco, senso, fresco • sottospecificazione → N+P+N (”coltello da pane”, ”faccia da schiaffi”, ”bicchiere di vino”, ”forchetta di plastica”) • opacità → metafore, metonimie, polirematiche in generale ⇒ Livello linguistico: informazione implicita ⇒ Livello meta-linguistico: informazione esplicita Arricchimento • Aggiunta di meta-informazione ai dati linguistici: annotazione • HTML: HyperT Markup Language http://www.w3schools.com/Html/tryit.asp?filename=tryhtml_basic • XML: eXtensible Markup Language • usa tags per l’annotazione • diversamente dall’HTML – è un linguaggio estendibile: si possono creare nuove “tags” – l’annotazione riflette il significato dei dati e non il loro aspetto XML • questa presentazione è un file • contiene vari elementi “diapositiva” • ogni elemento “diapositiva” contiene alcuni attributi: – titolo – numero – ... • ogni elemento “diapositiva” contiene ulteriori elementi (liste, figure, . . . ...) 7 XML Struttura argomentale • Gino ha costruito un muro • Il muro è stato costruito da Gino ⇒ argomenti del verbo diversi ⇒ ruoli tematici (relazione semantica) equivalenti FrameNet: annotazione del contorno tematico http://framenet.icsi.berkeley.edu/ 8