Rappresentazione dell’Informazione Semantica Lezione 1: Temi e Overview Malvina Nissim [email protected] 6 Febbraio 2013 1 Introduzione 1.1 Orari Orari • Lezioni mercoledi giovedi venerdi 15–18 13–16 13–16 laboratorio informatico, via Zamboni 34 laboratorio informatico, via Zamboni 34 laboratorio informatico, via Zamboni 34 • Ricevimento (Dip. di Filologia Classica e Italianistica, via Zamboni 32, II piano, studio 25) nel periodo del corso mercoledi su appuntamento 1.2 11:30–12:30 (email) Organizzazione Organizzazione • Lezioni – slides + handouts – attività durante la lezione – attività pratiche su corpora • Letture – raccolta di letture (preparata da me e disponibile in dipartimento a partire da venerdi pomeriggio) 1 – letture “pratiche” per lavorare sui dati (manuali) – letture aggiuntive su richesta NB: tutti i materiali relativi alle lezioni sono disponibili online: corpora.dslo.unibo.it/People/Nissim/teaching.html Letture facoltative di base (semantica) • Federica Casadei (2003). Lessico e Semantica. Carocci, Roma • Elisabetta Ježek (2005). Lessico. Il Mulino. • John Lyons (1981). Lezioni di Linguistica. Laterza. 1.3 Contenuti Contenuti del Corso • Breve accenno alla nozione di significato • Rappresentazione – intra-linguistica – meta-linguistica ∗ formalizzazione/classificazione/strutturazione ∗ arricchimento/esplicitazione 2 Significato Semantica: definizione e campo di indagine La semantica è la branca della linguistica che si occupa dello studio del significato • studio del significato delle parole (semantica lessicale) • studio di come le parole si combinano tra loro per dare significato alla frase (semantica frasale e del discorso) NB: 6= lessicografia: studio della progettazione, compilazione, utilizzo e valutazione delle risorse lessicali (dizionari) parleremo anche di questo 2 Cos’è il significato? • intuitivamente semplice capire cosa vuol dire che le parole hanno un significato • tecnicamente complesso definire il significato il significato è l’informazione trasmessa da un’espressione linguistica; il linguaggio è lo strumento per parlare del mondo extra-linguistico Ogden & Richards (1923) Studio del significato • singole parole → lessicologia, lessicografia e semantica lessicale • combinazione di parole per formare singole frasi → semantica frasale (semantica formale) • combinazione di frasi per formare un discorso → semantica del discorso 3 Rappresentazione 3 4 3.1 Linguistica Strumenti linguistici per esprimere il significato Quali strumenti ha la lingua per codificare il significato? Quali distinzioni possiamo voler marcare? • morfologia • lessico • sintassi (sintagma/frase) • discorso • gestualità Morfologia e Lessico Morfologia/Lessico • cane vs cani • grande vs grandissimo (più grande) • uomo vs donna • bello vs carino 5 • il cane di mia sorella vs quel barboncino nero • ... ⇒ qual è la differenza tra i primi tre esempi e il quarto/quinto? Excursus: Senso e Riferimento Frege: Sinn (senso) und Bedeutung (significato/riferimento) • (Harry Potter è) Harry Potter • (Harry Potter è) Il personaggio più famoso di J.K. Rowling • (Harry Potter è) Il nemico di Voldemort Le tre espressioni hanno lo stesso significato perché denotano la stessa entità (hanno lo stesso referente), ma hanno un senso diverso: presentano la stessa entità da punti di vista diversi Estensione e intensione (Leibniz/Carnap) • riferimento ' estensione = insieme delle entità a cui è applicabile un’espressione • senso ' intensione = insieme delle proprietà che individuano la suddetta entità Molteplicità di espressioni e molteplicità di referenti • più espressioni per indicare uno stesso oggetto ma pensiamo anche alla situazione “inversa”... • più oggetti indicati dalla stessa espressione! ⇒ omonimia ⇒ polisemia Sintagma/Frase Sintagma nominale • qual è la differenza tra “cane” o “barboncino” e “il barboncino di mia sorella”? • non solo una distinzione di senso: con “il barboncino di mia sorella” siamo entrati nella morfosintassi 6 • nominali complessi informazione semantica possesso materia tema funzione ... realizzazione linguistica il barboncino di mia sorella coltello di plastica suonatore di chitarra coltello da pane ... • le descrizioni qui sopra individuano oggetti, ma la lingua ci consente anche di parlare di eventi Struttura argomentale • Gino e Gina ballano → monovalente • Gino costruisce un muro → bivalente • il verbo esprime relazioni tra espressioni: queste espressioni sono gli argomenti del verbo argomenti: partecipanti all’azione o stato espresso dal verbo • Gino ha costruito un muro • Paolo ha rotto una tazza Struttura argomentale argomenti vs aggiunti • argomenti: costituenti obbligatori (interni al SV) – * Ernesta ha costruito – * Paolo ha rotto • aggiunti: costituenti opzionali (forniscono informazioni aggiuntive) – Ernesta ha costruito una casa in collina nel 1992 – Paolo ha rotto una tazza con un martello in cantina Struttura tematica specifica la relazione semantica tra il verbo e i propri argomenti identificandone i ruoli: ruoli tematici • Gino ha costruito un muro • Paolo ha rotto una tazza 7 • costruire ⇒ “costruttore” & “costruito” • rompere ⇒ “rompitore” & “rotto” cosa hanno in comune i rompitori e i costruttori? Ruoli tematici i ruoli tematici hanno lo scopo di catturare la ‘similarità’ semantica tra rompitori e costruttori • i soggetti di entrambi i verbi sono agenti: agente è il ruolo tematico che esprime una “causa volitiva” • gli oggetti diretti di entrambi i verbi sono prototipicamente oggetti inanimati che sono colpiti dall’azione: tale elemento è il paziente (o tema) il contorno argomentale del verbo codifica le relazioni semantiche Discorso Connettivi • Ho fame... – perché non ho fatto colazione. – anche se ho fatto una lauta colazione. • È una splendida giornata di sole... – e quindi sono uscito. – però sono rimasto a casa. Definitezza/Unicità • ? guarda il cane! • dov’è la chiave? • guarda la luna! (definiti semantici ) 8 3.2 Meta-linguistica Rappresentazione meta-linguistica • traduzione/formalizzazione • esplicitazione/arricchimento Formalizzazione/Classificazione/Strutturazione strutturare, classificare le informazioni • principi di classificazione • dizionari (elettronici) • risorse lessicali complesse – WordNet – VerbNet – FrameNet • qualia structure (generative lexicon) Esempio: Dizionario Esplicitazione/Arricchimento Esistono condizioni in cui la lingua ci consente di lasciare una parte dell’informazione “nascosta” (implicita) senza perdere potere comunicativo • omonimia o ambiguità di senso → riso/riso, parco/parco, senso, fresco • sottospecificazione → N+P+N (”coltello da pane”, ”faccia da schiaffi”, ”bicchiere di vino”, ”forchetta di plastica”) • opacità → metafore, metonimie, polirematiche in generale ⇒ Livello linguistico: informazione implicita ⇒ Livello meta-linguistico: informazione esplicita Arricchimento • Aggiunta di meta-informazione ai dati linguistici: annotazione • HTML: HyperT Markup Language http://www.w3schools.com/Html/tryit.asp?filename=tryhtml_basic • XML: eXtensible Markup Language 9 • usa tags per l’annotazione • diversamente dall’HTML – è un linguaggio estendibile: si possono creare nuove “tags” – l’annotazione riflette il significato dei dati e non il loro aspetto XML • questa presentazione è un file • contiene vari elementi “diapositiva” • ogni elemento “diapositiva” contiene alcuni attributi: – titolo – numero – ... • ogni elemento “diapositiva” contiene ulteriori elementi (liste, figure, . . . ...) XML Struttura argomentale • Gino ha costruito un muro • Il muro è stato costruito da Gino ⇒ argomenti del verbo diversi ⇒ ruoli tematici (relazione semantica) equivalenti 10 FrameNet: annotazione del contorno tematico http://framenet.icsi.berkeley.edu/ Wikipedia 11 Wiki semantici Wiki semantici: ambienti collaborativi arricchiti con annotazione di tipo semantico, per ottimizzare la ricerca, l’organizzazione e la condivisione del loro contenuto ”’Bologna”’ [...] is the capital city of [[is-capital-of: Emilia-Romagna]] in northern [[located-in: Italy]], in the Po Valley ([[Pianura Padana]] in Italian), between the [[Po River]] and the [[Apennine Mountains|Apennines]], exactly between the [[Reno River]] and the [[Sàvena River]]. Home of the oldest university in the world, [[host-to: ‘‘Alma Mater Studiorum"]], founded in 1088, Giocare con il significato check www.wordrobe.org 12