La linguistica computazionale Informatica e lingue naturali Teorie e applicazioni computazionali per la ricerca sulle lingue Informatica e lingue naturali - Isabella Chiari (2004) Luogo d’incontro tra linguistica teorica (e applicata) e tecnologie informatiche Area interdisciplinare e multidisciplinare Area legata a teorie linguistiche anche molto distanti 1 Informatica e lingue naturali - Isabella Chiari (2004) 1) Applicazioni computazionali per la linguistica Linguistica computazionale Linguistica computazionale Linguistica dei corpora { { 1) Applicazioni computazionali per la ricerca linguistica Paradigma comportamentista Approccio legato allo studio dei TESTI Natural Language Processing { { 2) Applicazioni linguistiche per scopi generali Informatica e lingue naturali - Isabella Chiari (2004) 2 3 Paradigma chomskyano Approccio legato allo studio delle REGOLE e della competenza linguistica Informatica e lingue naturali - Isabella Chiari (2004) 4 2) Applicazioni linguistiche per scopi generali Contributi teorici collaterali Approccio inizialmente a-teorico improntato a scopi tecnico-pratici applicativi { { { Traduzione automatica (primi stadi) Dizionari elettronici Correttori ortografici Informatica e lingue naturali - Isabella Chiari (2004) Teorie che hanno fortemente influenzato gli sviluppi recenti della linguistica computazionale 5 Informatica e lingue naturali - Isabella Chiari (2004) 6 1 Contributi principali Il paradigma di Chomsky Chomsky: modelli e linguaggi formali La teoria dell’informazione (Shannon) La statistica linguistica (Zipf, Guiraud, Herdan) L’intelligenza artificiale Informatica e lingue naturali - Isabella Chiari (2004) 7 La teoria dell’informazione Modello di teoria della trasmissione (fisica del segnale) – Shannon Informazione come scelta (a-semantica) Teorema Fondamentale per un canale discreto con disturbo { { Natural language generation Natural language understanding Il Parsing Statistical Natural Language Processing 8 Sorgente del rumore SORGENTE Segnali x trasmessi, con probabilità P(x) 9 CODIFICATORE E TRASMETTITORE Segnali RICEVENTE Segnali rumorosi y ricevuti Osservatore Teoria Informatica e lingue naturali - Isabella Chiari (2004) 10 La statistica linguistica Primi lavori statistici degli stenografi (Kaeding, Estoup) G. K. Zipf e il principio del minimo sforzo (tendenze del lessico e dei sistemi fonologici) La distribuzione statistica del lessico (Guiraud) Informatica e lingue naturali - Isabella Chiari (2004) Natural Language Processing La teoria dell’informazione La statistica linguistica Informatica e lingue naturali - Isabella Chiari (2004) «vi sono, comunque, dei modi di trasmettere le informazioni i quali sono ottimali nel combattere il disturbo» (1949: 72) La ridondanza Centralità della dimensione statistica del messaggio Informatica e lingue naturali - Isabella Chiari (2004) Teoria generativotrasformazionale Formalizzazione delle lingue Centralità del sistema a REGOLE Centralità della SINTASSI 11 La didattica delle lingue: wordbooks (Thorndike, Knease) I dizionari fondamentali (Basic English, Vocabolario di base, ecc.) I lessici di frequenza (LIF, LIP) Informatica e lingue naturali - Isabella Chiari (2004) 12 2