Informatica e lingue naturali La linguistica

La linguistica computazionale
Informatica e lingue naturali
„
„
Teorie e applicazioni
computazionali per la ricerca
sulle lingue
Informatica e lingue naturali - Isabella Chiari
(2004)
„
Luogo d’incontro tra linguistica teorica
(e applicata) e tecnologie informatiche
Area interdisciplinare e
multidisciplinare
Area legata a teorie linguistiche anche
molto distanti
1
Informatica e lingue naturali - Isabella Chiari
(2004)
1) Applicazioni computazionali
per la linguistica
Linguistica computazionale
„
Linguistica computazionale
Linguistica dei
corpora
{
{
1) Applicazioni computazionali
per la ricerca linguistica
Paradigma
comportamentista
Approccio legato
allo studio dei
TESTI
„
Natural Language
Processing
{
{
2) Applicazioni linguistiche
per scopi generali
Informatica e lingue naturali - Isabella Chiari
(2004)
2
3
Paradigma
chomskyano
Approccio legato
allo studio delle
REGOLE e della
competenza
linguistica
Informatica e lingue naturali - Isabella Chiari
(2004)
4
2) Applicazioni linguistiche per
scopi generali
„
Contributi teorici collaterali
Approccio inizialmente a-teorico
improntato a scopi tecnico-pratici
applicativi
{
{
{
Traduzione automatica (primi stadi)
Dizionari elettronici
Correttori ortografici
Informatica e lingue naturali - Isabella Chiari
(2004)
Teorie che hanno fortemente
influenzato gli sviluppi recenti
della linguistica
computazionale
5
Informatica e lingue naturali - Isabella Chiari
(2004)
6
1
Contributi principali
„
„
„
„
Il paradigma di Chomsky
Chomsky: modelli e linguaggi formali
La teoria dell’informazione (Shannon)
La statistica linguistica (Zipf, Guiraud,
Herdan)
L’intelligenza artificiale
Informatica e lingue naturali - Isabella Chiari
(2004)
„
„
„
„
7
La teoria dell’informazione
„
„
„
Modello di teoria della
trasmissione (fisica
del segnale) –
Shannon
Informazione come
scelta (a-semantica)
Teorema
Fondamentale per un
canale discreto con
disturbo
„
„
„
„
„
{
{
„
„
Natural language
generation
Natural language
understanding
Il Parsing
Statistical Natural
Language
Processing
8
Sorgente
del rumore
SORGENTE
Segnali x
trasmessi,
con probabilità
P(x)
9
CODIFICATORE
E
TRASMETTITORE
Segnali
RICEVENTE
Segnali rumorosi y
ricevuti
Osservatore
Teoria
Informatica e lingue naturali - Isabella Chiari
(2004)
10
La statistica linguistica
Primi lavori statistici degli stenografi
(Kaeding, Estoup)
G. K. Zipf e il principio del minimo
sforzo (tendenze del lessico e dei
sistemi fonologici)
La distribuzione statistica del lessico
(Guiraud)
Informatica e lingue naturali - Isabella Chiari
(2004)
Natural Language
Processing
La teoria dell’informazione
La statistica linguistica
„
„
Informatica e lingue naturali - Isabella Chiari
(2004)
«vi sono, comunque,
dei modi di trasmettere
le informazioni i quali
sono ottimali nel
combattere il disturbo»
(1949: 72)
La ridondanza
Centralità della
dimensione statistica
del messaggio
Informatica e lingue naturali - Isabella Chiari
(2004)
Teoria generativotrasformazionale
Formalizzazione
delle lingue
Centralità del
sistema a REGOLE
Centralità della
SINTASSI
„
„
„
11
La didattica delle lingue: wordbooks
(Thorndike, Knease)
I dizionari fondamentali (Basic
English, Vocabolario di base, ecc.)
I lessici di frequenza (LIF, LIP)
Informatica e lingue naturali - Isabella Chiari
(2004)
12
2