Presentazione di PowerPoint - Istituto di Linguistica Computazionale

informatica di base
per le discipline umanistiche
vito pirrelli
Istituto di Linguistica
Computazionale CNR Pisa
Dipartimento di linguistica
Università di Pavia
prima lezione
introduzione: computer e linguaggio
vito pirrelli
Istituto di Linguistica
Computazionale CNR Pisa
Dipartimento di linguistica
Università di Pavia
schema del corso
„
„
„
„
30 ore di lezione
20 ore di esercitazione
una verifica scritta (per 10 punti
complessivi)
esame orale (rimanenti 20 punti)
lezione 1
orari
„
lezioni
‹
‹
„
esercitazioni (a partire dal 18 marzo)
‹
„
lunedì: 16.45 - 18.30 (aula L2)
martedì: 9.15 - 10.45 (aula L2)
martedì: 15 - 16.45 (aula L3)
ricevimento studenti
martedì: 11.30 – 13.30
Dipartimento di Linguistica
‹
lezione 1
servizi web
„
mailing list del corso
‹
per iscriversi:

„
http://mail.ilc.cnr.it/mailman/listinfo/informatica_unipv
sito web del corso: http://webilc.ilc.cnr.it/~pirrelli
‹
contiene




descrizione del corso
presentazioni delle lezioni
letture consigliate
altro materiale utile
lezione 1
si richiedono ...
„
„
nozioni di linguistica teorica di base (elementi di
morfologia e sintassi)
familiarità col computer come strumento di base per la
casa/ufficio:
‹
‹
‹
‹
‹
sistema operativo a finestre
gestione cartelle
creazione e gestione di documenti testo (word
processing),
creazione e gestione di documenti di dati non testuali
(fogli elettronici, database),
navigazione del web con un browser
lezione 1
non si richiedono ...
„
„
„
„
„
familiarità con l’architettura concettuale e funzionale di un
computer
familiarità con infrastrutture hardware e software
familiarità con un linguaggio di programmazione (Pascal, C,
C++, Java ecc.)
nozioni di base di linguistica computazionale
familiarità con applicazioni del computer al trattamento
automatico del testo (correttori grammaticali, correttori di
stile, strumenti per le concordanze ecc.)
lezione 1
si vuole offrire...
„
„
„
„
„
„
familiarità con l’architettura concettuale e funzionale di
un computer
familiarità con infrastrutture hardware e software
nozioni di base di linguistica computazionale
operazioni di base del calcolatore sul testo
alcuni esempi d’uso di queste operazioni
riflessioni metodologiche
lezione 1
non si offriranno...
„
„
„
nozioni di programmazione
dettagli sui modelli e sui metodi per il trattamento
automatico del linguaggio (NLP)
competenze specifiche per l’uso di software
commerciale
lezione 1
le domande a cui saprete
rispondere ...
„
„
„
„
„
su che tipo di dati linguistici il calcolatore è in grado di
operare?
quali operazioni è capace di eseguire su questi dati?
come si organizzano queste operazioni e quali problemi
possono ragionevolmente aiutarci a risolvere?
che cosa vuol dire analizzare un testo al computer e in che
misura il computer può migliorare la nostra comprensione di
un testo?
quale impatto ha avuto la tecnologia informatica sulle
discipline umanistiche e sul modo in cui oggi studiamo il
linguaggio?
lezione 1
schema del corso
„
„
„
Parte prima:
Introduzione - computer e linguaggio
Parte seconda:
Il testo in formato digitale
Parte terza:
computer e cervello umano
(per saperne di più clicca sulle icone!)
lezione 1
parte prima: introduzione
„
computer e linguaggio
‹
Cos’è un computer?
‹
Come funziona?
‹
Il linguaggio e il computer: “calcolatrice” o “cervello
elettronico”?
lezione 1
parte seconda:
il testo in formato digitale
„
Le parole come numeri
elementi strutturali del testo ortografico
‹ il corpus
‹
„
l’analisi linguistica del testo: livelli di annotazione
‹
„
XML
archivi elettronici testuali e lessicali
lezione 1
(parte terza:
computer e cervello)
„
„
„
acquisizione di informazione linguistica da
basi di dati testuali
le parole come stimoli
il linguaggio e il tempo:
apprendimento e mutamento
lezione 1
durata del corso
„
„
il corso consiste di un modulo unico di 50 ore
complessive (tra lezioni frontali e esercitazioni) che
si articola tra il terzo e quarto trimestre
i primi appelli di esame utili sono quelli relativi al
quarto trimestre
lezione 1
computer e
discipline umanistiche
„
perché?
‹
per imparare a usare il computer
‹
per studiare usando il computer





‹
corsi multimediali
ricerche sul www
ricerche su archivi digitali
ricerche su insiemi di dati non strutturati
...
per comunicare usando il computer




creare un ipertesto
creare un sito web
strutturare un percorso didattico o narrativo per e-learning
lezione 1
...
computer e
discipline umanistiche
(continua…)
„
perché?
‹
per fare ricerca usando il computer

potenziando i nostri strumenti:
•
•
•
•

creare e consultare basi di dati
acquisire nuovi dati da materiale non strutturato
strutturare il materiale acquisito
fare esperimenti su grandi quantità di dati attraverso analisi
e simulazioni...
rielaborando i nostri concetti:
• impatto delle tecnologie informatiche sul modo in cui oggi
guardiamo al linguaggio
‹
per crearsi una “nuova professione”
lezione 1
computer e
discipline umanistiche
„
come?
‹
‹
‹
‹
creando e consultando basi di dati testuali digitalizzati
navigando sul web per reperire nuovi materiali
“annotando” automaticamente dati testuali non strutturati
utilizzando strumenti software commerciali







‹
traduttori automatici
correttori automatici
classificatori automatici
editor multimediali
motori di ricerca
interfacce uomo-macchina
ipertesti
sviluppando nuovi strumenti software
lezione 1
computer e
discipline umanistiche
„
in che ambiti disciplinari?
‹
linguistica computazionale


‹
‹
‹
‹
‹
‹
‹
trattamento automatico del linguaggio scritto
trattamento automatico del linguaggio parlato
stilo-statistica
lessicografia computazionale
filologia computazionale
linguistica del corpus (corpus linguistics)
biblioteche digitali
didattica computerizzata (e-learning)
...
lezione 1
computer e
discipline umanistiche
„
da quando?
‹
anni 50



‹
anni 60


‹
primi esperimenti di traduzione automatica
negli stessi anni, in Italia, a Gallarate, P. Busa lavora sulle
prime concordanze dell’opera di S.Tommaso prodotte con
calcolatori IBM
impulso allo studio del linguaggio col computer dato dalla
rivoluzione chomskyana (gerarchia di grammatiche)
Humanistic Text Processing
Natural Language Processing
anni 70

sviluppo parser/grammatiche di media copertura
lezione 1
computer e
discipline umanistiche
(continua)
„
da quando?
‹
anni 80
 le
‹
“risorse linguistiche”
anni 90
 linguistica
computazionale e “industria delle
lingue”
‹
2000-?
 linguistica
computazionale e “contenuto digitale”
lezione 1
mercato del lavoro ...
‹
‹
‹
‹
‹
‹
‹
‹
‹
‹
‹
‹
agenzie web
case editrici e agenzie redazionali multimediali
giornalismo in linea (on-line)
aziende produttrici di software
aziende localizzatrici di software
aziende operanti nella “industria delle lingue”
biblioteche e musei
scuole di ogni genere e grado
agenzie di formazione professionale (e-learning);
università e centri di ricerca
grandi aziende
amministrazioni
http://compass.di.unipi.it/didattica/infouma/
lezione 1
linguaggio, mente e computer
apprendimento e uso
linguaggio come flusso di stimoli
linguaggio come
repertorio di dati
discreti
linguaggio
operazioni
logico-matematiche
per saperne di più,
clicca sul computer!
linguaggio come
facoltà
linguistica
modelli della
facoltà linguistica
lezione 1
software
il calcolatore: una definizione
tutto quanto
possiamo trasmettere
per telefono...
dispositivo elettronico programmabile
finalizzato alla gestione delle informazioni
hardware
tutto quanto non possiamo
trasmettere per telefono...
lezione 1
(torna indietro…)
gestione delle
informazioni...
„
raccolta, acquisizione
„
archiviazione, conservazione
„
elaborazione, trasformazione, produzione
„
distribuzione, comunicazione, scambio
lezione 1
(continua…)
il calcolatore:
funzionalità di base ...
lezione
1
lascia
(torna indietro…)
la lezione 1 per la 2
il calcolatore:
modello architetturale ...
(torna indietro…)
lezione
1
(per saperne di più
clicca
sulle icone!)
(torna indietro…)
la cpu
è la parte "pensante" di ogni computer,
costituita da un sottile cristallo di silicio. Su un
processore (p.e. di un cm2) vengono impressi
diodi, transistor e circuiti. Esegue le istruzioni
ed elabora i dati dei programmi presenti nella
memoria RAM e nei registri interni al
processore.
(lascia la lezione 1 per la 2)
lezione 1
(torna indietro…)
la memoria centrale
„
„
„
la RAM (random access memory) o memoria centrale
serve a memorizzare un programma in esecuzione o i
dati in corso di elaborazione
è l’unità di memoria con la quale interagisce la cpu
attraverso i bus
la memoria centrale è volatile, nel senso che i
dati/programmi in essa contenuti vengono cancellati al
termine dei processi di esecuzione/elaborazione e
comunque non sopravvivono a computer spento...
lezione 1
(torna indietro…)
la memoria “virtuale”
„
„
i programmi e i file molto estesi possono eccedere la
capacità della memoria centrale disponibile anche se
questa è molto grande
per evitare inconvenienti, in un sistema che utilizza la
memoria virtuale, soltanto le parti del programma o del
file al momento necessarie vengono memorizzate
nella memoria centrale del computer; il resto è
immagazzinato sul disco fisso fino a che non si renda
necessario il suo caricamento sulla RAM
lezione 1
(torna indietro…)
la memoria di massa
lezione 1
(torna indietro…)
le periferiche di input/output
lezione 1
(torna indietro…)
i bus
„
il bus di un computer è un insieme di collegamenti in
rame localizzati sulla scheda madre che connettono
tra loro tutti i dispositivi dell’elaboratore ...
lezione 1
(torna indietro…)
scheda libro
titolo:
Informatica di Base
autori:
Curtin D.P., Foley K., Sen K., Morin C.
edizione: seconda
anno: 2002
editore: McGraw-Hill
costo: 29 euro
capitoli rilevanti per il corso:
(2), 3, 4, 5, 6, 8
lezione 1