informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia prima lezione introduzione: computer e linguaggio vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia schema del corso 30 ore di lezione 20 ore di esercitazione una verifica scritta (per 10 punti complessivi) esame orale (rimanenti 20 punti) lezione 1 orari lezioni esercitazioni (a partire dal 18 marzo) lunedì: 16.45 - 18.30 (aula L2) martedì: 9.15 - 10.45 (aula L2) martedì: 15 - 16.45 (aula L3) ricevimento studenti martedì: 11.30 – 13.30 Dipartimento di Linguistica lezione 1 servizi web mailing list del corso per iscriversi: http://mail.ilc.cnr.it/mailman/listinfo/informatica_unipv sito web del corso: http://webilc.ilc.cnr.it/~pirrelli contiene descrizione del corso presentazioni delle lezioni letture consigliate altro materiale utile lezione 1 si richiedono ... nozioni di linguistica teorica di base (elementi di morfologia e sintassi) familiarità col computer come strumento di base per la casa/ufficio: sistema operativo a finestre gestione cartelle creazione e gestione di documenti testo (word processing), creazione e gestione di documenti di dati non testuali (fogli elettronici, database), navigazione del web con un browser lezione 1 non si richiedono ... familiarità con l’architettura concettuale e funzionale di un computer familiarità con infrastrutture hardware e software familiarità con un linguaggio di programmazione (Pascal, C, C++, Java ecc.) nozioni di base di linguistica computazionale familiarità con applicazioni del computer al trattamento automatico del testo (correttori grammaticali, correttori di stile, strumenti per le concordanze ecc.) lezione 1 si vuole offrire... familiarità con l’architettura concettuale e funzionale di un computer familiarità con infrastrutture hardware e software nozioni di base di linguistica computazionale operazioni di base del calcolatore sul testo alcuni esempi d’uso di queste operazioni riflessioni metodologiche lezione 1 non si offriranno... nozioni di programmazione dettagli sui modelli e sui metodi per il trattamento automatico del linguaggio (NLP) competenze specifiche per l’uso di software commerciale lezione 1 le domande a cui saprete rispondere ... su che tipo di dati linguistici il calcolatore è in grado di operare? quali operazioni è capace di eseguire su questi dati? come si organizzano queste operazioni e quali problemi possono ragionevolmente aiutarci a risolvere? che cosa vuol dire analizzare un testo al computer e in che misura il computer può migliorare la nostra comprensione di un testo? quale impatto ha avuto la tecnologia informatica sulle discipline umanistiche e sul modo in cui oggi studiamo il linguaggio? lezione 1 schema del corso Parte prima: Introduzione - computer e linguaggio Parte seconda: Il testo in formato digitale Parte terza: computer e cervello umano (per saperne di più clicca sulle icone!) lezione 1 parte prima: introduzione computer e linguaggio Cos’è un computer? Come funziona? Il linguaggio e il computer: “calcolatrice” o “cervello elettronico”? lezione 1 parte seconda: il testo in formato digitale Le parole come numeri elementi strutturali del testo ortografico il corpus l’analisi linguistica del testo: livelli di annotazione XML archivi elettronici testuali e lessicali lezione 1 (parte terza: computer e cervello) acquisizione di informazione linguistica da basi di dati testuali le parole come stimoli il linguaggio e il tempo: apprendimento e mutamento lezione 1 durata del corso il corso consiste di un modulo unico di 50 ore complessive (tra lezioni frontali e esercitazioni) che si articola tra il terzo e quarto trimestre i primi appelli di esame utili sono quelli relativi al quarto trimestre lezione 1 computer e discipline umanistiche perché? per imparare a usare il computer per studiare usando il computer corsi multimediali ricerche sul www ricerche su archivi digitali ricerche su insiemi di dati non strutturati ... per comunicare usando il computer creare un ipertesto creare un sito web strutturare un percorso didattico o narrativo per e-learning lezione 1 ... computer e discipline umanistiche (continua…) perché? per fare ricerca usando il computer potenziando i nostri strumenti: • • • • creare e consultare basi di dati acquisire nuovi dati da materiale non strutturato strutturare il materiale acquisito fare esperimenti su grandi quantità di dati attraverso analisi e simulazioni... rielaborando i nostri concetti: • impatto delle tecnologie informatiche sul modo in cui oggi guardiamo al linguaggio per crearsi una “nuova professione” lezione 1 computer e discipline umanistiche come? creando e consultando basi di dati testuali digitalizzati navigando sul web per reperire nuovi materiali “annotando” automaticamente dati testuali non strutturati utilizzando strumenti software commerciali traduttori automatici correttori automatici classificatori automatici editor multimediali motori di ricerca interfacce uomo-macchina ipertesti sviluppando nuovi strumenti software lezione 1 computer e discipline umanistiche in che ambiti disciplinari? linguistica computazionale trattamento automatico del linguaggio scritto trattamento automatico del linguaggio parlato stilo-statistica lessicografia computazionale filologia computazionale linguistica del corpus (corpus linguistics) biblioteche digitali didattica computerizzata (e-learning) ... lezione 1 computer e discipline umanistiche da quando? anni 50 anni 60 primi esperimenti di traduzione automatica negli stessi anni, in Italia, a Gallarate, P. Busa lavora sulle prime concordanze dell’opera di S.Tommaso prodotte con calcolatori IBM impulso allo studio del linguaggio col computer dato dalla rivoluzione chomskyana (gerarchia di grammatiche) Humanistic Text Processing Natural Language Processing anni 70 sviluppo parser/grammatiche di media copertura lezione 1 computer e discipline umanistiche (continua) da quando? anni 80 le “risorse linguistiche” anni 90 linguistica computazionale e “industria delle lingue” 2000-? linguistica computazionale e “contenuto digitale” lezione 1 mercato del lavoro ... agenzie web case editrici e agenzie redazionali multimediali giornalismo in linea (on-line) aziende produttrici di software aziende localizzatrici di software aziende operanti nella “industria delle lingue” biblioteche e musei scuole di ogni genere e grado agenzie di formazione professionale (e-learning); università e centri di ricerca grandi aziende amministrazioni http://compass.di.unipi.it/didattica/infouma/ lezione 1 linguaggio, mente e computer apprendimento e uso linguaggio come flusso di stimoli linguaggio come repertorio di dati discreti linguaggio operazioni logico-matematiche per saperne di più, clicca sul computer! linguaggio come facoltà linguistica modelli della facoltà linguistica lezione 1 software il calcolatore: una definizione tutto quanto possiamo trasmettere per telefono... dispositivo elettronico programmabile finalizzato alla gestione delle informazioni hardware tutto quanto non possiamo trasmettere per telefono... lezione 1 (torna indietro…) gestione delle informazioni... raccolta, acquisizione archiviazione, conservazione elaborazione, trasformazione, produzione distribuzione, comunicazione, scambio lezione 1 (continua…) il calcolatore: funzionalità di base ... lezione 1 lascia (torna indietro…) la lezione 1 per la 2 il calcolatore: modello architetturale ... (torna indietro…) lezione 1 (per saperne di più clicca sulle icone!) (torna indietro…) la cpu è la parte "pensante" di ogni computer, costituita da un sottile cristallo di silicio. Su un processore (p.e. di un cm2) vengono impressi diodi, transistor e circuiti. Esegue le istruzioni ed elabora i dati dei programmi presenti nella memoria RAM e nei registri interni al processore. (lascia la lezione 1 per la 2) lezione 1 (torna indietro…) la memoria centrale la RAM (random access memory) o memoria centrale serve a memorizzare un programma in esecuzione o i dati in corso di elaborazione è l’unità di memoria con la quale interagisce la cpu attraverso i bus la memoria centrale è volatile, nel senso che i dati/programmi in essa contenuti vengono cancellati al termine dei processi di esecuzione/elaborazione e comunque non sopravvivono a computer spento... lezione 1 (torna indietro…) la memoria “virtuale” i programmi e i file molto estesi possono eccedere la capacità della memoria centrale disponibile anche se questa è molto grande per evitare inconvenienti, in un sistema che utilizza la memoria virtuale, soltanto le parti del programma o del file al momento necessarie vengono memorizzate nella memoria centrale del computer; il resto è immagazzinato sul disco fisso fino a che non si renda necessario il suo caricamento sulla RAM lezione 1 (torna indietro…) la memoria di massa lezione 1 (torna indietro…) le periferiche di input/output lezione 1 (torna indietro…) i bus il bus di un computer è un insieme di collegamenti in rame localizzati sulla scheda madre che connettono tra loro tutti i dispositivi dell’elaboratore ... lezione 1 (torna indietro…) scheda libro titolo: Informatica di Base autori: Curtin D.P., Foley K., Sen K., Morin C. edizione: seconda anno: 2002 editore: McGraw-Hill costo: 29 euro capitoli rilevanti per il corso: (2), 3, 4, 5, 6, 8 lezione 1