Cenni su Reti di Calcolatori Cos’è una rete? Punto di vista logico: sistema di dati ed utenti distribuito Punto di vista fisico: insieme di hardware, collegamenti e protocolli che permettono la comunicazione tra macchine remote Vedremo Come avviene la trasmissione dati Configurazioni delle reti (LAN/WAN) Cos’è un protocollo Cos’è Internet, quali protocolli e quali applicazioni possiamo utilizzare Cos’è il Web e come si naviga Trasmissione dati Mezzi di trasmissione: Velocita’ di trasmissione: bps=bit x sec Doppino telefonico (2400-9600 bps) Cavo coassiale (10 alla 4~6 bps) Fibra ottica dove bit = assenza/presenza segnale luminoso (10 alla 9 bps) Onde elettromagnetiche (es via satellite) Digitale-Analogico Informazione = digitale (seq. bit) Segnali = analogico (continuo) Il Modem (Modulatore-Demodulatore) si preoccupa di trasformare bit in segnali e viceversa Modulazione in frequenza=il modem altera in frequenza una sequenza portante 0=freq più bassa; 1=freq più alta ...modulazione in ampiezza, fase, Es PC collegati ‘da casa’ attraverso un modem Collegamenti Single-point: calcolatore-terminale Multi-point: calcolatore-vari terminali (uno solo comunica con il calcolatore) Linee Dedicate Linee Commutate Flusso dei dati: Simplex/Duplex/Half Duplex (alternato) Reti Locali e Geografiche Terminali nella stessa stanza/edificio possiamo utilizzare collegamenti diretti (senza passare per reti pubbliche) Reti locale più diffuse: Ethernet e Fast Ethernet insieme di componenti hardware e software particolari che gestiscono la trasmissione dati in una rete locale Rete Locale pc pc LAN dorsale pc server Reti Geografiche Nodi distribuiti su medio-lunga distanza Possiamo usare la rete di comunicazione pubblica utilizzando modem o affittando linee di trasmissione Oppure reti digitali di trasmissione dati Trasmissione dati: attraverso messaggi Topologia di una Rete A stella Ad anello treno di messaggi A bus tutti i nodi sono collegati ad un elaboratore centrale (che smista i messaggi) nodi disposti lungo un unico canale Irregolare attraverso host e nodi di trasmissione Messaggi? Sequenze di bit: Nodo di trasmissione: Mittente e destinatario Caratteri di controllo (per consistenza dei dati) Contenuto messaggi riceve e ritrasmette un messaggi al destinatario o ad un nodo vicino se il destinatario non è collegato Routing dei messaggi: il percorso del messaggio nella rete può essere statico o dinamico Protocolli di Comunicazione I protocolli di comunicazione sono utilizzati dai calcolatori per dialogare tra loro Come per la codifica dei dati occorre utilizzare degli standard internazionali per risolvere i problemi di compatibilità! Per definire un protocollo occorre: fissare il formato dei messaggi la sequenza di messaggi inviati dalle parti coinvolte,ecc. Esempio di Protocollo? A contatta B: “Init” B risponde ad: “Ack” A inizia a mandare i dati (1,2,3,…) a B B riceve di dati Il protocollo termina quando A invia “Fine” a B B risponde con “AckFine” Modelli per Architetture di Reti Modello OSI/ISO Modello TCP/IP Grazie ad internet, il modello TCP/IP e’ diventato lo standard de facto Modello TCP/IP Livello Applicazone: software applicativo (Browser Web, ecc) Livello Trasporto: trasforma dati in messaggi usando i protocolli Livello Internet: TCP (trasmissione sicura) e UDP (trasmissione veloce) protocollo IP di spedizione dei messaggi sulla rete Indirizzo IP=indirizzo degli host in rete (codici binari) Livello Fisico: hardware! Modello TCP/IP TELNET FTP SMTP TCP UDP Applicaz. Trasporto Internet IP ARPANET DNS LAN Fisico Internet Inter-rete (cioè che collega varie sottoreti tra loro) nata dalla fusione di diverse reti di agenzie governative americane (ARPANET) e reti di università Utilizza protocolli di comunicazione di dominio pubblico derivato dal modello TCP/IP Al giorno d’oggi è accessibile a tutti tramite provider che sono fisicamente collegati a internet World Wide Web (WWW) Architettura software per gestire dati distribuiti geograficamente basata sulla nozione di ipertesto Si appogggia a TCP/IP e quindi è compatibile con ogni tipo di macchina collegata ad Internet Pagina Web Pagine ipertestuali cioe’ che possono contenere link a altre pagine (testo), Immagini e suoni, programmi eseguibili un utente legge le pagine, se seleziona un link la pagina viene sostituita con quella richiesta (scaricata dal sito remoto) Struttura del Web Architettura Client-server Client (ad esempio explorer) permette la navigazione nel web trasmette le richieste di pagine/dati remoti, riceve le informazioni e le visualizza sul client a volte utilizza programmi esterni (plug-in) per gestire i dati ricevuti Il Server è un processo sempre attivo che aspetta e serve le richieste dei client Restituisce la pagina richiesta oppure un messaggio di errore Client-Server Richiesta Explorer CNN CNN.COM Last News SERVER Pagina INTERNET Dominio Domini = suddivisione logica di Internet per facilitare la gestione dei nomi delle risorse Internet è suddivisa in una multitudine di domini radice Domini nazionali: uk it de Domini generici: com edu Un dominio radice include una collezione di host (cioe’ server) e può essere suddiviso a sua volta in sottodomini e così via Sottodominio del DISI: disi.unige.it Spazio dei nomi dei domini com gov org yahoo it unige unipi microsoft research ...... ...... disi dist jp ..... di ac co Name Server Lo spazio dei nomi è diviso in zone gestiti da un server principale e server secondari che mantegono la lista degli host inclusi nel dominio (database dei nomi) Se un server non trova un nome nel suo database manda una richiesta al server del dominio antenato o successore e così via (interrogazioni ricorsive) Si usa una memoria cache per mantenere gli indirizzi recuperati tramite altri server Domain Name Server Lo spazio dei nomi è memorizzato quindi sotto forma di database distribuito (DNS) Ogni rete locale ha un proprio server DNS che mappa nomi logici (indirizzi DNS) in indirizzi fisici (indirizzi IP) Ricordate che Indirizzi IP=codice binario utilizzato dal protocollo di invio dati del modello TCP/IP (livello Internet) Es. 121.34.16.19 URL: indirizzi nel Web URL (Uniform Resource Location) è uno standard per il formato degli indirizzi delle risorse sul Web Specifica: Come si vuole accedere alla risorsa (metodo) Dove si trova la risorsa (indirizzo server DNS) Nome della risorsa (nome) Formato: Metodo://host/nome Metodo http: protocollo gestione ipertesti ftp: trasferimento file telnet: accedere a macchine remote file: accedere a documenti locali email: scrivere email Nome Nome (mnemonico) di dominio del server DNS al quale si vuole chiedere la risorsa Esempio: Server Web DISI: www.disi.unige.it Server FTP DISI: ftp.disi.unige.it Nome risorsa Path name (cammino) che porta al file contente la risorsa (es pagina, foto, ecc) nello spazio di dati gestito dal server del sito che abbiamo contattato Solitamente ogni sito ha una pagina di ingresso denominata index.html Riepilogando http://www.disi.unige.it/person/DelzannoG ftp://ftp.disi.unige.it/person/DelzannoG Server per i domini gov com yahoo org ...... it unige unipi msn ...... disi dist jp ..... di ac ...... co ...... Problemi di sicurezza La parte di File System del server accessibile al client è controllata dal server (i nomi delle risorse sono relativi a tale parte di file system!) Il client può scaricare dalla rete programmi (es Java) che vengono poi automaticamente eseguiti dal browser (ad es animazioni); tali programmi hanno permessi molto limitata per evitare intrusioni nel sistema del client Pagine Web Web basato su un linguaggio ipertestuale che associa indirizzi URL a parti di documento chiamati link Selezionando un link (ad es con il mouse) si scarica una pagina dal server DNS identificato dal corrispondente URL Le applicazioni che gestiscono pagine web vengono dette browser Netscape, Explorer, Mozilla, Opera, ... Come fornire servizi sul web? Dobbiamo ‘affitare’ (o comunque avere a disposizione) spazio su disco di un server di un sottodominio (Tiscali?) e quindi ottenere un indirizzo URL per le nostre risorse Es. Spazio sul server del DISI ... Dobbiamo creare delle pagine web che i clienti possano leggere con i loro browser collegandosi al nostro indirizzo URL Tramite le pagine spieghiamo quali risorse mettiamo a disposizione (es. la nostra Tesi le nostre ricerche per colleghi all’estero) Linguaggio per Pagine Web Si utilizza il linguaggio HTML (HyperText Markup Language) In HTML oltre al testo delle pagine si utilizzano delle annotazioni per descrivere come verrà visualizzato il documento sul browser di un cliente HTML si puo’ vedere quindi come un linguaggio di annotazioni per descrivere ipertesti Il browser interpreta le annotazioni traducendole in effetti grafici Es: La prossima parola è in <b>neretto</b> L’es. Precedente diventa: La prossima parola è in neretto Alcuni tool forniscono direttamente l’effetto desiderato senza dover usare HTML (ad es. FrontPage, Word, ecc) Manuale in linea del linguaggio HTML Alcuni esempi Una pagina web deve essere sempre racchiusa all’interno del comando <HTML>....</HTML> Intestazione: <HEAD>...</HEAD> Corpo pagina: <BODY>...</BODY> <P>: inizia un paragrafo <BR>: fine linea <B>...</B>: testo in bold <I>...</I>: testo in italico Altri tag Link <A HREF=“indirizzo URL”>...</A> Immagine <IMG SRC=“nome_immagine”> Linea di separazione: <hr> Caratteri accentati: &caratteregrave (es &agrave=à) &carattereacute (es &eacute=é) Sorgente pagina web <HTML> <BODY> <b>Marco Rossi</b><br> PhD Student <br> Universit&agrave di Genova<br> <IMG SRC=“marco.gif”><hr> Per scaricare la mia tesi premi qui sotto<br> <a href=“ftp://ftp.disi.unige.it/RossiM/tesi.ps”> <i>TESI</i></a> </BODY> </HTML> Pagina risultante Marco Rossi PhD Student Università di Genova Per scaricare la mia tesi premi qui sotto TESI Form e interazione con l’utente Si possono creare pagine che permettono all’utente di immettere dati attraverso FORM (moduli da compilare) I dati vengono gestiti poi da programmi residenti sul server Ad esempio servono per E-commerce o per consultare cataloghi (biblioteche virtuali) Esempio: Prenotazione esami al DISI Ricerca di Informazioni in Rete Il web comprende moltissime sorgenti di informazione a volte male organizzate, ridondanti, frammentarie, non aggiornate,… Per questo motivo esistono servizi (ovvero siti dedicati) che permettono di navigare in modo ragionato: Pagine indice Cataloghi Motori di ricerca Directory Pagine indice Sono pagine che contengono collezioni di link ad altre pagine raggruppati per argomento Solitamente tale collezione corrisponde alla lista di bookmark (favorites) che usualmente si raccolgono durante la navigazione e che vengono messi poi disponibili a tutti gli utenti Le pagine indice sono mantenute da singoli utenti e messe in linea per facilitare colleghi che lavorano nello stesso campo Es: Pagina del Dr. Rovetta Motori di ricerca Un motore di ricerca e’ un servizio di rete che ha la funzione di indicizzare automaticamente le pagine del web Si accede ad un motore di ricerca come ad ogni altra pagina tramite il corrispondente indirizzo URL Il servizio solitamente e’ gratuito. I gestori del sito finanzianola loro attivita’ tramite la pubblicita’ che compare nelle pagine del sito oppure tramite quote per l’inserimento di nuovi URL nel database che contiene le informazioni sulle quali si effettua una ricerca Come usare un motore di ricerca I motori di ricerca memorizzano in modo efficiente e mantengono aggiornate informazioni su altri siti La pagina principale di un generico motore di ricerca presenta all’utente una FORM tramite la quale e’ possibile immettere query (interrogazioni) che verranno utilizzate per guidare la ricerca L’esempio piu’ semplice di query e’ una parola chiave Come risposta ad una query, un motore di ricerca restituisce all’utente una lista (con link e informazioni sul sito corrispondente) che soddisfa la query Esistono siti che effettuano meta-ricerce: cioe’ propagano la query su altri motoridi ricerca e restituiscono il risultato Directory e cataloghi Esistono siti che oltre al servizio di ricerca forniscono un vero e catalogo (di parte) delle informazioni disponibili sul web Il catalogo raccoglie i link ad altri siti utilizzando diversi criteri Suddivisione per argomenti e sotto-argomenti Ordine alfabetico Esempi Search-engine (motore di ricerca) Cataloghi e ricerca Google Yahoo Altavista Virgilio Meta-search engine Mamma Cosa sono le query? Inizialmente possiamo pensare ad una query in un motore di ricerca come ad una lista di parole chiave Ad es: cinema a Genova Le parole vengono cercate all’interno dei documenti memorizzati nel sito del motore di ricerca in qualunque ordine e non necessariamente tutte insieme (per default ricerca disgiuntiva) Inoltre vengono filtrate per eliminare le parole troppo comuni (ad es. articoli) e le varianti (ad es. desinenze e plurali) Ad es: cinema a genova va letta come cerca i documenti che contengono la parola cinema oppure la parola Genova Criteri di ricerca Il risultato di una query viene calcolato considerando le pagine che contengono tutte o alcune parole della query parole simili parole con significato simile Gli indirizzi calcolati vengono ordinati per rilevanza e affidabilita’ Contiene piu’ parole della query Contiene le parole vicine tra loro Contiene le parole nel titolo della pagina I siti non sono stati segnalati da utenti insoddisfatti Strutturare una query Esistono alcuni comandi per specializzare la ricerca che sono considerati standard dalla maggior parte dei motori di ricerca Bypassare i filtri ed includere determinate parole Escludere pagine con determinate parole Forzare la ricerca di una sequenza di parole chiave In realta’ ogni sito di ricerca fornisce il servizio advanced search (e relativo help) che permette di specializzare la ricerca secondo le proprie caratteristiche Specializzazione di una query Il segno + davanti ad un termine indica una parola chiave obbligatoria. Ad es: cinema +a Genova Il segno – davanti ad un termine si usa per escludere tutte le pagine in cui compare tale termine (si esclude un possibile secondo significato del resto della query) Ad es. cinema a Genova -Nervi Per cercare esattamente una sequenza di parole si racchiude la frase tra virgolette “ … ” Ad es. “cinema Genova” Bibliografie e cataloghi in linea La ricerca bibliografica e’ un’aspetto importante nella nostra attivita’ di studio Le fonti di informazioni alle quali possiamo rivolgerci sono: Pagine indice di colleghi Cataloghi in linea messi a disposizione da istituti accademici/di ricerca (ad es. con lista di pubblicazioni e rapporti tecnici) Sistema bibliotecario di ateneo (ad es.con informazioni bibliografiche sui libri disponibili in biblioteca) Documenti scientifici in rete Oltre a riferimenti bibliografici o link ad altre pagine, tramite cataloghi e motori di ricerca possiamo accedere direttamente a documenti di vario tipo e in vari formati di stampa Esempi di documenti scientifici: abstract: riassunto di un lavoro; rapporto tecnico(TR): lavoro pubblicato da un ist. di ricerca; articolo su rivista scientifica elettronica. Formati di stampa A seconda dell’applicazione/formato in cui un documento viene creato/salvato troveremo estensioni quali: Spesso i documenti sono compressi (per minimizzare l’occupazione di memoria) tramite programmi speciali: doc file leggibile con Microsoft Word rtf File leggibile con Microsoft Word prn oppure ps file in formato di stampa postscript pdf file leggibile con AcroRead Estenzione .gz file compresso con gzip Estensione .Z file compresso con zip Troveremo quindi documenti compressi: Ad es: lista di pubblicazioni Cataloghi di interesse scientifico Catalogo bibliotecario unificato dell’universita’ di Genova Aleph Catalogo di matematica CSB_MAT Cataloghi dell’universita’ di Stanford Stanford Libraries--Catalogs & Databases Biblioteca scientifica on-line Research Index: The NECI Digital Library Posta elettronica Servizio per trasmettere dati (messaggi) tra vari utenti Sistemi di posta elettronica supportano: Composizione di messaggi Trasferimento al destinatario Visualizzazione e cancellazione Caselle di posta (Mailbox) per memorizzare i messaggi in arrivo Mailing list (lista di indirizzi) Invio di messaggi Occorre fornire un messaggio, e l’indirizzo del destinatario Indirizzo ha la seguente forma Mailbox@locazione E viene gestito dal DNS server del nostro dominio Es. [email protected] Formato dei messaggi To: (destinatario) Cc: (in copia a) Bcc: (copia trasparente) From: mittente Sender: indirizzo del mittente Testo dele messaggio Attachment MIME foto, suoni, ecc) Applicazioni per posta Esistono molte applicazioni che permettono di leggere la posta e mantenere mailbox Explorer Outlook Netscape Eudora (MaIntosh)