Introduzione alla rete Internet File

annuncio pubblicitario
Internet e re': conce+ base, stru1ura, applicazioni Tommaso Mazzoli 1
Un po’ di storia •  La successione di even', proge+, idee e protagonis' che, nel corso di oltre trenta anni, hanno portato alla nascita di Internet e alla sua evoluzione nella forma a1uale, cos'tuisce un capitolo molto affascinante, ma anche a'pico, nella storia dello sviluppo tecnologico. •  Parte del fascino è legato al ruolo determinante che questa tecnologia ha svolto e sta ancora svolgendo nella cosidde1a ‘rivoluzione digitale’. In pochissimi anni, infa+, la rete da esoterico strumento di lavoro per pochi informa'ci è divenuta un mezzo di comunicazione di massa, che coinvolge quo'dianamente decine e decine di milioni di persone. •  Nessuno strumento di comunicazione ha mai avuto un tasso di espansione simile. 2
Bibliografia: •  Le origini di Internet di T. De+ e G. Lauricella, Bruno Mondadori, 2013 •  Internet 2004, Manuale per l'uso della rete, di M. Calvo, F. Cio+, G. Roncaglia, M. Zela, Laterza 2004 oppure •  h8p://www.liberliber.it/online/autori/
autori-­‐c/marco-­‐calvo/internet-­‐2004-­‐
manuale-­‐per-­‐luso-­‐della-­‐rete/ •  Come gran parte delle innovazioni tecnologiche nel se1ore delle telecomunicazioni e dell’informa'ca, anche le origini di Internet si collocano nel terreno della ricerca militare. •  Il contesto in cui si colloca questa preistoria è quello della ‘guerra fredda’ e della contesa tecnologica che ne derivò tra Sta' Uni' e Unione Sovie'ca. •  Un evento simbolico di questa contesa fu la messa in orbita del primo satellite ar'ficiale da parte dei sovie'ci, lo Sputnik, nel 1957. Dopo il rapido superamento del gap nucleare, questo successo della tecnologia sovie'ca seminò nel campo occidentale, e sopra1u1o negli USA, una profonda inquietudine. •  Per cercare di rispondere immediatamente a ques' 'mori, nell’ambito dell’amministrazione USA si concepì l’idea di creare un’agenzia il cui compito fosse quello di s'molare e finanziare la ricerca di base in se1ori che avrebbero potuto avere una ricaduta militare. •  Nel 1958 il Congresso approvò la cos'tuzione e il finanziamento della Advanced Research Projects Agency, l’ARPA, la cui sede fu stabilita nell’edificio del Pentagono a Washington. •  L’ARPA indirizzò le sue a+vità nella ricerca aerospaziale, ma quando pochi mesi dopo tu+ i programmi spaziali vennero trasferi' (insieme agli ingen' finanziamen') alla NASA, per i dirigen' dell’ARPA fu necessario trovare una nuova area di sviluppo. Tale area fu individuata nella neonata scienza dei calcolatori. •  Tra tan' scienzia', un ruolo fondamentale fu svolto da J.C.R. Licklider, uno dei personaggi più geniali e crea'vi della storia dell’informa'ca. •  Di formazione psicologo, Lick (così lo chiamavano i suoi amici) passò ben presto a occuparsi di computer nei laboratori del MIT di Boston. Ma a differenza di tan' altri ricercatori in questo campo, il suo interesse si rivolse subito al problema delle interfacce uomo/
computer e al ruolo che le macchine di calcolo avrebbero potuto avere per lo sviluppo delle facoltà cogni've e comunica've dell’uomo (ben trenta anni prima che ques' conce+ divenissero centrali nel se1ore informa'co). •  Appena giunto all’ARPA, iniziò a creare una rete di collegamen' tra i maggiori centri di ricerca universitari nel se1ore informa'co, raccogliendo un gruppo di collaboratori che ba1ezzò secondo il suo s'le an'conformista ‘Intergalac<c Computer Network’. •  Parallelamente, nella West Coast, in un altro dei centri lega' alla ricerca militare, la Rand Corpora/on, viene assunto un giovane ingegnere che aveva lavorato nel se1ore delle valvole per computer: Paul Baran. •  Egli fu inserito nella neonata divisione informa'ca, dove si mise a lavorare su un problema che da qualche tempo veniva studiato dai tecnici della Rand: come riuscire a garan<re che il sistema di comando e controllo strategico dell’esercito rimanesse se non intaDo almeno opera<vo in caso di aDacco nucleare. Le re' di comunicazione tradizionali su cui si basava l’intero apparato di controllo militare, infa+, erano estremamente vulnerabili. •  Lavorando su questo problema, Baran giunse a due conclusioni: la prima era che una rete sicura dovesse avere una configurazione decentralizzata e ridondante, in modo che esistessero più percorsi possibili lungo i quali far viaggiare un messaggio da un punto a un altro; la seconda, legata alla prima, era che il sistema di telecomunicazioni dovesse basarsi sulle nuove macchine di calcolo digitale, in grado di applicare sistemi di correzione degli errori e scelta dei canali di comunicazione. •  Baran aveva elaborato un modello in cui ciascun nodo fosse collegato ad almeno altri qua1ro nodi, e nessun nodo avesse la funzione di concentratore, al contrario di quanto avveniva per la rete telefonica. •  In questo modo ogni nodo poteva con'nuare a lavorare, ricevendo, elaborando e trasme1endo informazioni, anche nel caso in cui alcuni fra i nodi vicini fossero sta' danneggia'. •  L’assenza di un nodo centrale inoltre eliminava ogni possibile obie+vo strategico, la cui distruzione avrebbe compromesso il funzionamento dell’intera rete. •  Oltre all’idea di una rete decentrata e ridondante, Baran ebbe anche un’altra intuizione geniale: piu1osto che inviare un messaggio da un nodo all’altro come un unico blocco di bit, era meglio dividerlo in par' separate, che potessero viaggiare a1raverso vari percorsi verso la des'nazione, dove sarebbero sta' ricompos'. •  Bob Taylor si era brillantemente laureato in psicologia e matema'ca, e aveva fa1o una tesi di do1orato in psicoacus'ca. Aveva conosciuto Licklider nel 1963, facendo una o+ma impressione sul grande scienziato, e stabilendo con lui una relazione di amicizia e di s'ma reciproca. Per queste ragioni il successore di Lick all’Ufficio Tecniche di Elaborazione dell’Informazione (IPTO) dell’ARPA, Ivan Sutherland (il padre della computer graphic), lo chiamò come suo collaboratore nel 1965. Pochi mesi dopo anche Sutherland si dimise e Taylor, a soli 34 anni, ne assunse il posto. •  Taylor si rese conto in prima persona di quanto assurda fosse l’incomunicabilità reciproca che quelle possen' e costose macchine dimostravano. Possibile che non fosse possibile condividere risorse tanto costose, come Lick aveva più volte suggerito? •  Il finanziamento di un proge1o volto a consen're la comunicazione e lo scambio di risorse tra i computer dei vari laboratori universitari finanzia' dall’agenzia fu approvato e Taylor: iniziò così la storia di Arpanet, la rete dell’ARPA. •  Per mol' mesi il problema di proge1are una rete abbastanza affidabile e veloce da perme1ere l’elaborazione intera+va a distanza rimase insoluto. •  Finché alla fine del 1967 Larry Roberts (che aveva sos'tuito Taylor spedito in Vietnam con incarichi militari) partecipò a una conferenza alla quale intervenne un collaboratore di Donald Davies, che illustrò il principio della commutazione di pacche1o, e fece riferimento ai lavori preceden' di Baran su questo tema: fu come trovare l’ago nel pagliaio. •  La rete dell’ARPA sarebbe stata una rete a commutazione di pacche1o in tempo reale. •  Piu1osto che collegare dire1amente i vari grandi computer, ogni nodo sarebbe stato ges'to da un computer specializzato dedicato alla ges'one del traffico (ba1ezzato Interface Message Processor, IMP), al quale sarebbe stato connesso il computer che ospitava (host) i veri propri servizi di elaborazione. •  Dunque, se è vero che il proge1o della rete nacque in un contesto militare, la diffusa opinione che essa dovesse fungere da strumento di comunicazione sicuro tra i centri di comando militari nell’evenienza di una guerra nucleare è fru1o di un equivoco storiografico. •  In realtà l’obie+vo perseguito da Bob Taylor era di aumentare la produ+vità e la qualità del lavoro scien'fico nei centri finanzia' dall’ARPA, perme1endo ai ricercatori universitari di comunicare e di condividere le risorse informa'che, a quei tempi costosissime e di difficile manutenzione. •  Parte dell’equivoco circa le origini belliche della rete deriva dal fa1o che nella stesura delle specifiche Larry Roberts riprese le idee elaborate da Baran all’inizio degli anni ’60. •  La fase esecu'va del proge1o Arpanet prese il via nel 1969. •  Il primo IMP (delle dimensioni di un frigorifero) fu consegnato alla University of California il due se1embre, e fu immediatamente connesso al grande elaboratore SDS Sigma 7 della UCLA senza alcuna difficoltà. •  Il primo di o1obre fu installato il secondo IMP presso lo Stanford Research Ins/tute (SRI), dove fu collegato a un mainframe SDS 940. Il proge1o dell’ARPA si era finalmente materializzato in una vera rete, cos'tuita da due nodi connessi con una linea dedicata a 50 Kbps. •  Dopo qualche giorno fu tentato il primo collegamento tra host facendo simulare al Sigma 7 il comportamento di un terminale remoto del 940: l’esperimento, seppure con qualche difficoltà iniziale, andò e buon fine, e dimostrò che la rete poteva funzionare. •  Nei mesi successivi vennero collega' i nodi delle Università di Santa Barbara e dello Utah. •  Il primo protocollo applica'vo vero e proprio, dedicato al trasferimento di file da un host all’altro fu il File Transfer Protocol. •  Ma l’applicazione che forse ebbe la maggiore influenza nell’evoluzione successiva della rete fu la posta ele1ronica. •  L’idea venne per caso nel marzo del 1972 a un ingegnere, Ray Tomlinson, che provò a ada1are un sistema di messaggis'ca sviluppato l’anno prima per funzionare su un minicomputer mul'utente (fu lui che ebbe l’idea di separare il nome dell’utente da quello della macchina con il cara1ere ‘@’). L’esperimento funzionò, e il protocollo FTP venne integrato con le specifiche per mandare e ricevere messaggi indirizza' a singoli uten'. •  Nel fra1empo la rete Arpanet, come veniva ormai ufficialmente chiamata, cominciava a crescere. I nodi nel 1971 erano divenu' quindici, e gli uten' alcune cen'naia. Nel giro di pochi mesi tu+ coloro che avevano accesso a un host iniziarono a usare la rete per scambiarsi messaggi. E si tra1ava di messaggi di tu+ i 'pi: da quelli di lavoro a quelli personali. La rete dell’ARPA era divenuto un sistema di comunicazione tra una comunità di giovani ricercatori di informa'ca! •  Intorno alla rete dell’ARPA, andava prendendo forma una sorta di rete delle re'. •  A sancire la nascita defini'va di tale rete intervenne nel 1983 la decisione da parte della DCA di dividere Arpanet in due rami per mo'vi di sicurezza: uno militare e chiuso, inizialmente ba1ezzato Defense Data Network e poi Milnet, e uno per la comunità scien'fica, che ereditava il nome originario e che non avrebbe avuto limi' di interconnessione esterna. •  La vecchia Arpanet poteva così divenire a tu+ gli effe+ il cuore della neonata Internet. Cosa è una rete •  Una RETE INFORMATICA è cos'tuita da un insieme di computer collega' tra di loro ed in grado di condividere sia le risorse hardware (periferiche accessibili dai vari computer che formano la rete), che le risorse sorware (programmi applica'vi e file archivia' nelle memorie di massa dei vari terminali). •  A seconda delle dimensioni si dis'nguono diversi 'pi di re':
14
•  LAN: Local Area Network (rete locale), è una rete che, da un minimo di un paio di computer, si può estendere ad un intero edificio o ad un comprensorio, come ad esempio una fabbricao un campus universitario con una estensione di alcuni chilometri. •  MAN: Metropolitan Area Network (rete metropolitana, rete ci1adina). In questo caso, i computer si trovano all’interno di un’area urbana di grandi dimensioni oppure sono disloca' in più comuni limitrofi. Originariamente sfru1ava le re' per le trasmissioni via cavo della televisione, oggi grosse aziende cablano intere ci1à abbinando la trasmissione da' via internet a quella TV sfru1ando l’alta qualità dei collegamen' con fibre o+che. Esempi di re' MAN sono quella che si potrebbe estendere nell’intero territorio comunale e quella cos'tuita dalle segreterie delle facoltà universitarie dislocate in una determinata area metropolitana •  WAN: Wide Area Network (rete geografica), è una rete di estensione superiore alle preceden', può essere regionale o nazionale o anche più ampia. Generalmente le WAN sono u'lizzate per collegare tra loro più re' di livello inferiore (LAN, MAN) in modo che un utente di una rete possa comunicare con uten' di un'altra rete. Molte WAN sono costruite per una par'colare organizzazione e sono private. Una evoluzione delle WAN sono le GAN (Global Area Network). Si tra1a di re' che collegano computer disloca' in tu+ i con'nen'. Come funziona Internet •  Abbiamo de1o che Internet è una rete di re' telema'che •  Per capire meglio che
cosa si intende con
questa affermazione
utilizziamo una
similitudine con una
infrastruttura che ci è
molto più familiare: la
rete ferroviaria
17
Come funziona Internet •  Ogni so1orete che è parte di Internet è assimilabile ad una rete ferroviaria nazionale •  Internet può essere assimilata al sistema ferroviario mondiale •  Si no' che affinché i treni possano passare da una rete nazionale ad un'altra, è necessario che esse condividano le norme di costruzione dei binari e che gli en' ferroviari si accordino sugli orari in cui far passare i treni e così via: sono insomma necessari dei protocolli 18
Come funziona Internet •  Un aspe1o importante di Internet è la sua topologia distribuita e decentrata •  In questo modo
se un percorso è
interrotto o troppo
trafficato i dati
possono prendere
strade alternative
N1
N5
N2 N7
N6
N3
N4
•  Ad esempio per andare da N1 a N3 si può
prendere il percorso N1-N2-N6-N3 oppure N1N5-N4-N3 e così via
19
Come funziona Internet •  Per afferrare questo aspe1o, torniamo alla nostra metafora ferroviaria •  Le stazioni corrispondono ai nodi della rete •  Ogni stazione è collegata a diverse altre stazioni, come ogni host di Internet è connesso con più host stazione = nodo
20
Come funziona Internet •  Se un viaggiatore volesse andare da Roma a Torino potrebbe prendere la linea che passa lungo la costa Tirrenica a1raverso le stazioni di Livorno, Pisa e Genova •  Ma se i posti sul treno fossero
esauriti potrebbe passare per
Milano lungo la linea che
passa per Firenze e Bologna,
e di lì andare a Torino
21
Gli indirizzi di Internet •  Ma come fanno i computer a trovare le strada giusta per ogni messaggio? •  A questo fine viene impiegato uno schema di indirizzamento dei computer collega' in rete •  Ogni host è dotato di un suo indirizzo univoco, cos'tuito da una sequenza di qua1ro numeri da 0 a 255 denominato indirizzo IP 22
Gli indirizzi di Internet •  Grazie agli indirizzi IP ogni computer, e dunque ogni utente della rete, è in grado di individuare un nodo in par'colare tra milioni e milioni, e di inviargli da' •  Ma se i computer si trovano perfe1amente a loro agio nel ges're numeri, lo stesso non può dirsi degli esseri umani •  Per questo al sistema di indirizzi numerici è stato affiancato un sistema di nomi simbolici, assai più facili da ricordare per noi esseri umani 23
I nomi di Internet •  Tale sistema si chiama Domain Name Service, e i nomi assegna' ai computer su Internet sono de+ nomi di dominio •  Essi sono compos' da sequenze di cara1eri alfanumerici divise da pun' 24
I nomi di Internet •  Ogni suddivisione iden'fica in modo gerarchico •  il singolo host •  la so1orete (o dominio) di cui fa parte •  e così via a salire di livello fino ad arrivare ad una delle macrosezioni (o domini di primo livello) in cui Internet è stata suddivisa 25
La commutazione di pacche1o •  I messaggi su Internet non viaggiano tu+ interi •  Essi vengono divisi in pacche+ che vengono spedi' autonomamente sulla rete 26
La commutazione di pacche1o •  Ciascun pacche1o che fa parte di un determinato messaggio viene dotato di una e'che1a che ne indica la des'nazione e il numero d’ordine Destinazione
123.134.100.45
Numero: 3
•  Così quando arriverà a
destinazione l’host
potrà ricomporre il
messaggio originario
rimettendo in ordine
tutti i pacchetti
27
Internet Protocol Suite •  I cui due protocolli più no' sono il TCP (Transmission Control Protocol) e l'IP (Internet Protocol). •  Il protocollo IP provvede a fornire il sistema di indirizzamento dei nodi terminali della rete, assegnando a ciascuno un nome univoco, formato da qua1ro gruppi di cifre. •  Al livello immediatamente superiore,il protocollo TCP provvede a ges're il flusso dell'informazione tra i due nodi. Si fa riferimento a questa archite1ura di rete con la sigla TCP/IP o IP/TCP (quest'ul'ma non è quasi mai usata). Le applicazioni comuni sono: FTP, HTTP,SMTP: : perme1e il •  FTP( File Transfer Protocol) trasferimento di file tra due computer •  HTTP (HyperText Transfer Protocol): perme1e la visualizzazione di pagine web •  SMTP (Simple Mail Transfer Protocol) per la ges'one della posta ele1ronica La presentazione all’utente (client)
avviene a cura di un apposito
programma installato sul client stesso
(il browser)
29
Nascita del World Wide Web •  Nel 1992 presso il CERN di Ginevra il ricercatore Tim Berners-­‐Lee definì il protocollo HTTP (HyperText Transfer Protocol), un sistema che perme1e una le1ura ipertestuale, non-­‐sequenziale dei documen', saltando da un punto all'altro mediante l'u'lizzo di rimandi (link o, più propriamente, hyperlink). •  Il primo browser con cara1eris'che simili a quelle a1uali, il Mosaic, venne realizzato nel 1993. Esso rivoluzionò profondamente il modo di effe1uare le ricerche e di comunicare in rete. Nacque così il World Wide Web. 30
World Wide Web •  Lungo questa trama ogni utente può costruire i suoi percorsi di le1ura, guidato dai suoi interessi e dalla sua curiosità •  Un simile sistema di organizzazione delle informazioni viene denominato ipertesto •  World Wide Web dunque è un ipertesto mul<mediale distribuito sulla rete Internet 31
World Wide Web •  Ogni pagina di questa rete è dotata di un indirizzo, denominato Uniform Resource Locator (URL) •  Esso ci perme1e di individuarla tra tu1e le altre 32
World Wide Web •  Per consultare le pagine mul'mediali del World Wide Web si usa un programma denominato browser Alcune porzioni di
testo o parti di
immagini in una
pagina Web
corrispondono ai
collegamenti, o link,
ad altre pagine, o ad
altre sezioni della
stessa pagina
33
I browser • 
• 
• 
• 
• 
Internet Explorer Firefox h1p://www.mozillaitalia.it/firefox/ Safari h1p://www.apple.com/it/safari/ Opera h1p://www.opera.com/ Chrome
h1p://www.google.com/chrome/ 34
35
HTML: HyperText Markup Language •  È un sistema di marcatura/forma1azione del testo •  filosofia alterna'va al WYSIWYG (what you see is what you get = “ciò che vedi è ciò che o+eni”) 'pica di editor come Microsor word •  Perme1e –  forma1azione del testo mediante l’uso di comandi (tag) –  collegamen' (link) ad altre risorse disponibili sul WWW –  definizione di maschere di inserimento da' –  inclusione di altri ogge+ complessi (immagini, suoni, etc) 36
I motori di ricerca •  Il motore di ricerca è un server che periodicamente ispeziona i documen' residen' sulla rete e li indicizza in base al loro contenuto e alla stru1ura dei loro link •  Un motore di ricerca fornisce un servizio di ricerca sulla rete per parole chiave fornite dall’utente •  Ogni ricerca produce una lista di link (ordinata per rilevanza) ai documen' contenen' quelle parole chiave 37
I motori di ricerca – http://www.google.com/
– http://www.bing.com
– http://www.altavista.com/
– http://www.yahoo.com/
– http://www.excite.com/
– http://www.lycos.it/
– http://www.virgilio.it/
– ...
38
I motori di ricerca: operatori booleani AND, +
Restringe il campo di ricerca
igiene AND dentale oppure +igiene +dentale
entrambi i termini devono
essere presenti (default di Google)
OR
Estende il campo di ricerca
igiene OR dentale
AND NOT, -
Restringe il campo di ricerca
Non è riconosciuto da tutti i motori
igiene AND NOT dentale oppure igiene -dentale
“”
le parole chiave si devono trovare di seguito
“igiene dentale”
39
MOTORI DI RICERCA: Google •  SeDembre 1998, Menlo Park (CA): inizia la "Google Story" •  Larry Page e Sergey Brin, due studen' di Stanford con il pallino della matema'ca, avevano 25 anni quando nel se1embre del 1998 fondarono Google. •  Poco dopo aver fondato l’azienda, per mancanza dei fondi necessari per l’acquisto di nuovi PC e di altro materiale, cercarono di venderla per un milione di dollari a diverse società finanziarie, oltre che a dire+ concorren' come Altavista e Yahoo, o1enendo solo dei rifiu'. •  Oggi Google vale oltre 100 miliardi di dollari 40
MOTORI DI RICERCA: Google •  La loro “impossible mission” era trovare un modo di catalogare tu1e le informazioni presen' in internet e renderle rapidamente e facilmente disponibili a tu+. E ovviamente di farlo meglio di quanto già facessero Yahoo, Altavista, etc •  La cosa più innova'va è stata sicuramente l’invenzione del “PageRank”. •  Il pagerank è un metodo per determinare “l’importanza” di una pagina web. Mentre i motori esisten', per indicizzare e posizionare i si' web nei loro database, si limitavano a contare le ricorrenze, nel testo delle pagine, dei termini cerca' dagli uten', e quindi mostravano ai primi pos' si' web non sempre per'nen' con le informazioni desiderate, Page e Brin ebbero l’idea di verificare e contare non solo le ripe'zioni delle parole ma anche i link che provenivano da altri si' e che puntavano ad una determinata pagina. Il loro ragionamento era semplice: se un certo sito è citato e consigliato da mol' altri significa che ha dei contenu' interessan' e quindi è giusto farlo vedere prima di altri. 41
MOTORI DI RICERCA: Google •  In realtà il metodo ado1ato dai due studen' per calcolare il Page Rank è molto più complesso ed ar'colato; non si limita a contare i link ma 'ene conto anche della “qualità” dei contenu' e dell’importanza dei si' da cui provengono i link. Ad esempio, se il sito della Microsor consiglia o cita il mio sito, lo stesso acquista agli occhi di Google un valore maggiore rispe1o al sito di un concorrente consigliato da un’azienda sconosciuta, e quindi avrà un PageRank più elevato del concorrente. •  Ci sono poi altri fa1ori che contribuiscono a determinare il PageRank, come l’anzianità del sito, il numero dei visitatori, ecc.. Credo che nessuno li conosca tu+, anche se sono sta' ormai scri+ migliaia di ar'coli e di libri sui “segre' del PageRank di Google”. •  Ciò che conta è che gli uten', usando Google, si rendevano conto che era più facile e richiedeva meno tempo trovare le informazioni desiderate e pertanto abbandonavano gli altri motori e consigliavano agli amici e conoscen' di fare altre1anto. 42
MOTORI DI RICERCA: Google •  Oggi Google reperisce e ges'sce le informazioni presen' su internet grazie ad una propria rete composta da oltre 100.000 PC. Una potenza di calcolo che nessun’altra azienda al mondo possiede. •  Google riesce parzialmente ad esplorare il DEEP WEB, ossia quelle
informazioni contenute nel web, ma non indicizzate dai motori di
ricerca e contenute nei database. Google riesce ad indicizzare anche documen' in forma' non testuali (PDF, presentazioni, fogli di calcolo, immagini). •  Google ha nel suo database oltre 8 miliardi di pagine web e ogni giorno i suoi uten' effe1uano 200 milioni di ricerche in oltre 80 lingue. A1ualmente è in a1o il più ambizioso dei proge+ mai a1ua': la digitalizzazione dei volumi di intere biblioteche al fine di rendere il sapere umano alla portata di tu+. 43
MOTORI DI RICERCA: Google •  Ma chi paga? Da dove provengono i soldi? •  Ma tu+ ques' miliardi di dollari da dove arrivano, considerato che l’u'lizzo di Google è gratuito? •  Chi paga? •  Questa è la domanda che spesso mi è stata posta da clien', amici e conoscen', e sono certo che anche mol' di voi qualche volta se la saranno posta. •  La risposta è molto semplice: Google non fa pubblicità a se stesso ma incassa molto per la pubblicità che fa agli altri. 44
MOTORI DI RICERCA: Google •  La pubblicità contestuale •  Un’altra delle idee brillan' di Google è stata la pubblicità contestuale, o mirata. Provate a immaginare… state guardando un film di fantascienza alla TV e c’è un’interruzione pubblicitaria con uno spot che parla di un fascicolo con DVD allegato, in edicola da domani; il 'tolo è “ai confini della realtà” (un mito degli anni ’60 per gli aman' di fantascienza). •  Quan' di voi cambierebbero canale per evitare questa pubblicità? •  Google fa la stessa cosa: se state cercando ad esempio “noleggio macchine per caffè” vedrete sulla parte destra della pagina dei risulta' alcuni link pubblicitari di aziende che noleggiano macchine per caffè o che vendono cialde di caffè. Le probabilità che questa pubblicità dia fas'dio sono quindi minime e nello stesso tempo, le probabilità che qualcuno clicchi su ques' link sono alte. •  Questo consente a Google di far acce1are ai suoi inserzionis' di pagare un “tot” per click più elevato rispe1o a ciò che pagherebbero per la stessa pubblicità inserita su si' o portali che parlano di calcio, di libri, di corsi, di telefonini o di cronaca. 45
MOTORI DI RICERCA: Google •  Il sito di GOOGLE -­‐ un esempio da imitare •  Il sito di Google si presenta in modo spartano, senza animazioni in flash, senza musiche1e, senza sfondi mul'colori, senza banner pubblicitari. Non c’è nulla che possa distrarre l’utente, che lo costringa a pensare dove cliccare. Ci sono soltanto informazioni. Google sa cosa vogliono gli uten' e li accontenta. •  Pensate a quan' milioni di dollari Google sta rinunciando pur di non "sporcare" e rendere pesante la sua home page con l'inserimento di banner pubblicitari sta'ci o anima' in Flash, come invece fanno altri motori (MSN, YAHOO, ecc..). 46
GOOGLE: la ricerca • 
-­‐ 
-­‐ 
-­‐ 
Ricerche di base Operatore AND automa'co; Google ignora le “stop words”* Google non supporta la ricerca di radici di parole (per es. aziend*) *Stop words o stopwords, è il nome dato alle parole che vengono filtrate a priori o conseguentemente ad un processo di analisi dei tes' di documen' presen' in un data base, come ad esempio: -­‐ da, in, per, il, chi, su, ecc.. 47
GOOGLE: la ricerca •  La ricerca avanzata: 48
GOOGLE: gli strumen' • Google libri (h1p://books.google.it/) Consente la ricerca e la le1ura di libri resi disponibili online dagli editori aderen' all'inizia'va. In alcuni casi, per mo'vi legali, viene richiesta l’auten'cazione per poter leggere i libri trova' 49
Google libri •  I problemi incontra' sembrano essere fondamentalmente di tre 'pi: •  1) quelli, ben no', lega' alle inizia've legali a1raverso le quali la Authors Guild e la Associa'on of American Publishers (oltre ad alcuni autori individuali) stanno cercando di bloccare la digitalizzazione dei tes' so1o diri+; •  2) quelli, purtroppo assai meno no', lega' alle difficoltà tecniche del proge1o e alle cara1eris'che degli strumen' sorware e dei forma' di codifica u'lizza'; •  3) quelli, ovviamente influenza' anche dalle prime due 'pologie, lega' alla focalizzazione dell’esa1a fisionomia del proge1o stesso. 50
GOOGLE: gli strumen' • Google scholar (h1p://scholar.google.com/) -Che cos'è Google Scholar? Google Scholar offre un modo semplice per effe1uare un'ampia ricerca sulla le1eratura accademica. Con un unico servizio, puoi effe1uare ricerche tra molte discipline e fon': documen' approva' per la pubblicazione, tesi, libri, abstract e ar'coli di case editrici accademiche, ordini professionali, database di studi non ancora pubblica', università e altre organizzazioni accademiche.. Funzioni di Google Scholar Cerca in diverse fon' u'lizzando un unico e pra'co sito Trova documen', abstract e citazioni Individua un documento completo nella tua biblioteca oppure sul web Scopri documen' importan' in qualsiasi area di ricerca Come vengono classifica< gli ar<coli? Google Scholar mira ad elencare gli ar'coli in base alla stessa classificazione ado1ata dal mondo scien'fico, ossia valutando il testo completo di un ar'colo, l'autore, la pubblicazione in cui è riportato e il numero di volte in cui viene citato in altri documen' accademici. I risulta' più per'nen' vengono sempre visualizza' nella prima pagina. 51
Scarica