Tipologia dei dati e organizzazione delle informazioni
Sistemi di indicizzazione e recupero
7.
Ricerca delle informazioni in rete,
browsers, portali, motori di ricerca
browser
Un browser è un programma che
fornisce un modo per accedere e
interagire con l’informazione sul Web.
Prima del Web indicava una generica
interfaccia per navigare attraverso testi
e leggere (to browse).
Dal 93, (Mosaic primo browser con
interfaccia grafica), è diventato un
termine di uso generale per indicare
uno strumento di accesso a tutto il
contenuto del Web.
Tecnicamente, è un programma client
che usa l’Hypertext Transfer Protocol
(HTTP) per spedire richieste ai server
Web attraverso Internet per conto
dell’utente del browser.
1
Browsers:
risultati di uno studio sperimentale
• Più del 90% degli eventi di interazione è navigazionale:
- 52% degli eventi: link following
- 41% degli eventi: bottone “back”
• Solo il 2% delle URL visitate è digitato esplicitamente
• Frequenti modelli di navigazione “hub&spoke”, con pagina
centrale a cui si ritorna dopo le esplorazioni
(Catledge & Pitkow, 1995)
E’ ancora valido?
2
Quanto tempo su ogni pagina?
10
25
Tempi di permanenza superiori a 10 sec sono relativamente rari
(Cockburn & McKenzie, 2000)
Caratteristiche fondamentali dei browser:
(NON contravvenire!)
•Capacità di navigazione bidirezionale
(pulsanti Avanti e Indietro)
•Cronologia, Segnalibri, Preferiti
•Codice colore per i link ipertestuali
3
Il world wide web: sintesi
File HTML
browser
URL
Internet
Client
Server
web server
il protocollo: HTTP
7
Tipologie di siti web
•business e attività industriali
•commercio e servizi
•gestione documenti e banche dati on line
•turismo
•tempo libero, hobby
•news, testate giornalistiche, agenzie
•reti civiche e servizi al cittadino
•siti istituzionali di enti pubblici, enti no-profit
•portali
•
•
4
Tipi di siti
interattività
alta
bassa
poco
molto
contenuto
Tipi di siti
interattività
alta
bassa
company
brochure
poco
molto
contenuto
5
Tipi di siti
interattività
alta
bassa
company
brochure
poco
e-zine,
digital
libraries,
portals
molto
contenuto
Tipi di siti
interattività
alta
bassa
games
company
brochure
poco
e-zine,
digital
libraries,
portals
molto
contenuto
6
Tipi di siti
interattività
alta
bassa
games
e-commerce
company
brochure
e-zine,
digital
libraries,
portals
poco
molto
contenuto
La complessità dei siti è in
crescita
interattività
I siti
importanti
migrano qui
alta
u
ol
ev
e
on
i
z
bassa
poco
molto
contenuto
7
MINISITO (Microsite, Promotional web site)
forma promozionale on-line che prevede la creazione
ad hoc di appositi siti Web di durata limitata, per
promuovere un evento o un prodotto. Più che per
scopi di branding sono diretti a focalizzare l'attenzione
dell'utente su un nuovo prodotto o evento particolare.
In abbinamento a campagne banner o
sponsorizzazioni consentono una efficace
comunicazione on line.
Sito Web
collezione di file Web su un particolare soggetto, a
partire da un file iniziale detto home page.
La home page ha un indirizzo (URL: Universal
Resource Address) che la identifica univocamente.
Portale
si propone di essere un importante sito di partenza per
gli utenti quando si collegano o che gli utenti tendono a
visitare come sito - ancora.
Ci sono portali generalisti o specializzati.
Generalisti: Yahoo, Lycos, , Excite….
Specializzati : Cooker.net, Garden.com,
8
Classificazione dei siti web
• Per origine / destinazione della comunicazione
G
G2B
B2B
Extranet
B
B2E
Intranet
(Enterprise
Portals)
E
“E-government”
G2C
B2CSiti
istituzionali,
Portali,
E-commerce,
News,
…
C
C2C
Siti
personali,
comunità,
…
Portale
9
Servizi tipici offerti dai portali:
•directory di siti Web
•strumenti per cercare altri siti (es. un motore di ricerca)
•news
•informazioni sul tempo
•e-mail
•quotazioni di borsa
•forum per la comunità di interesse
•……………..
Una categoria SPECIALE
I motori di ricerca
10
Un search engine si trova a dover lavorare con
miliardi di pagine (basti pensare a Google, circa 4
miliardi di documenti), per le quali, (per ognuna di
queste), è necessario definirne il dominio,
indicizzarne e mantenerne aggiornato il contenuto.
Un Motore di Ricerca è un complesso e potente sistema di
recupero informazioni che, partendo da una richiesta di un
generico utente, restituisce una serie di riferimenti a documenti,
siti web, file, che maggiormente rispondono alle caratteristiche
introdotte.
In generale un Motore di Ricerca può essere considerato come
un “agente” che ha il compito di scandagliare l’intero web al
fine di recuperare in maniera efficiente il maggior numero di
documenti qualitativamente interessanti, relativi ad una query
sottomessa da un qualsiasi utilizzatore del web.
Un search engine si trova a dover lavorare con miliardi di
pagine (basti pensare a Google, circa 4 miliardi di
documenti),
per le quali, (per ognuna di queste), è necessario
definirne il dominio,
indicizzarne e
mantenerne aggiornato il contenuto.
(Google è passato da una media di 10 mila interrogazioni al
giorno nel 1996, ad oltre 150 milioni di query nel 2004
[Google].)
11
Il successo di Google
Il motivo del successo riscosso da Google va ricercato nella eccellente
tecnologia, chiamata PageRank, e nella rapidità delle ricerche. Tale
metodologia, consiste essenzialmente nel dare maggior valore a siti verso cui
puntano il maggior numero di link; in pratica è stato applicato al web il sistema
delle citazioni dell’ambito accademico in riferimento ai links verso una
determinata pagina. Questo metodo fornisce un’approssimativa importanza e
qualità del documento stesso. È quindi possibile non solo valutare il valore di
una pagina web in modo preciso e veloce, ma si viene a simulare il
comportamento di un navigatore standard che si sposta da link a link tentando di
giungere ad un punto giudicato “importante”. Attualmente Google ha nel suo
database 4.285.199.774 pagine di cui 2.073.418.204 indicizzate, gestendo ben
101 domini locali; la sua ricerca è velocissima e la sua utilizzazione è garantita
da pagine in 34 lingue diverse e da traduzioni in continua crescita. Tutto il
sistema è basato su 5000 PC supportati dal sistema operativo open source Linux
[Google].
Tipi di Dati
Numero
Percentuale
testo/html
41,490,044
69.2%
immagini/gif
10,729,326
17.9%
immagini/jpeg
4,846,257
8.1%
testo
869,911
1.5%
applicazioni/pdf
540,656
0.9%
audio
269,384
0.4%
applicazioni/zip
213,089
0.4%
applicazioni/ps
159,869
0.3%
altro
829,410
1.4%
59,947,946
100%
Totale
Distribuzione di tipi di dati presenti su web
basata su un campione di 60 milioni di documenti non replicati
12
Motore di ricerca (Search Engine)
Insieme di programmi coordinato che comprende:
•uno spider che scorre ogni pagina o le pagine rappresentative
dei siti Web e li legge percorrendo anche i link ipertestuali
•un programma che crea un indice (o catalogo) dalle pagine lette
•un programma che riceve la richiesta, la confronta con gli
elementi dell’indice e restituisce i risultati
In alternativa all’uso di un motore di ricerca è a volte offerta
l’esplorazione di Directory di argomenti (es.Yahoo)
Molti portali offrono ambedue.
Schema generale di un Search Engine
13
Tre generazioni di motori di ricerca
1 – Indicizzazione basata sull’analisi dei testi, ranking basato su
frequenza…..
2 – Indicizzazione basata su popolarità, …..
3 – Meta-agenti…..
Meta Search Engine
14
I diversi approcci, i maggiori, diverse strategie
Google (53,2)
Yahoo (20,4)
Msn Search (9,1)
Indici che puntano alle
pagine web e tengono conto
di frequenza, posizione nel
testo, font, popolarità
Terra Lycos (3,7)
Aol Search (2,9)
Altavista (2,8)
Diversi motori (tra
cui Google)
Inquick (2,2)
Da Aggiornare!!!!!!!
• http://www.google.com/press/zeitgeist2004/index.html
Un sito interattivo con statistiche
15
I motori di ricerca e il marketing
Le ricerche più recenti dimostrano che oltre l'80% degli
utenti che ricercano informazioni si affida ai motori di
ricerca.
MARKETING
Attività dell'impresa volta a ottimizzare
tutti i fattori che permettono di migliorare
la commercializzazione di merci o servizi
offerti, mediante la creazione,
l'individuazione e lo stimolo dei bisogni
dei consumatori, associata alla proposta di
prodotti o servizi idonei per il
soddisfacimento dei bisogni stessi.
Riguarda tutte le decisioni relative al
prodotto: caratteristiche, prezzo,
pubblicità, promozione, canali di
distribuzione, rete di vendita.
16
MARKETING MIX
Si dice del valore determinato che la combinazione delle
quattro variabili di mercato più importanti - prodotto, prezzo,
promozione, distribuzione - di volta in volta assume per ogni
singola offerta di vendita.
Il prezzo del prodotto, il modo in cui lo si distribuisce, i mezzi
con cui lo si fa conoscere devono essere coerenti con il tipo di
prodotto, ma soprattutto con il posizionamento deciso per
esso, e prima ancora con gli obiettivi aziendali.
MARKETING MULTICANALE
Grazie ad Internet, ma anche con altri nuovi mezzi (Wap, SMS, ecc), è
possibile rendere le esperienze di comunicazione e/o di acquisto
omogenee, in grado cioè di dare al cliente quelle sensazioni e quelle
esperienze che in passato i diversi mezzi (stampa, televisione, ecc) o i
diversi canali (il negoziante sotto casa, il catalogo spedito per posta)
potevano dare solo separatamente.
I mezzi di comunicazione erano gestiti indipendentemente tra loro e
indipendentemente dai canali di vendita.
Il marketing multicanale dà la possibilità di promuovere la stessa
iniziativa di marketing con più mezzi, ma offrendo al consumatore la
stessa identica sensazione o esperienza di acquisto con ognuno.
Si pensi al marketing della Kinder, che ha avuto l'idea di far trovare la
sorpresa dell'ovetto sia in termini fisici, sia su Internet, dove usando un
piccolo codice trovato col giocattolo si può accedere ad un video-game a
sorpresa (www.magic-kinder.com).
17
La pubblicità in Internet
Fonte: Il Sole24Ore
Aggiornare!!!!!!!
Un nuovo strumento di pubblicità
KEYWORD
Ovvero parola chiave. Si possono utilizzare le keyword come
formula di distribuzione degli annunci pubblicitari, sui
motori di ricerca e sui portali.
L'inserzionista può sfruttare pubblicitariamente gli esiti delle
ricerche effettuate dagli utenti, acquistando alcune parole
chiave che, associate alla ricerca effettuata, portano
all'esposizione degli annunci relativi al tema della parola
chiave selezionata.
18
Pubblicità mediante keyword
Un sito dove trovare informazioni, statistiche etc.
19
http://www.marketingfind.com
Un sito sulle tecniche di marketing
Su Web
Esercizio N.7
Situare 10 siti diversi nel diagramma interattività/contenuto
interattività
alt
a
bassa
games
e-commerce
company
brochure
e-zine,
digital
libraries,
portals
poco
molto
contenuto
20
Esercizio N.8
Aggiornare mediante ricerca in rete i seguenti dati:
•Percentuali di utilizzo dei maggiori motori di ricerca
•Pubblicità su Internet (es. banner, avvisi sponsorizzati etc.)
Come si suddividono il mercato
•Eventuali altri dati statistici su Internet (es. n. siti Web,
n.host, tipo di utilizzo (da casa, dal lavoro..))
21