Domenica 21 ottobre 2012
If you torture the data long enough,
Nature will always confess
Ronald H. Coase (premio Nobel 1991 per l’economia)
Modello di
previsione
del churn
campione CB
"churn"=1.8%
sottoscrive servizio A
"churn"=5.5%
attivazione prima del xxx
"churn"=4.6%
non sottoscrive servizio A
"churn"=1.4%
attivazione dopo il xxx
"churn"=6.0%
usa servizio B
"churn"=2.5%
non usa servizio B
"churn"=7.2%
più di n chiamate outbound
"churn"=3.1%
più di m mail ricevute
"churn"=2.6%
meno di m mail ricevute
"churn"=6.8%
meno di n chiamate outbound
"churn"=16.1%
età superiore ai k anni
"churn"=14.0%
non persona fisica
"churn"=16.0%
età inferiore ai k anni
"churn"=19.6%
femmina
"churn"=17.8%
maschio
"churn"=20.3%
residente nelle regiorni a,b,c,d,e
"churn"=19.2%
residente nelle altre regioni
percentuale dellacustomer base=1.8%
"churn"=21.1%
Modelli per il riconoscimento del linguaggio
“La nozione di “probabilità di una frase” è completamente inutile.” (N. Chomsky)
1. Incolori idee verdi dormono furiosamente
2. Furiosamente dormono idee verdi incolori
Entrambe le due frasi (né qualche loro parte) non sono mai apparse
nella passata esperienza linguistica.
Ma 1. è grammaticamente corretta, mentre 2. non lo è.
(Chomsky, 1957, Syntactic Structures)
Secondo Chomsky un modello statistico assegna ad entrambe
probabilità nulla, e quindi non è in grado di distinguere la correttezza
della 1. rispetto alla 2.
-> Bisogna saper scegliere bene il modello!
In realtà dipende dal modello statistico usato. L’affermazione è vera per il modello statistico più semplice, ma non per modelli più sofisticati.
Ad esempio Pereira mostra che un semplice modello che considera 2 parole consecutive (bigram model) calcola che 1. è 200mila volte più
probabile di 2.
All science is either physics or stamp collecting
Ernest Rutherford (fisico)