Statistici e lavoro: un`analisi testuale sui profili

Statistici e lavoro:
un’analisi testuale sui profili richiesti “in rete”
Maria Gabriella Grassia1
Università degli Studi di Napoli “Federico II”
Paolo Mariani
Università degli Studi di Milano-Bicocca
Biancamaria Zavanella
Università degli Studi di Milano-Bicocca
Riassunto. Obiettivo del presente lavoro è illustrare una strategia di analisi utile a studiare le
richieste del mondo del lavoro per i laureati in discipline statistiche, suggerendo la possibilità
di sfruttare nuove fonti informative per descrivere in modo qualitativo l’effettiva domanda di
questi laureati da parte degli operatori. A questo fine si è sfruttato il patrimonio informativo
reperibile a costo zero sul Web. Attualmente, infatti, le aziende, principalmente quelle del
settore privato, ricercano candidati mediante la pubblicazione di annunci su siti web
specializzati. Sono stati analizzati tutti gli annunci pubblicati da aziende private nei siti
specializzati nel mese di settembre 2010, contenenti un esplicito riferimento alla statistica.
Le tecniche utilizzate per l’analisi dei testi degli annunci sono ascrivibili all’ambito
dell’analisi automatica di dati testuali e alla classificazione automatica dei documenti. I
risultati mostrano l’eterogeneità delle offerte di lavoro, a conferma del ruolo
multidisciplinare, ma anche sfocato, dello statistico.
Parole chiave: Profili occupazionali; Inserzioni web; Analisi testuale dei dati; Expectationmaximization algorithm.
1. Introduzione
All’interno delle aziende in cui operano, gli statistici svolgono ruoli e mansioni
diverse (Martini e Fabbris, 2005): dalla gestione dei sistemi informativi al controllo
della qualità e della pianificazione della produzione, dal marketing alle attività di
1
Il presente lavoro è stato finanziato nell’ambito del progetto PRIN 2007 “Modelli, indicatori e
metodi statistici per rappresentare l’efficacia formativa di corsi di laurea ai fini dell’accreditamento e
del miglioramento”, cofinanziato dal MIUR e dall'Università di Padova (CUP: C91J11002460001),
coordinato da Luigi Fabbris. La nota, pur essendo frutto di un lavoro comune è stata redatta da:
Biancamaria Zavanella per il Par. 1, Paolo Mariani per i Parr. 2, 4.2 e 5, Maria Gabriella Grassia per i
Parr. 3 e 4.1. I dati sono stati raccolti da Chiara Longeri.
78
Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”
previsione, dalla consulenza vera e propria alle attività di supporto alle decisioni
aziendali.
Ciò rende la figura dello statistico piuttosto indefinita. Non è chiaro, infatti, se lo
statistico sia da ricondurre a una sola figura o a più figure professionali. A conferma
di questo, le richieste di lavoro sono indirizzate non solo a laureati in statistica, ma
anche a laureati in altre discipline quali economia, ingegneria gestionale, informatica.
In alcuni casi, benché le competenze richieste siano specifiche della figura dello
statistico, gli annunci si rivolgono esclusivamente a laureati in altre discipline.
Obiettivo di questo lavoro è indagare gli ambiti occupazionali dello statistico e
le mansioni ed i ruoli a lui associati nelle richieste provenienti dal mercato del lavoro
italiano, intendendo con il termine “statistico” non solo il laureato in statistica, ma
più in generale, chiunque svolga attività professionali connesse alla statistica.
Le usuali fonti disponibili per lo studio della transizione università-lavoro sono
relative ad indagini rivolte prevalentemente agli stessi laureati (offerta di lavoro),
mentre fonti che descrivano in modo qualitativo il lato della domanda sono molto
esigue. Da qui l’esigenza di progettare un approccio per reperire i dati che
rispondano a questa esigenza informativa. La soluzione di progettare indagini ad hoc
rivolte agli operatori del mercato del lavoro è di difficile realizzazione, a causa degli
elevati costi. Si è privilegiata, di contro, una soluzione a costo zero, che consentisse
di sfruttare il patrimonio informativo presente sul web, estraendone l’informazione
richiesta. Attualmente, infatti, le aziende domandano lavoro pubblicando annunci su
siti web specializzati. Si è deciso, perciò di studiare questi annunci di lavoro e di
valutarne le potenzialità informative.
Il riferimento è al settore privato, dato che, nel pubblico, il reclutamento avviene
attraverso procedure concorsuali, raramente attraverso canali quali il web. Per questo
motivo, alcune specializzazioni riferite alla statistica nella pubblica amministrazione
probabilmente non compariranno frequentemente su questo canale.
Nel lavoro si analizzano gli annunci di lavoro rivolti a posizioni di statistico,
reperiti nei principali siti specializzati nell’incontro tra domanda ed offerta di lavoro,
nel mese di settembre 2010. La metodologia di analisi utilizzata è l’analisi di dati
testuali, che permette di estrarre informazioni non note a priori, contenute in dati non
strutturati.
Il lavoro è nel seguito così organizzato. Nel Par. 2 vengono illustrati l’utilizzo e
l’importanza dei siti internet per l’accesso al mercato del lavoro, nel Par. 3 vengono
brevemente richiamate le tecniche statistiche utilizzate per l’analisi dei dati testuali,
nel Par. 4 viene illustrata la procedura seguita per l’analisi degli annunci di lavoro
on-line e i relativi risultati. Infine, nel Par. 5 si traggono alcune considerazioni
conclusive.
Il profilo professionale dello statistico: ruoli, competenze e prospettive
79
2. Internet come canale di accesso al lavoro
L’attività di reclutamento di personale è da intendersi come la ricerca, sulla base di
determinate esigenze dell’azienda, di un certo numero di persone in possesso di un
minimo di requisiti tali da soddisfare le esigenze stesse. I datori di lavoro investono
una considerevole quantità di tempo e di risorse nella ricerca di nuovi dipendenti per
individuare e attrarre i candidati con le caratteristiche desiderate.
Nella letteratura che tratta del mercato del lavoro, la maggior parte degli studi ha
considerato le questioni relative al posto da ricoprire, alla durata del periodo di
selezione dei candidati e alle strategie che le imprese possono adottare per ridurre al
minimo tempi e risorse (Mariani et al., 2011). Questo filone di letteratura si è
concentrato sull'utilizzo di canali di ricerca, sulle fonti utilizzate dalle imprese per
reperire nuovi lavoratori e sui canali utilizzati dai candidati per accedere al mondo
del lavoro (Mocavini e Paliotta, 2002; Zerilli, 1998).
La scelta dei canali di ricerca è di strategica importanza nella maggior parte dei
programmi di ricerca del personale, poiché incide sia sul numero dei potenziali
candidati, sia sulle loro competenze in termini di conoscenze ed esperienza, sia
sull’effettiva corrispondenza tra il posto da ricoprire ed il candidato idoneo a
ricoprirlo.
Per quanto riguarda il canale delle inserzioni pubblicate dalle aziende, è
opportuno offrire una prima differenza tra quelle pubblicate su carta stampata e
quelle on-line. Le prime rivestono un ruolo non trascurabile nella ricerca di
personale, nonostante il costo elevato che le imprese devono sostenere per accedervi.
Si tratta di un canale particolare, visto dalle imprese come la via per raggiungere
personale non altrimenti reperibile, in grado di raggiungere un numero di candidati
potenzialmente alto ed operare contestualmente una selezione dovuta al target di
lettori della rivista o del quotidiano su cui si pubblica l’annuncio. Tale selezione a
priori non avviene su web se non per caratteristiche legate all’accessibilità e alla
capacità di ricerca del singolo. Per avere una dimensione del fenomeno, i posti di
lavoro offerti tramite inserzioni sui quotidiani italiani hanno registrato nel primo
semestre 2009 un numero di annunci pari a 31.8412 (Corsi, 2003; Cuppone et al.,
2009). Se si analizza il canale utilizzato per la ricerca del primo impiego,
(tendenzialmente un contratto di stage), secondo la ricerca effettuata dall’Istituto per
lo Sviluppo della Formazione Professionale dei Lavoratori in collaborazione con il
sito “La repubblica degli stagisti”, si nota che il canale informale costituito da
internet copre il 26% del flusso di ricerca (ISFOL, 2009).
2
In diminuzione rispetto al primo semestre 2008 (numero di annunci pari a70.319) con un calo del
54,7% .
80
Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”
Nell'agosto del 2000, un disoccupato su quattro in cerca di lavoro negli Stati
Uniti ha riferito di avere regolarmente utilizzato internet per cercare lavoro, una
persona occupata su dieci ha detto di aver cercato regolarmente altri posti di lavoro
utilizzando il web (Fountain, 2005).
Inoltre, l'uso di internet e dei siti che offrono posti di lavoro è in genere gratuito
per i lavoratori e molto più conveniente per le imprese rispetto alle inserzioni di
pubblicità effettuate sulla stampa tradizionale. Questi servizi offrono alle imprese e
ai lavoratori la possibilità di un accesso immediato a un numero molto maggiore di
annunci e inserzioni rispetto ai canali tradizionali, così come le informazioni
potenziali che si possono scambiare sono molto più dettagliate da entrambi le parti,
azienda e candidato.
Il mismatch nel mercato del lavoro è legato alle caratteristiche del capitale
umano dei lavoratori, ai requisiti e ai compensi dei posti di lavoro, ma anche al
processo attraverso il quale si ha l’incontro tra i lavoratori e i posti di lavoro (Centra
e Tronti, 2011).
Poiché questo processo di incontro dipende in modo cruciale dalla disponibilità
di informazioni, sia per lavoratori sia per i datori di lavoro, internet rappresenta un
nuovo spazio attraverso il quale queste informazioni possono fluire meglio rispetto ai
tradizionali luoghi di incontro di domanda ed offerta.
La proliferazione di migliaia di siti internet che riportano annunci di lavoro, per
non parlare degli annunci on-line e dei posti di lavoro pubblicati sui siti web
aziendali, indica che il canale è aperto. A tal proposito, in riferimento al mercato
italiano, Staglianò (2001) riporta che il Ministero del Lavoro, in un recente
censimento, ha contato circa 200 siti specializzati in reclutamento e selezione del
personale e, secondo uno studio di Forrester Research, circa il 30% delle persone che
hanno accesso a internet li avrebbe visitati almeno una volta.
I disoccupati in cerca di lavoro che utilizzano internet sono anche più propensi a
usare allo stesso tempo i tradizionali canali di ricerca di lavoro; ciò sembra suggerire
un’attività di ricerca più intensa, orientata su più fronti, offrendo un criterio di
segmentazione dell’offerta. Ci sono molti siti internet, come Monster o Infojobs3,
progettati per mediare il processo di incontro tra lavoratori e datori di lavoro, oltre
agli annunci di lavoro pubblicati direttamente su siti web aziendali dalle imprese
stesse. Gran parte dei maggiori quotidiani pubblica i propri annunci economici online e spesso includono strumenti che rendono facile la ricerca di offerte di lavoro.
Ma come utilizzare tutto questo patrimonio informativo testuale “a basso costo”
presente sul web, al fine di delineare il ruolo che le stesse aziende intendono affidare
ai laureati in statistica?
3
Per una rassegna sui principali siti specializzati nell’offerta di lavoro si rimanda alla pagina del
seguente sito: www.trovareillavorochepiace.it/links/links annunci di lavoro.htm.
Il profilo professionale dello statistico: ruoli, competenze e prospettive
81
3. La statistica testuale ed il text mining
La crescente disponibilità di risorse linguistiche informatizzate e la crescente
diffusione dei testi consultabili on-line hanno portato a trovare soluzioni che non si
fondano più soltanto su strumenti derivanti dalla statistica testuale (Bolasco, 2004;
Lebart e Salem, 1984; Lebart e Morineau, 1985; Lebart e Salem, 1988), ma che
scaturiscono da una stretta multidisciplinarità che associa a questi, con uguale
importanza, strumenti informatici e linguistici nell’area del text mining.
Il text mining è un’applicazione specifica di text analysis e costituisce solo una
delle possibili finalizzazioni di un’analisi testuale in forma automatica (Berry e
Kogan, 2010; Bolasco, 2005; Bramer, 2007; Hearst, 2003).
Per text mining si intende l’insieme di tecnologie e procedure che mettono in
concatenazione operazioni di information retrieval e information extraction. Tali
tecnologie, tendenti a catturare la sola informazione rilevante presente nei testi,
integrano in maniera intrinsecamente interdisciplinare metodi statistici propri del
data mining e tecniche di intelligenza artificiale, al fine di creare, a partire da fonti
non strutturate, conoscenza utilizzabile.
Il text mining è, quindi, un processo che impiega un insieme di algoritmi per la
conversione dei testi non strutturati in dati strutturati e fa ricorso a metodi
quantitativi di analisi.
Un processo di text mining prevede i seguenti passi:
a) la fase dei testi (in cui prevale l’informatica), che consiste nel reperimento dal web
o dai database aziendali delle fonti dei testi (es.: articoli di stampa, annunci di
lavoro o altre basi documentali), nella loro formattazione (pre-processing) e nella
costituzione del document warehouse;
b) la fase di lexical processing (in cui prevale la linguistica), che consiste nel
riconoscere i vocaboli, individuare parole chiave o concetti già noti (text parsing),
effettuare lemmatizzazioni;
c) la fase di vero e proprio text mining, in cui la statistica e le tecniche di data mining
hanno un ruolo cruciale.
Le procedure e le tecniche di text mining tendono in sostanza a trattare i
materiali testuali in formato libero, usa quindi dati non strutturati, estraendo da questi
informazioni specifiche da riportare in database tradizionali e creando dati codificati
in campi strutturati, dai quali trarre informazione che crei valore. La statistica
testuale riveste una funzione cruciale nel text mining per il successo
dell’applicazione.
Tecniche di text mining sono state più volte utilizzate per studiare gli annunci di
lavoro al fine di comprendere la domanda proveniente dal mercato (Balbi et al.,
82
Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”
2008; Di Meglio et al., 2007), ma non sono mai state applicate allo studio della
professione dello statistico.
4. L’analisi degli annunci di lavoro
Lo studio ha riguardato gli annunci di lavoro pubblicati on-line e rivolti a possibili
candidati laureati in statistica.
Grazie al processo di text mining, è stata estratta l’informazione utile a delineare
il ruolo, le competenze e le prospettive assegnate agli statistici in azienda.
Gli annunci sono il risultato di una ricerca delle parole chiave “offerta lavoro
statistica” effettuata on-line tramite il motore di ricerca Google.it4 ed i documenti
oggetto dell’analisi sono le offerte di lavoro per statistici collezionati nel mese di
settembre 2010. Il corpus è formato da 55 annunci che hanno un orizzonte temporale
di pubblicazione che spazia da giugno a settembre 2010.
Gli annunci sono stati classificati in base a:
- sito internet su cui erano stati pubblicati;
- presenza o meno di una società esterna di recruiting e laddove presente la sua
ragione sociale;
- candidato a cui era rivolto, se neolaureato o con esperienza;
- settore dell’azienda che ricercava (ove possibile);
- contratto offerto, ad esempio stage, contratto a tempo determinato, contratto a
tempo indeterminato (ove possibile);
- sede di lavoro (ove possibile).
Per quanto riguarda queste ultime tre variabili, non è stato possibile effettuare
classificazioni complete, in quanto si tratta di informazioni non sempre presenti nella
descrizione dell’annuncio. Gli annunci per tipologia del sito, sito e relative frequenze
sono riportati in Tab. 1.
I siti internet da cui sono stati tratti gli annunci sono 30; il 63,6% presenta
l’intermediazione di una società di selezione, mentre i restanti annunci sono stati
pubblicati direttamente da aziende. Le società di selezione sono 18: Adecco, Alma
Spa, Alvin Consulting, Aquerò, Articolo 1, Gi Group Spa, Hays, Help Lavoro,
Manpower Spa, Metis Spa, Obiettivo Lavoro Spa, Page Personnel Italia Spa, Quanta
Spa, Randstad Italia Spa, Sixtema, Skill Risorse Umane, Star People Spa, Umana
Spa.
4
Il ricorso a Google è giustificato dal fatto che si tratta del motore di ricerca maggiormente utilizzato
per scopi sia privati sia lavorativi.
83
Il profilo professionale dello statistico: ruoli, competenze e prospettive
La metà degli annunci è rivolta a persone con una precedente esperienza
lavorativa, l’altra metà a neolaureati.
Tabella 1. Annunci per tipologia del sito, sito e relative frequenze, settembre 2010. Fonte:
www.google.it
TIPOLOGIA SITO
FREQUENZA
1
2
infojobs.it
helplavoro.it
lavoro.ilcurriculum.net
offerte-lavoro.monster.it
lavoro.wickedin.it
assores.it
iowork.it
bollettinodellavoro.it
cambiolavoro.com
candidate.adecco
careerbuilder.it
catapulta.it/
categorieprotette.it
dovajobs.com
eurometis.it
experteer.it
ialweb.it
it.fashionjobs.com
offertedilavoro.info
techcareers.com
lavoro.corriere.it
lavoro.milanofinanza.it
annunci.repubblica.it
miojob.repubblica.i
kijiji.it
milano.bakeca.it
subito.it
accenture.it
almalaurea.it
1
riminimpiego.it
JOB-RECRUITING
32
INFORMAZIONE
12
ANNUNCI
GENERICI
7
AZIENDA
UNIVERSITA'
OPERATORI
ISTITUZIONALI
SITO INTERNET
N
6
3
3
3
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
7
2
2
1
5
1
1
1
2
1
84
Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”
Con riferimento al luogo, 21 offerte di lavoro provengono da aziende di Milano
e provincia, per un totale di 25 annunci dalla Lombardia; 28 annunci provengono da
altre regioni dell’Italia, mentre per 2 annunci non è presente l’informazione sulla
sede del lavoro. Secondo una recente ricerca pubblicata da Monster, il profilo di chi
accede ai siti di reclutamento on-line è costituito per l’11% da manager, per il 4% da
figure di minore esperienza. Il 45% di chi si candida on-line dichiara di avere
esperienza. Il 34% possiede una laurea, il 30% è costituito da diplomati.
4.1 Le fasi del Text Mining
Al fine di evitare che testi più lunghi, con un dizionario quindi più ampio, potessero
impattare sui risultati, è stata effettuata una normalizzazione dei testi sugli annunci
(in tutto quattro) che presentavano una lunghezza superiore a 200 parole eliminando i
frammenti che si allontanavano dalla descrizione vera e propria dell’offerta di lavoro.
A seguito di ciò si sono ottenuti annunci di lunghezza compresa tra le 20 e le 160
parole; si è poi proceduto con le varie fasi del text mining che riguardano il
trattamento delle parole.
A titolo di esempio si riportano l’annuncio più breve e quello più lungo:
“LAUREATO/A in STATISTICA per il ruolo di analista dati: analisi flussi
magazzino. Si offre contratto di STAGE” – Adecco;
“Il nostro cliente è un importante Gruppo Bancario che, in una fase di sviluppo della
propria Area Pianificazione e Marketing, sta ricercando LAUREATO/A IN
MATEMATICA/STATISTICA Ricerchiamo un/una giovane laureato/a con interesse
a formarsi nell'ambito delle analisi di dati numerici finalizzate ad attività di
budgeting e marketing. Il candidato verrà inserito nell'area Pianificazione/Marketing
(ricerche di mercato) alle dirette dipendenze del responsabile di settore. In particolare
si occuperà di:
- fornire supporto al team nell'elaborazione della reportistica richiesta in area
marketing, pianificazione e controllo di gestione
- effettuare analisi e la gestione dei dati per vari prodotti dell’azienda - effettuare
attività di analisi previsionali su alcuni prodotti finanziari.
- elaborare dati per la definizione del budget
- elaborare dati per il controllo di gestione.
Il candidato ideale possiede una buona capacità di utilizzo dei principali sistemi di
office automation in generale e di Excel nonché la predisposizione ad utilizzare
programmi dedicati all'analisi statistica. L'interesse per il settore finanziario
rappresenta un elemento preferenziale. Completano il profilo doti di comunicazione e
di relazione, predisposizione al lavoro di squadra e capacita di pianificazione e
organizzazione della propria attività” - Skill risorse umane.
Il profilo professionale dello statistico: ruoli, competenze e prospettive
85
Nella fase di parsing si è proceduto ad individuare le polirematiche, ossia le
prole composte, come ad esempio Knowledege_management, contratto_determinato,
contratto_indeterminato.
Con la lemmatizzazione si sono ricondotte le parole al loro lemma, in modo da
non avere impatti sull’analisi dovuti a forme lessicali che differiscono solo in base a
genere, quantità o, come nel caso dei verbi, a coniugazione. In questo modo, per
esempio, nel calcolo delle frequenze del termine “azienda” sono ricomprese le
frequenze anche degli aggettivi “aziendale”, “aziendali” e così via.
Nella stessa ottica si è provveduto a tradurre, laddove necessario e possibile,
termini dall’inglese all’italiano (es: monitoring in monitoraggio, tool in strumenti), e
a rendere omogenee le abbreviazioni (es: telco/ telecomunicazioni/tlc in tlc).
Nella fase di analisi lessicale è stata creata una lista di “parole vuote”, ovvero la
lista delle parole da non includere nell’analisi La stop list è stata aggiornata più volte
nel corso dell’analisi in quanto, oltre alle preposizioni, congiunzioni, avverbi sono
state aggiunte altre forme testuali che non apportavano valore all’analisi, perché
presenti con alta frequenza per tutti i testi inseriti nel corpus (Tab. 2).
Tabella 2 Selezione di termini aggiunti alla stop list per numero di annunci e frequenza.
Fonte: elaborazioni su dati www.google.it
Termini
Esperienza
Inglese
Economia
Capacità
Ingegneria
Team
Excel
Numero annunci
29
31
25
19
22
16
15
Frequenza
45
34
28
25
23
19
17
Le forme testuali inserite nella lista sono “vuote”, ma solo fino ad un certo
punto: indicano, infatti, che per fare statistica in azienda sono richieste caratteristiche
ricorrenti quali: la laurea in statistica, economia o ingegneria; l’esperienza e la
capacità di lavoro in team; la conoscenza di strumenti informatici di base (Excel); la
conoscenza della lingua inglese.
Eliminando le forme presenti nella stop list si è proceduto ad analizzare le cooccorrenze rispetto ad alcune parole pivot.
In Fig. 1 sono mostrate le forme più associate alla parola statistica. Dal grafico è
possibile anche leggere il livello associazione delle forme, in base allo spessore del
86
Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”
raggio che collega la parola pivot al centro dell’analisi con le altre forme individuate
dal software.
Le forme che co-occorrono più frequentemente quando è presente la parola
statistica sono: marketing, risultato,
risultato, campagna, comunicazione, analitico, ingegneria
gestionale, quantitativo, analisi, business, indagine, elemento.
Figura 1. Analisi delle forme associate a "statistica"
4.2 L’estrazione delle tipologie di profili professionali richiesti
Una delle attività più importanti all’interno del processo di text mining consiste
nell’analizzare una raccolta di documenti in modo da creare cluster di documenti
caratterizzati da specifici termini. La “clusterizzazione” non supervisionata dei
documenti è ottenuta sulla base della presenza e dell'assenza dei concetti centrali
estratti nel testo. Idealmente, ogni cluster contiene un diverso insieme di questi
concetti. I cluster sono caratterizzati dalle forme testuali che meglio li descrivono e
quindi consentono una facile interpretazione del loro contenuto.
L’analisi condotta si basa sull’algoritmo non gerarchico expectationmaximization (Mitchell, 1997; Prescher, 2004), che integra la ricerca della massima
87
Il profilo professionale dello statistico: ruoli, competenze e prospettive
verosimiglianza nella stima dei parametri in modelli statistici. La metodologia itera
le seguenti fasi:
- Expectation: nel quale si effettua una prima allocazione dei documenti nei cluster
(si calcola la probabilità che un documento appartenga ad un cluster);
- Maximization: si parte dalle allocazioni del passo precedente per stimare, in
maniera pesata in base alla probabilità di appartenenza di un documento al cluster, i
parametri dei modelli.
Si iterano expectation e maximization fino alla convergenza dei parametri che si
stanno stimando.
La procedura di classificazione ha riguardato la totalità degli annunci
collezionati ed ha prodotto una classificazione in cinque classi di cui una formata da
un solo annuncio, definita come indistinta e della quale non verrà effettuata alcuna
trattazione.
In Tab. 3 sono riportate in sintesi le tipologie, con forme testuali e frequenze
degli annunci, di seguito descritte.
Gruppo 1: Pianificazione/Produzione (13 annunci) - Sono richiesti in
particolare da società di job-recruiting (ad esempio: RANDSTAD ITALIA:3
annnunci; GI Group:3 annunci). Le forme che caratterizzano la tipologia sono:
mensile, pianificazione della produzione, produzione, pianificazione, sistema,
supportare, progetto, scientifico, definizione, dirigere.
Tabella 3 Tipologie, forme e frequenze degli annunci
Forme
Frequenze
Tipologie
mensile, pianificazione della produzione,
produzione, pianificazione, sistema,
supportare, progetto, scientifico, definizione,
dirigere
13
PIANIFICAZIONE/
PRODUZIONE
information, intelligence, sas, tecnologia,
informatica, business, matematica,
applicazione, realizzazione, comunicazione
11
INFORMATICA
derivato, econometrico, project, risk
management, risk, finanziario, management,
financial
7
FINANZA
vendita, dato, marketing, elaborazione,
creazione, prodotto, valutazione, analisi,
mercato, quantitativo
23
ANALISI DATI
88
Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”
Esempio di inserzione: “La posizione ha lo scopo di garantire alle consociate il
corretto livello di stock e di servizio in base agli accordi presi, garantire alla
pianificazione della produzione corretta visibilità dei fabbisogni e al Customer
Service corretta visibilità dei piani di spedizione, alimentare correttamente la
revisione mensile delle previsioni export; la persona si occuperà di controllare
settimanalmente le previsioni ricevute dalle consociate, preparare i piani di
spedizione, allineamento con la produzione, aggiornamento per i materiali di
Packaging; Laurea in Statistica o Ingegneria gestionale. Esperienza gradita di un
anno in contesto multinazionale area Supply Chain, sales support, customer service;
Ottimo Inglese, Buon utilizzo Pc, Excel e Access, pacchetto office in generale.
Gradito SAP. Ottime doti relazionali e ottime capacità analitiche”
Gruppo 2: Informatica (11 annunci) – È la tipologia meno numerosa. Sono
pubblicati in particolare da siti di informazione e generici (lavoro.corriere.it - 3;
offerte-lavoro.monster.it - 2). I termini caratterizzanti la tipologia sono: information,
intelligence, SAS, tecnologia, informatica, business, matematica, applicazione,
realizzazione, comunicazione. Esempio di inserzione: “Approfondire le tue
conoscenze informatiche e costruirne di nuove integrandole a competenze funzionali
relative a diversi settori aziendali. Analisi di processi aziendali implementazione di
pacchetti software gestionali sviluppo di soluzioni tecnologiche "customizzate"
analisi di ambienti e architetture tecnologiche disegno e ottimizzazione di
infrastrutture tecnologiche e applicative information management. Neolaureati
specialistici in Ingegneria, Informatica, Matematica, Fisica e Scienze Statistiche
Attitudine al problem solving. Spiccata propensione al lavoro in team.
Intraprendenza e autonomia organizzativa Buone capacità di comunicazione, scritta e
orale. Interesse per le nuove tecnologie. Buona conoscenza della lingua inglese”.
Gruppo 3: Finanza (7 annunci) - Sono pubblicati sia da siti generici sia da
società di job-recruiting (cambiolavoro.com; GI Group - 2). I termini caratterizzanti
la tipologia sono: derivato, econometrico, project, risk management, risk, finanziario, management, financial. Esempio di inserzione: “Ricerchiamo per importante
azienda del credito:"Addetto al Risk Management". Requisiti richiesti: Il Candidato
deve possedere Laurea in Statistica e/o in Economia. E' richiesta un'esperienza da
tirocinio/stage di almeno 6 mesi fino ad impiego di 2 anni, preferibilmente presso
Banche Finanziarie, Centri Elaborazione Dati. Sede di lavoro Bologna Centro.”
Gruppo 4: Analisi Dati (23 annunci) - È la tipologia più numerosa. Sono
pubblicati in particolare da società di job-recruiting (ad esempio: Page Personnel
Italia - 2; GI Group - 4). I termini caratterizzanti la tipologia sono: vendita, dato,
marketing, elaborazione, creazione, prodotto, valutazione, analisi, mercato,
quantitativo. Esempio di inserzione: “Ricerche e studi di mercato; Elaborazione di
dati e reporting; Consumer Panel; Supporto alla progettazione delle indagini di
mercato condotte da agenzie esterne. Il tutto a supporto delle attività dei Team
Il profilo professionale dello statistico: ruoli, competenze e prospettive
89
Marketing, Sales e Ricerca e Sviluppo, nell’obiettivo di fornire elementi utili per la
revisione delle strategie di marketing, per la valutazione dei volumi di vendita e del
potenziale prodotti, e per l’individuazione di segmenti commerciali e di mercato in
cui potersi inserire. Laurea in Economia e Commercio/Marketing o in Statistica o
affini. - Ottima conoscenza del pacchetto Office (excel livello avanzato) e buona
conoscenza della lingua inglese - Esperienza minima di stage o tirocinio - Passione
ed entusiasmo per l’analisi quantitativa e le dinamiche legate alle ricerche di mercato
- Predisposizione all’uso costante di software gestionali e database di mercato.
Precisione, autonomia, problem solving e buone doti relazionali ne completano il
profilo”.
5. Conclusioni
Obiettivo del presente articolo era dimostrare le potenzialità informative degli
annunci di lavoro presenti sul web in merito ai ruoli dello statistico richiesti dal
mondo del lavoro, attraverso la sperimentazione e valutazione della procedura di
selezione ed analisi degli annunci, al fine di utilizzarla poi su di un insieme riferito
ad un arco temporale più ampio, almeno annuale.
La procedura seguita ha consentito di comporre cluster degli annunci relativi ai
laureati in statistica, separando i ruoli e le competenze richieste.
Dall’analisi dei risultati ottenuti sul corpus dei soli 55 articoli, appare chiaro che
i ruoli e le competenze richieste agli statistici dalle imprese private sono molto
differenti: si passa da ruoli dirigenziali legati alla progettazione, alla pianificazione,
alla definizione dell’intero sistema, alle mansioni “classiche” di analisi ed
elaborazione dei dati in campi quali la finanza ed il marketing, fino ad arrivare a
ruoli tecnici e specialistici legati alle funzioni informatiche. Tutto ciò confermerebbe
quanto ipotizzato in partenza: all’interno delle aziende gli statistici svolgono ruoli e
mansioni molto diverse tra loro e tutto ciò rende la figura dello statistico una figura
professionale dai contorni poco definiti e molto sfumati.
Per ottenere una piena conferma empirica sulla figura professionale dello
statistico, la procedura descritta verrà ripetuta sugli annunci di lavoro estratti ad
intervalli mensili in un arco temporale annuale. Se i risultati ottenuti in questo lavoro
fossero confermati, bisognerebbe far riflettere il mondo accademico sull’importanza
di una migliore caratterizzazione della professione dello statistico. Sarebbe
necessario far capire che lo statistico non è solo colui che utilizza o progetta software
informatici per diffondere tabelle e grafici, ma soprattutto la risorsa aziendale che
riempie di significato tali tabelle e grafici, in quanto utilizza tutte le sue conoscenze e
90
Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”
competenze al fine di diffondere un’informazione affidabile. In tal modo sarebbe
possibile diffondere una maggiore consapevolezza del ruolo di statistico e stimolare
un numero più elevato di richieste da parte del mondo del lavoro di laureati in
statistica da impiegare in ruoli appropriati.
Riferimenti bibliografici
BALBI S., GRASSIA M.G., INFANTE G. (2008). La rappresentazione delle competenze
nel linguaggio delle università e in quello degli operatori del settore. Relazioni tra
corpora. In: S. BALBI, G. BOCCUZZO, M.G. GRASSIA (a cura di) Profili formativi e
bisogno di competenze nel terzo settore. CLEUP, Padova, 83-94.
ISFOL (2009). Gli stagisti italiani allo specchio. Sondaggio Isfol- Repubblica degli stagisti.
BERRY M., KOGAN J. (2010). Text mining, applications and theory. Wiley, Chicester.
BOLASCO S. (2004). L’analisi statistica dei dati testuali: intrecci problematici e prospettive.
In: E. AURELI, S. BOLASCO (a cura di) Applicazioni di analisi statistica di dati
testuali. Casa Editrice Università “La Sapienza”, Roma: 9-26
BOLASCO S. (2005). Statistica testuale e text mining: alcuni paradigmi applicativi,
Quaderni di Statistica, 7, Napoli: 17-53.
BRAMER M. (2007). Principles of Data Mining. Springer, London.
CENTRA M., TRONTI L. (2011). Capitale umano e mercato del lavoro, Osservatorio Isfol,
1: 31-44.
CORSI E. (2003). La domanda di lavoro attraverso le inserzioni sui giornali - L’anno dei
paradossi. Rapporto 2002 sul mercato del lavoro e le politiche di lavoro in provincia di
Milano. Osservatorio del mercato del lavoro, Franco Angeli, Milano: 493-519.
CUPPONE M., MOCAVINI A., PALIOTTA A.P., RAUCO G. (2010). La domanda di
lavoro qualificato nel 1 semestre 2009: le inserzioni sui quotidiani, Collana Studi Isfol,
n. 2/2010.
DI MEGLIO E., GRASSIA M.G., MISURACA M. (2007). The Ideal Candidate. Analysis of
Professional Competences through Text Mining of Job Offers, in: L. FABBRIS (a cura
di), Effectiveness of University Education in Italy. Physica Verlag, Heidelberg: 261-275.
FOUNTAIN C. (2005). Finding a job in the Internet age, Social Forces, 83: 1235-1262.
HEARST M.A. (2003). What is Text Mining. Berkeley. Unpublished essay.
LEBART L., MORINEAU A. (1985). Systeme Portable pour l’Analyse des Données
(SPAD). Cesia, Paris.
LEBART L., SALEM A. (1988). Analyse Statistique des Données Textuelles. Dunod, Paris.
LEBART L., SALEM A. (1994.) Statistique Textuelle. Dunod, Paris.
Il profilo professionale dello statistico: ruoli, competenze e prospettive
91
MARIANI P., MUSSINI M., ZAVANELLA B. (2011). Servizi pubblici per l’impiego e
imprese: un’analisi della relazione tra preselezione e job matching, Rivista di Economia
e Statistica del Territorio, n.1, Franco Angeli, Milano: 106-133.
MARTINI M., FABBRIS L. (2005). Analisi delle competenze dei laureati in Scienze
Statistiche di Padova, in F. D’OVIDIO (a cura di), Professioni e competenze nel lavoro
dei laureati, Cleup, Padova: 295-315.
MITCHELL T.M. (1997). Machine Learning, McGraw-Hill, New York.
MOCAVINI A., PALIOTTA A.P. (2002). I canali di ricerca del personale tra tradizione e
innovazione, Franco Angeli, Milano.
PRESCHER D. (2004). A Tutorial on the Expectation-Maximization Algorithm Including
Maximum-Likelihood Estimation and EM Training of Probabilistic Context-Free
Grammars, arXiv:cs.CL/0412015
ZERILLI A. (1998) (a cura di). Reclutamento, selezione e accoglimento del personale,
Franco Angeli, Milano.
Work and Statisticians:
Analysis of the job offers on the web by textual analysis
Summary. Aim of this paper is to propose a strategy for the analysis of the job offers for
statisticians. We propose the use of job advertising published on the web. Especially private
firms use specialized web sites in order to find the ideal candidate for whom they are
looking. We analyzed with text mining techniques the job advertisements published in
September 2010, that required statistical competences. Our results show that job
advertisements for statisticians are disparate, because of the multidisciplinary, but also
vague, role of this profession.
Keywords. Occupational Profiles; Web Advertisements; Textual Data Analysis; Algorithm
Expectation-Maximization.