Circa un terzo dei docenti italiani è improduttivo in

Circa un terzo dei docenti italiani è improduttivo in quanto a
pubblicazioni e citazioni
(o almeno è assente dai database di Google Scholar)
Di Michele Ciavarella, Politecnico di BARI e Vito Ricci, Università di BARI.
Siccome l’Agenzia ANVUR ha finalmente avviato in Italia una valutazione della ricerca, usando sia
strumenti “bibliometrici” che “peer review”, si è scatenato un dibattito in Italia mai visto prima,
anche perché l’Anvur assegnerà con la valutazione VQR 2004-2010, ca.700 milioni di euro
premiali alle Università “meritevoli”. VQR imita in parte il sistema RAE che in UK è operativo da
molti anni, con varie scadenze che hanno affinato via via il metodo di analisi, e che ora è basato
(REF) tutto sulle citazioni, ma non solo di pubblicazioni, bensì del “valore” del docente nel
panorama mondiale, aspirando gli UK ad avere “leader” mondiali del settore.
Noi del gruppo ItalianScientists abbiamo usato con mezzi minimi a disposizione il database Google
Scholar, in particolare con il sistema messo a punto da Gianni Cesareni di UniROMA2.
In precedenza, avevamo valutato le Univ. Italiane per H medio del docente (nel periodo 20042010), dove H indice di Hirsch misura il numero di articoli citati piu’ di H volte di un certo docente,
e la classifica è qui: http://italianscientists.blogspot.it/2012/04/la-classifica-delle-universitaitaliane.html Le prime vengono univ. serie come S. Raffaele e SISSA e SANTANNA di PISA e
PADOVA e PISA, intorno a H=10, mentre le ultime sono le telematiche con H=0. Vorrà dire
qualcosa?
Siccome molti hanno notato che alcuni settori sono troppo più presenti di altri (i medici e i fisici da
anni hanno un output internazionale più curato e presente), allora abbiamo voluto tener conto del
valore H medio di ogni settore SSD, ottenendo una classifica simile
http://italianscientists.blogspot.it/2012/04/la-classifica-delle-univ-per-h-medio.html, in cui le prime
sono di nuovo Univ. serie, con qualche spostamento, e il valore per la prima, BOCCONI, intorno a
2.6, mentre S.Raff 1.9, vuol dire che sono mediamente intorno a 2 volte piu' alti gli H index, a parità
di SSD.
In questo paper, si presentano alcuni dati sulla % di docenti italiani non presenti nel database
Google Scholar né in italiano né in inglese. Si tratta di 20.461 docenti con 0 prodotti citati
(34,6% dei docenti), di cui ben 16.456 (27,9%) sono docenti con 0 prodotti totali. Si può dire
quindi che la differenza di ca.4000 docenti (4,7% dei docenti) sono presenti nel database ma
non sono per nulla citati, il chè ha un significato ulteriore.
Magari 30% di docenti non sarà del tutto improduttivo, e magari non è una percentuale troppo alta,
se paragonata ad altre categorie. Purtroppo un dato comparativo con l’estero non è facile da avere.
Insomma, sembra di andare verso alcune proposte di differenziazione che vengono da Perotti,
Giavazzi, la Confindustria. Peccato però che la LUISS, Università della Confindustria, appare
piuttosto bassa nelle classifiche!
Un primo commento dagli UK ci è arrivato dal Prof. Ponter che è molto pratico della questione
RAE ed è stato Pro-Vice Chancellor per molti anni dell’Univ. di Leicester.
http://italianscientists.blogspot.it/2012/04/comment-from-prof-alan-ponter-on-vqr.html
“I Dipartimenti sono stati messi in grado di scegliere o meno se un particolare accademico è messa
nel processo di valutazione. Chi non è inserito, da quel momento non riceve denaro per la ricerca.
Tali studiosi devono quindi accettare che il loro ruolo presso il Dipartimento è l'insegnamento e
l'amministrazione, rilasciando tempo utile al personale di ricerca attivo.”
Andrebbe fatto così anche in Italia? Non si può fare valutazione solo per distribuire più soldi alle
Università “migliori”, serve anche organizzare meglio il tempo delle persone attive, e caricare di
compiti noiosi chi non è attivo. La soluzione inglese è ancora molto da imitare. Interessanti anche le
obiezioni di Ponter al problema (che anche in UK esiste) della poca produzione nei dipartimenti di
Umanistica.
Essendo sorto il dubbio che gli “improduttivi” o “assenti”, come chiamar si vogliano, siano
diversamente concentrati nelle varie università, abbiamo stimato la loro incidenza. Esiste una certa
disparità, anzi la classifica delle Università in funzione del numero (in ordine crescente) di
"improduttivi" sembra rispettare abbastanza bene la classifica fatta in precedenza per Hmedio
docente, il chè dimostra che il dato è ben correlato. Naturalmente rimane la questione delle materie
che hanno troppi "improduttivi", che potrebbero essere in parte falsi "improduttivi". Ma guarda
caso, le grandi Università di prestigio rimangono al vertice, anche se hanno molte facoltà
umanistiche. Rimane da vedere cosa verrà fuori con ANVUR e VQR. Magari i dati coincideranno
e allora sarà stato il nostro un esercizio molto meno costoso di VQR, fatto da 2 sole persone, senza
tanta fatica, e sarà una piccola soddisfazione per noi. Salta all'occhio tuttavia la discesa della
Bocconi e della Normale di Pisa. Come mai? Hanno molti improduttivi? Da notare che in questo
caso, abbiamo usato come “improduttività” la soglia H<3, cercando di "mimare" il fatto che VQR
raccoglie 3 lavori per docente, e supponendo che almeno 3 lavori esistano, e che siano almeno citati
3 volte l'uno, abbiamo voluto dare una stima veloce.
Se avessimo da subito definito la soglia di “assenza dai database” o “improduttività” ad H<3,
avremmo ottenuto ben 52,9% dei docenti italiani, il chè francamente è un dato allarmante, ben più
allarmante del dato 34.6% di H=0. Se proprio dovessimo “abolire il valore legale della laurea”,
andrebbe abolito per le università telematiche, che difficilmente posso trovare scusante nel fattore
assenza dati “umanistici” del Google Scholar.
Obiezioni, disclaimer e warning
Molte delle obiezioni riguardano il fatto che per molti settori disciplinari (SSD), Google Scholar è
in difetto o perlomeno non è “rappresentativo”, non avendo ancora dati sui prodotti di quei settori, o
perché non si ha interesse generale, sia perché questi settori finora si contentavano di non essere
indicizzati su Google. A noi pare, in prima battuta, che Google Scholar ha tutto l’interesse a
indicizzare qualsiasi cosa che esista e venga citata, e Umberto Eco per es. trova migliaia di
citazioni, pur essendo un umanista.
Ma supponendo di eliminare brutalmente per es. i SSD per cui la mediana dell’indice di Hirsch H è
nulla, che sono esattamente 159, per ca.20 mila docenti, in questi settori ben l’80% è “assente” (ma
notate che anche in questi SSD c’è sempre hanno anche un buon 20% presente nel database, da
Umberto Eco in poi…). In questo modo si eliminano quindi 16000 docenti “dubbiamente”
improduttivi di questi settori, e si ottiene una stima della % dei docenti davvero improduttivi, che
scende a numero di 4400, ossia a 7,4%. La cifra magari non è troppo alta, anche considerando che il
docente deve anche fare didattica.
Parlando in termini di aree CUN, le aree CUN 12 (Scienze giuridiche), 10 (Scienze dell’antichità,
filologico-letterarie e storico-artistiche), 11 (Scienze storiche, filosofiche, pedagogiche e
psicologiche), e 14 (Scienze politiche e sociali), hanno oltre il 50% di docenti completamente
“assenti”. Relativamente meno attesa, la presenza subito dopo di ingegneria civile e architettura, che
è assente ancora per il 45% dei docenti, mentre dalla successiva area CUN, si passa a valori
inferiori al 30%.
Rimane il fatto che i SSD che sono del tutto assenti da GS rimane davvero limitata a pochissimi. E
quindi le due stime (7,4%, e 34,6%) si possono considerare per difetto e per eccesso. Se fosse
soltanto un problema di presenza di dati in Google Scholar, non si spiegherebbe come mai la
percentuale di docenti “assenti” diminuisce con l’H index medio del SSD. Dato un certo SSD
infatti, se la media dipendesse solo da variabili estrinseche, tutte le curve di distribuzione
dovrebbero essere sovrapponibili, incluse quelle dei docenti “improduttivi”. Invece la correlazione
inversa c’è eccome, e sembra migliore con H mediana. In altre parole i SSD con Hmedio o
Hmediana basso, sono produttivi fino a tendere al 100%.
Riteniamo che la vera % di totalmente “assenti” sia compresa nella fascia tra 7 e 35%, e non e'
sbagliato assumere in prima approssimazione qualcosa tipo la meta' ossia ca. un 20%.
Questo dato è abbastanza noto, tanto che secondo ANVUR le aree 10, 11, 12, e 14 vanno in
completo peer review (prevalentemente “italiano”) proprio a causa dell'assenza di banche dati
affidabili su cui fare bibliometria, e in questi settori resta più difficile capire cosa è valido per il
Paese e cosa no. Alcuni risultati sembrano un po' strani (l'assenza del 60% dei docenti di area CUN
11 sembra particolarmente curiosa – si pensava gli psicologi potessero esserci tutti, e così la gran
parte di storici e filosofi) ma tuttavia i dati sono stati controllati.
Introduzione
La bibliometria è una scienza recente. Dalla conta del numero di pubblicazioni, si è passati a
valutare l’impact factor delle riviste, e successivamente è stata data rilevanza all’impatto sulla base
di quante “citazioni” riceve un dato articolo, e quindi un dato docente. Da quando ci sono banche
dati anche accessibili liberamente da tutti, come google scholar, hanno avuto successo indici
sintetici come l’H-index. Dalla proposta di Hirsch, che ha ricevuto molta attenzione, si sono
scatenati gli usi dell’indice di H per valutare persone, istituzioni, giornali, nazioni. La bibliografia
fondamentale su H-index, rapida, è l’articolo su wikipedia, e Publish or Perish di Anne-Wil
Harzing. Una esigenza che è nata nel gruppo “ItalianScientists” che è stato formato da alcuni
scienziati italiani, invitati anche dalla lista dei 2500 “TopItalianScientists” come chiamati della
ViaAcademy, ossia che hanno h>30, è stata quella di distinguere per settori. Naturalmente è facile
segnalare come vi e' eccesso di medici e biologi nella lista di H index non normalizzata, per via di
maggior numero di articoli, di autori, di interesse per la materia per ovvi motivi. Esistono varie
forme di universalità sull'H index, che fanno pensare a valorì normalizzati, vedasi per es. qua.
Elaborando i dati di Scholar Search, uno strumento messo a punto da un gruppo del prof. Gianni
Cesareni della Univ di Roma "Tor Vergata" (dipartimento di Biologia Molecolare), che usa un
semplice algoritmo per interrogare il noto database Google Scholar, i dati di circa 55mila docenti
delle Università italiane sono stati archiviati, eliminando il più possibile le omonimie e gli errori di
affiliazione, che in piccola percentuale possono ancora affliggere i risultati per alcuni dettagli, ma
statisticamente non significativi. Ebbene, nonostante si sia usato il database di Google Scholar
completo, ossia non limitato a quello inglese, un primo dato salta all’occhio: la percentuale di
docenti del tutto improduttiva, sia come citazioni, sia persino come pubblicazioni, e' intorno al
30%! Inoltre, essa e' quasi equamente ripartita tra fasce di docenza (smentendo una ipotesi di
miglioramento progressivo come vorrebbe Anvur e la logica), mentre ovviamente e' concentrata su
alcuni SSD (Settori Scientifico Disciplinari), in parte penalizzati dall’avere meno uso di
pubblicazioni internazionali, e dal tipo di materia, ma in parte non si può nascondere che una
notevole percentuale di docenti italiani sembra del tutto assente in importanti database che ormai
includono pubblicazioni anche a conferenze, su riviste online. Scholar è forse la più completa oggi
disponibile che spazi tra tutti i campi sia scientifici che umanistici, e nonostante i primi siano
avvantaggiati storicamente, non si può nascondere la sorpresa nel leggere questi dati.
Docenti
Docenti
con 0
con 0
Totale
prodotti
prodotti
Fascia
docenti
totali
%
citati
%
Ordinari
15.898
4.253
26,8
5.363
33,7
Associati
16.954
4.501
26,5
5.650
33,3
Ricercatori
26.226
7.702
29,4
9.448
36,0
Totale
59.078
16.456
27,9
20.461
34,6
Tab. 1. I docenti “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in
inglese e italiano.
Fatto salvo che i dati completi sono sul blog http://italianscientists.blogspot.it/2012/04/docentiimproduttivi-per-pubblicazioni.html, se ordiniamo i dati per SSD, vediamo che i meno “produttivi
sono settori di lingue e di giurisprudenza (magari per motivi intrinseci di assenza nel database
italiano e inglese). E’ ovvio che Google Scholar contiene un set di dati tra i più completo e
eterogenei, ma non contiene certo tutto. E purtuttavia, ciò che non compare in Google Scholar né in
italiano né in inglese, difficilmente ha un grosso impatto o può essere facilmente misurato
altrimenti, se non con i “pari” o “peers”, con una tecnica ossia molto più costosa e non a tutti
disponibile.
Docenti
Docenti
con 0
con 0
prodotti
prodotti
SSD
Docenti totali
citati
%
totali
%
1
L-LIN/09
10
10
100,0
10
100,0
2
L-OR/17
5
5
100,0
5
100,0
3
L-LIN/17
10
10
100,0
9
90,0
4
L-LIN/20
10
10
100,0
9
90,0
5
L-LIN/07
127
119
93,7
113
89,0
6
IUS/03
45
42
93,3
40
88,9
7
IUS/15
197
188
95,4
174
88,3
8
L-FIL-LET/11
143
135
94,4
126
88,1
9
L-ANT/02
96
92
95,8
84
87,5
10
IUS/12
192
173
90,1
167
87,0
Tab. 2. I SSD con docenti “totalmente assenti” secondo elaborazioni su Scholar Search, anni 2004-2010,
database in inglese e italiano. Estratto dei primi 10, per la lista completa vedasi
http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-per-pubblicazioni.html .
Conviene a questo proposito vedere quali sono i settori più presenti. Curiosamente sono alcuni
settori della Ingegneria Industriale, che pure non sono i maggiormente citati nella classifica dell’H
index complessivo (http://italianscientists.blogspot.it/2012/04/i-top-ssd-italiani-per-h-indexmedio.html i primi dieci essendo MED/15 , FIS/05 , FIS/01 , MED/12 , MED/06, MED/08 , FIS/04
, MED/16 , MED/13, MED/01).
Docenti
Docenti
con 0
con 0
prodotti
prodotti
SSD
Docenti totali
citati
%
totali
%
359
BIO/15
96
1
1,0
0
0,0
360
MED/14
107
1
0,9
0
0,0
361
VET/03
90
0
0,0
0
0,0
362
VET/06
71
0
0,0
0
0,0
363
VET/07
47
1
2,1
0
0,0
364
ING-IND/03
24
0
0,0
0
0,0
365
ING-IND/18
13
0
0,0
0
0,0
366
ING-IND/23
19
0
0,0
0
0,0
367
ING-IND/26
35
1
2,9
0
0,0
368
ING-IND/30
10
0
0,0
0
0,0
369
ING-IND/34
61
1
1,6
0
0,0
Tab. 3. I docenti meno “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in
inglese e italiano. Estratto degli ultimi 10, per la lista completa vedasi
http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-per-pubblicazioni.html .
Se andiamo a diagrammare i SSD “improduttivi” e in ordine decrescente, troviamo che non c’è un
modo banale per tracciare una “soglia” aldisotto della quale è evidente che Google Scholar non
contiene dati. A parte pochissimi SSD, gli altri sembrano seguire una curva regolare. Certo, si
potrebbe dividere la curva in 3 parti, che corrispondono ognuna a ca. 120 SSD, una fino al 60%, una
fino a ca. il 10%, e una sotto il 10% di improduttivi. Da notare pero’ che per es. AGR-13 si trova tra
i più produttivi, mentre AGR-10 si trova nella fascia intermedia.
E’ possibile che si possa tracciare un valore intorno al 40% dove i valori degli SSD appaiono meno
significativi. Ma andrebbe a questo punto migliorato lo studio guardando ad altri parametri.
Fig.1. % docenti con 0 prodotti divisi per SSD.
Un altro modo per controllare i dati è verificare la correlazione tra Hmedio del SSD, con la % di
docenti “improduttivi”. Ecco le fig.2,3 dove si correlano il numero di docenti con H nullo in
funzione dell’ H medio del SSD. La correlazione inversa è evidente, anzi se ne può dare equazione.
Fig. 2. % improduttivi vs Hmedio del SSD.
Fig. 3. % improduttivi vs Hmediana del SSD.
Meno valida la correlazione in funzione dell’H Max, anche perché quest’ultimo è più soggetto ad
errori.
La correlazione inversa sembra migliore apparentemente con H mediana. In altre parole sono meno
produttivi i SSD con Hmedio o Hmediana basso, fino a tendere a zero.
E’ evidente che per tutti gli SSD per cui la mediana è nulla, che sono esattamente 159, non ha molto
senso parlare di “improduttività”, dato che ca. l’80% dei docenti di questi 159 settori non hanno
prodotti citati. Di conseguenza, eliminando tali 16000 docenti ca improduttivi di questi settori, la %
dei docenti davvero improduttivi, scende a numero di 4400, ossia a 7,4%.
Divisione per aree CUN
Come aree CUN, si conferma la presenza tra le aree “assenti” nel GS, delle scienze giuridiche,
letterarie, filosofiche, e politiche e sociali. Relativamente meno attesa, la presenza subito dopo di
ingegneria civile e architettura, che è assente ancora per il 45% dei docenti,
mentre dalla successiva area CUN, si passa a valori inferiori al 30%.
Area CUN
12 - Scienze
Docenti
con 0
prodotti
Docenti totali citati
4902
4271
Docenti
con 0
prodotti
%
totali
87,1
3836
%
78,3
giuridiche:
10 - Scienze
dell’antichità,
filologicoletterarie e
storico-artistiche:
5490
4555
83,0
3823
69,6
11 - Scienze
storiche,
filosofiche,
pedagogiche e
psicologiche:
5033
3469
68,9
2747
54,6
14 - Scienze
politiche e sociali:
1740
1210
69,5
891
51,2
8 - Ingegneria
civile e
Architettura:
3658
1973
53,9
1676
45,8
13 - Scienze
economiche e
statistiche:
4848
1942
40,1
1277
26,3
7 - Scienze
agrarie e
veterinarie:
3088
455
14,7
308
10,0
1 - Scienze
matematiche ed
informatiche:
3283
444
13,5
302
9,2
6 - Scienze
mediche:
10383
1089
10,5
836
8,1
9 - Ingegneria
industriale e
dell’informazione:
5216
523
10,0
370
7,1
4 - Scienze della
terra:
1116
89
8,0
64
5,7
5 - Scienze
biologiche:
4985
251
5,0
191
3,8
2 - Scienze
fisiche:
2334
114
4,9
76
3,3
3 – Scienze
chimiche:
3002
76
2,5
59
2,0
Tab. 4. I docenti “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in
inglese e italiano. Per aree CUN http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-perpubblicazioni.html .
Fig. 4. % improduttivi divisi per aree CUN e in ordine progressivo di “produttività”.
Divisione per Università e passaggio ad usare il criterio simil VQR – ANVUR ossia H>3
A seguito di alcuni suggerimenti, considerando ossia che VQR chiede 3 articoli per docente,
abbiamo usato anche il metro H<3 per classificare gli “improduttivi” o “assenti”:
Essendo sorto il dubbio che gli “improduttivi” o “assenti”, come chiamar si vogliano, siano
diversamente concentrati nelle varie università, abbiamo stimato la loro incidenza.
rank
1
2
3
4
5
6
7
8
9
10
Ateneo
SISSA - TRIESTE
Univ, Campus Bio-Medico
ROMA
S, Raffaele MILANO
Politecnica delle MARCHE
S,ANNA di PISA
PADOVA
INSUBRIA
PISA
MODENA e REGGIO EMILIA
BRESCIA
Docenti
totali
63
Docenti con
H-index=0
3
104
93
532
103
2.213
393
1.588
859
566
14
14
78
18
495
110
391
174
139
Docenti
con Hindex<3
%
%
4,8
5
7,9
13,5
15,1
14,7
17,5
22,4
28,0
24,6
20,3
24,6
28
29
187
37
841
155
642
350
231
26,9
31,2
35,2
35,9
38,0
39,4
40,4
40,7
40,8
11
12
13
14
15
16
17
18
19
20
FERRARA
MILANO
BOLOGNA
PARMA
PAVIA
NAPOLI Federico II
CATANZARO
CAMERINO
L AQUILA
Politecnico di TORINO
645
2.204
2.939
992
1.029
2.695
230
314
603
813
175
496
705
254
274
795
66
91
153
201
27,1
22,5
24,0
25,6
26,6
29,5
28,7
29,0
25,4
24,7
268
931
1.268
432
455
1.197
103
145
283
388
Tab. 5 - Docenti totali, con h-index=0 e inferiore a 3 in Italia nel periodo 2004-2001 per Ateneo.
Dati completi a http://italianscientists.blogspot.it/2012/04/la-classifica-delle-universita-in.html
La classifica delle Università in funzione del numero (in ordine crescente) di "improduttivi" sembra
rispettare abbastanza bene la classifica fatta in precedenza per Hmedio docente, il chè dimostra che
il dato è ben correlato. Naturalmente rimane la questione delle materie che hanno troppi
"improduttivi", che potrebbero essere in parte falsi "improduttivi". Ma guarda caso, le grandi
Università di prestigio rimangono al vertice, anche se hanno molte facoltà umanistiche. Rimane da
vedere cosa verrà fuori con ANVUR e VQR. Magari i dati coincideranno e allora sarà stato il
nostro un esercizio molto meno costoso di VQR, fatto da 2 sole persone, senza tanta fatica, e sarà
una piccola soddisfazione per noi.
Salta all'occhio tuttavia la discesa della Bocconi e della Normale di Pisa. Come mai?
Notate che abbiamo ordinato per improduttività come H<3, cercando di "mimare" il fatto che VQR
raccoglie 3 lavori per docente, e supponendo che almeno 3 lavori esistano, e che siano almeno citati
3 volte l'uno, abbiamo voluto dare una stima veloce.
http://italianscientists.blogspot.it/2012/04/la-classifica-delle-universita-in.html
Volendo diagrammarli, si nota che esiste un gran numero di Università nella fascia dal 30 al 60% di
“improduttivi”, e d'altronde la % media di improduttivi (per H<3) è di ben 52,9%, mentre restando
al H=0 avevamo 34.6%. Se proprio dovessimo “abolire il valore legale della laurea”, andrebbe
abolito per le università telematiche, che difficilmente posso trovare scusante nel fattore assenza
dati “umanistici” del Google Scholar.
41,6
42,2
43,1
43,5
44,2
44,4
44,8
46,2
46,9
47,7
% docenti "improduttivi" con H<3
100,0
90,0
80,0
70,0
60,0
50,0
40,0
30,0
20,0
10,0
0,0
Docenti con
h-index < 3
5
3
22
11
47
33
14
24
36
45
8
10
7
11
15
8
14
18
Univ, Telematica
Docenti totali
2
132
67
451
182
611
420
177
300
444
553
96
113
76
117
159
82
140
174
Univ, Telematica
SSD
CHIM/05
CHIM/04
CHIM/10
CHIM/08
MED/15
CHIM/06
CHIM/02
ING-INF/02
MED/08
FIS/03
CHIM/03
BIO/15
BIO/19
GEO/10
FIS/04
MED/12
ING-IND/24
MED/03
FIS/05
Univ, Telematica
rank
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
%
Docenti
con hindex < 3
0,0
3,8
4,5
4,9
6,0
7,7
7,9
7,9
8,0
8,1
8,1
8,3
8,8
9,2
9,4
9,4
9,8
10,0
10,3
UNICUSANO -
Ritornando alla questione H<3, una tabella viene inserita di seguito.
Stranieri di SIENA
SCIENZE
L Orientale di
Libera Univ, Maria
ROMA Foro Italico
Universita IUAV di
I,U,S,S, - PAVIA
ROMA TRE
Ca Foscari
TERAMO
URBINO Carlo BO
SALERNO
CHIETI-PESCARA
BASILICATA
PALERMO
TRIESTE
TRENTO
della CALABRIA
SASSARI
PIEMONTE
PERUGIA
L AQUILA
NAPOLI Federico II
BOLOGNA
BRESCIA
INSUBRIA
Politecnica delle
SISSA - TRIESTE
Fig. 5. Classifica delle Università in base alla % improduttivi in ordine progressivo di
“produttività”.
20
FIS/01
898
93
10,4
Tab. 6 - Docenti con h-index inferiore a 3 in Italia nel periodo 2004-2001 per SSD. I primi 20 SSD
per “produttività”.
Per avere una idea complessiva, il grafico dei SSD è riportato di seguito si divide molto facilmente.
Circa la metà dei SSD ha più della metà di docenti con H<3.
% Docenti con h-index < 3
100,0
90,0
80,0
70,0
60,0
50,0
40,0
30,0
20,0
10,0
C
H
IM
C /0
H 5
IM
C /0
H 3
IM
M /0
IN ED 9
G /0
-IN 7
F/
0
IN BIO 4
G /1
I
IN NF 6
G /0
-IN 6
D
C /3
H 1
IM
VE /12
T
M /01
IN ED
G /2
IN IND 4
G /0
-IN 6
D
G /20
EO
IC /11
AR
M /0
IN ED 8
G /2
-IN 5
D
/
BI 08
O
AG /08
SE R
C /09
SM P/0
SE PS 3
C I/08
SP
AG /10
R
L- /0
LI 1
N
IC /18
A
M R/
-E 20
D
L- F/0
LI 2
N
L- IU /08
FI S
L- /0
LE 4
M T/0
-F 9
L- IL/0
AR 6
T/
IU 02
L- S/1
AR 1
L- T/0
AR 4
L- T/0
LI 1
N
L- /20
O
M R/1
-F 0
IL
/0
4
0,0
Fig. 6. Ordinamento dei SSD in base alla % di docenti con H<3.
E infine, riotteniamo la tabella delle aree CUN, stavolta per H<3.
Area CUN
3 – Scienze chimiche:
2 - Scienze fisiche:
5 - Scienze biologiche:
6 - Scienze mediche:
9 - Ingegneria industriale e dell’informazione:
4 - Scienze della terra:
1 - Scienze matematiche ed informatiche:
7 - Scienze agrarie e veterinarie:
13 - Scienze economiche e statistiche:
8 - Ingegneria civile e Architettura:
11 - Scienze storiche, filosofiche, pedagogiche e psicologiche:
14 - Scienze politiche e sociali:
10 - Scienze dell’antichità, filologico-letterarie e storico-
Docenti
3002,0
2334,0
4985,0
10383,0
5216,0
1116,0
3.283
3088,0
4848,0
3658,0
5033,0
1740,0
5490,0
Docenti
con hindex <
3
250
300
875
2907
1572
372
1.199
1181
3614
2774
4519
1623
5295
%
8,3
12,9
17,6
28,0
30,1
33,3
36,5
38,2
74,5
75,8
89,8
93,3
96,4
artistiche:
12 - Scienze
giuridiche:
4902,0
4792
97,8
Totali
59.078 31.273
52,9
Tab. 7. I docenti “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in
inglese e italiano. Per aree CUN
DISCUSSIONE E CONCLUSIONI
I dati di cui in questo articolo sono stati in larga parte presentati sul blog di ItalianScientist, e hanno
ricevuto migliaia di letture, commenti su varie mailing list, e critiche o elogi. Ringraziamo tutti gli
interventi sul tema, specie i (pochi) documentati e scientifici, e altri che chiedono altri dati, magari
confronto con UK o con altri paesi, che certamente sarebbe utile, per quanto difficile. Un primo
commento dagli UK ci è arrivato dal Prof. Ponter che è molto pratico della questione RAE ed è
stato Pro-Vice Chancellor per molti anni dell’Univ. di Leicester.
http://italianscientists.blogspot.it/2012/04/comment-from-prof-alan-ponter-on-vqr.html
“I Dipartimenti sono stati messi in grado di scegliere o meno se un particolare accademico è messa
nel processo di valutazione. Chi non è inserito, da quel momento non riceve denaro per la ricerca.
Tali studiosi devono quindi accettare che il loro ruolo presso il Dipartimento è l'insegnamento e
l'amministrazione, rilasciando tempo utile al personale di ricerca attivo.”
Le critiche maggiori sono sull’uso di Google Scholar e su quanto esso è comprensivo dei vari
settori.
C’e’ da distinguere invece l’altro problema, connesso, che anche i settori ben coperti da Google
Scholar, mostrano evidenti disparità tra H medi, e che occorre decidere “a priori” se le disparità
sono intrinseche (come quelle degli individui, a meno che non vogliamo dire che nemmeno quelle
sono da depurare!), o sono in parte intrinseche nel settore disciplinare.
La questione che noi trattiamo è solo di analisi di dati su Google Scholar, dando spunti di
riflessione su una notevole quantità di dati raccolti su 56 mila docenti italiani, senza pretendere di
dare l’ultima parola sul tema, ammesso che esista una tale ultima parola.
Chi pensa che gli "improduttivi" o comunque gli "assenti dai database" siano diversamente
distribuiti tra università, ha parzialmente ragione, ma da questo a dire che occorre l'abolizione
valore legale, che e' quanto vorrebbe fare il governo forse, ce ne passa. Le Telematiche si potrebbe
dire, come infatti ha dichiarato il Min Profumo, che dovrebbero fare solo didattica. Si arriverà a
distinguere tra “teaching University”, e “Research University”?
Ma allora dovremo distinguere anche gli stipendi? Insomma, sembra di andare verso alcune
proposte di differenziazione che vengono da Perotti, Giavazzi, la Confindustria. Peccato però che la
LUISS, Università della Confindustria, appare piuttosto bassa nelle classifiche!
Avete senzaltro visto che quando ordino le univ. italiane per H medio del docente,
http://italianscientists.blogspot.it/2012/04/la-classifica-delle-universita-italiane.html
le prime vengono univ. serie come S. Raffaele e SISSA e SANTANNA di PISA e PADOVA e
PISA, intorno a H=10, mentre le ultime sono le telematiche con H=0. Vorrà dire qualcosa?
Se dividiamo per H medio SSD, http://italianscientists.blogspot.it/2012/04/la-classifica-delle-univper-h-medio.html, le prime sono di nuovo Univ. serie, con qualche spostamento, e il valore che
ottengo per la prima, BOCCONI, intorno a 2.6, mentre S.Raff 1.9, vuol dire che sono mediamente
intorno a 2 volte piu' alti gli H index, a parità di SSD.
Ora, abbiamo visto tutti questi H=0, e controllato anche l'assenza di pubblicazioni. Ebbene, non
viene chiaro quale settore SSD sarebbe del tutto assente, c'e' una curva continua. La curva continua
parte senzaltro dai SSD scientifici in cui GS e' ottimo, e su questo non ci piove anche ANVUR e'
daccordo. In altre parole, abbiamo una curva di Hmedio per SSD. E su questo stavamo ragionando:
sono curve da normalizzare, perche' alcuni SSD sono avvantaggiati nei database? Pare ragionevole,
e lo avevamo fatto.
Poi abbiamo visto la curva della percentuale di docenti con H=0 in funzione dell H medio di SSD.
La curva e' molto chiara e precisa. Questo vuol dire che, anche se GS avrà dei salti e dei buchi,
statisticamente, la questione "scaling" dell'Hmedio, e' intrinsecamente connessa alla presenza di
H=0. Attenzione pero'. Se le curve di distribuzione di H o di numero lavori fossero "simili", come
altri autori hanno trovato come power law, in modo da scalare per H medio, allora come la media
(ossia il valore che superano il 50% dei docenti di un dato SSD), cosi' ogni altro valore di H scala
con H medio, cosa non verificata nei ns calcoli, data la correlazione inversa. Ne consegue che
normalizzare per H medio non e' tanto valido.
Da notare che lo studio di Iglesias et al (2007), già riporta alcune interessanti correlazioni, e in
particolare suggerisce dei fattori correttivi per paragonare diversi settori disciplinari ISI. In
particolare, preso ?Physics? come riferimento unitario, i fattori in tabella sono da usare per
correggere H index in altri settori. Per es. in medicina clinica (fattore 0.76) devo ridurre il valore per
correttamente confrontarmi con un fisico, mentre in ingegneria devo molto aumentare il valore
(fattore 1.70) per questo confronto. Come ci aspettavamo, in matematica abbiamo il fattore piu?
elevato (1.83), mentre se paragoniamo il fattore piu? basso (biologia molecolare, 0.44), con quello
piu? alto (matematica), abbiamo un rapporto massimo di correzione di tra un biologo molecolare e
un matematico di 0.44/1.83= 0.24, ossia il fattore massimo di differenza puo? essere di 4 volte!! Un
biologo molecolare e? avvantaggiato come H index di 4 volte rispetto ad un matematico.
Ci attendiamo commenti e spunti di riflessione.
Michele Ciavarella. Professore associato al PoliBA, presso la Facoltà di Taranto. Ha lavorato in USA, Francia, UK,
Germania e al CNR. Nel comitato editoriale di tre riviste scientifiche, ha pubblicato circa 100 lavori su riviste ISI. Ha
un blog. Contatti. Centro di Eccellenza in Meccanica Computazionale. Politecnico di BARI. +39 080 5962811, mob.
+393204316816. Humboldt fellow 2010-2012. University TUHH. Germany. http://poliba.academia.edu/micheleciavarella
Email: [email protected], [email protected].
Vito Ricci è uno statistico dell’Università degli Studi di Bari Aldo Moro. Dipartimento amministrativo per il coordinamento
dell'azione amministrativa con le funzioni di governo. Macro Area: Controllo strategico, Analisi statistica e
Programmazione.
Area
Studi
e
ricerche.
Palazzo
ATENEO
-
P.zza
Umberto
I,
1
-
70121
BARI
Riferimenti
Italian Scientists Blog http://italianscientists.blogspot.com/










La classifica delle Università in funzione del num...
Circa un terzo dei docenti delle Università italia...
la classifica delle Univ per H medio docente norma...
La classifica delle Università italiane per H-inde...
disomogeneità SSD: ordinati per H-max/H-med
I top SSD per H max
i SSD ordinati per numerosità di docenti
i dati di H index per SSD in ordine alfabetico
i Top SSD italiani per H index medio
considerazioni sulle varianti di H Index da un ns ...
JUAN E. IGLESIAS, CARLOS PECHARROMÁN Scaling the h-index for different scientific ISI
fields , Scientometrics, Vol. 73, No. 3 (2007) 303?320 DOI: 10.1007/s11192-007-1805-x