Circa un terzo dei docenti italiani è improduttivo in quanto a

Circa un terzo dei docenti italiani è improduttivo in quanto a
pubblicazioni e citazioni
(o almeno è assente dai database di Google Scholar)
http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-perpubblicazioni.html
Di Michele Ciavarella, Politecnico di BARI e Vito Ricci, Università di BARI.
Si presentano alcuni dati sulla % di docenti italiani non presenti nel database Google Scholar né in
italiano né in inglese. Si trova che la % e ti ringrazio dei file. Di 20.461 docenti con 0 prodotti citati
(34,6% dei docenti), ben 16.456 (27,9%) sono docenti con 0 prodotti totali. Si può dire quindi che
la differenza di ca.4000 docenti (4,7% dei docenti) sono presenti nel database ma non sono per nulla
citati, il chè è un dato abbastanza indipendente dalla ricchezza dei settori in Google Scholar.
Eliminando i SSD per cui la mediana è nulla, che sono esattamente 159, per ca.20 mila docenti, che
hanno ca. 80% di loro non citati (ma notate che hanno anche un buon 20% presente nel database…),
si eliminano quindi 16000 docenti “dubbiamente” improduttivi di questi settori, e si ottiene una
stima della % dei docenti davvero improduttivi, che scende a numero di 4400, ossia a 7,4%. Rimane
il fatto che i SSD che sono del tutto assenti da GS rimane davvero limitata a pochissimi. E quindi le
due stime (7,4%, e 34,6%) si possono considerare per difetto e per eccesso. Se fosse soltanto un
problema di presenza di dati in Google Scholar, non si spiegherebbe come mai la percentuale di
docenti “improduttivi” diminuisce con l’H index medio del SSD. Dato un certo SSD infatti, se la
media dipendesse solo da variabili estrinseche, tutte le curve di distribuzione dovrebbero essere
sovrapponibili, incluse quelle dei docenti “improduttivi”. Invece la correlazione inversa c’è
eccome, e sembra migliore apparentemente migliore con H mediana. In altre parole i SSD con
Hmedio o Hmediana basso, sono produttivi fino a tendere al 100%.
Riteniamo che la vera % di improduttivi sia compresa nella fascia tra 7 e 35%, e non e'
sbagliato assumere in prima approssimazione qualcosa tipo la meta' ossia ca. un 20%.
Tra parentesi, risulta da un collega di Pisa leader di un sindacato autonomo che la Univ
Pisa fece un report 6 o 7 anni fa interno, trovando appunto un 20% di improduttivi.
Parlando in termini di aree CUN, le aree CUN 12 (Scienze giuridiche), 10 (Scienze dell’antichità,
filologico-letterarie e storico-artistiche), 11 (Scienze storiche, filosofiche, pedagogiche e
psicologiche), e 14 (Scienze politiche e sociali), hanno oltre il 50% di docenti completamente
assenti. Comunque questo dato è abbastanza noto, tanto che secondo ANVUR le aree 10, 11, 12, e
14 vanno in completo peer review proprio a causa dell'assenza di banche dati reliable su cui fare
bibliometria. Alcuni risultati sembrano un po' strani (l'assenza del 60% dei docenti di area CUN 11
sembra particolarmente curiosa – si pensava gli psicologi potessero esserci tutti, e così la gran parte
di storici e filosofi) ma tuttavia i dati sono stati controllati.
Restiamo a disposizione per collaborazioni e discussioni con tutti, da ANVUR ai colleghi del
gruppo italianscientists, e ai semplici lettori.
Introduzione
Elaborando i dati di Scholar Search, uno strumento messo a punto da un gruppo del prof. Gianni
Cesareni della Univ di Roma "Tor Vergata" (dipartimento di Biologia Molecolare), che usa un
semplice algoritmo per interrogare il noto database Google Scholar, i dati di circa 55mila docenti
delle Università italiane sono stati archiviati, eliminando il più possibile le omonimie e gli errori di
affiliazione, che in piccola percentuale possono ancora affliggere i risultati per alcuni dettagli, ma
statisticamente non significativi. Ebbene, nonostante si sia usato il database di Google Scholar
completo, ossia non limitato a quello inglese, un primo dato salta all’occhio: la percentuale di
docenti del tutto improduttiva, sia come citazioni, sia persino come pubblicazioni, e' intorno al
30%! Inoltre, essa e' quasi equamente ripartita tra fasce di docenza (smentendo una ipotesi di
miglioramento progressivo come vorrebbe Anvur e la logica), mentre ovviamente e' concentrata su
alcuni SSD (Settori Scientifico Disciplinari), in parte penalizzati dall’avere meno uso di
pubblicazioni internazionali, e dal tipo di materia, ma in parte non si può nascondere che una
notevole percentuale di docenti italiani sembra del tutto assente in importanti database che ormai
includono pubblicazioni anche a conferenze, su riviste online. Scholar è forse la più completa oggi
disponibile che spazi tra tutti i campi sia scientifici che umanistici, e nonostante i primi siano
avvantaggiati storicamente, non si può nascondere la sorpresa nel leggere questi dati.
Docenti
Docenti
con 0
con 0
Totale
prodotti
prodotti
Fascia
docenti
totali
%
citati
%
Ordinari
15.898
4.253
26,8
5.363
33,7
Associati
16.954
4.501
26,5
5.650
33,3
Ricercatori
26.226
7.702
29,4
9.448
36,0
Totale
59.078
16.456
27,9
20.461
34,6
Tab. 1. I docenti “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in
inglese e italiano.
Fatto salvo che i dati completi sono sul blog http://italianscientists.blogspot.it/2012/04/docentiimproduttivi-per-pubblicazioni.html, se ordiniamo i dati per SSD, vediamo che i meno “produttivi
sono settori di lingue e di giurisprudenza (magari per motivi intrinseci di assenza nel database
italiano e inglese). E’ ovvio che Google Scholar contiene un set di dati tra i più completo e
eterogenei, ma non contiene certo tutto. E purtuttavia, ciò che non compare in Google Scholar né in
italiano né in inglese, difficilmente ha un grosso impatto o può essere facilmente misurato
altrimenti, se non con i “pari” o “peers”, con una tecnica ossia molto più costosa e non a tutti
disponibile.
1
2
3
4
5
6
7
8
9
10
SSD
L-LIN/09
L-OR/17
L-LIN/17
L-LIN/20
L-LIN/07
IUS/03
IUS/15
L-FIL-LET/11
L-ANT/02
IUS/12
Docenti totali
10
5
10
10
127
45
197
143
96
192
Docenti
con 0
prodotti
citati
10
5
10
10
119
42
188
135
92
173
%
100,0
100,0
100,0
100,0
93,7
93,3
95,4
94,4
95,8
90,1
Docenti
con 0
prodotti
totali
10
5
9
9
113
40
174
126
84
167
%
100,0
100,0
90,0
90,0
89,0
88,9
88,3
88,1
87,5
87,0
Tab. 2. I SSD con docenti “totalmente assenti” secondo elaborazioni su Scholar Search, anni 2004-2010,
database in inglese e italiano. Estratto dei primi 10, per la lista completa vedasi
http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-per-pubblicazioni.html .
Conviene a questo proposito vedere quali sono i settori più presenti. Curiosamente sono alcuni
settori della Ingegneria Industriale, che pure non sono i maggiormente citati nella classifica dell’H
index complessivo (http://italianscientists.blogspot.it/2012/04/i-top-ssd-italiani-per-h-indexmedio.html i primi dieci essendo MED/15 , FIS/05 , FIS/01 , MED/12 , MED/06, MED/08 , FIS/04
, MED/16 , MED/13, MED/01).
Docenti
Docenti
con 0
con 0
prodotti
prodotti
SSD
Docenti totali
citati
%
totali
%
359
BIO/15
96
1
1,0
0
0,0
360
MED/14
107
1
0,9
0
0,0
361
VET/03
90
0
0,0
0
0,0
362
VET/06
71
0
0,0
0
0,0
363
VET/07
47
1
2,1
0
0,0
364
ING-IND/03
24
0
0,0
0
0,0
365
ING-IND/18
13
0
0,0
0
0,0
366
ING-IND/23
19
0
0,0
0
0,0
367
ING-IND/26
35
1
2,9
0
0,0
368
ING-IND/30
10
0
0,0
0
0,0
369
ING-IND/34
61
1
1,6
0
0,0
Tab. 3. I docenti meno “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in
inglese e italiano. Estratto degli ultimi 10, per la lista completa vedasi
http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-per-pubblicazioni.html .
Se andiamo a diagrammare i SSD “improduttivi” e in ordine decrescente, troviamo che non c’è un
modo banale per tracciare una “soglia” aldisotto della quale è evidente che Google Scholar non
contiene dati. A parte pochissimi SSD, gli altri sembrano seguire una curva regolare. Certo, si
potrebbe dividere la curva in 3 parti, che corrispondono ognuna a ca. 120 SSD, una fino al 60%, una
fino a ca. il 10%, e una sotto il 10% di improduttivi. Da notare pero’ che per es. AGR-13 si trova tra
i più produttivi, mentre AGR-10 si trova nella fascia intermedia.
E’ possibile che si possa tracciare un valore intorno al 40% dove i valori degli SSD appaiono meno
significativi. Ma andrebbe a questo punto migliorato lo studio guardando ad altri parametri.
Fig.1. % docenti con 0 prodotti divisi per SSD.
Un altro modo per controllare i dati è verificare la correlazione tra Hmedio del SSD, con la % di
docenti “improduttivi”. Ecco le fig.2,3 dove si correlano il numero di docenti con H nullo in
funzione dell’ H medio del SSD. La correlazione inversa è evidente, anche se non perfetta.
Fig. 2. % improduttivi vs Hmedio del SSD.
Fig. 3. % improduttivi vs Hmediana del SSD.
La correlazione inversa sembra migliore apparentemente con H mediana. In altre parole sono meno
produttivi i SSD con Hmedio o Hmediana basso, fino a tendere a zero.
E’ evidente che per tutti gli SSD per cui la mediana è nulla, che sono esattamente 159, non ha molto
senso parlare di “improduttività”, dato che ca. l’80% dei docenti di questi 159 settori non hanno
prodotti citati. Di conseguenza, eliminando tali 16000 docenti ca improduttivi di questi settori, la %
dei docenti davvero improduttivi, scende a numero di 4400, ossia a 7,4%.
Divisione per aree CUN
Come aree CUN, si conferma la presenza tra le aree “improduttive” nel senso della presenza in GS,
delle scienze giuridiche, letterarie, filosofiche, e politiche e sociali. Relativamente meno attesa, la
presenza subito dopo di ingegneria civile e architettura, che è assente ancora per il 45% dei docenti,
mentre dalla successiva area CUN, si passa a valori inferiori al 30%.
Area CUN
Docenti
con 0
prodotti
Docenti totali citati
%
Docenti
con 0
prodotti
totali
%
12 - Scienze
giuridiche:
4902
4271
87,1
3836
78,3
10 - Scienze
5490
4555
83,0
3823
69,6
dell’antichità,
filologicoletterarie e
storico-artistiche:
11 - Scienze
storiche,
filosofiche,
pedagogiche e
psicologiche:
5033
3469
68,9
2747
54,6
14 - Scienze
politiche e sociali:
1740
1210
69,5
891
51,2
8 - Ingegneria
civile e
Architettura:
3658
1973
53,9
1676
45,8
13 - Scienze
economiche e
statistiche:
4848
1942
40,1
1277
26,3
7 - Scienze
agrarie e
veterinarie:
3088
455
14,7
308
10,0
1 - Scienze
matematiche ed
informatiche:
3283
444
13,5
302
9,2
6 - Scienze
mediche:
10383
1089
10,5
836
8,1
9 - Ingegneria
industriale e
dell’informazione:
5216
523
10,0
370
7,1
4 - Scienze della
terra:
1116
89
8,0
64
5,7
5 - Scienze
biologiche:
4985
251
5,0
191
3,8
2 - Scienze
fisiche:
2334
114
4,9
76
3,3
3 – Scienze
chimiche:
3002
76
2,5
59
2,0
Tab. 4. I docenti “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in
inglese e italiano. Per aree CUN http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-perpubblicazioni.html .
Fig. 4. % improduttivi divisi per aree CUN e in ordine progressivo di “produttività”.
Ci attendiamo commenti e spunti di riflessione.
Michele Ciavarella. Professore associato al PoliBA, presso la Facoltà di Taranto. Ha lavorato in USA, Francia, UK,
Germania e al CNR. Nel comitato editoriale di tre riviste scientifiche, ha pubblicato circa 100 lavori su riviste ISI. Ha
un blog. Contatti. Centro di Eccellenza in Meccanica Computazionale. Politecnico di BARI. +39 080 5962811, mob.
+393204316816. Humboldt fellow 2010-2012. University TUHH. Germany. http://poliba.academia.edu/micheleciavarella
Email: [email protected], [email protected].
Vito Ricci è uno statistico dell’Università degli Studi di Bari Aldo Moro. Dipartimento amministrativo per il coordinamento
dell'azione amministrativa con le funzioni di governo. Macro Area: Controllo strategico, Analisi statistica e
Programmazione.
Area
Studi
e
ricerche.
Palazzo
ATENEO
Riferimenti
Italian Scientists Blog http://italianscientists.blogspot.com/
RETTORE VIRTUOSO BLOG http://rettorevirtuoso.blogspot.com/
-
P.zza
Umberto
I,
1
-
70121
BARI