Circa un terzo dei docenti italiani è improduttivo in quanto a pubblicazioni e citazioni (o almeno è assente dai database di Google Scholar) http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-perpubblicazioni.html Di Michele Ciavarella, Politecnico di BARI e Vito Ricci, Università di BARI. Si presentano alcuni dati sulla % di docenti italiani non presenti nel database Google Scholar né in italiano né in inglese. Si trova che la % e ti ringrazio dei file. Di 20.461 docenti con 0 prodotti citati (34,6% dei docenti), ben 16.456 (27,9%) sono docenti con 0 prodotti totali. Si può dire quindi che la differenza di ca.4000 docenti (4,7% dei docenti) sono presenti nel database ma non sono per nulla citati, il chè è un dato abbastanza indipendente dalla ricchezza dei settori in Google Scholar. Eliminando i SSD per cui la mediana è nulla, che sono esattamente 159, per ca.20 mila docenti, che hanno ca. 80% di loro non citati (ma notate che hanno anche un buon 20% presente nel database…), si eliminano quindi 16000 docenti “dubbiamente” improduttivi di questi settori, e si ottiene una stima della % dei docenti davvero improduttivi, che scende a numero di 4400, ossia a 7,4%. Rimane il fatto che i SSD che sono del tutto assenti da GS rimane davvero limitata a pochissimi. E quindi le due stime (7,4%, e 34,6%) si possono considerare per difetto e per eccesso. Se fosse soltanto un problema di presenza di dati in Google Scholar, non si spiegherebbe come mai la percentuale di docenti “improduttivi” diminuisce con l’H index medio del SSD. Dato un certo SSD infatti, se la media dipendesse solo da variabili estrinseche, tutte le curve di distribuzione dovrebbero essere sovrapponibili, incluse quelle dei docenti “improduttivi”. Invece la correlazione inversa c’è eccome, e sembra migliore apparentemente migliore con H mediana. In altre parole i SSD con Hmedio o Hmediana basso, sono produttivi fino a tendere al 100%. Riteniamo che la vera % di improduttivi sia compresa nella fascia tra 7 e 35%, e non e' sbagliato assumere in prima approssimazione qualcosa tipo la meta' ossia ca. un 20%. Tra parentesi, risulta da un collega di Pisa leader di un sindacato autonomo che la Univ Pisa fece un report 6 o 7 anni fa interno, trovando appunto un 20% di improduttivi. Parlando in termini di aree CUN, le aree CUN 12 (Scienze giuridiche), 10 (Scienze dell’antichità, filologico-letterarie e storico-artistiche), 11 (Scienze storiche, filosofiche, pedagogiche e psicologiche), e 14 (Scienze politiche e sociali), hanno oltre il 50% di docenti completamente assenti. Comunque questo dato è abbastanza noto, tanto che secondo ANVUR le aree 10, 11, 12, e 14 vanno in completo peer review proprio a causa dell'assenza di banche dati reliable su cui fare bibliometria. Alcuni risultati sembrano un po' strani (l'assenza del 60% dei docenti di area CUN 11 sembra particolarmente curiosa – si pensava gli psicologi potessero esserci tutti, e così la gran parte di storici e filosofi) ma tuttavia i dati sono stati controllati. Restiamo a disposizione per collaborazioni e discussioni con tutti, da ANVUR ai colleghi del gruppo italianscientists, e ai semplici lettori. Introduzione Elaborando i dati di Scholar Search, uno strumento messo a punto da un gruppo del prof. Gianni Cesareni della Univ di Roma "Tor Vergata" (dipartimento di Biologia Molecolare), che usa un semplice algoritmo per interrogare il noto database Google Scholar, i dati di circa 55mila docenti delle Università italiane sono stati archiviati, eliminando il più possibile le omonimie e gli errori di affiliazione, che in piccola percentuale possono ancora affliggere i risultati per alcuni dettagli, ma statisticamente non significativi. Ebbene, nonostante si sia usato il database di Google Scholar completo, ossia non limitato a quello inglese, un primo dato salta all’occhio: la percentuale di docenti del tutto improduttiva, sia come citazioni, sia persino come pubblicazioni, e' intorno al 30%! Inoltre, essa e' quasi equamente ripartita tra fasce di docenza (smentendo una ipotesi di miglioramento progressivo come vorrebbe Anvur e la logica), mentre ovviamente e' concentrata su alcuni SSD (Settori Scientifico Disciplinari), in parte penalizzati dall’avere meno uso di pubblicazioni internazionali, e dal tipo di materia, ma in parte non si può nascondere che una notevole percentuale di docenti italiani sembra del tutto assente in importanti database che ormai includono pubblicazioni anche a conferenze, su riviste online. Scholar è forse la più completa oggi disponibile che spazi tra tutti i campi sia scientifici che umanistici, e nonostante i primi siano avvantaggiati storicamente, non si può nascondere la sorpresa nel leggere questi dati. Docenti Docenti con 0 con 0 Totale prodotti prodotti Fascia docenti totali % citati % Ordinari 15.898 4.253 26,8 5.363 33,7 Associati 16.954 4.501 26,5 5.650 33,3 Ricercatori 26.226 7.702 29,4 9.448 36,0 Totale 59.078 16.456 27,9 20.461 34,6 Tab. 1. I docenti “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in inglese e italiano. Fatto salvo che i dati completi sono sul blog http://italianscientists.blogspot.it/2012/04/docentiimproduttivi-per-pubblicazioni.html, se ordiniamo i dati per SSD, vediamo che i meno “produttivi sono settori di lingue e di giurisprudenza (magari per motivi intrinseci di assenza nel database italiano e inglese). E’ ovvio che Google Scholar contiene un set di dati tra i più completo e eterogenei, ma non contiene certo tutto. E purtuttavia, ciò che non compare in Google Scholar né in italiano né in inglese, difficilmente ha un grosso impatto o può essere facilmente misurato altrimenti, se non con i “pari” o “peers”, con una tecnica ossia molto più costosa e non a tutti disponibile. 1 2 3 4 5 6 7 8 9 10 SSD L-LIN/09 L-OR/17 L-LIN/17 L-LIN/20 L-LIN/07 IUS/03 IUS/15 L-FIL-LET/11 L-ANT/02 IUS/12 Docenti totali 10 5 10 10 127 45 197 143 96 192 Docenti con 0 prodotti citati 10 5 10 10 119 42 188 135 92 173 % 100,0 100,0 100,0 100,0 93,7 93,3 95,4 94,4 95,8 90,1 Docenti con 0 prodotti totali 10 5 9 9 113 40 174 126 84 167 % 100,0 100,0 90,0 90,0 89,0 88,9 88,3 88,1 87,5 87,0 Tab. 2. I SSD con docenti “totalmente assenti” secondo elaborazioni su Scholar Search, anni 2004-2010, database in inglese e italiano. Estratto dei primi 10, per la lista completa vedasi http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-per-pubblicazioni.html . Conviene a questo proposito vedere quali sono i settori più presenti. Curiosamente sono alcuni settori della Ingegneria Industriale, che pure non sono i maggiormente citati nella classifica dell’H index complessivo (http://italianscientists.blogspot.it/2012/04/i-top-ssd-italiani-per-h-indexmedio.html i primi dieci essendo MED/15 , FIS/05 , FIS/01 , MED/12 , MED/06, MED/08 , FIS/04 , MED/16 , MED/13, MED/01). Docenti Docenti con 0 con 0 prodotti prodotti SSD Docenti totali citati % totali % 359 BIO/15 96 1 1,0 0 0,0 360 MED/14 107 1 0,9 0 0,0 361 VET/03 90 0 0,0 0 0,0 362 VET/06 71 0 0,0 0 0,0 363 VET/07 47 1 2,1 0 0,0 364 ING-IND/03 24 0 0,0 0 0,0 365 ING-IND/18 13 0 0,0 0 0,0 366 ING-IND/23 19 0 0,0 0 0,0 367 ING-IND/26 35 1 2,9 0 0,0 368 ING-IND/30 10 0 0,0 0 0,0 369 ING-IND/34 61 1 1,6 0 0,0 Tab. 3. I docenti meno “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in inglese e italiano. Estratto degli ultimi 10, per la lista completa vedasi http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-per-pubblicazioni.html . Se andiamo a diagrammare i SSD “improduttivi” e in ordine decrescente, troviamo che non c’è un modo banale per tracciare una “soglia” aldisotto della quale è evidente che Google Scholar non contiene dati. A parte pochissimi SSD, gli altri sembrano seguire una curva regolare. Certo, si potrebbe dividere la curva in 3 parti, che corrispondono ognuna a ca. 120 SSD, una fino al 60%, una fino a ca. il 10%, e una sotto il 10% di improduttivi. Da notare pero’ che per es. AGR-13 si trova tra i più produttivi, mentre AGR-10 si trova nella fascia intermedia. E’ possibile che si possa tracciare un valore intorno al 40% dove i valori degli SSD appaiono meno significativi. Ma andrebbe a questo punto migliorato lo studio guardando ad altri parametri. Fig.1. % docenti con 0 prodotti divisi per SSD. Un altro modo per controllare i dati è verificare la correlazione tra Hmedio del SSD, con la % di docenti “improduttivi”. Ecco le fig.2,3 dove si correlano il numero di docenti con H nullo in funzione dell’ H medio del SSD. La correlazione inversa è evidente, anche se non perfetta. Fig. 2. % improduttivi vs Hmedio del SSD. Fig. 3. % improduttivi vs Hmediana del SSD. La correlazione inversa sembra migliore apparentemente con H mediana. In altre parole sono meno produttivi i SSD con Hmedio o Hmediana basso, fino a tendere a zero. E’ evidente che per tutti gli SSD per cui la mediana è nulla, che sono esattamente 159, non ha molto senso parlare di “improduttività”, dato che ca. l’80% dei docenti di questi 159 settori non hanno prodotti citati. Di conseguenza, eliminando tali 16000 docenti ca improduttivi di questi settori, la % dei docenti davvero improduttivi, scende a numero di 4400, ossia a 7,4%. Divisione per aree CUN Come aree CUN, si conferma la presenza tra le aree “improduttive” nel senso della presenza in GS, delle scienze giuridiche, letterarie, filosofiche, e politiche e sociali. Relativamente meno attesa, la presenza subito dopo di ingegneria civile e architettura, che è assente ancora per il 45% dei docenti, mentre dalla successiva area CUN, si passa a valori inferiori al 30%. Area CUN Docenti con 0 prodotti Docenti totali citati % Docenti con 0 prodotti totali % 12 - Scienze giuridiche: 4902 4271 87,1 3836 78,3 10 - Scienze 5490 4555 83,0 3823 69,6 dell’antichità, filologicoletterarie e storico-artistiche: 11 - Scienze storiche, filosofiche, pedagogiche e psicologiche: 5033 3469 68,9 2747 54,6 14 - Scienze politiche e sociali: 1740 1210 69,5 891 51,2 8 - Ingegneria civile e Architettura: 3658 1973 53,9 1676 45,8 13 - Scienze economiche e statistiche: 4848 1942 40,1 1277 26,3 7 - Scienze agrarie e veterinarie: 3088 455 14,7 308 10,0 1 - Scienze matematiche ed informatiche: 3283 444 13,5 302 9,2 6 - Scienze mediche: 10383 1089 10,5 836 8,1 9 - Ingegneria industriale e dell’informazione: 5216 523 10,0 370 7,1 4 - Scienze della terra: 1116 89 8,0 64 5,7 5 - Scienze biologiche: 4985 251 5,0 191 3,8 2 - Scienze fisiche: 2334 114 4,9 76 3,3 3 – Scienze chimiche: 3002 76 2,5 59 2,0 Tab. 4. I docenti “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in inglese e italiano. Per aree CUN http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-perpubblicazioni.html . Fig. 4. % improduttivi divisi per aree CUN e in ordine progressivo di “produttività”. Ci attendiamo commenti e spunti di riflessione. Michele Ciavarella. Professore associato al PoliBA, presso la Facoltà di Taranto. Ha lavorato in USA, Francia, UK, Germania e al CNR. Nel comitato editoriale di tre riviste scientifiche, ha pubblicato circa 100 lavori su riviste ISI. Ha un blog. Contatti. Centro di Eccellenza in Meccanica Computazionale. Politecnico di BARI. +39 080 5962811, mob. +393204316816. Humboldt fellow 2010-2012. University TUHH. Germany. http://poliba.academia.edu/micheleciavarella Email: [email protected], [email protected]. Vito Ricci è uno statistico dell’Università degli Studi di Bari Aldo Moro. Dipartimento amministrativo per il coordinamento dell'azione amministrativa con le funzioni di governo. Macro Area: Controllo strategico, Analisi statistica e Programmazione. Area Studi e ricerche. Palazzo ATENEO Riferimenti Italian Scientists Blog http://italianscientists.blogspot.com/ RETTORE VIRTUOSO BLOG http://rettorevirtuoso.blogspot.com/ - P.zza Umberto I, 1 - 70121 BARI