Circa un terzo dei docenti italiani è improduttivo in quanto a pubblicazioni e citazioni (o almeno è assente dai database di Google Scholar) Di Michele Ciavarella, Politecnico di BARI e Vito Ricci, Università di BARI. Siccome l’Agenzia ANVUR ha finalmente avviato in Italia una valutazione della ricerca, usando sia strumenti “bibliometrici” che “peer review”, si è scatenato un dibattito in Italia mai visto prima, anche perché l’Anvur assegnerà con la valutazione VQR 2004-2010, ca.700 milioni di euro premiali alle Università “meritevoli”. VQR imita in parte il sistema RAE che in UK è operativo da molti anni, con varie scadenze che hanno affinato via via il metodo di analisi, e che ora è basato (REF) tutto sulle citazioni, ma non solo di pubblicazioni, bensì del “valore” del docente nel panorama mondiale, aspirando gli UK ad avere “leader” mondiali del settore. Noi del gruppo ItalianScientists abbiamo usato con mezzi minimi a disposizione il database Google Scholar, in particolare con il sistema messo a punto da Gianni Cesareni di UniROMA2. In precedenza, avevamo valutato le Univ. Italiane per H medio del docente (nel periodo 20042010), dove H indice di Hirsch misura il numero di articoli citati piu’ di H volte di un certo docente, e la classifica è qui: http://italianscientists.blogspot.it/2012/04/la-classifica-delle-universitaitaliane.html Le prime vengono univ. serie come S. Raffaele e SISSA e SANTANNA di PISA e PADOVA e PISA, intorno a H=10, mentre le ultime sono le telematiche con H=0. Vorrà dire qualcosa? Siccome molti hanno notato che alcuni settori sono troppo più presenti di altri (i medici e i fisici da anni hanno un output internazionale più curato e presente), allora abbiamo voluto tener conto del valore H medio di ogni settore SSD, ottenendo una classifica simile http://italianscientists.blogspot.it/2012/04/la-classifica-delle-univ-per-h-medio.html, in cui le prime sono di nuovo Univ. serie, con qualche spostamento, e il valore per la prima, BOCCONI, intorno a 2.6, mentre S.Raff 1.9, vuol dire che sono mediamente intorno a 2 volte piu' alti gli H index, a parità di SSD. In questo paper, si presentano alcuni dati sulla % di docenti italiani non presenti nel database Google Scholar né in italiano né in inglese. Si tratta di 20.461 docenti con 0 prodotti citati (34,6% dei docenti), di cui ben 16.456 (27,9%) sono docenti con 0 prodotti totali. Si può dire quindi che la differenza di ca.4000 docenti (4,7% dei docenti) sono presenti nel database ma non sono per nulla citati, il chè ha un significato ulteriore. Magari 30% di docenti non sarà del tutto improduttivo, e magari non è una percentuale troppo alta, se paragonata ad altre categorie. Purtroppo un dato comparativo con l’estero non è facile da avere. Insomma, sembra di andare verso alcune proposte di differenziazione che vengono da Perotti, Giavazzi, la Confindustria. Peccato però che la LUISS, Università della Confindustria, appare piuttosto bassa nelle classifiche! Un primo commento dagli UK ci è arrivato dal Prof. Ponter che è molto pratico della questione RAE ed è stato Pro-Vice Chancellor per molti anni dell’Univ. di Leicester. http://italianscientists.blogspot.it/2012/04/comment-from-prof-alan-ponter-on-vqr.html “I Dipartimenti sono stati messi in grado di scegliere o meno se un particolare accademico è messa nel processo di valutazione. Chi non è inserito, da quel momento non riceve denaro per la ricerca. Tali studiosi devono quindi accettare che il loro ruolo presso il Dipartimento è l'insegnamento e l'amministrazione, rilasciando tempo utile al personale di ricerca attivo.” Andrebbe fatto così anche in Italia? Non si può fare valutazione solo per distribuire più soldi alle Università “migliori”, serve anche organizzare meglio il tempo delle persone attive, e caricare di compiti noiosi chi non è attivo. La soluzione inglese è ancora molto da imitare. Interessanti anche le obiezioni di Ponter al problema (che anche in UK esiste) della poca produzione nei dipartimenti di Umanistica. Essendo sorto il dubbio che gli “improduttivi” o “assenti”, come chiamar si vogliano, siano diversamente concentrati nelle varie università, abbiamo stimato la loro incidenza. Esiste una certa disparità, anzi la classifica delle Università in funzione del numero (in ordine crescente) di "improduttivi" sembra rispettare abbastanza bene la classifica fatta in precedenza per Hmedio docente, il chè dimostra che il dato è ben correlato. Naturalmente rimane la questione delle materie che hanno troppi "improduttivi", che potrebbero essere in parte falsi "improduttivi". Ma guarda caso, le grandi Università di prestigio rimangono al vertice, anche se hanno molte facoltà umanistiche. Rimane da vedere cosa verrà fuori con ANVUR e VQR. Magari i dati coincideranno e allora sarà stato il nostro un esercizio molto meno costoso di VQR, fatto da 2 sole persone, senza tanta fatica, e sarà una piccola soddisfazione per noi. Salta all'occhio tuttavia la discesa della Bocconi e della Normale di Pisa. Come mai? Hanno molti improduttivi? Da notare che in questo caso, abbiamo usato come “improduttività” la soglia H<3, cercando di "mimare" il fatto che VQR raccoglie 3 lavori per docente, e supponendo che almeno 3 lavori esistano, e che siano almeno citati 3 volte l'uno, abbiamo voluto dare una stima veloce. Se avessimo da subito definito la soglia di “assenza dai database” o “improduttività” ad H<3, avremmo ottenuto ben 52,9% dei docenti italiani, il chè francamente è un dato allarmante, ben più allarmante del dato 34.6% di H=0. Se proprio dovessimo “abolire il valore legale della laurea”, andrebbe abolito per le università telematiche, che difficilmente posso trovare scusante nel fattore assenza dati “umanistici” del Google Scholar. Obiezioni, disclaimer e warning Molte delle obiezioni riguardano il fatto che per molti settori disciplinari (SSD), Google Scholar è in difetto o perlomeno non è “rappresentativo”, non avendo ancora dati sui prodotti di quei settori, o perché non si ha interesse generale, sia perché questi settori finora si contentavano di non essere indicizzati su Google. A noi pare, in prima battuta, che Google Scholar ha tutto l’interesse a indicizzare qualsiasi cosa che esista e venga citata, e Umberto Eco per es. trova migliaia di citazioni, pur essendo un umanista. Ma supponendo di eliminare brutalmente per es. i SSD per cui la mediana dell’indice di Hirsch H è nulla, che sono esattamente 159, per ca.20 mila docenti, in questi settori ben l’80% è “assente” (ma notate che anche in questi SSD c’è sempre hanno anche un buon 20% presente nel database, da Umberto Eco in poi…). In questo modo si eliminano quindi 16000 docenti “dubbiamente” improduttivi di questi settori, e si ottiene una stima della % dei docenti davvero improduttivi, che scende a numero di 4400, ossia a 7,4%. La cifra magari non è troppo alta, anche considerando che il docente deve anche fare didattica. Parlando in termini di aree CUN, le aree CUN 12 (Scienze giuridiche), 10 (Scienze dell’antichità, filologico-letterarie e storico-artistiche), 11 (Scienze storiche, filosofiche, pedagogiche e psicologiche), e 14 (Scienze politiche e sociali), hanno oltre il 50% di docenti completamente “assenti”. Relativamente meno attesa, la presenza subito dopo di ingegneria civile e architettura, che è assente ancora per il 45% dei docenti, mentre dalla successiva area CUN, si passa a valori inferiori al 30%. Rimane il fatto che i SSD che sono del tutto assenti da GS rimane davvero limitata a pochissimi. E quindi le due stime (7,4%, e 34,6%) si possono considerare per difetto e per eccesso. Se fosse soltanto un problema di presenza di dati in Google Scholar, non si spiegherebbe come mai la percentuale di docenti “assenti” diminuisce con l’H index medio del SSD. Dato un certo SSD infatti, se la media dipendesse solo da variabili estrinseche, tutte le curve di distribuzione dovrebbero essere sovrapponibili, incluse quelle dei docenti “improduttivi”. Invece la correlazione inversa c’è eccome, e sembra migliore con H mediana. In altre parole i SSD con Hmedio o Hmediana basso, sono produttivi fino a tendere al 100%. Riteniamo che la vera % di totalmente “assenti” sia compresa nella fascia tra 7 e 35%, e non e' sbagliato assumere in prima approssimazione qualcosa tipo la meta' ossia ca. un 20%. Questo dato è abbastanza noto, tanto che secondo ANVUR le aree 10, 11, 12, e 14 vanno in completo peer review (prevalentemente “italiano”) proprio a causa dell'assenza di banche dati affidabili su cui fare bibliometria, e in questi settori resta più difficile capire cosa è valido per il Paese e cosa no. Alcuni risultati sembrano un po' strani (l'assenza del 60% dei docenti di area CUN 11 sembra particolarmente curiosa – si pensava gli psicologi potessero esserci tutti, e così la gran parte di storici e filosofi) ma tuttavia i dati sono stati controllati. Introduzione La bibliometria è una scienza recente. Dalla conta del numero di pubblicazioni, si è passati a valutare l’impact factor delle riviste, e successivamente è stata data rilevanza all’impatto sulla base di quante “citazioni” riceve un dato articolo, e quindi un dato docente. Da quando ci sono banche dati anche accessibili liberamente da tutti, come google scholar, hanno avuto successo indici sintetici come l’H-index. Dalla proposta di Hirsch, che ha ricevuto molta attenzione, si sono scatenati gli usi dell’indice di H per valutare persone, istituzioni, giornali, nazioni. La bibliografia fondamentale su H-index, rapida, è l’articolo su wikipedia, e Publish or Perish di Anne-Wil Harzing. Una esigenza che è nata nel gruppo “ItalianScientists” che è stato formato da alcuni scienziati italiani, invitati anche dalla lista dei 2500 “TopItalianScientists” come chiamati della ViaAcademy, ossia che hanno h>30, è stata quella di distinguere per settori. Naturalmente è facile segnalare come vi e' eccesso di medici e biologi nella lista di H index non normalizzata, per via di maggior numero di articoli, di autori, di interesse per la materia per ovvi motivi. Esistono varie forme di universalità sull'H index, che fanno pensare a valorì normalizzati, vedasi per es. qua. Elaborando i dati di Scholar Search, uno strumento messo a punto da un gruppo del prof. Gianni Cesareni della Univ di Roma "Tor Vergata" (dipartimento di Biologia Molecolare), che usa un semplice algoritmo per interrogare il noto database Google Scholar, i dati di circa 55mila docenti delle Università italiane sono stati archiviati, eliminando il più possibile le omonimie e gli errori di affiliazione, che in piccola percentuale possono ancora affliggere i risultati per alcuni dettagli, ma statisticamente non significativi. Ebbene, nonostante si sia usato il database di Google Scholar completo, ossia non limitato a quello inglese, un primo dato salta all’occhio: la percentuale di docenti del tutto improduttiva, sia come citazioni, sia persino come pubblicazioni, e' intorno al 30%! Inoltre, essa e' quasi equamente ripartita tra fasce di docenza (smentendo una ipotesi di miglioramento progressivo come vorrebbe Anvur e la logica), mentre ovviamente e' concentrata su alcuni SSD (Settori Scientifico Disciplinari), in parte penalizzati dall’avere meno uso di pubblicazioni internazionali, e dal tipo di materia, ma in parte non si può nascondere che una notevole percentuale di docenti italiani sembra del tutto assente in importanti database che ormai includono pubblicazioni anche a conferenze, su riviste online. Scholar è forse la più completa oggi disponibile che spazi tra tutti i campi sia scientifici che umanistici, e nonostante i primi siano avvantaggiati storicamente, non si può nascondere la sorpresa nel leggere questi dati. Docenti Docenti con 0 con 0 Totale prodotti prodotti Fascia docenti totali % citati % Ordinari 15.898 4.253 26,8 5.363 33,7 Associati 16.954 4.501 26,5 5.650 33,3 Ricercatori 26.226 7.702 29,4 9.448 36,0 Totale 59.078 16.456 27,9 20.461 34,6 Tab. 1. I docenti “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in inglese e italiano. Fatto salvo che i dati completi sono sul blog http://italianscientists.blogspot.it/2012/04/docentiimproduttivi-per-pubblicazioni.html, se ordiniamo i dati per SSD, vediamo che i meno “produttivi sono settori di lingue e di giurisprudenza (magari per motivi intrinseci di assenza nel database italiano e inglese). E’ ovvio che Google Scholar contiene un set di dati tra i più completo e eterogenei, ma non contiene certo tutto. E purtuttavia, ciò che non compare in Google Scholar né in italiano né in inglese, difficilmente ha un grosso impatto o può essere facilmente misurato altrimenti, se non con i “pari” o “peers”, con una tecnica ossia molto più costosa e non a tutti disponibile. Docenti Docenti con 0 con 0 prodotti prodotti SSD Docenti totali citati % totali % 1 L-LIN/09 10 10 100,0 10 100,0 2 L-OR/17 5 5 100,0 5 100,0 3 L-LIN/17 10 10 100,0 9 90,0 4 L-LIN/20 10 10 100,0 9 90,0 5 L-LIN/07 127 119 93,7 113 89,0 6 IUS/03 45 42 93,3 40 88,9 7 IUS/15 197 188 95,4 174 88,3 8 L-FIL-LET/11 143 135 94,4 126 88,1 9 L-ANT/02 96 92 95,8 84 87,5 10 IUS/12 192 173 90,1 167 87,0 Tab. 2. I SSD con docenti “totalmente assenti” secondo elaborazioni su Scholar Search, anni 2004-2010, database in inglese e italiano. Estratto dei primi 10, per la lista completa vedasi http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-per-pubblicazioni.html . Conviene a questo proposito vedere quali sono i settori più presenti. Curiosamente sono alcuni settori della Ingegneria Industriale, che pure non sono i maggiormente citati nella classifica dell’H index complessivo (http://italianscientists.blogspot.it/2012/04/i-top-ssd-italiani-per-h-indexmedio.html i primi dieci essendo MED/15 , FIS/05 , FIS/01 , MED/12 , MED/06, MED/08 , FIS/04 , MED/16 , MED/13, MED/01). Docenti Docenti con 0 con 0 prodotti prodotti SSD Docenti totali citati % totali % 359 BIO/15 96 1 1,0 0 0,0 360 MED/14 107 1 0,9 0 0,0 361 VET/03 90 0 0,0 0 0,0 362 VET/06 71 0 0,0 0 0,0 363 VET/07 47 1 2,1 0 0,0 364 ING-IND/03 24 0 0,0 0 0,0 365 ING-IND/18 13 0 0,0 0 0,0 366 ING-IND/23 19 0 0,0 0 0,0 367 ING-IND/26 35 1 2,9 0 0,0 368 ING-IND/30 10 0 0,0 0 0,0 369 ING-IND/34 61 1 1,6 0 0,0 Tab. 3. I docenti meno “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in inglese e italiano. Estratto degli ultimi 10, per la lista completa vedasi http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-per-pubblicazioni.html . Se andiamo a diagrammare i SSD “improduttivi” e in ordine decrescente, troviamo che non c’è un modo banale per tracciare una “soglia” aldisotto della quale è evidente che Google Scholar non contiene dati. A parte pochissimi SSD, gli altri sembrano seguire una curva regolare. Certo, si potrebbe dividere la curva in 3 parti, che corrispondono ognuna a ca. 120 SSD, una fino al 60%, una fino a ca. il 10%, e una sotto il 10% di improduttivi. Da notare pero’ che per es. AGR-13 si trova tra i più produttivi, mentre AGR-10 si trova nella fascia intermedia. E’ possibile che si possa tracciare un valore intorno al 40% dove i valori degli SSD appaiono meno significativi. Ma andrebbe a questo punto migliorato lo studio guardando ad altri parametri. Fig.1. % docenti con 0 prodotti divisi per SSD. Un altro modo per controllare i dati è verificare la correlazione tra Hmedio del SSD, con la % di docenti “improduttivi”. Ecco le fig.2,3 dove si correlano il numero di docenti con H nullo in funzione dell’ H medio del SSD. La correlazione inversa è evidente, anzi se ne può dare equazione. Fig. 2. % improduttivi vs Hmedio del SSD. Fig. 3. % improduttivi vs Hmediana del SSD. Meno valida la correlazione in funzione dell’H Max, anche perché quest’ultimo è più soggetto ad errori. La correlazione inversa sembra migliore apparentemente con H mediana. In altre parole sono meno produttivi i SSD con Hmedio o Hmediana basso, fino a tendere a zero. E’ evidente che per tutti gli SSD per cui la mediana è nulla, che sono esattamente 159, non ha molto senso parlare di “improduttività”, dato che ca. l’80% dei docenti di questi 159 settori non hanno prodotti citati. Di conseguenza, eliminando tali 16000 docenti ca improduttivi di questi settori, la % dei docenti davvero improduttivi, scende a numero di 4400, ossia a 7,4%. Divisione per aree CUN Come aree CUN, si conferma la presenza tra le aree “assenti” nel GS, delle scienze giuridiche, letterarie, filosofiche, e politiche e sociali. Relativamente meno attesa, la presenza subito dopo di ingegneria civile e architettura, che è assente ancora per il 45% dei docenti, mentre dalla successiva area CUN, si passa a valori inferiori al 30%. Area CUN 12 - Scienze Docenti con 0 prodotti Docenti totali citati 4902 4271 Docenti con 0 prodotti % totali 87,1 3836 % 78,3 giuridiche: 10 - Scienze dell’antichità, filologicoletterarie e storico-artistiche: 5490 4555 83,0 3823 69,6 11 - Scienze storiche, filosofiche, pedagogiche e psicologiche: 5033 3469 68,9 2747 54,6 14 - Scienze politiche e sociali: 1740 1210 69,5 891 51,2 8 - Ingegneria civile e Architettura: 3658 1973 53,9 1676 45,8 13 - Scienze economiche e statistiche: 4848 1942 40,1 1277 26,3 7 - Scienze agrarie e veterinarie: 3088 455 14,7 308 10,0 1 - Scienze matematiche ed informatiche: 3283 444 13,5 302 9,2 6 - Scienze mediche: 10383 1089 10,5 836 8,1 9 - Ingegneria industriale e dell’informazione: 5216 523 10,0 370 7,1 4 - Scienze della terra: 1116 89 8,0 64 5,7 5 - Scienze biologiche: 4985 251 5,0 191 3,8 2 - Scienze fisiche: 2334 114 4,9 76 3,3 3 – Scienze chimiche: 3002 76 2,5 59 2,0 Tab. 4. I docenti “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in inglese e italiano. Per aree CUN http://italianscientists.blogspot.it/2012/04/docenti-improduttivi-perpubblicazioni.html . Fig. 4. % improduttivi divisi per aree CUN e in ordine progressivo di “produttività”. Divisione per Università e passaggio ad usare il criterio simil VQR – ANVUR ossia H>3 A seguito di alcuni suggerimenti, considerando ossia che VQR chiede 3 articoli per docente, abbiamo usato anche il metro H<3 per classificare gli “improduttivi” o “assenti”: Essendo sorto il dubbio che gli “improduttivi” o “assenti”, come chiamar si vogliano, siano diversamente concentrati nelle varie università, abbiamo stimato la loro incidenza. rank 1 2 3 4 5 6 7 8 9 10 Ateneo SISSA - TRIESTE Univ, Campus Bio-Medico ROMA S, Raffaele MILANO Politecnica delle MARCHE S,ANNA di PISA PADOVA INSUBRIA PISA MODENA e REGGIO EMILIA BRESCIA Docenti totali 63 Docenti con H-index=0 3 104 93 532 103 2.213 393 1.588 859 566 14 14 78 18 495 110 391 174 139 Docenti con Hindex<3 % % 4,8 5 7,9 13,5 15,1 14,7 17,5 22,4 28,0 24,6 20,3 24,6 28 29 187 37 841 155 642 350 231 26,9 31,2 35,2 35,9 38,0 39,4 40,4 40,7 40,8 11 12 13 14 15 16 17 18 19 20 FERRARA MILANO BOLOGNA PARMA PAVIA NAPOLI Federico II CATANZARO CAMERINO L AQUILA Politecnico di TORINO 645 2.204 2.939 992 1.029 2.695 230 314 603 813 175 496 705 254 274 795 66 91 153 201 27,1 22,5 24,0 25,6 26,6 29,5 28,7 29,0 25,4 24,7 268 931 1.268 432 455 1.197 103 145 283 388 Tab. 5 - Docenti totali, con h-index=0 e inferiore a 3 in Italia nel periodo 2004-2001 per Ateneo. Dati completi a http://italianscientists.blogspot.it/2012/04/la-classifica-delle-universita-in.html La classifica delle Università in funzione del numero (in ordine crescente) di "improduttivi" sembra rispettare abbastanza bene la classifica fatta in precedenza per Hmedio docente, il chè dimostra che il dato è ben correlato. Naturalmente rimane la questione delle materie che hanno troppi "improduttivi", che potrebbero essere in parte falsi "improduttivi". Ma guarda caso, le grandi Università di prestigio rimangono al vertice, anche se hanno molte facoltà umanistiche. Rimane da vedere cosa verrà fuori con ANVUR e VQR. Magari i dati coincideranno e allora sarà stato il nostro un esercizio molto meno costoso di VQR, fatto da 2 sole persone, senza tanta fatica, e sarà una piccola soddisfazione per noi. Salta all'occhio tuttavia la discesa della Bocconi e della Normale di Pisa. Come mai? Notate che abbiamo ordinato per improduttività come H<3, cercando di "mimare" il fatto che VQR raccoglie 3 lavori per docente, e supponendo che almeno 3 lavori esistano, e che siano almeno citati 3 volte l'uno, abbiamo voluto dare una stima veloce. http://italianscientists.blogspot.it/2012/04/la-classifica-delle-universita-in.html Volendo diagrammarli, si nota che esiste un gran numero di Università nella fascia dal 30 al 60% di “improduttivi”, e d'altronde la % media di improduttivi (per H<3) è di ben 52,9%, mentre restando al H=0 avevamo 34.6%. Se proprio dovessimo “abolire il valore legale della laurea”, andrebbe abolito per le università telematiche, che difficilmente posso trovare scusante nel fattore assenza dati “umanistici” del Google Scholar. 41,6 42,2 43,1 43,5 44,2 44,4 44,8 46,2 46,9 47,7 % docenti "improduttivi" con H<3 100,0 90,0 80,0 70,0 60,0 50,0 40,0 30,0 20,0 10,0 0,0 Docenti con h-index < 3 5 3 22 11 47 33 14 24 36 45 8 10 7 11 15 8 14 18 Univ, Telematica Docenti totali 2 132 67 451 182 611 420 177 300 444 553 96 113 76 117 159 82 140 174 Univ, Telematica SSD CHIM/05 CHIM/04 CHIM/10 CHIM/08 MED/15 CHIM/06 CHIM/02 ING-INF/02 MED/08 FIS/03 CHIM/03 BIO/15 BIO/19 GEO/10 FIS/04 MED/12 ING-IND/24 MED/03 FIS/05 Univ, Telematica rank 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 % Docenti con hindex < 3 0,0 3,8 4,5 4,9 6,0 7,7 7,9 7,9 8,0 8,1 8,1 8,3 8,8 9,2 9,4 9,4 9,8 10,0 10,3 UNICUSANO - Ritornando alla questione H<3, una tabella viene inserita di seguito. Stranieri di SIENA SCIENZE L Orientale di Libera Univ, Maria ROMA Foro Italico Universita IUAV di I,U,S,S, - PAVIA ROMA TRE Ca Foscari TERAMO URBINO Carlo BO SALERNO CHIETI-PESCARA BASILICATA PALERMO TRIESTE TRENTO della CALABRIA SASSARI PIEMONTE PERUGIA L AQUILA NAPOLI Federico II BOLOGNA BRESCIA INSUBRIA Politecnica delle SISSA - TRIESTE Fig. 5. Classifica delle Università in base alla % improduttivi in ordine progressivo di “produttività”. 20 FIS/01 898 93 10,4 Tab. 6 - Docenti con h-index inferiore a 3 in Italia nel periodo 2004-2001 per SSD. I primi 20 SSD per “produttività”. Per avere una idea complessiva, il grafico dei SSD è riportato di seguito si divide molto facilmente. Circa la metà dei SSD ha più della metà di docenti con H<3. % Docenti con h-index < 3 100,0 90,0 80,0 70,0 60,0 50,0 40,0 30,0 20,0 10,0 C H IM C /0 H 5 IM C /0 H 3 IM M /0 IN ED 9 G /0 -IN 7 F/ 0 IN BIO 4 G /1 I IN NF 6 G /0 -IN 6 D C /3 H 1 IM VE /12 T M /01 IN ED G /2 IN IND 4 G /0 -IN 6 D G /20 EO IC /11 AR M /0 IN ED 8 G /2 -IN 5 D / BI 08 O AG /08 SE R C /09 SM P/0 SE PS 3 C I/08 SP AG /10 R L- /0 LI 1 N IC /18 A M R/ -E 20 D L- F/0 LI 2 N L- IU /08 FI S L- /0 LE 4 M T/0 -F 9 L- IL/0 AR 6 T/ IU 02 L- S/1 AR 1 L- T/0 AR 4 L- T/0 LI 1 N L- /20 O M R/1 -F 0 IL /0 4 0,0 Fig. 6. Ordinamento dei SSD in base alla % di docenti con H<3. E infine, riotteniamo la tabella delle aree CUN, stavolta per H<3. Area CUN 3 – Scienze chimiche: 2 - Scienze fisiche: 5 - Scienze biologiche: 6 - Scienze mediche: 9 - Ingegneria industriale e dell’informazione: 4 - Scienze della terra: 1 - Scienze matematiche ed informatiche: 7 - Scienze agrarie e veterinarie: 13 - Scienze economiche e statistiche: 8 - Ingegneria civile e Architettura: 11 - Scienze storiche, filosofiche, pedagogiche e psicologiche: 14 - Scienze politiche e sociali: 10 - Scienze dell’antichità, filologico-letterarie e storico- Docenti 3002,0 2334,0 4985,0 10383,0 5216,0 1116,0 3.283 3088,0 4848,0 3658,0 5033,0 1740,0 5490,0 Docenti con hindex < 3 250 300 875 2907 1572 372 1.199 1181 3614 2774 4519 1623 5295 % 8,3 12,9 17,6 28,0 30,1 33,3 36,5 38,2 74,5 75,8 89,8 93,3 96,4 artistiche: 12 - Scienze giuridiche: 4902,0 4792 97,8 Totali 59.078 31.273 52,9 Tab. 7. I docenti “improduttivi” secondo elaborazioni su Scholar Search, anni 2004-2010, database in inglese e italiano. Per aree CUN DISCUSSIONE E CONCLUSIONI I dati di cui in questo articolo sono stati in larga parte presentati sul blog di ItalianScientist, e hanno ricevuto migliaia di letture, commenti su varie mailing list, e critiche o elogi. Ringraziamo tutti gli interventi sul tema, specie i (pochi) documentati e scientifici, e altri che chiedono altri dati, magari confronto con UK o con altri paesi, che certamente sarebbe utile, per quanto difficile. Un primo commento dagli UK ci è arrivato dal Prof. Ponter che è molto pratico della questione RAE ed è stato Pro-Vice Chancellor per molti anni dell’Univ. di Leicester. http://italianscientists.blogspot.it/2012/04/comment-from-prof-alan-ponter-on-vqr.html “I Dipartimenti sono stati messi in grado di scegliere o meno se un particolare accademico è messa nel processo di valutazione. Chi non è inserito, da quel momento non riceve denaro per la ricerca. Tali studiosi devono quindi accettare che il loro ruolo presso il Dipartimento è l'insegnamento e l'amministrazione, rilasciando tempo utile al personale di ricerca attivo.” Le critiche maggiori sono sull’uso di Google Scholar e su quanto esso è comprensivo dei vari settori. C’e’ da distinguere invece l’altro problema, connesso, che anche i settori ben coperti da Google Scholar, mostrano evidenti disparità tra H medi, e che occorre decidere “a priori” se le disparità sono intrinseche (come quelle degli individui, a meno che non vogliamo dire che nemmeno quelle sono da depurare!), o sono in parte intrinseche nel settore disciplinare. La questione che noi trattiamo è solo di analisi di dati su Google Scholar, dando spunti di riflessione su una notevole quantità di dati raccolti su 56 mila docenti italiani, senza pretendere di dare l’ultima parola sul tema, ammesso che esista una tale ultima parola. Chi pensa che gli "improduttivi" o comunque gli "assenti dai database" siano diversamente distribuiti tra università, ha parzialmente ragione, ma da questo a dire che occorre l'abolizione valore legale, che e' quanto vorrebbe fare il governo forse, ce ne passa. Le Telematiche si potrebbe dire, come infatti ha dichiarato il Min Profumo, che dovrebbero fare solo didattica. Si arriverà a distinguere tra “teaching University”, e “Research University”? Ma allora dovremo distinguere anche gli stipendi? Insomma, sembra di andare verso alcune proposte di differenziazione che vengono da Perotti, Giavazzi, la Confindustria. Peccato però che la LUISS, Università della Confindustria, appare piuttosto bassa nelle classifiche! Avete senzaltro visto che quando ordino le univ. italiane per H medio del docente, http://italianscientists.blogspot.it/2012/04/la-classifica-delle-universita-italiane.html le prime vengono univ. serie come S. Raffaele e SISSA e SANTANNA di PISA e PADOVA e PISA, intorno a H=10, mentre le ultime sono le telematiche con H=0. Vorrà dire qualcosa? Se dividiamo per H medio SSD, http://italianscientists.blogspot.it/2012/04/la-classifica-delle-univper-h-medio.html, le prime sono di nuovo Univ. serie, con qualche spostamento, e il valore che ottengo per la prima, BOCCONI, intorno a 2.6, mentre S.Raff 1.9, vuol dire che sono mediamente intorno a 2 volte piu' alti gli H index, a parità di SSD. Ora, abbiamo visto tutti questi H=0, e controllato anche l'assenza di pubblicazioni. Ebbene, non viene chiaro quale settore SSD sarebbe del tutto assente, c'e' una curva continua. La curva continua parte senzaltro dai SSD scientifici in cui GS e' ottimo, e su questo non ci piove anche ANVUR e' daccordo. In altre parole, abbiamo una curva di Hmedio per SSD. E su questo stavamo ragionando: sono curve da normalizzare, perche' alcuni SSD sono avvantaggiati nei database? Pare ragionevole, e lo avevamo fatto. Poi abbiamo visto la curva della percentuale di docenti con H=0 in funzione dell H medio di SSD. La curva e' molto chiara e precisa. Questo vuol dire che, anche se GS avrà dei salti e dei buchi, statisticamente, la questione "scaling" dell'Hmedio, e' intrinsecamente connessa alla presenza di H=0. Attenzione pero'. Se le curve di distribuzione di H o di numero lavori fossero "simili", come altri autori hanno trovato come power law, in modo da scalare per H medio, allora come la media (ossia il valore che superano il 50% dei docenti di un dato SSD), cosi' ogni altro valore di H scala con H medio, cosa non verificata nei ns calcoli, data la correlazione inversa. Ne consegue che normalizzare per H medio non e' tanto valido. Da notare che lo studio di Iglesias et al (2007), già riporta alcune interessanti correlazioni, e in particolare suggerisce dei fattori correttivi per paragonare diversi settori disciplinari ISI. In particolare, preso ?Physics? come riferimento unitario, i fattori in tabella sono da usare per correggere H index in altri settori. Per es. in medicina clinica (fattore 0.76) devo ridurre il valore per correttamente confrontarmi con un fisico, mentre in ingegneria devo molto aumentare il valore (fattore 1.70) per questo confronto. Come ci aspettavamo, in matematica abbiamo il fattore piu? elevato (1.83), mentre se paragoniamo il fattore piu? basso (biologia molecolare, 0.44), con quello piu? alto (matematica), abbiamo un rapporto massimo di correzione di tra un biologo molecolare e un matematico di 0.44/1.83= 0.24, ossia il fattore massimo di differenza puo? essere di 4 volte!! Un biologo molecolare e? avvantaggiato come H index di 4 volte rispetto ad un matematico. Ci attendiamo commenti e spunti di riflessione. Michele Ciavarella. Professore associato al PoliBA, presso la Facoltà di Taranto. Ha lavorato in USA, Francia, UK, Germania e al CNR. Nel comitato editoriale di tre riviste scientifiche, ha pubblicato circa 100 lavori su riviste ISI. Ha un blog. Contatti. Centro di Eccellenza in Meccanica Computazionale. Politecnico di BARI. +39 080 5962811, mob. +393204316816. Humboldt fellow 2010-2012. University TUHH. Germany. http://poliba.academia.edu/micheleciavarella Email: [email protected], [email protected]. Vito Ricci è uno statistico dell’Università degli Studi di Bari Aldo Moro. Dipartimento amministrativo per il coordinamento dell'azione amministrativa con le funzioni di governo. Macro Area: Controllo strategico, Analisi statistica e Programmazione. Area Studi e ricerche. Palazzo ATENEO - P.zza Umberto I, 1 - 70121 BARI Riferimenti Italian Scientists Blog http://italianscientists.blogspot.com/ La classifica delle Università in funzione del num... Circa un terzo dei docenti delle Università italia... la classifica delle Univ per H medio docente norma... La classifica delle Università italiane per H-inde... disomogeneità SSD: ordinati per H-max/H-med I top SSD per H max i SSD ordinati per numerosità di docenti i dati di H index per SSD in ordine alfabetico i Top SSD italiani per H index medio considerazioni sulle varianti di H Index da un ns ... JUAN E. IGLESIAS, CARLOS PECHARROMÁN Scaling the h-index for different scientific ISI fields , Scientometrics, Vol. 73, No. 3 (2007) 303?320 DOI: 10.1007/s11192-007-1805-x