L’Offerta di ricerca ICT in Abruzzo: una proposta metodologica per sviluppare innovazione nella domotica Dott. Ing. Marco Santic, Fondazione MIRROR Dott. Ric. Ing. Luigi Pomante, Università degli Studi dell’Aquila - DEWS Dott. Ric. Ing. Claudia Rinaldi, Università degli Studi dell’Aquila - DEWS 1. Introduzione Questo lavoro, svolto nell’ambito del progetto SMILING (descritto in seguito), presenta l’analisi dei dati relativi all’offerta di ricerca, limitatamente al settore ICT, della regione Abruzzo. In particolare, esso descrive le metodologie adottate per la raccolta e l’analisi dei dati, soffermandosi sugli aspetti automatizzabili e quindi idealmente ripetibili in altre realtà geografiche, al fine di abilitare la possibilità di confronti significativi, e, a seguire, descrive, come possibile esempio applicativo, alcuni dei risultati dell’analisi stessa che permettono quindi di tracciare un quadro, probabilmente non esaustivo, di quella che può essere considerata l’Offerta di Ricerca della Regione Abruzzo nel Settore ICT. Da sottolineare come la metodologia e gli strumenti presentati siano di fatto abilitanti per un analisi più approfondita e mirata in funzione del tipo di analisi di interesse. Prima, però, è opportuno precisare cosa si intende per “offerta di ricerca” e descrivere il contesto nel quale tale attività di raccolta e analisi dei dati è stata svolta. Per quanto riguarda quest’ultimo punto, è sufficiente sottolineare come l’attività in questione sia collocata nell’ambito delle attività del Polo ICT della regione Abruzzo (www.poloictabruzzo.it) che, di fatto, delinea i contorni di tale settore nella regione comprendendo la maggior parte dei soggetti (imprese, università, ecc.) che rappresentano l’ICT abruzzese. In tale dominio, l’analisi qui presentata fa riferimento a quei settori scientifico-disciplinari delle università abruzzesi (AQ, TE, CH-PE) che siano direttamente o indirettamente riconducibili alle attività del Polo e quindi all’ICT. Inoltre, e per concludere la descrizione del contesto, è opportuno sottolineare come l’attività svolta sia anche strettamente correlata con quelle di due progetti RIDITT (http://www.sviluppoeconomico.gov.it) attualmente in corso presso l’Università degli Studi dell’Aquila (rispettivamente presso il Centro di Eccellenza DEWS e il DISIM): SMILING1,2 Il progetto SMILING (SMart In home LIviNG) si pone come obiettivo quello di valorizzare i risultati della ricerca pubblica, mirando ad incrementare le sinergie e sviluppare un sistema collaborativo fra i diversi attori coinvolti (imprese, associazioni, università e centri di trasferimento tecnologico) tale da poter stimolare la realizzazione di nuovi prodotti nel campo domotico. 1 http://smiling.univpm.it 2 http://dews.univaq.it/smiling RICOSTRUIRE3 RICOSTRUIRE è un progetto di trasferimento tecnologico e creazione di nuove imprese nell’ambito ICT avanzato, applicate allo sviluppo economico post sisma in Abruzzo. Il progetto intende valorizzare i risultati della ricerca ottenuti nel settore ICT dall’Università dell’Aquila attraverso la diffusione e il trasferimento di tecnologie al sistema produttivo e la creazione di nuove imprese ad alta tecnologia. Delineato adeguatamente il contesto è quindi possibile precisare il significato di “offerta di ricerca” qui considerato elencando di seguito gli indicatori che, in questa attività, contribuiscono alla definizione di tale significato: Settori scientifico-disciplinari Numero e tipologia di persone che svolge attività di ricerca Numero di pubblicazioni Numero di brevetti e azioni di trasferimento tecnologico Numero di progetti di ricerca Numero e tipologia di laboratori Tali indicatori saranno descritti in seguito con maggiore dettaglio, insieme alla descrizione della metodologia e degli strumenti utilizzati per calcolarli (principalmente legati a elaborazioni banche dati nazionali o a indagine diretta). La visione d’insieme delle informazioni puntuali elencate in precedenza, limitate al settore dell’Information and Communication Technology, inteso come sopra, rappresenta, quindi l’offerta di ricerca che la Regione Abruzzo può esporre, con riferimento al periodo 01/12/2012-31/03/2014 (nel senso che tutti i dati considerati sono aggiornati ad una data compresa in tale intervallo), nel settore ICT. Fornire una visione esaustiva e puntuale di tale offerta, facendo emergere quanto rappresentato da tali informazioni, è l’obiettivo ultimo del lavoro stesso. Il lavoro è strutturato nel seguente modo: la sezione 2 presenta in modo sintetico la metodologia e gli indicatori adottati che verranno ripresi e approfonditi nelle sezioni 3 e 4 mentre, la sezione 5, presenta una valutazione quantitativa degli indicatori stessi ottenuta applicando la metodologia descritta. La sezione 6 presenta quindi una metodologia avanzata volta a superare le limitazioni emerse dall’analisi dei dati ricavati dalla precedente. La sezione 7 conclude il lavoro cercando di riassumere i principali risultati ottenuti. 2. Metodologia e indicatori in breve Come già brevemente descritto, la metodologia utilizzata per analizzare l’offerta di ricerca ICT della regione Abruzzo prevede i seguenti passi: 1. Individuazione dei settori scientifico-disciplinari (SSD) delle università abruzzesi (AQ, TE, CHPE) caratterizzati da attività di ricerca riconducibile al settore ICT 2. Individuazione degli strumenti da utilizzare per la raccolta dei dati: banche dati nazionali (ove disponibili), indagine diretta (ove possibile) 3 http://ricostruire.org 3. Calcolo dei seguenti indicatori: Insieme dei settori scientifico-disciplinari caratterizzati da attività di ricerca riconducibile al settore ICT L’indicatore permette di circoscrivere le successive analisi ai soli elementi di interesse Numero e tipologia di persone che svolge ufficialmente attività di ricerca riconducibile al settore ICT L’indicatore permette di valutare il numero di professori, ricercatori, assegnisti (e, ove possibile, dottorandi e borsisti) coinvolti e la distribuzione degli stessi nei confronti dei SSD individuati al punto precedente Numero di pubblicazioni riconducibili al settore ICT L’indicatore prende in considerazione il numero di pubblicazioni su libro, su rivista e a conferenza Numero di brevetti e azioni di trasferimento tecnologico riconducibili al settore ICT L’indicatore mette in evidenza la capacità di valorizzazione e finalizzazione della ricerca scientifica Numero di progetti di ricerca riconducibili al settore ICT L’indicatore permette di valutare le partecipazioni a bandi regionali, nazionali ed europei Numero e tipologia di laboratori riconducibili al settore ICT L’indicatore permette di valutare la disponibilità di strumentazione scientifica e competenze tecniche sul territorio 3. Metodologia Come già detto, la metodologia utilizzata è basata sulla selezione dei settori scientifico-disciplinari caratterizzati da attività di ricerca riconducibile al settore ICT, al fine di circoscrivere le analisi ai soli elementi di interesse, e sull’uso di opportuni strumenti per la consultazione di banche dati nazionali o lo svolgimento di indagini dirette. Questo paragrafo fornisce quindi ulteriori indicazioni a riguardo. In particolare, vengono elencati I settori scientifico-disciplinari considerati di interesse e gli strumenti (nel senso di banca dati accessibile tramite un sito web) utilizzati. 3.1. Settori scientifico disciplinari Sulla base di un’analisi preliminare già svolta nel contesto del progetto SMILING sono stati individuati i settori scientifico-disciplinari delle università abruzzesi (AQ, TE, CH-PE) caratterizzati da attività di ricerca riconducibile al settore ICT. Tali settori sono di seguito elencati (in ordine alfabetico): CHIM/04 CHIMICA INDUSTRIALE ING-IND/32 CONVERTITORI, MACCHINE E AZIONAMENTI ELETTRICI CHIM/07 FONDAMENTI CHIMICI DELLE TECNOLOGIE IND/33 SISTEMI ELETTRICI PER L'ENERGIA FIS/01 FISICA SPERIMENTALE ING-INF/01 ELETTRONICA FIS/03 FISICA DELLA MATERIA ING-INF/02 CAMPI ELETTROMAGNETICI INF/01 INFORMATICA ING-INF/03 TELECOMUNICAZIONI ING-IND/08 MACCHINE A FLUIDO ING-INF/04 AUTOMATICA ING-IND/09 SISTEMI PER L'ENERGIA E L'AMBIENTE ING-INF/05 SISTEMI INFORMAZIONI ING-IND/10 FISICA TECNICA INDUSTRIALE ING-INF/06 BIOINGEGNERIA ELETTRONICA E INFORMATICA ING-IND/14 PROGETTAZIONE MECCANICA E COSTRUZIONE DI MACCHINE MAT/09 RICERCA OPERATIVA ING-IND/15 DISEGNO INDUSTRIALE MED/32 AUDIOLOGIA E METODI DELL'INGEGNERIA ING-IND/22 SCIENZA E TECNOLOGIA DEI MATERIALI DI ELABORAZIONE DELLE MED/36 DIAGNOSTICA PER IMMAGINI E RADIOTERAPIA ING-IND/31 ELETTROTECNICA 3.2. Strumenti Nel lavoro in questione, oltre all’indagine diretta sono state utilizzate le banche dati nazionali accessibili tramite i seguenti siti (maggiori dettagli saranno forniti contestualmente alla descrizione del loro utilizzo): http://cercauniversita.cineca.it (Figura 1) Figura 1. Sito CercaUniversità Cineca 4. Indicatori Questo paragrafo descrive come, applicando la metodologia definita in precedenza e utilizzando gli strumenti a disposizione, sia possibile raccogliere le informazioni necessarie per calcolare gli indicatori precedentemente elencati. Tali informazioni sono state raccolte nella base dati OffertaRicercaICTAbruzzo grazie alla quale, tramite opportune interrogazioni della stessa, sarà possibile poi associare dei valori quantitativi agli indicatori stessi (cfr. paragrafo 5). 4.1. Numero e tipologia di persone che svolgono ufficialmente attività di ricerca riconducibile al settore ICT Tale indicatore permette di valutare il numero di professori, ricercatori, assegnisti (e, ove possibile, dottorandi e borsisti) coinvolti e la distribuzione degli stessi nei confronti dei SSD di interesse. 4.1.1. Professori e ricercatori Sorgente dati: http://cercauniversita.cineca.it Sono stati estrapolati dal sito cercauniversita.cineca.it tutti gli elenchi del personale docente proveniente dalle province di AQ, TE, PE-CH con i seguenti dati (come da categorizzazione Cineca): Fascia (“ordinario”, “associato”, “ricercatore”,...) Cognome e Nome Facoltà (anche “nessuna afferenza”) SSD, settore scientifico-disciplinare (come da classificazione Cineca) SC, settore concorsuale Dipartimento I campi di cui sopra sono ri-tracciabili direttamente dal sito, quindi facilmente allineabili alla banca dati Cineca anche in periodi successivi a quello considerato. La procedura prevede interrogazioni separate per le diverse province, che hanno reso possibile la categorizzazione con l'ulteriore campo (non previsto direttamente da Cineca): UNI, che assume quindi i valori AQ TE PE/CH (“PC”) I dati raccolti sono stati quindi utilizzati per popolare opportune tabelle nella base dati OffertaRicercaICTAbruzzo e tenuti in considerazione per le analisi successive. 4.1.2. Assegnisti di ricerca Sorgente dati: http://cercauniversita.cineca.it Sono stati estrapolati dal sito cercauniversita.cineca.it tutti gli elenchi degli assegnisti di ricerca proveniente dalle province di AQ, TE, PE-CH con i seguenti dati (come da categorizzazione Cineca): Qualifica (“assegnista”) Cognome e Nome Facoltà (anche “nessuna afferenza”) Area (come da classificazione Cineca) SSD, settore scientifico-disciplinare (come da classificazione Cineca) Dipartimento Argomento della ricerca I campi di cui sopra sono ri-tracciabili direttamente dal sito, quindi facilmente allineabili alla banca dati Cineca anche in periodi successivi a quello considerato. La procedura prevede interrogazioni separate per le province, che hanno reso possibile la categorizzazione con l'ulteriore campo (non previsto direttamente da Cineca): UNI, che assume quindi i valori AQ TE PE/CH (“PC”) 4.1.3. Studenti di dottorato Sorgente dati: indagine diretta e http://cercauniversita.cineca.it (con necessità di elaborazione manuale) Un primo tentativo di raccolta dati per indagine diretta, utilizzando gli appositi uffici dottorati delle diverse università, ha portato a riscontare un’oggettiva difficoltà nel reperire dati puntuali ed uniformi. Si è quindi passato ad utilizzare la banca dati di Cineca riguardo i corsi di dottorato attivi. Per ogni istituto e per gli ultimi tre cicli di dottorato (cioè quelli che sono “in essere”), sono stati estratti tutti i Corsi di Dottorato che avessero tra i settori (SSD) coinvolti almeno uno tra quelli individuati come di interesse. In particolare, dal sito Cineca sono stati considerati le seguenti informazioni: Ateneo (AQ, TE, PE-CH) Ciclo (XXVI, XXVII, XXVIII) Nome corso Posti potenziali Posti banditi SSD percentuale SSD Da tali dati si evince che: ciascun corso ha un numero di posti potenziali e banditi; ciascun corso ha una percentuale di coinvolgimento per gli SSD trattati. Si è quindi potuto procedere alla: suddivisione dei posti su percentuale degli SSD; riaggregazione per gli SSD di interesse per avere uno numero virtuale di dottorandi per SSD. I dati sono stati poi elaborati in fogli di calcolo e caricati in opportune tabelle del database OffertaRicercaICTAbruzzo. Da segnalare che nella fase di elaborazione è necessario identificare e modificare manualmente diverse disomogeneità nel formato dei dati. Questo rende la procedura particolarmente onerosa e non immediatamente ripetibile. 4.1.4. Borse di studio per attività di ricerca Sorgente dati: indagine diretta Un primo tentativo di raccolta dati per indagine diretta, contattando uffici di diversa natura, ha portato a riscontare un’oggettiva difficoltà nel reperire dati puntuali ed uniformi. Si è quindi deciso di non considerare tali figure. 4.1.5. Aggregazione di professori, ricercatori e assegnisti I dati raccolti, relativamente alle figure di professore, ricercatore e assegnisti sono stati quindi utilizzati per creare opportune tabelle aggregate nella base dati OffertaRicercaICTAbruzzo al fine di meglio supportare le analisi successive. Questa operazione ha reso però necessari alcuni “adattamenti” alle codifiche utilizzate nel sito Cineca per distinguere fasce, qualifiche e ruoli. Per una semplificazione della nomenclatura sui diversi ruoli, si è quindi definito un unico campo con 3 valori possibili: “DOC”, “RIC” e “ASS”. Tale operazione ha permesso di uniformare i campi utilizzati nel sito Cineca pur mantenendo concettualmente separate le origini dei dati. Dall’unione di professori, ricercatori e assegnisti è stata quindi è stata fatta un'associazione con gli identificativi sopra definiti come riportato in Tabella 1. DOC DOC DOC DOC DOC DOC RIC RIC RIC ASS Ordinario Associato confermato Associato non confermato Straordinario Incaricato Assistente r.e. Ricercatore Ricercatore non confermato Ricercatore tempo determinato Assegnista di ricerca Tabella 1. Identificazione uniforme di fasce, qualifiche e ruoli Cineca Da sottolineare come nell’unione dei dati non siano stati contemplati quelli relativi ai dottorandi e i borsisti per un motivo ben preciso: la necessità di operazioni manuali e l’oggettiva difficoltà nel reperire parte dei dati non renderebbero i risultati, ottenuti da analisi effettuate sull’unione degli stessi, ripetibili e confrontabili in periodi di tempo o realtà geografiche diverse. Questo non implica però che non siano possibili analisi limitate ai dottorandi (o ai borsisti, ove I dati fossero disponibili). A questo punto, con gli schemi e le tabelle precedentemente elencati, e con le limitazioni evidenziate, i dati su numero e tipologia di persone che svolgono ufficialmente attività di ricerca riconducibile al settore ICT nell’ambito accademico abruzzese posso essere aggregati costituendo la base di una sorta di tabella anagrafica. In particolare, in relazione alla sorgente dati Cineca, valgono i seguenti importanti punti che caratterizzano la base dati OffertaRicercaICTAbruzzo: Tracciabilità I dati si possono facilmente risincronizzare con gli eventuali aggiornamenti che possono avvenire alla sorgente Viste di aggregazione Non ci si è vincolati a strutture tabellari o relazionali rigide prima di aver definito uno schema globale 4.2. Numero di pubblicazioni riconducibili al settore ICT Tale indicatore prende in considerazione il numero di pubblicazioni su libro, su rivista e a conferenza e permette di associarle alle persone che svolgono ufficialmente attività di ricerca riconducibile al settore ICT nell’ambito accademico abruzzese. Sorgente dati: indagine diretta Prendendo come riferimento l’aggregazione dei dati di cui al 4.1.5 è stata eseguita un’indagine diretta sui curricula scientifici delle persone associate agli SSD di interesse. L'ordine di ricerca, anche in maniera combinata, è stato: archivi e documenti pubblici dal web, richiesta via e-mail. Le pubblicazioni sono considerate solo in numero totale in quanto, per le limitazioni dovute all’indagine diretta e all’analisi manuale dei dati ottenuti, non è stato possibile applicare divisioni per anno o argomento. I relativi dati sono stati inseriti in un’opportuna tabella della base di dati OffertaRicercaICTAbruzzo. 4.3. Numero di brevetti e azioni di trasferimento tecnologico riconducibili al settore ICT Tale indicatore mette in evidenza la capacità di valorizzazione e finalizzazione della ricerca scientifica da parte dei soggetti accademici abruzzesi attivi nel settore ICT. 4.3.1. Brevetti Sorgente dati: siti istituzionali delle università (con necessità di elaborazione manuale) Dai siti istituzionali delle università sono stati identificati i brevetti e vi sono stati associati manualmente degli identificativi SSD. I dati risultanti, relativi agli SSD di interesse, sono stati conteggiati e raggruppati in formato tabellare. Infine, i dati sono stati inseriti nella base di dati OffertaRicercaICTAbruzzo. 4.3.2. Attività di trasferimento tecnologico Sorgente dati: indagine diretta Per quanto riguarda le azioni di trasferimento tecnologico, sono stati contattati gli uffici “Settore trasferimento tecnologico” (o equivalenti) delle università abruzzesi e i dati sono stati estratti manualmente dalla documentazione disponibile fornita dagli uffici stessi. Si è cercato di uniformare i formati e di conteggiare le seguenti voci: Progetti nazionali di trasferimento tecnologico (partecipazione a) Partecipazione a consorzi Spin-Off (attività di sostenimento, collaborazioni, progetti) Contratti di cessione di know-how Contratti di trasferimento tecnologico con le imprese I dati risultanti, relativi agli SSD di interesse, sono stati conteggiati e raggruppati in formato tabellare. Infine, tali dati sono stati inseriti nella base di dati OffertaRicercaICTAbruzzo. 4.4. Numero di progetti di ricerca riconducibili al settore ICT Tale indicatore permette di valutare le partecipazioni a bandi regionali, nazionali ed europei delle varie università abruzzesi attive nel settore ICT. Sorgente dati: indagine diretta Sono stati contattati gli uffici preposti delle diverse università per ottenere informazioni sui progetti tramite schede di dettaglio e nominativi dei responsabili. Sono quindi stati riorganizzati i dati che riguardano i diversi progetti, assegnando ad ogni progetto l’SSD del responsabile (quando disponibile), e raccolti in formato tabellare suddividendoli in funzione della tipologia di progetto. Infine, i dati sono stati inseriti nella base di dati OffertaRicercaICTAbruzzo. 4.5. Numero e tipologia di laboratori riconducibili al settore ICT Tale indicatore permette di valutare la disponibilità di strumentazione scientifica e competenze tecniche sul territorio. Sorgente dati: siti istituzionali delle università (con necessità di elaborazione manuale) Sono stati individuati i laboratori presenti nelle strutture dei diversi atenei e i relative dati sono stati raccolti in formato tabellare. Successivamente è stato individuato ed assegnato, per ciascun laboratorio, un SSD in base al nominativo del responsabile, ove questo non fosse già esplicito nella descrizione. Infine, i dati sono stati inseriti in un’opportuna tabella della base di dati OffertaRicercaICTAbruzzo. 5. Valutazione quantitativa degli indicatori Questo paragrafo, per mezzo di opportune interrogazioni della base di dati OffertaRicercaICTAbruzzo, composta dalle tabelle descritte nel paragrafo 4, permette di valutare in modo quantitativo gli indicatori precedentemente elencati. È da sottolineare come la possibilità di interrogare una base di dati permetta di estrapolare dati statistici di varia natura. Il paragrafo riporta quindi quelli ritenuti più significativi ma che non vogliono assolutamente essere esaustivi delle analisi che possono essere di interesse. Purtroppo però, va anche evidenziato come, per molti indicatori (esplicitamente indicati nel seguito), ci sia stata un’oggettiva difficoltà nel reperire informazioni complete in modo sistematico. La conseguenza è che molte delle valutazioni ottenute sono necessariamente da considerare parziali e, quindi, da considerare con la dovuta cautela in sede di un’analisi d’insieme dei risultati e un confronto degli stessi con altre statistiche similari (di altri periodi o di altre realtà geografiche) 5.1. Numero e tipologia di persone che svolgono ufficialmente attività di ricerca riconducibile al settore ICT Tale indicatore permette di valutare il numero di professori, ricercatori, assegnisti (e, ove possibile, dottorandi e borsisti) coinvolti e la distribuzione degli stessi nei confronti dei SSD di interesse. 5.1.1. Studenti di dottorato Per quanto riguarda i corsi di dottorato selezionati, comprendenti SSD sia di interesse che non di interesse, complessivamente sono state caricate 329 tuple. Esempio di interrogazione statistica: “Corsi di dottorato e SSD di interesse” L’interrogazione relativa i corsi di dottorato riguardanti i soli SSD di interesse produce come risultato 102 tuple. Esempio di interrogazione statistica: “Dottorandi ciclo e ateneo” Ricordando che ciascun corso ha un numero di posti potenziali e banditi e che ciascun corso ha una percentuale di coinvolgimento per gli SSD, si è quindi potuto procedere alla suddivisione dei posti su percentuale degli SSD e successive riaggregazione per gli SSD di interesse per generare un numero virtuale di dottorandi per SSD (per ciclo e per ateneo). I risultati sono riportati in Tabella 2. Ateneo Ciclo TotPotenziali TotBanditi AQ 26 54.05 31.75 AQ 27 52.05 28.61 AQ 28 56.90 25.18 CP 26 1.79 1.79 CP 27 1.89 1.89 CP 28 1.78 1.78 TE 26 0.72 0.72 Tabella 2. Esempio di interrogazione statistica: “Dottorandi ciclo e ateneo” Esempio di interrogazione statistica: “Dottorandi e SSD” Esempio di interrogazione aggregativa rispetto agli SSD di interesse che produce il risultato riportato in Tabella 3. Ssd TotPotenziali TotBanditi CHIM/07 3.66 1.30 FIS/01 12.02 8.15 FIS/03 9.63 7.49 INF/01 28.66 17.62 ING-IND/08 1.80 0.60 ING-IND/09 7.74 2.88 ING-IND/10 5.77 2.24 ING-IND/14 4.32 1.64 ING-IND/15 5.94 2.18 ING-IND/22 9.90 4.10 ING-IND/31 6.81 3.25 ING-IND/32 12.04 5.30 ING-IND/33 5.47 2.35 ING-INF/01 5.46 2.95 ING-INF/02 4.06 2.05 ING-INF/03 6.06 4.01 ING-INF/04 9.35 6.47 ING-INF/05 12.53 7.40 MAT/09 8.00 4.36 MED/36 9.96 5.38 Tabella 3. Esempio di interrogazione statistica: “Dottorandi e SSD” Da notare come siano presenti dottorandi in 20 dei 23 SSD di interesse. 5.1.2. Aggregazione di professori, ricercatori e assegnisti La vista aggrega complessivamente 1788 record. Esempio di interrogazione statistica: “Nominativi di interesse” Estrazione dell'elenco dei nominativi di tutte le persone coinvolte nella ricerca e produzione scientifica, per i soli settori (SSD) di interesse per la ricerca. Il conteggio delle tuple risultanti è di 154. Esempio di interrogazione statistica: “Conteggio aggregativo” A partire dall'elenco dei nominativi di interesse si può produrre una tabella che evidenzi l'università di appartenenza, il SSD e il ruolo, ottenendo 54 tuple (Tabella 4). Uni Fig SSD Uni Num Fig SSD Num AQ ASS CHIM/07 3 AQ ASS CHIM/07 3 AQ ASS FIS/03 4 AQ ASS FIS/03 4 AQ ASS INF/01 6 AQ ASS INF/01 6 AQ ASS ING-IND/09 2 AQ ASS ING-IND/09 2 AQ ASS ING-IND/10 1 AQ ASS ING-IND/10 1 AQ ASS ING-IND/22 2 AQ ASS ING-IND/22 2 AQ ASS ING-IND/31 3 AQ ASS ING-IND/31 3 AQ ASS ING-INF/03 1 AQ ASS ING-INF/03 1 AQ ASS ING-INF/04 3 AQ ASS ING-INF/04 3 AQ ASS MAT/09 1 AQ ASS MAT/09 1 AQ DOC CHIM/07 2 AQ DOC CHIM/07 2 AQ DOC FIS/01 7 AQ DOC FIS/01 7 AQ DOC FIS/03 5 AQ DOC FIS/03 5 AQ DOC INF/01 9 AQ DOC INF/01 9 DOC ING-IND/08 1 AQ DOC ING-IND/08 1 AQ AQ DOC ING-IND/09 3 AQ DOC ING-IND/09 3 AQ DOC ING-IND/10 2 AQ DOC ING-IND/10 2 AQ DOC ING-IND/14 1 AQ DOC ING-IND/14 1 AQ DOC ING-IND/15 1 AQ DOC ING-IND/15 1 AQ DOC ING-IND/22 6 AQ DOC ING-IND/22 6 AQ DOC ING-IND/31 4 AQ DOC ING-IND/31 4 AQ DOC ING-IND/32 5 AQ DOC ING-IND/32 5 AQ DOC ING-IND/33 2 AQ DOC ING-IND/33 2 AQ DOC ING-INF/01 3 AQ DOC ING-INF/01 3 DOC ING-INF/02 2 AQ DOC ING-INF/02 2 AQ AQ DOC ING-INF/03 2 AQ DOC ING-INF/03 2 AQ DOC ING-INF/04 6 AQ DOC ING-INF/04 6 AQ DOC ING-INF/05 6 AQ DOC ING-INF/05 6 AQ DOC MAT/09 2 AQ DOC MAT/09 2 AQ DOC MED/36 2 AQ DOC MED/36 2 Tabella 4. Esempio di interrogazione statistica: “Conteggio aggregativo” Esempio di interrogazione statistica: “Conteggio aggregativo completo” Al fine di poter creare grafici o diagrammi è possibile considerare l'interrogazione precedente nella sua completezza, cioè esponendo anche le tuple che contengono uno conteggio nullo per i nominativi. In tal modo, si ottengono le 207 tuple rappresentate in Figura 2. Figura 2. Esempio di interrogazione statistica: “Conteggio aggregativo completo” Opportunamente riorganizzando le tuple con diverse condizioni è possibile creare ulteriori grafici di esposizione. 5.2. Numero di pubblicazioni riconducibili al settore ICT Tale indicatore prende in considerazione il numero di pubblicazioni su libro, su rivista e a conferenza e permette di associarle alle persone che svolgono ufficialmente attività di ricerca riconducibile al settore ICT nell’ambito accademico abruzzese. Ricordando che le pubblicazioni sono considerate solo in numero totale in quanto, a causa delle limitazioni dovute all’indagine diretta e all’analisi manuale dei dati ottenuti, segue un possibile esempio di interrogazione. Esempio di interrogazione statistica: “Conteggio aggregativo per SSD” SSD tot CHIM/07 Pubblicazioni Abruzzo per SSD 131 FIS/01 539 FIS/03 1263 INF/01 1857 CHIM/07 FIS/01 FIS/03 ING-IND/08 0 ING-IND/09 77 INF/01 ING-IND/08 ING-IND/10 340 ING-IND/09 ING-IND/14 60 ING-IND/10 ING-IND/14 ING-IND/15 ING-IND/15 60 ING-IND/22 577 ING-IND/22 ING-IND/31 431 ING-IND/32 342 ING-IND/33 120 ING-IND/31 ING-IND/32 ING-IND/33 ING-INF/01 357 ING-INF/02 305 ING-INF/01 ING-INF/02 ING-INF/03 ING-INF/03 55 ING-INF/04 ING-INF/04 929 ING-INF/05 506 MAT/09 144 ING-INF/05 MAT/09 MED/32 MED/32 0 MED/36 1787 MED/36 Figura 3. Esempio di interrogazione statistica: “Conteggio aggregativo per SSD” 5.3. Numero di brevetti e azioni di trasferimento tecnologico riconducibili al settore ICT Tale indicatore mette in evidenza la capacità di valorizzazione e finalizzazione della ricerca scientifica da parte dei soggetti accademici abruzzesi attivi nel settore ICT. 5.3.1. Brevetti Dal sito dell'Ateneo dell'Aquila sono stati individuati i brevetti e vi sono stati associati manualmente gli identificativi degli SSD di competenza (in base alla tipologia di brevetto e/o al SSD “dominante” dei titolari del brevetto stesso). I dati risultanti, relativi ai SSD di interesse, sono riportati in Tabella 5. BREVETTI UNIVAQ FIS/01 ING-IND/22 3 ING-INF/01 2 ING-INF/02 3 1 Tabella 5. Brevetti dell’Università degli Studi dell’Aquila Al momento non sono state considerate altre università. Per un’estensione significativa della valutazione sarebbe prima opportuno raffinare la metodologia definendo un meccanismo preciso per l’associazione dei brevetti ai SSD. 5.3.2. Attività di trasferimento tecnologico Per quanto riguarda le attività di trasferimento tecnologico, i dati sono stati estratti manualmente dalle relazioni annuali di attività fornite dall'omonimo ufficio dell’Università degli Studi dell’Aquila. I dati sono riportati in forma tabellare per il periodo 2006-2012 (Tabella 6). AZ IO NI s ettore T ras ferimento T ecnologico P rogetti Nazionali P artecipazioni a C onsorzi S pin O ff C ontratti di ces s ione di know how C ontratti con le impres e 2006 5 1 2 2 2 2007 2 n.p. n.p. n.p. n.p. 2008 4 64 11 n.p. 36 2009 4 65 11 n.p. n.p. 2010 5 51 10 n.p. n.p. 2011 n.p. n.p. n.p. n.p. n.p. 2012 3 85 10 n.p. n.p. Tabella 6. Attività di trasferimento tecnologico dell’Università degli Studi dell’Aquila A causa della necessità di indagine diretta e stretti rapporti con gli uffici di competenza, al momento non sono state considerate altre università. Per un’estensione significativa della valutazione sarebbe prima opportuno raffinare la metodologia definendo un meccanismo preciso per la gestione di informazioni potenzialmente eterogenee. 5.4. Numero di progetti di ricerca riconducibili al settore ICT Tale indicatore permette di valutare le partecipazioni a bandi regionali, nazionali ed europei delle varie università abruzzesi attive nel settore ICT. Per raccogliere i dati relativi ai progetti in questione sono stati contattati gli uffici preposti delle diverse università per ottenere le informazioni rilevanti. Sfortunatamente, dopo diversi tentativi, si sono avuti degli incontri e informazioni solo dall'ateneo dell'Aquila. Inoltre, solo di alcuni progetti sono disponibili informazioni approfondite (schede di dettaglio e nominativi dei responsabili) mentre per altri non è stato possibile risalire a tali informazioni. Il resto del paragrafo riporta quindi le informazioni, relative alla sola Università degli Studi dell’Aquila, per le sole tipologie di progetti di cui si sono avute sufficienti informazioni. Progetti CARISPAQ (regionali) Caratteristiche dei dati ottenuti e riportati in Tabella 7 (in questo caso i dati riportati sono relativi a tutti gli SSD): conteggio dal 2004 al 2012; suddivisione per area scientifica (come da classificazione Cineca). AREA 01 02 Sc. Mat. Sc. Fis. 2004 2005 2006 2007 2008 2009 2010 2011 2012 1 03 Sc. Chim. 1 1 11 10 12 Sc. Sc. 07 08 09 Sc. Storiche, 05 06 Sc. Agr. Ing. Civ Ing. Ind. Antichità Filos. Giuridich Sc. Bio. Sc. Med. Sc. Vet. Ed Arch. E dell'Inf. Filo-let e e Pedag. sto-art E Psico. 2 2 1 1 2 1 1 1 1 2 1 3 1 1 1 2 13 Sc. CETEMP Mecc/En Econ. S erg/Gest E Stat. 1 1 1 1 1 1 1 1 1 1 1 Tabella 7. Progetti CARISPAQ Progetti PRIN (nazionali) Caratteristiche dei dati ottenuti e riportati in Tabella 8 (in questo caso i dati riportati sono relativi a tutti gli SSD): conteggio dal 2004 al 2010/11; suddivisione per area scientifica (come da classificazione Cineca); suddivisione per tipologie “A” (coordinamento nazionale) e “B” (coordinamento locale). AREA 2004 2005 2006 2007 2008 2009 2010/11 01 Sc. Mat. 02 Sc. Fis. A A B 03 Sc. Chim. B A 05 Sc. Bio. B A B 2 4 1 1 3 7 1 1 2 2 1 1 1 1 2 3 2 2 1 1 6 1 3 1 A A B B 2 08 Ing. Civ Ed Arch. 09 Ing. Ind. E dell'Inf. A A 2 B 7 B 10 11 12 Sc. Antichità Sc. Storiche, Sc. Filo-let e sto- Filos. Pedag. Giuridiche art E Psico. A B A B A B 5 1 9 1 1 9 2 1 5 7 1 3 1 3 1 4 1 5 2 2 1 6 1 2 1 1 2 6 2 1 1 2 4 1 06 Sc. Med. 07 Sc. Agr. Sc. Vet. 8 3 1 1 4 14 2 1 1 7 3 2 3 3 2 13 Sc. Econ. E Stat. A B 1 2 1 1 1 1 1 1 2 4 1 1 Tabella 8. Progetti PRIN Progetti FIRB (nazionali) Caratteristiche dei dati ottenuti e riportati in Tabella 9 (in questo caso i dati riportati sono relativi a tutti gli SSD): conteggio dal 2008 al 2012; suddivisione per area scientifica (come da classificazione Cineca); suddivisione per tipologie “A” (coordinamento nazionale) e “B” (coordinamento locale). AREA 2008 2009 2010 2011 2012 01 Sc. Mat. 02 Sc. Fis. A A B 03 Sc. Chim. B A B 05 Sc. Bio. 06 Sc. Med. 07 Sc. Agr. Sc. Vet. 08 Ing. Civ Ed Arch. A A A A B B B 09 Ing. Ind. E dell'Inf. B A 1 1 1 1 B 1 11 Sc. Storiche, Filos. Pedag. E Psico. A B 10 Sc. Antichità Filo-let e sto-art A B 1 12 Sc. Giuridiche A B 13 Sc. Econ. E Stat. A B 1 1 1 Tabella 9. Progetti FIRB Progetti CORDIS (internazionali) I dati ottenuti, per i quali non sono disponibili ulteriori dettagli riguardo periodo di riferimento e SSD del responsabile, sono riportati in Tabella 10. CORDIS TOT FP6 18 FP7 22 Altri 5 Cooperazione Territoriale 5 TEMPUS 8 Tabella 10. Progetti CORDIS 5.5. Numero e tipologia di laboratori riconducibili al settore ICT Tale indicatore permette di valutare la disponibilità di strumentazione scientifica e competenze tecniche sul territorio. Sono stati elencati i laboratori presenti nelle strutture dei diversi atenei, in particolare dell'Aquila. I dati di circa 300 laboratori sono poi stati caricati nel base di dati OffertaRicercaICTAbruzzo. Esempio di interrogazione statistica: “Laboratori per SSD” Un’interrogazione per evidenziare i laboratori dei soli SSD di interesse riporta 43 risultati. Il dato aggregato sugli SSD è riportato in Tabella 11 CHIM/07 FIS/01 FIS/03 INF/01 ING-IND/10 ING-IND/15 ING-IND/22 ING-IND/31 ING-IND/32 ING-IND/33 ING-INF/01 ING-INF/02 ING-INF/03 ING-INF/04 MAT/09 MED/36 1 7 9 4 2 1 4 2 3 1 1 2 2 2 1 1 Tabella 11. Esempio di interrogazione statistica: “Laboratori per SSD” 6. Metodologia avanzata Da un’analisi preliminare della qualità dei risultati ottenuti e riportati in precedenza, risulta evidente come, questi, siano soggetti a limitazioni derivanti dalla frequente necessità di indagini dirette (con carenze e difformità di contenuti) ed elaborazioni in parte manuali dei dati. Questo, limita notevolmente la possibilità di estendere rapidamente le analisi svolte a contesti o aree geografiche diverse e di fare eventuali confronti di diverse realtà. Per superare queste limitazioni, seppur dovendone accettare altre descritte in seguito, questa sezione propone un approccio alternativo (chiamato appunto Metodologia avanzata) per la valutazione di diversi indicatori. Tale approccio, automatizzato e ripetibile al meglio degli strumenti ad oggi disponibili permetterà inoltre di poter estrapolare indicatori aggiuntivi, descritti di seguito, di rilevante interesse. Inoltre, il tutto, come detto sopra, sarà facilmente ripetibile in diversi tipologie di contesti e quindi utile per analisi comparative. Quanto proposto in seguito è da intendersi quindi come un approccio alternativo a quanto già esposto in sezione 4.2. Segue quindi la descrizione degli strumenti adottati, degli indicatori considerati e una descrizione puntuale della metodologia stessa. 6.1. Strumenti In questo approccio alternativo si vuole, per prima cosa, eliminare la necessità di indagine diretta, utilizzando quindi esclusivamente le banche dati nazionali accessibili tramite i seguenti siti (maggiori dettagli saranno forniti contestualmente alla descrizione del loro utilizzo): http://cercauniversita.cineca.it (Figura 4) Figura 4. Sito CercaUniversità Cineca www.scopus.com (Figura 5) Figura 5. Sito SCOPUS La scelta di SCOPUS è dovuta ad un compromesso tra “ricchezza” di contenuti del DB e formato di uscita dei dati. Infatti, la non completezza dei DB, è uno dei limiti principali della procedura automatica (nel senso che non compaiono tutte le pubblicazioni di una data persona ma solo un determinato sottoinsieme). Altri DB possono fornire insiemi diversi che, in teoria, potrebbero permettere di ampliare il sottoinsieme considerato. Tuttavia, questo può portare ad un insieme di formati di dati difficilmente gestibile in contemporanea e in automatico. Di conseguenza, la scelta di utilizzare SCOPUS rappresenta secondo un’analisi delle caratteristiche di vari DB la giusta via di mezzo. Per completezza, riportiamo di seguito i principali DB che possono essere considerati in sostituzione (o in appoggio) ed eventualmente integrati in futuro: http://www.dblp.org/ http://academic.research.microsoft.com/ http://scholar.google.it 6.2. Indicatori Come detto in precedenza, il principale indicatore che si vuole ricavare, stavolta automaticamente (cioè senza la necessità di indagine diretta e data entry manuale), con la nuova metodologia è il numero di pubblicazioni del settore ICT riconducibili a persone impegnate nel campo della ricerca nelle università abruzzesi (in sostanza quanto già riportato in 5.2). Tuttavia, dato che la nuova metodologia permette anche di creare automaticamente basi di dati in grado di legare tra loro informazioni rilevanti, sarà possibile anche estrapolare indicatori relativi alle collaborazioni tra le persone di cui sopra e, elemento ancora più interessante, quelle che possono essere definite le parole chiave che caratterizzano la ricerca del settore ICT in Abruzzo (si noti che, essendo basata sugli SSD, l’analisi può essere facilmente scalata a livello nazionale). Con la disponibilità di parole chiave significative sarà successivamente possibile effettuare ricerche relative ad esse (incrociandole con altri elementi di interesse) sulle banche dati nazionali (e internazionali) ottenendo, sempre in modo automatico, la possibilità di valutare indicatori di svariata natura. Ad esempio sarà possibile evidenziare le migliori parole chiave per pubblicazioni frutto di collaborazioni tra particolari SSD. Il tutto, come detto sopra, in modo facilmente ripetibile in diversi tipologie di contesti e utile per analisi comparative. Riepilogando, gli indicatori considerati per mettere a punto la metodologia sono i seguenti: numero di pubblicazioni del settore ICT riconducibili a persone impegnate nel campo della ricerca nelle università abruzzesi; numero di pubblicazioni del settore ICT riconducibili a persone impegnate nel campo della ricerca nelle università abruzzesi raggruppate per SSD; sopracitate pubblicazioni raggruppabili o numerabili per anno o periodo storico; numero di articoli scritti in collaborazione tra gli SSD di cui sopra; parole chiave maggiormente utilizzate nelle pubblicazioni identificate. 6.3. La metodologia Definiti gli strumenti e gli indicatori, la metodologia proposta è così riassumibile (Figura 6): Cineca SSD di interesse 1 Estrazione e filtraggio Scopus 2 Area geografica di interesse 4 3 Personale Ricerca Individuazione ID Scopus ID Scopus Personale Ricerca Estrazione Pubblicazioni 5 6 Analisi e costruzione DB 7 Offerta Ricerca Interrogazione DB 8 Indicatori Figura 6. Metodologia avanzata 1. Individuazione degli SSD e dell’area geografica di interesse a. In questo caso quelli relativi alle università dell’Abruzzo riconducibili ad attività più o meno strettamente legate al settore ICT 2. Estrazione semi-automatica (nel senso che è attualmente necessaria un’interazione esplicita), tramite sito Cineca, delle persone appartenenti agli SSD di interesse per le università di interesse a. Da segnalare che i dati disponibili su Cineca sono sempre aggiornati allo stato attuale. È tuttavia possibile raffinare utilizzando dati storici organizzati in periodi di un anno 3. Creazione del DB intermedio Personale Ricerca 4. Individuazione manuale (nel senso che è attualmente necessaria un’interazione esplicita per ogni elemento di Personale Ricerca) degli identificativi del Personale Ricerca su DB Scopus 5. Estrazione semi-automatica (nel senso che è attualmente necessaria un’interazione esplicita) tramite sito Scopus delle pubblicazioni del Personale Ricerca a. In questo lavoro è stato utilizzato il formato .ris di Scopus 6. Creazione del DB intermedio Pubblicazioni 7. Analisi automatica, tramite strumento SW sviluppato ad-hoc (Figura 7), dei DB intermedi e costruzione del DB Offerta di Ricerca a. Da notare come, essendo Scopus di portata internazionale, lo strumento SW si presta per analisi di più ampio respiro in funzione dell’insieme Personale Ricerca considerato 8. Interrogazione semi-automatica (nel senso che le interrogazioni del DB vanno esplicitamente costruite a seconda degli indicatori di interesse) del DB Offerta di Ricerca per il calcolo degli indicatori desiderati Cartella sorgente file: OK ************ IMPORT DATA **************** sorgenteFilePresenti: 136 sorgenteFileEsaminati: 136 numeroErrori: 0 numeroPubblicazioniDistinte: 5843 numeropubblicazioniDuplicate: 2034 numeroTotaleAutoriNeiFiles: 78885 (C: 136) Lista autori di interesse: caricati 153/153 ************ ASSOCIATE DATA **************** Autori da file non trovati in lista autori di interesse: 0 Autori di interesse senza corrispondenza in lista autori da files: [ 1] ******** ********* ING-IND/22 AQ ASS [ 2] ******* ******* ING-IND/22 AQ ASS [ 3] ** ******** ******* ING-IND/31 AQ ASS [ 4] ** *** ****** FIS/01 AQ RIC [ 5] ********** ****** CHIM/07 AQ RIC [ 6] ****** ******** ING-IND/09 AQ ASS [ 7] ************ ***** MAT/09 AQ ASS [ 8] ******** ****** ING-IND/09 AQ ASS [ 9] ***** ******** ING-INF/04 AQ ASS [10] ********* ******** CHIM/07 AQ RIC [11] ***** ******* CHIM/07 AQ ASS [12] ****** ********* ING-INF/04 AQ ASS [13] ******** ****** FIS/03 AQ RIC [14] ***** ***** FIS/03 AQ ASS [15] ******* ******* ING-IND/14 PC ASS [16] ******* ********* INF/01 TE ASS [17] ********** ********** MED/36 AQ RIC ************ EXPORT DATA **************** Creato autori.csv Creato pubblicazioni.csv Creato relazioniAP.csv EXECUTION SUCCESSFUL (total time: 3 seconds) Figura 7. Esempio esecuzione SW ad-hoc 6.4. Esempio di applicazione della metodologia avanzata Di seguito è riportato un esempio di applicazione della metodologia avanzata relativamente agli indicatori attinenti le pubblicazioni nel settore ICT della regione Abruzzo. 6.4.1. Pubblicazioni per SSD Tabella risultante (e confronto con i risultati manuali riportati in Figura 3): CHIM/07 FIS/01 FIS/03 INF/01 ING-IND/08 ING-IND/09 ING-IND/10 ING-IND/14 ING-IND/15 ING-IND/22 ING-IND/31 ING-IND/32 ING-IND/33 ING-INF/01 ING-INF/02 ING-INF/03 ING-INF/04 ING-INF/05 MAT/09 MED/32 MED/36 Metodologia avanzata Metodologia manuale 124 1091 1320 1324 7 65 170 9 46 225 599 276 69 326 141 302 601 293 122 48 719 131 539 1263 1857 0 77 340 60 60 577 431 342 120 357 305 55 929 506 144 0 1787 6.4.2. Pubblicazioni per SSD per anno E' possibile, con interrogazioni mirate, estrapolare il numero di pubblicazioni per ogni anno per specifici SSD di interesse. A seguire alcuni esempi per i settori “INF/01”, “ING-IND/31”, “INGINF/04” e “ING-INF/05”. E' anche possibile eseguire interrogazioni su tutti gli SSD per creare tabelle complete al fine di elaborare grafici di confronto. L’esempio seguente mostra (tabella e relativo grafico) un sottoinsieme del numero di pubblicazioni per ogni anno dal 1985 al 2014 per tutti gli SSD di interesse. 7. Conclusioni Questo lavoro, svolto nell’ambito del progetto SMILING (descritto in seguito), ha presenta l’analisi dei dati relativi all’offerta di ricerca, limitatamente al settore ICT, della regione Abruzzo. In particolare, esso ha descritto le metodologie adottate per la raccolta e l’analisi dei dati, soffermandosi sugli aspetti automatizzabili e quindi idealmente ripetibili in altre realtà geografiche, al fine di abilitare la possibilità di confronti significativi mostrando, come esempio applicativo, quella che può essere considerata l’Offerta di Ricerca della Regione Abruzzo nel Settore ICT. Da sottolineare come la metodologia e gli strumenti presentati siano di fatto abilitanti per un analisi più approfondita e mirata in funzione del tipo di analisi di interesse. In particolare, è stata presentata una metodologia avanzata che permette senz'altro una più precisa e scalabile valutazione degli indicatori di interesse, del loro evolvere temporale e un confronto con diverse realtà geografiche.