Ministero dell'Istruzione dell'Università e della Ricerca Dipartimento per l'Università, l'Alta Formazione Artistica, Musicale e Coreutica e per la Ricerca Direzione Generale per il Coordinamento e lo Sviluppo della Ricerca PROGRAMMI DI RICERCA SCIENTIFICA DI RILEVANTE INTERESSE NAZIONALE RICHIESTA DI COFINANZIAMENTO (D.M. 2/ric del 12/01/2012) PROGETTO DI UNITÀ DI RICERCA - MODELLO B Anno 2010-2011 - prot. 2010J3HN72_003 1 - Area Scientifico-disciplinare 01: Scienze matematiche e informatiche 90% * 09: Ingegneria industriale e dell'informazione 10% * Area prescelta ai fini della valutazione 2 - Coordinatore Scientifico TERENZIANI PAOLO Professore Ordinario Università degli Studi del PIEMONTE ORIENTALE "Amedeo Avogadro"Vercelli Facoltà di SCIENZE MATEMATICHE FISICHE e NATURALI Dipartimento di INFORMATICA 3 - Responsabile dell'Unità di Ricerca COMBI (Cognome) CARLO (Nome) Professore Ordinario (Qualifica) 24/05/1962 (Data di nascita) Università degli Studi di VERONA (Università/Ente) Dipartimento di INFORMATICA CMBCRL62E24F393Z (Codice fiscale) (Dipartimento) 045 802 7985 (telefono) 045 802 7068 (fax) [email protected] (E-mail) 4 - Curriculum scientifico Testo italiano Carlo Combi è nato a Montagna in Valtellina (SO) il 24 maggio 1962. Ha conseguito la Maturità Classica nell'anno scolastico 1980-81 presso il Liceo Classico G. Piazzi di Sondrio con la votazione di 60/60. Il 10 giugno 1987 si è laureato in Ingegneria Elettronica presso il Politecnico di Milano con la votazione di 94/100, discutendo la tesi "Esperimenti con alcune tecniche di compressione dati con salto di campioni su segnali ECG con aritmie", relatore Prof. Francesco Pinciroli. Il 13 luglio 1993 ha sostenuto con esito favorevole la dissertazione finale, dal titolo "Gestione del tempo nelle cartelle cliniche: modellizzazione, implementazione ed interrogazioni con tecniche orientate agli oggetti", per il conseguimento del titolo di Dottore di Ricerca ed ha così conseguito il titolo di Dottore di Ricerca in Bioingegneria. Ha quindi svolto negli anni 1993/94 e 1994/95 attività di ricerca post-dottorato presso il Dipartimento di Bioingegneria, beneficiando di una borsa di studio MURST. Dall'aprile 1996 all’ottobre 2001 è stato ricercatore (settore disciplinare K05A: Sistemi di elaborazione delle informazioni) presso l'Università degli Studi di Udine, Facoltà di Lettere e Filosofia, afferendo al Dipartimento di Matematica ed Informatica. Nel luglio 2001 ha ottenuto l’idoneità in una procedura di valutazione comparativa ad un posto di Professore Associato presso la Facoltà di Scienze Matematiche Fisiche e Naturali, settore disciplinare K05B: Informatica. Dal novembre 2001 al febbraio 2005 è stato professore associato, dal marzo 2005 al febbraio 2008 è stato professore straordinario e dal marzo 2008 è professore ordinario (settore disciplinare INF/01: Informatica) presso l'Università degli Studi di Verona, Facoltà di Scienze Matematiche, Fisiche e Naturali, ed afferisce al Dipartimento di Informatica, di cui è direttore dall'ottobre 2007. I principali interessi di ricerca di Carlo Combi sono nel campo delle basi di dati e dei sistemi informativi, con una particolare attenzione alla gestione dell'informazione clinica. Le due aree di ricerca principali riguardano i sistemi informativi temporali (modellazione e gestione di dati e di processi orientati al tempo) e le basi di dati multimediali. E' autore di oltre 100 articoli scientifici apparsi su riviste internazionali e su atti di conferenze internazionali con revisori. E' autore, con Elpida Keravnou - University of Cyprus e Yuval Shahar - Ben-Gurion University of the Negev, del libro "Temporal Information Systems in Medicine", Springer, 2010. Dal gennaio 1999 è membro dell'"editorial board" della rivista internazionale "Artificial Intelligence in Medicine". Da luglio 2009 è chair della Artificial Intelligence in Medicine Society (AIME). È guest-editor, insieme a Yuval Shahar - Università Ben Gurion, di un numero speciale della rivista Artificial Intelligence in Medicine su "Artificial Intelligence in Medicine AIME 2009 selected papers" (2011). È guest-editor, insieme a Niels Peek – Università di Amsterdam e Allan Tucker – Brunel University, di una sezione speciale della rivista Methods of Information in Medicine su "Biomedical Data Mining" (2009). È guest-editor, insieme a Maroua Bouzid – Università di Caen, Gerard Ligozat – Università di Parigi-SUD - e Michael Fisher – Università di Liverpool, di un numero speciale della rivista Annals of Mathematics and Artificial Intelligence su "Temporal Representation and Reasoning" (2006). È guest-editor, insieme a Giuseppe Pozzi - Politecnico di Milano, di un numero speciale della rivista Artificial Intelligence in Medicine su "Temporal Representation and Reasoning in Medicine" (2006). È guest-editor, insieme a Yuval Shahar - Università di Stanford, di un numero speciale della rivista Computers in Biology and Medicine su "Time-Oriented Systems in Medicine" (1997). È guest-editor, insieme a Yuval Shahar - Università di Stanford, di un numero speciale della rivista Journal of Intelligent Information Systems su "Intelligent Temporal Information Systems in Medicine" (1999). È membro del comitato scientifico di un volume speciale della serie Annals of Information Systems su "New Trends in Data Warehousing and Data Analysis" – guest editor: Stanislaw Kozielski - Silesian University of Technology, Poland - e Robert Wrembel - Poznan University of Technology, Poland - (2009). È membro del comitato scientifico di un numero speciale della rivista Artificial Intelligence in Medicine su "Information Visualization in Medicine" – guest editor: Luca Chittaro, Università degli Studi di Udine - (2000). Ha svolto e svolge attività di revisione per riviste nazionali e internazionali del settore: IEEE Transactions on Data and Knowledge Engineering, IEEE Transactions on Multimedia, Annals of Mathematics and Artificial Intelligence, Artificial Intelligence in Medicine, Computers in Biology and Medicine, IEEE Concurrency, IEEE Internet Computing, Methods of Information in Medicine, Rivista di Informatica dell'AICA, The Computer Journal, Journal of Intelligent and Fuzzy Systems, Journal of Logic and Computation. È “general chair” del congresso 18th International Symposium on Temporal Representation and Reasoning – TIME 2011. È “scientific co-chair” e "local chair" del congresso 12th Conference on Artificial Intelligence in Medicine Europe - AIME'09. È “program co-chair” del congresso 11th International Symposium on Temporal Representation and Reasoning – TIME 2004. È ed è stato componente dei comitati di programma di numerosi convegni internazionali, quali TIME (Symposium on Temporal Representation and Reasoning), CIKM (Conference on Information and Knowledge Management), AIME (Conference on Artificial Intelligence in Medicine), DEXA (Conference on Database and Expert System Applications), ADBIS (Conference on Advances in Databases and Information Systems), ACM IHI (SIGHIT International Health Informatics Symposium). Testo inglese Carlo Combi was born in 1962. In 1987 he received the Laurea Degree in E.E. by the Politecnico of Milan with a thesis on "Data Compression Techniques applied to Dynamic Electrocardiograms". In 1993 he received the Ph.D. degree in biomedical engineering with the dissertation "Time Management in Medical Records: Modeling, Implementation, and Queries by Object-Oriented Techniques". He was in 1994 and 1995 Post-Doc fellow at the Department of Biomedical Engineering of the Politecnico of Milan. From 1987 to 1996 he worked within the research group in Medical Informatics at the Politecnico of Milan. From April 1996 to October 2001, Carlo Combi was with the Department of Mathematics and Computer Science of the University of Udine as Assistant Professor. Since November 2001, he is with the Department of Computer Science of the University of Verona: from November 2001 to February 2005, he was Associate Professor of Computer Science; since March 2005, he is Professor of Computer Science. Since October 2007, he is head of the Department. Main research interests are related to the database and information system field, with an emphasis on the management of clinical information. The two main areas are temporal information systems (time-oriented data and process modeling) and multimedia databases. The following specific research topics have been considered by Carlo Combi: * XML, semistructured data and temporal information; * temporal workflows: conceptual modeling, architectures, and management of temporal information; * dealing with multiple temporal dimensions in modeling and querying data; * extending Event Calculus to deal with temporal granularity and indeterminacy; * visualizing temporal data; * managing uncertainty in temporal relationships by multiple-valued logics; * WWW-based access to temporal information; * dealing with granularity and indeterminacy in modeling and querying object-oriented temporal databases; * modeling and querying multimedia data; * temporal features of multimedia data; * indexing structures; * compression techniques applied on biomedical signals and images. He is author of more than 100 papers published on international journals and proceedings of international conferences. He is involved in the scientific activity of several scientific international journals and conferences. Since January 1999 he is editorial Board Member, journal Artificial Intelligence in Medicine. Since July 2009 he is chair of the Artificial Intelligence in Medicine Society (AIME). He is author, with Elpida Keravnou - University of Cyprus and Yuval Shahar - Ben-Gurion University of the Negev, of the book "Temporal Information Systems in Medicine", Springer, 2010. He is guest editor (with Yuval Shahar, Ben Gurion University) of a special issue on "Artificial Intelligence in Medicine AIME 2009 - selected papers", Artificial Intelligence in Medicine Journal (2011). He is guest editor, with Niels Peek – University of Amsterdam and Allan Tucker – Brunel University, of a special section of the journal Methods of Information in Medicine on "Biomedical Data Mining" (2009). He is member of the Scientific Committee, volume "New Trends in Data Warehousing and Data Analysis" (2009) of the series Annals of Information Systems (guest editor: Stanislaw Kozielski - Silesian University of Technology, Poland - and Robert Wrembel - Poznan University of Technology, Poland). He is guest editor (with Maroua Bouzid - University of Caen, Gerard Ligozat - University of Paris-SUD, and Michael Fisher, University of Liverpool) of a special issue on temporal representation and reasoning, Annals of Mathematics and Artificial Intelligence (2006). He is guest editor (with Giuseppe Pozzi, Politecnico di Milano), of a special issue on temporal representation and reasoning in medicine, International Journal Artificial Intelligence in Medicine (2006). He is member of the Scientific Committee, special issue on information visualization in medicine (guest editor: Luca Chittaro, University of Udine), journal Artificial Intelligence in Medicine (2000). He is guest editor (with Yuval Shahar, Stanford University), special issue on intelligent temporal information systems in medicine, Journal of Intelligent Information Systems (1999). He is guest editor (with Yuval Shahar, Stanford University), special issue on time-oriented systems in medicine, journal Computers in Biology and Medicine (1997). He has been reviewer for national and international journals and magazines: IEEE Transactions on Knowledge and Data Engineering, IEEE Transactions on Multimedia, Annals of Mathematics and Artificial Intelligence, Artificial Intelligence in Medicine, Computers in Biology and Medicine, IEEE Concurrency, IEEE Internet Computing, Methods of Information in Medicine, Rivista di Informatica of AICA, the Computer Journal, Journal of Intelligent and Fuzzy Systems, Journal of Logic and Computation, Acta Informatica. He is general chair of the 18th International Symposium on Temporal Representation and Reasoning - TIME 2011. He is scientific co-chair and local chair of the 12th Conference on Artificial Intelligence in Medicine - AIME'09. He is program co-chair of the IDAMAP 2007 and IDAMAP 2006 Workshops on Intelligent Data Analysis in bioMedicine and Pharmacology. He is program co-chair of the 11th International Symposium on Temporal Representation and Reasoning - TIME 2004. He has been involved since several years as a member of the program committee of international conferences, as TIME (Symposium on Temporal Representation and Reasoning, AIME (Artificial Intelligence in MEdicine), DEXA (Database and Expert System Application), CIKM (Conference on Information and Knowledge Management), ADBIS (Conference on Advances in Databases and Information Systems) and of international workshops as ECDM (International Workshop on Evolution and Change in Data Management), AITAmI (Workshop on Artificial Intelligence Techniques for Ambient Intelligence), and IDAMAP (workshop on Intelligent Data Analysis in bioMedicine and Pharmacology), ACM IHI (SIGHIT International Health Informatics Symposium). 5 - Pubblicazioni scientifiche più significative del Responsabile dell'Unità di Ricerca 1. COMBI C., Gambini Mauro, Migliorini Sara, Posenato Roberto (2012). Modelling Temporal, Data-Centric Medical Processes. In: IHI '12 Proceedings of the 2nd ACM SIGHIT International Health Informatics Symposium. Miami, FL, USA, 28-30 Gennaio 2012ACM, p. 141-150, ISBN/ISSN: 9781450307819, doi: 10.1145/2110363.2110382 2. COMBI C., Oliboni Barbara (2012). Visually defining and querying consistent multigranular clinical temporal abstractions . ARTIFICIAL INTELLIGENCE IN MEDICINE, vol. 54; p. 75-101, ISSN: 0933-3657 3. COMBI C., Gambini Mauro, Migliorini Sara (2011). The NestFlow Interpretation of Workflow Control-Flow Patterns. In: Advances in Databases and Information Systems. Vienna, Austria, September 20-23, 2011Springer, vol. 6909 4. COMBI C., KERAVNOU-PAPAILIOU ELPIDA, SHAHAR YUVAL (2010). Temporal information systems in medicineSpringer Publishing Company, Incorporated, p. 1-408, ISBN: 1441965424 5. COMBI C., POSENATO ROBERTO (2010). Towards Temporal Controllabilities for Workflow Schemata. In: 2010 17th International Symposium on Temporal Representation and Reasoning TIME 2010. Parigi, Francia, 6-8 settembre 2010IEEE Computer Society, p. 129-136, ISBN/ISSN: 9780769541877 6. BELUSSI ALBERTO, COMBI C., POZZANI GABRIELE (2009). Formal and conceptual modeling of spatio-temporal granularities. In: -. Cetraro (CS), Calabria, Italy, 16-18 September 2009The Association for Computing Machinery, p. 275-283, ISBN/ISSN: 978-160558-402-7 7. COMBI C. (2009). Temporal Object-Oriented Databases. Encyclopedia of Database Systems. p. 2998-3004, Springer, ISBN/ISSN: 978-0-387-35544-3 8. COMBI C., GAMBINI M. (2009). Flaws in the flow: the weakness of unstructured business process modeling languages dealing with data. In: On the Move to Meaningful Internet Systems: OTM 2009, Confederated International Conferences, CoopIS, DOA, IS, and ODBASE 2009, Proceedings, Part I. Vilamoura, Portugal, Novembre, 2009Springer, vol. 5870, p. 42-59, ISBN/ISSN: 978-3-642-05147-0 9. COMBI C., GOZZI M., OLIBONI B., JUAREZ J.M., MARIN R. (2009). Temporal similarity measures for querying clinical workflows. ARTIFICIAL INTELLIGENCE IN MEDICINE, vol. 46; p. 37-54, ISSN: 0933-3657, doi: 10.1016/j.artmed.2008.07.013 10. COMBI C., POZZI G. (2009). Temporalities for Workflow Management Systems. Handbook of Research on Business Process Modeling. p. 255-273, IGI-Global, ISBN/ISSN: 978-1-60566-288-6 11. COMBI C., ROBERTO POSENATO (2009). Controllability in Temporal Conceptual Workflow Schemata. In: Business Process Management, 7th International Conference, BPM 2009. Ulm, Germany, 8-10 Settembre 2009Springer Berlin / Heidelberg, vol. 5701, p. 64-79, ISBN/ISSN: 978-3-642-03847-1 12. COMBI C., DEGANI S., JENSEN C.S. (2008). Capturing Temporal Constraints in Temporal ER Models. In: Proceedings ER 2008 International Conference on Conceptual Modeling. Barcellona, 20-23 ottobre 2008, Berlino: Springer, vol. Lecture Notes in Computer Scie, p. 397-411, ISBN/ISSN: 978-3-540-87876-6 13. COMBI C., POZZI G. (2008). Workflow Management Systems for Healthcare Processes. Encyclopedia of Healthcare Information Systems (3 Volumes). p. 1412-1416, IGI-Global, ISBN/ISSN: 978-1-59904-889-5 14. COMBI C., A. MONTANARI, G. POZZI (2007). The T4SQL Temporal Query Language. In: ACM CIKM 2007 Sixteenth Conference on Information and Knowledge Management. Lisbona, novembre 2007, New York: ACM, p. 193-202, ISBN/ISSN: 978-1-59593-803-9 15. COMBI C., GOZZI M., JUAREZ J.M., OLIBONI B., POZZI G. (2007). Conceptual Modeling of Temporal Clinical Workflows. In: Proceedings 14th International Symposium on Temporal Representation and Reasoning (TIME 2007). Alicante - Spain, giugno 2007, Los Alamitos: IEEE Computer Society Press, p. 70-81 16. SACCHI L., LARIZZA C., COMBI C., BELLAZZI R. (2007). Data mining with Temporal Abstractions: Learning Rules from Time Series. DATA MINING AND KNOWLEDGE DISCOVERY, vol. 15; p. 217-247, ISSN: 1384-5810 17. ADLASSNIG K.P, COMBI C., DAS A.K, KERAVNOU E.T, POZZI G (2006). Temporal representation and reasoning in medicine: Research directions and challenges. ARTIFICIAL INTELLIGENCE IN MEDICINE, vol. 38; p. 101-113, ISSN: 0933-3657 18. COMBI C., OLIBONI B., ROSSATO R. (2005). Merging Multimedia Presentations and Semistructured Temporal Data: a Graph-based Model and its Application to Clinical Information. ARTIFICIAL INTELLIGENCE IN MEDICINE, vol. 34(2); p. 89-112, ISSN: 0933-3657, doi: 10.1016/j.artmed.2004.11.003 19. COMBI C., FRANCESCHET M., PERON A. (2004). Representing and Reasoning about Temporal Granularities. JOURNAL OF LOGIC AND COMPUTATION, vol. 14; p. 51-77, ISSN: 0955-792X 20. COMBI C., POZZI G. (2004). Architectures for a Temporal Workflow Management System. In: ACM SAC 2004 SYMPOSIUM ON APPLIED COMPUTING, DATABASE THEORY, TECHNOLOGY, AND APPLICATIONS (DTTA) TR. Nicosia - Cipro, Marzo 2004, New York: ACM, p. 659-666 21. CHITTARO L., COMBI C. (2003). Visualizing Queries on Databases of Temporal Histories: New Metaphors and their Evaluation. DATA & KNOWLEDGE ENGINEERING, vol. 44; p. 239-264, ISSN: 0169-023X 22. CHITTARO L., COMBI C., TRAPASSO G. (2003). Clinical Data Mining: a Visual Approach and its Application to Hemodialysis. JOURNAL OF VISUAL LANGUAGES AND COMPUTING, vol. 14; p. 591-620, ISSN: 1045-926X 23. COMBI C., POZZI G. (2003). Temporal Conceptual Modelling of Workflows. In: Proceedings ER 2003 International Conference on Conceptual Modeling. Chicago, Ottobre 2003, Berlin: Springer, vol. LNCS 2813, p. 59-76 24. PORTONI L., COMBI C., PINCIROLI F. (2002). User-Oriented Views in Health Care Information Systems. IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING, vol. 49; p. 1387-1398, ISSN: 0018-9294 25. COMBI C., A.MONTANARI (2001). Data Models with Multiple Temporal Dimensions: Completing the Picture. In: Proceedings 13th International Conference CAiSE 2001 Advanced Information Systems Engineering. Interlaken, giugno 2001, Berlin: Springer, p. 187-202 26. PINCIROLI F., CRIPPA F., COMBI C., RENI G., FAVA D. (2000). TANCLICO: Tools for the Analysis of Inter-departmental Clinical Communications. METHODS OF INFORMATION IN MEDICINE, vol. 39/1; p. 44-49, ISSN: 0026-1270 27. PINCIROLI F., MARCHENTE M., COMBI C., FAVA D., BRAMBILLASCHI G., PEDRAZZI A. (2000). TEODOLINDA. A Communication Architecture for Hospital Information Systems. COMPUTER METHODS AND PROGRAMS IN BIOMEDICINE, vol. 62/1; p. 59-68, ISSN: 0169-2607 28. COMBI C., L. CHITTARO (1999). Abstraction on Clinical Data Sequences: an ObjectOriented Data Model and a Query Language Based on the Event Calculus. ARTIFICIAL INTELLIGENCE IN MEDICINE, vol. 17/3; p. 271-301, ISSN: 0933-3657 29. COMBI C., CUCCHI G., PINCIROLI F. (1997). Applying Object-Oriented Technologies in Modeling and Querying Temporally-Oriented Clinical Databases Dealing with Temporal Granularity and Indeterminacy. IEEE TRANSACTIONS ON INFORMATION TECHNOLOGY IN BIOMEDICINE, vol. 1/2; p. 100-127, ISSN: 1089-7771 30. COMBI C., SHAHAR Y. (1997). Temporal Reasoning and Temporal Data Maintenance in Medicine: Issues and Challenges. In: COMBI, C., SHAHAR, Y. (eds.) Time-Oriented Systems in Medicine. Special Issue. COMPUTERS IN BIOLOGY AND MEDICINE, vol. 27; p. 353-368, ISSN: 0010-4825 6 - Abstract dei compiti svolti dall'Unità di Ricerca Testo italiano Il programma di ricerca dell'unità di Verona consisterà delle seguenti linee di ricerca principali. MODELLAZIONE INTEGRATA DI DATI E PROCESSI CLINICI E SANITARI E VERIFICA DEI PROCESSI Lo scopo di questa linea di ricerca è quello di distinguere quali sono gli aspetti temporali principali da rappresentare nella modellazione concettuale di linee guida e processi clinici e sanitari attraverso modelli di workflow orientati ai dati. Per tali aspetti, ci si focalizzerà sulle notazioni più opportune per rappresentare vincoli assoluti, periodici e di durata, eventualmente affetti da incertezza, vaghezza e differenti granularità, caratterizzando l'espressività del modello rispetto alla complessità legata alla valutazione di diversi livelli di consistenza di tali vincoli. Oltre alla consistenza, un concetto recentemente applicato all'ambito dei workflow è quello di "controllabilità". La controllabilità è una proprietà più forte della consistenza e prevede che un workflow possa essere eseguito rispettando tutti i vincoli temporali senza fissare a priori le durate delle attività cliniche, che sono fuori dal controllo del sistema di gestione di workflow. La controllabilità e gli algoritmi per la sua verifica saranno oggetto di studio e di applicazione in ambito clinico. Per la verifica di controllabilità saranno considerati sia gli aspetti design time, sia gli aspetti legati alla verifica incrementale, run time, della controllabilità durante l'esecuzione dei processi stessi. ANALISI INTELLIGENTE ed INTEGRATA DI DATI E PROCESSI CLINICI E SANITARI Nella modellazione di linee guida o di processi sanitari per mezzo di workflow, le regole che un processo deve seguire sono descritte nello schema di workflow e devono essere soddisfatte dalle istanze (casi) del processo stesso. Le istanze di uno stesso schema di workflow possono, quindi, essere differenti rispetto alla struttura e rispetto alle attività che compongono il caso, al loro ordine (temporale) e alla loro lunghezza. Quando uno schema di workflow rappresenta una linea guida, ad esempio, i suoi casi rappresentano istanze differenti derivanti dall'applicazione della linea guida a pazienti diversi in situazioni diverse. L'analisi intelligente dei dati relativi ai vari casi diviene quindi centrale nella valutazione dei singoli casi, rispetto alla corretta applicazione delle linee guida, rispetto al corretto trattamento del singolo paziente, e così via. L'analisi di casi di processi clinici permette di riconoscere insiemi di casi (istanze dello stesso schema di workflow) simili tra loro e quindi consente di scoprire modelli di processi clinici e sanitari. Spesso, inoltre, i dati clinici di supporto all'esecuzione dei processi sono numerosi e richiedo opportune analisi, di supporto alle attività decisionali del processo stesso. Rispetto a questo scenario, l'unità di Verona si concentrerà sullo studio di tecniche innovative di data mining temporali per processi e dati clinici, con particolare enfasi sull'estrazione di regole di associazione temporali e di dipendenze funzionali temporali approssimate basate su punti e/o su intervalli temporali. PROGETTAZIONE E IMPLEMENTAZIONE DI UNA SUITE DI STRUMENTI SOFTWARE PER LA GESTIONE E L’ANALISI INTEGRATE DI LINEE GUIDA E DI DATI CLINICI Sistemi prototipali per la gestione di linee guida/processi clinici e per l'analisi integrata di dati e processi clinici verranno progettati ed implementati nel corso del progetto, sulla base di prodotti opensource già disponibili. Tali prototipi saranno applicati a più ambiti clinici, fra quelli approfonditi ed esaminati nelle prime fasi del progetto: fra questi l'unità di Verona considererà in particolare l'ambito della farmacovigilanza, e quello della gestione dei pazienti in arresto cardiaco. Testo inglese The research program of the unit of Verona will consist in the main research directions detailed in the following. INTEGRATED MODELING OF DATA, CLINICAL PROCESSES, AND HEALTHCARE PROCESSES and VERIFICATION OF CLINICAL PROCESSES The goal of this research direction within the project is that of clearly distinguishing which temporal aspects have to be considered in the conceptual modeling of clinical processes. With respect to healthcare related workflows, it will be important to clearly identify the temporalities which have to be dealt with for clinical tasks. A further concept recently discussed for workflows is that of "controllability". Controllability is stronger than consistency and it refers to the capability of being able to perform a workflow satisfying all the given constraints for any combination of the allowed durations for clinical tasks, as tasks are not under the control of the WfMS (that, instead, is able to fix suitable delays between successive tasks). Controllability and related verification algorithms will be considered as for their application in the medical domain. For checking the controllability, algorithms will be considered and designed both for the verification of controllability at design time and for the incremental verification of process controllability at run time, when executing clinical processes. INTELLIGENT AND INTEGRATED ANALYSIS OF DATA, CLINICAL PROCESSES AND HEALTCARE PROCESSES In the context of guidelines/health process modeling by means of workflow systems, the rules a process has to follow are described in the workflow schema and must be satisfied by the instances (cases) of the process itself. Moreover, the schema may contain qualitative and quantitative temporal constraints. Workflow cases with the same schema can be different with respect to the structure, i.e. to the activities composing the cases, and to their (temporal) order and length. When a workflow schema represents a guideline, for example, its cases represent different instances deriving from the application of the guideline to different patients in different situations. The intelligent analysis of workflow cases is thus an important issue in the clinical context, where cases are slightly different according to the patient situation: indeed, intelligent analysis allows the discovering of set of cases that are similar one of the other, and thus it allows one to discover models of clinical processes starting from data. This is extremely important, as often process schemata are not at disposal and may only be derived from process data. Moreover, the intelligent analysis of clinical cases may be a strong basis for assessing the quality of the care provided by health organizations. Moreover, data acquired during process executions are often huge a require suitable analyses to support process-related clinical decision making. With respect to this scenario, the unit of Verona will focus on the issues related to the mining of clinical process warehouses. In particular the focus will be on the definition of techniques for mining clinical process warehouse through similarity criteria, for deriving temporal association rules and approximante temporal functional dependencies from temporal process warehouses (both point- and interval-based). DESIGN AND IMPLEMENTATION OF A SOFTWARE SUITE FOR THE INTEGRATED MANAGEMENT AND ANALYSIS OF CLINICAL GUIDELINES AND CLINICAL DATA Suitable prototypes for the management of clinical guidelines/pathways and for the integrated analysis of clinical data and processes will be designed and implemented during the project, even on the base of sound opensource systems, currently available. Such prototypes we be applied to several clinical contexts, among those identified and deeply considered at the beginning of the project: in particular, the unit of Verona will explicitly consider the domains of pharmacovigilance and of the management of cardiac arrest patients. 7 - Settori di ricerca ERC (European Research Council) PE Physical Sciences and Engineering PE6 Computer science and informatics: informatics and information systems, computer science, scientific computing, intelligent systems PE6_7 Artificial intelligence, intelligent systems, multi agent systems 8 - Collaborazioni con altri organismi di ricerca pubblici e privati, nazionali e internazionali, e indicazione degli eventuali collegamenti con gli obiettivi di Horizon 2020 Testo italiano COLLABORAZIONI CON ALTRI ORGANISMI DI RICERCA L'unità di Verona (UNIVR nel seguito) collaborerà con il Dipartimento di Sistemi Informativi dell'Università di Haifa, Israele, nella persona del suo direttore, prof.ssa Mor Peleg. La prof.ssa Mor Peleg è molto nota a livello internazionale per la sua attività di ricerca nell'ambito dei sistemi informativi clinici e in particolare per i suoi studi sui sistemi di supporto alle linee guida e ai processi clinici. Le sue competenze e i suoi lavori precedenti si integrano perfettamente con UNIVR per quanto riguarda l'approfondimento e l'applicazione di tecniche di process mining in ambito clinico. Mor sarà coinvolta nella specifica e nella valutazione degli algoritmi di process mining per informazioni temporali che verranno sviluppati da UNIVR. UNIVR collaborerà, inoltre,con l'Istituto di Basi di Dati e Sistemi Informativi dell'Università di Ulm, Germania, nella persona del prof. Manfred Reichert. Il prof. Manfred Reichert è molto noto a livello internazionale per la sua attività di ricerca nell'ambito dei sistemi di workflow e dei business process, dove si è occupato anche di applicazioni in ambito clinico e sanitario. Le sue competenze e i suoi lavori precedenti si integrano perfettamente con UNIVR per quanto riguarda l'approfondimento dei temi inerenti la gestione temporale di workflow clinici e la progettazione e implementazione di algoritmi per la verifica della controllabilità dei processi clinici. COLLEGAMENTI CON GLI OBIETTIVI DI HORIZON 2020 Il programma di ricerca proposto si colloca pienamente nella proposta HORIZON 2020, affrontando una delle linee primarie nella priorità "Sfide della Società" - ovvero "sanità, cambiamenti demografici e benessere" - e richiedendo lo sviluppo di metodologie informatiche avanzate ed innovative, come previsto dalla priorità "Scienza di Eccellenza" della proposta, al fine di ottenere gli obiettivi e l’impatto sociale prefissato. Il progetto proposto si può quindi anche ben inquadrare nel contesto delle cross-cutting actions della proposta Horizon 2020, proponendo, come previsto dalla stessa, soluzioni ad alto grado di interdisciplinarità (in particolare fra l’ambito della medicina e quello dell’informatica). Più in dettaglio, la Horizon 2020 Proposal (Brussels, 30.11.2011) consta di quattro priorità: la priorità I “Excellent science” e la priorità III “Societal challenges” costituiscono il contesto nel quale si colloca il progetto. In aggiunta, Horizon 2020 intende promuovere il coordinamento fra le varie parti: “COMPLEMENTARITIES AND CROSS-CUTTING ACTIONS Horizon 2020 is structured around the objectives defined for its three major parts: generating excellent science, creating industrial leadership and tackling societal challenges. Particular attention will be paid to ensuring adequate coordination between these parts and fully exploiting the synergies generated between all specific objectives to maximise their combined impact on the higher level policy objectives of the Union.” … “Cross-cutting actions will be promoted between Part I 'Excellent science' and the societal challenges …. to develop jointly new knowledge, future and emerging technologies, research infrastructures and key competences.” (Complementarities and cross-cutting actions, pag. 23) La Horizon2020 Proposal evidenzia come il raggiungimento di tale coordinamento possa richiedere l’adozione di soluzioni interdisciplinari. “….contributing effectively to the objectives of Europe 2020 and the Innovation Union will require solutions to be developed which are interdisciplinary in nature…”. Il progetto proposto si colloca perfettamente in tale contesto, proponendo un progetto di ricerca informatica innovativo finalizzato ad un forte impatto sociale nell’ambito della salute. Speficatamente, la salute e’ la prima delle “Social Challenges” specificate in Horizon 2020: “1. HEALTH, DEMOGRAPHIC CHANGE AND WELLBEING Effective health promotion, supported by a robust evidence base, prevents disease, improves wellbeing and is cost effective” (pag 50) “An increasing disease and disability burden in the context of an aging population places further demands on health and care sectors. If effective health and care is to be maintained for all ages, efforts are required to improve decision making in prevention and treatment provision, to identify and support the dissemination of best practice in the healthcare sector,” (pag. 50) “1.15. Optimising the efficiency and effectiveness of healthcare systems and reducing inequalities through evidence based decision making and dissemination of best practice, and innovative technologies and approaches. There is a need to support the development of health technology assessment and health economics, as well as the of gathering evidence and dissemination of best practice and innovative technologies and approaches in the healthcare sector, including ICT and e-health applications” (pag. 54) I precedenti passi, tratti dalla proposal HORIZON 2020, evidenziano chiaramente (1) l’importanza di supportare l’adozione e la disseminazione della “best practice” nel contesto medico-sanitario, e (2) il ruolo che l’informatica può giocare nel conseguimento di tale obiettivo. Per quanto riguarda il primo aspetto, il progetto proposto si focalizza sul trattamento di linee guida cliniche che, informalmente, costituiscono il principale strumento proposto in ambito medico al fine da un lato di raccogliere l’evidenza medica, e dall’altro di codificarla in procedure di “best practice” per gli operatori sanitari. Le linee guida cliniche sono, nella definizione dello USA Institute of Medicine, “sistematically developed statements to assist practitioner and patient decisions about appropriate health care in specific clinical circumstances”. Le linee guida cliniche sono tipicamente caratterizzate dalla presenza di complessi processi decisionali, in cui il medico gioca un ruolo fondamentale, e non debbono essere intese come una limitazione all’attività decisionale del medico, quanto come un supporto alla stessa. Il ciclo di vita delle linee guida o dei protocolli clinici risulta fondamentalmente composto da tre fasi: (i) definizione, da parte di un comitato di medici esperti nel settore, (ii) applicazione agli specifici pazienti, (iii) aggiornamento, da parte di un comitato di esperti. E’ importante notare come, nella seconda fase, le line guida generali vengano contestualizzati alle specifiche unità sanitarie (integrandole così con gli aspetti organizzativi di tali unità), ed allo specifico paziente, dando origine ai cosiddetti Clinical Pathway. L’adozione di sistemi di supporto di linee guida/pathway clinici e insieme di tecniche di analisi intelligenti di grosse moli di dati/processi clinici costituisce, quindi, uno degli strumenti principali per promuovere la cosiddetta evidence-based medicine, e comporta innumerevoli vantaggi per tutti i componenti del sistema sanitario integrato, fra i quali evidenziamo: - per i pazienti: la garanzia della qualità delle prestazioni ricevute (secondo i dettami della evidence-based medicine) - per i medici: la disponibilità di un riferimento standard affidabile, utilizzabile come documentazione, come supporto alla decisione, e/o come strumento di critica ed autovalutazione; la certifica della qualità delle prestazioni erogate (quest’ultimo aspetto assume una particolare rilevanza legale-assicurativa nel mondo anglosassone) - per le aziende sanitarie: la disponibilità di uno strumento per la standardizzazione delle prestazione erogate, per il controllo di qualità, per la valutazione e l’ottimizzazione di costi e risorse - rispetto al territorio: oltre ai vantaggi menzionati per le singole aziende sanitarie, si aggiungono quelli legati alla disseminazione di procedure cliniche standardizzate, e quelli legati ad una più stretta integrazione fra ospedali e territorio. In particolare, la garanzia di qualità costituisce il vantaggio fondamentale fornito dall’adozione di linee guida. Tale vantaggio deriva sia dal fatto che esse costituiscono una messa in opera della evidence-based medicine, che garantisce l’adozione delle metodologie cliniche più appropriate, che dall’introduzione nelle linee guida di indicatori di qualità, sia riguardanti l’imapatto dell’esecuzione di una linea guida su specifici pazienti (indicatori clinici, quali goal-based outcomes, functional outcomes, e quality of life measures) che a livello di macro-sistema (aziende ospedaliere, entità territoriali; detti performance indicators). Purtroppo i suddetti vantaggi sono talvolta limitati, in fase applicativa, dall’incidenza di due principali problematiche: (1) in fase di definizione: in molti casi, la definizione delle linee guida risulta problematica, in quanto la conoscenza medica e’ talvolta molto complessa e difficilmente formalizzabile in modo rigoroso. Ne consegue che, in tali casi, le descrizioni possono essere imprecise e/o incomplete, o lasciare un certo grado di arbitrarietà (e di difficoltà) di interpretazione per i medici che dovranno applicarle ai pazienti. (2) in fase di applicazione: è ampiamente riconosciuto che il principale ostacolo all’effettivo utilizzo delle linee guida cliniche ed alla loro diffusione e’ la distanza che intercorre fra la descrizione “generale” delle linee guida (fornita dai comitati di esperti) ed i casi reali, costituiti dagli specifici pazienti su cui la linea guida viene di volta in volta applicata. Colmare tale distanza richiede una integrazione della linea guida con i dati del paziente, che e’ un processo talvolta molto complesso, che viene completamente delegato al medico utente. La ricerca a livello mondiale ha mostrato come l’adozione di adeguate metodologie informatiche fornisca strumenti utili a superare tali problematiche, massimizzando l’impatto pratico dell’adozione di linee guida cliniche e protocolli [Gordon, 95a; Grimshaw & Russel, 93; Molino, 99; Purves, 95]. A partire dagli anni '90, la ricerca in informatica medica a livello mondiale si e’ ampiamente occupata, con interesse sempre crescente, alla ricerca di formalismi ed approcci per la gestione informatizzata di linee guida cliniche, anche con tecniche mutuate dai sistemi di business process e di workflow, come evidenziato nella descrizione dello stato dell'arte. Se da un lato gli approcci proposti hanno dimostrato l’importanza di adottare metodologie informatiche al supporti delle linee guida, dall’altro hanno mostrato notevoli limitazioni, che non hanno permesso di ottenere appieno tutto l’impatto potenzialmente conseguibile. Per superare tali limitazioni, nell’ambito del progetto si propongono due principali modalità investigative, dettagliate nel seguito. (1) Adattamento di metodologie al campo medico Tale modalità consiste da un lato nell’identificare quelle teorie, metodologie e strumenti informatici già in essere che possano contribuire ad un piu’ evoluto ed adeguato trattamento delle linee guida, e dall’altro nel modificare, adattare ed estendere le stesse al fine di rendere adatti al contest applicativo prefissato. E’ importante, contestualmente, notare come una tale modalità operativa sia espressamente prevista e caldeggiata nella HORIZON 2020 proposal: “Particular attention will be paid to ensuring a broad approach to innovation, which is not only limited to the development of new products and services on the basis of scientific and technological breakthroughs, but which also incorporates aspects such as the use of existing technologies in novel applications,” (pag 19) Nella proposta di UNIVR sono ascrivibili a questo approccio l'adozione di strumenti opensource, quali YAWL per i sistemi di workflow e PENTAHO per la gestione di data warehouse, all'ambito clinico-sanitario, con particolare riferimento al supporto alle decisioni. (2) Ricerca avanzata Inoltre, il superamento dei limiti degli approcci finora sviluppati nella ricerca a livello mondiale richiederà lo sviluppo di metodologie e teorie innovative, come auspicato dalla proposal stessa: “The European Research Council (ERC) will promote world class frontier research. Research at and beyond the frontiers of current understanding is both of critical importance to economic and social welfare, and an intrinsically risky venture, progressing on new and most challenging research areas and characterised by an absence of disciplinary boundaries.” (pag 26) In particolare, UNIVR si focalizzerà sui seguenti aspetti, che comportano sia ricadute applicative interessanti negli ambiti già ricordati sia soluzioni e proposte innovative nel panorama della ricerca scientifica internazionale: - modelli di workflow orientati ai dati e agli aspetti temporali nella rappresentazione e gestione di processi clinici; - algoritmi di verifica design-time e run-time della controllabilità di processi clinici temporali; - sviluppo di tecniche di data mining (regole di associazione e dipendenze funzionali temporali approssimate) integrate per l'analisi di dati e processi clinici. Testo inglese COLLABORATIONS WITH OTHER RESEARCH INSTITUTIONS The research unit of Verona (hereinafter UNIVR) will cooperate with the Department of Information Systems of the University of Haifa, Israel, and, more precisely, with the head of the Department, prof. Mor Peleg. Prof. Mor Peleg is a very well known scientist, working on clinical information systems, and on computerized clinical guidelines. Her skills and research experience are extremely useful and complementary to the UNIVR specific expertise. UNIVR and the Department of Information Systems will work together on the application of process mining techniques in the clinical domain. Mor Peleg will be involved in the specification and evaluation of process mining algorithms for temporal clinical data, proposed by UNIVR. UNIVR will work with the Institute of Databases and Information Systems, University of Ulm, Germany. In particular, the collaboration will be with prof. Manfred Reichert, one of the responsibles of the Institute. Prof. Manfred Reichert is well known for his important contribution in the international scientific community working on workflows and business processes and has been involved in several studies related to the application of business process methodologies and technologies in health and clinical domains. His expertise and scientific experience will complete and integrate UNIVR in the study of the temporal management of clinical pathways and in the design and implementation of algorithms for checking the controllability of clinical processes. LINKS WITH HORIZON 2020 GOALS The proposed research project is completely within the scope of the framework programme for research and innovation HORIZON 2020, as it faces one of the most important objectives in the part "Societal challenges" – i.e., improving the lifelong health and wellbeing [Horizon]. On the other hand, it requires the proposal and development of advanced and innovative informatics methodologies, as considered in the part “Excellent science”, to allow the achievement of the specified goals and the foreseen social impact. Thus, the proposed project may be considered even within the context of cross-cutting actions of the framework programma Horizon 2020: indeed, it considers interdisciplinary solutions, with contributions - from and for - both medicine and computer science. More particularly, the Horizon 2020 Proposal (Brussels, 30.11.2011, [Horizon]) consists of 4 parts: part I “Excellent science” and part III “Societal challenges” are the natural context, where we can consider the proposed research project. Moreover, Horizon 2020 push for having a coordination among the activities related to different parts: “COMPLEMENTARITIES AND CROSS-CUTTING ACTIONS Horizon 2020 is structured around the objectives defined for its three major parts: generating excellent science, creating industrial leadership and tackling societal challenges. Particular attention will be paid to ensuring adequate coordination between these parts and fully exploiting the synergies generated between all specific objectives to maximise their combined impact on the higher level policy objectives of the Union.” … “Cross-cutting actions will be promoted between Part I 'Excellent science' and the societal challenges …. to develop jointly new knowledge, future and emerging technologies, research infrastructures and key competences.” (Complementarities and cross-cutting actions, pag. 23) The Horizon 2020 Proposal highlights the fact that such coordination goal could require some interdisciplinary solutions “….contributing effectively to the objectives of Europe 2020 and the Innovation Union will require solutions to be developed which are interdisciplinary in nature…”. The proposed project fits well the context of Horizon 2020, as it focus on computer science advancements with a strong impact for the society, in the domain of healthcare. Health is the first one among the “Social Challenges” specified in Horizon 2020: “1. HEALTH, DEMOGRAPHIC CHANGE AND WELLBEING Effective health promotion, supported by a robust evidence base, prevents disease, improves wellbeing and is cost effective” (pag 50) “An increasing disease and disability burden in the context of an aging population places further demands on health and care sectors. If effective health and care is to be maintained for all ages, efforts are required to improve decision making in prevention and treatment provision, to identify and support the dissemination of best practice in the healthcare sector,” (pag. 50)” “1.15. Optimising the efficiency and effectiveness of healthcare systems and reducing inequalities through evidence based decision making and dissemination of best practice, and innovative technologies and approaches. There is a need to support the development of health technology assessment and health economics, as well as the of gathering evidence and dissemination of best practice and innovative technologies and approaches in the healthcare sector, including ICT and e-health applications” (pag. 54)” Previous excerpts from [Horizon] clearly highlight: (1) the importance of tools and methodologies supporting the adoption and the dissemination of the “best practice” in the health and clinical contexts, and (2) the fundamental role of computer science in reaching this goal As for the first aspect, the project focuses on the specification of temporal aspects of clinical guidelines, which informally may be defined as the main tool in medicine for collecting the clinical evidence and for specifying it in “best practice” procedures for health stakeholders. Clinical guidelines are, according to the definition from the US Institute of Medicine, “sistematically developed statements to assist practitioner and patient decisions about appropriate health care in specific clinical circumstances”. Clinical guidelines are characterized by the presence of complex decision processes, where the physician plays the most important role: they support (and do not limit) the decisional activity of physicians. The clinical guidelines lifecycle is made of three phases: (i) guideline definition, by a committee of expert specialists, (ii) guideline application to specific patients and in specific clinical contexts, (iii) possible guideline update, by a committee of expert specialists. It is important to notice that, in the second phase, clinical guidelines, which are general, and specifically tailored for the considered health/clinical unit and patient (merging guidelines with some organizational constraints and adapting them to the considered patient situation), generating the so called Clinical Pathways. Adopting in an integrated way both systems supporting the specification/execution of clinical guidelines/pathways and techniques for the intelligent analysis of huge amounts of clinical (process) data, is an important way of promoting the so called evidence-based medicine; it ensures several advantages for all the stakeholders of the healthcare arena: - for patients: they are guaranteed with respect to the quality of the provided care (according to the approach of evidence-based medicine) - for physicians: a sound reference for clinical activities is available to them, as accessible documents, decision support tools and/or as a critiquing and self-evaluation tool; a certification of the quality of the care provided by them is at disposal (and it is important from a legal point of view) - for healthcare organizations: a tool is available for standardizing healthcare services, their related quality, and for evaluating the usage and costs of resources. - for the overall healthcare system: sharing standardized clinical procedures allow a tighter connection between hospitals, general practitioners, medical specialists and labs, and patients. In particular, the focus on the quality of the provided care is allowed by the adoption of clinical guidelines/pathways and it is derived by the fact that guidelines are based on evidence-based medicine, which guarantees the adoption of the most suitable clinical methodologies, according to the scientific state-of-the-art for the specific clinical domain. Moreover, the integration with techniques for the intelligent analysis of clinical data and processes allow the healthcare organization to build, even through the guidelines, quality indicators both related to the application of guidelines to specific patients (goal-based outcomes, functional outcomes, and quality of life measures) and to the whole healthcare organizations (performance indicators). The above mentioned advantages are often limited in the real life by two main issues: (1) at the design step: in several cases the definition of clinical guidelines is difficult, as the medical knowledge is often too complex and not easy to be formalized in a right way (to this end, natural language sentences are usually provided, sometimes without a sound “semantics”). In these cases, clinical recommendations could be incomplete, vague, and sometimes arbitrarily interpretable by physicians in some parts. (2) at the application step: it is widely acknowledged that there is a a gap between the general recommendations provided by guidelines and the real cases, physicians have to deal with in a specific organizational context. Bridging this gap is leaved to the physician. It hase been recently shown by the scientific community that adopting suitable software tools could help to overcome these issues, improving the practical usefulness of clinical guidelines and protocols. Since '90, research in medical informatics and related fields has focused on formalisms and approaches for the computer-based management of clinical guidelines/pathways, even with approaches from the research on business processes and workflows, as highlighted in the description of the state of the art. All these studies confirmed that computer-based tools could help in the management of clinical guidelines/processes and, at the same, highlighted several features/limitations/issues that need to be faced, for the realization of software tools and methodologies applicable to real world clinical domains. The goal of this project is to study both theoretical/methodological aspects and practical ones to allow the real world applicability of the proposed solutions for the integrated management of (temporal) clinical guidelines/pathways and the related data. The approaches UNIVR will consider may be summarized as in the following. (1) Adapting general methodologies and tools to the medical and healthcare domains. According to this approach, it is important to identify theories, methodologies, and software tools that could help in improving the management of clinical guidelines/pathways; afterwards, several studies and research are often required to modify, extend, and adapt these general solutions to clinical/healthcare domains. Such approach is explicitly encouraged in the Horizon 2020 framework: “Particular attention will be paid to ensuring a broad approach to innovation, which is not only limited to the development of new products and services on the basis of scientific and technological breakthroughs, but which also incorporates aspects such as the use of existing technologies in novel applications,” (pag 19) In the UNIVR project, the above approach is applied through the adoption and the (temporal) extension of general opensource tools, as YAWL among the workflow management systems and PENTAHO for the management of data warehouses, to consider clinical and/or healthcare domains, and by explicitly focusing on decision support tasks. (2) Considering advanced scientific research. On the other side, the expected scientific results of the UNIVR project will determine an improvement in the state-of-the-art of the specific scientific research areas, as required by the Horizon 2020 framework [Horizon] : “The European Research Council (ERC) will promote world class frontier research. Research at and beyond the frontiers of current understanding is both of critical importance to economic and social welfare, and an intrinsically risky venture, progressing on new and most challenging research areas and characterised by an absence of disciplinary boundaries.” (pag 26) In particular, UNIVR will focus on the following topics, which imply both interesting clinical applications and innovative scientific results: - data-centric temporal process models (workflow models) for representing and managing clinical guidelines/pathways; - design-time e run-time verification algorithms for temporal clinical guidelines/pathways; - temporal data mining techniques (association rules, approximate temporal functional dependencies) for the integrated analysis of clinical data and processes. Allegato 1 Lettera di intenti di Mor Peleg, University of Haifa, Israele Allegato 2 Lettera di intenti di Manfred Reichert, University of Ulm, Germany 9 - Parole chiave Testo italiano SISTEMI DI WORKFLOW CLINICI ANALISI DI PROCESSI CLINICI DATA WAREHOUSE CLINICI Testo inglese CLINICAL WORKFLOW SYSTEMS ANALYSIS OF CLINICAL PROCESSES CLINICAL DATA WAREHOUSE 10 - Stato dell'arte Testo italiano GESTIONE DI PROCESSI CLINICI E SANITARI TEMPORALI Uno schema di workflow (modello del processo) è una descrizione formale di un processo aziendale dove singole unità di lavoro atomiche (task o attività) sono assegnate ad agenti per l'esecuzione. Un agente può essere un'applicazione software (ad esempio, un sistema di basi di dati), una risorsa umana (ad esempio, un addetto alle vendite), o una combinazione di entrambi (ad esempio, un addetto che usa un sistema software) [CasatiCPP95]. Le istanze di un workflow sono dette casi. Un sistema di gestione di workflow (WfMS) si prende carico della esecuzione coordinata di task e casi [GeorgakopoulosHS95]. Le attività sono descritte attraverso modelli concettuali (schemi), che catturano il comportamento del processo e forniscono un modello formale del processo stesso. In letteratura sono presenti alcune proposte per la modellazione concettuale [CasatiCPP95,WfMC,vanderAalst02], e un qualsiasi sistema di workflow sul mercato propone un proprio approccio. Nonostante gli sforzi della Workflow Management Coalition (WfMC), non esistono standard riconosciuti per la modellazione concettuale di workflow [WfMC]. Molti processi aziendali hanno restrizioni temporali, come la durata limitata di sottoprocessi, termini di consegna, date di re-invio, o scadenze per attività. In generale, la violazione dei vincoli temporali aumenta i costi dei processi aziendali poichè induce la gestione di una qualche forma di eccezione [EderPR99,CasatiCPP95]. Quindi, un WfMS dovrebbe fornire al gestore dei processi l'informazione necessaria sui processi, comprensiva delle loro restrizioni temporali e dei loro reali requisiti temporali, allo scopo di evitare la violazione dei vincoli temporali [EderP00,EderT08]. Una recente direzione di ricerca ha esteso ai workflow il concetto di controllabilità [CombiP09,CombiP10,CombiG+12]: la controllabilità è un concetto più forte della consistenza rispetto ai vincoli temporali di un workflow. Uno schema di workflow è consistente se esiste una combinazione di durate per task e di ritardi fra i vari task, che rispetta tutti i vincoli specificati; uno schema è controllabile se è possibile fissare opportunamente i ritardi fra i task in modo che i vincoli siano rispettati per ogni combinazione delle possibili durate dei task. I task, infatti, hanno durate che, pur nei limiti consentiti, sono fuori dal controllo del WfMS. Quando i sistemi di workflow sono applicati all'ambito sanitario, gli aspetti temporali assumono un ruolo centrale e non possono essere trascurati: questo apre nuovi scenari per la ricerca inerente la gestione dei dati temporali nei sistemi di workflow. Infatti, i processi sanitari in genere hanno dei vincoli temporali che se non rispettati possono condurre a conseguenze inaccettabili, similmente a quanto può avvenire, ad esempio, nella gestione di un impianto nucleare. Come esempio di processo sanitario, si considerino le linee guida relative alla gestione dei pazienti infartuati con sovraslivellamento del tratto ST [ACC/AHA2004]: ci sono attività quali il monitoraggio, la somministrazione di terapie e la valutazione di eventuali complicazioni che devono essere eseguite in parallelo; altre attività sono eseguite in sequenza, come la valutazione iniziale, la decisione della terapia/intevento, la successiva attività terapeutica; i vincoli temporali sono parte integrante della linea guida, dal momento che, ad esempio, la terapia fibrinolitica deve essere iniziata entro 30 minuti dal contatto del paziente. Senza un rigoroso controllo sui vincoli temporali e sui ritardi massimi consentiti per le varie attività, difficilmente un sistema di workflow può gestire in modo opportuno processi clinici o sanitari. La definizione e la gestione dell'informazione temporale legata ai processi permetterà ai sistemi di gestione di workflow di migliorare la capacità di gestire processi complessi e, in ambito clinico-sanitario, consentirà di applicare la tecnologia dei workflow in diversi ambiti clinici, con esigenze temporali differenti, con riferimento, ad esempio, al supporto ai processi delle unità di terapia intensiva, alla gestione dei processi sanitari amministrativi, al supporto ai protocolli clinici, al supporto alle linee guida. La gestione degli aspetti temporali nei sistemi di workflow investe tutti i componenti di un WfMS e molteplici aspetti metodologici: dalla progettazione concettuale [CombiP03,CombiGJOP07], agli aspetti architetturali [CombiP04], alla gestione delle risorse [CombiP06], alla verifica di vincoli sia a tempo di progettazione sia a tempo di esecuzione [CombiP09, CombiP10, CombiG+12]. DATA WAREHOUSE TEMPORALI IN SANITA' Un altro ambito di ricerca di estremo interesse rispetto alla gestione di processi clinici e sanitari riguarda la organizzazione, gestione e analisi di grosse moli di dati clinici. I sistemi di data warehouse permettono di integrare e organizzare tali dati al fine di effettuare analisi complesse (OLAP: On Line Analytical Processing) e di applicare algoritmi di data mining. I sistemi di data warehouse temporali, dove la dimensione temporale è esplicitamente considerata sia nella modellazione che nella interrogazione di data warehouse, hanno ricevuto una attenzione costante negli anni [GolfarelliR09,GomezKMV09]; allo stesso tempo, essi richiedono ulteriori e approfonditi studi sia rispetto agli ambiti più generali della modellazione e della interrogazione sia rispetto a quanto richiesto in domini estremamente complessi come quelli clinici e sanitari. La costruzione e la gestione di data warehouse prevede una prima fase (ETL: Extraction, Transformation, Loading) di preparazione dei dati potenzialmente provenienti da diverse basi di dati in un unico archivio consistente, corretto, e opportunamente strutturato a permettere analisi on line di grosse moli di dati; in una seconda fase, vengono quindi preparati i dati da analizzare (data mart o cubi olap), secondo un modello multidimensionale; nelle ultime fasi sono possibili attività di reporting, analisi interattiva e data mining sui dati stessi. Anche in questo caso gli aspetti temporali dei dati sono molteplici: dalla gestione di versioni differenti dello schema del data warehouse, alla modellazione di dati con dimensioni temporali, alla analisi di dati temporali. Recentemente, sono stati considerati nei sistemi di data warehouse dati che descrivono, a volte in assenza di uno schema esplicito, l'esecuzione di processi [KaldeichO04]. L'analisi di dati può rivelarsi efficace nell'identificare quelle esecuzioni di processi più comuni e nell'identificare casi eccezionali [CastellanosCDS04]. Rispetto a questo scenario, la modellazione e l'analisi/interrogazione di esecuzioni di linee guida o di processi clinici consente, ad esempio, di verificare la qualità del servizio, valutando la similarità tra i casi reali e quello che viene descritto come miglior/peggior processo [CombiGJMO07,CombiGOJM09]. Ulteriori approcci all'analisi intelligente di dati clinici temporali propongono tecniche di data mining su dati temporali applicati a serie temporali di dati clinici intervallari, orientate all'estrazione di regole di associazione temporale [SacchiLCB07,CombiS11]. Testo inglese MODELING TEMPORAL HEALTH/CLINICAL PROCESSES A workflow schema (process model) is a formal description of a business process where single atomic work units (task) are assigned to processing entities (agent). Instances of a schema are called cases. An agent may be a software application (e.g., a database system), a human (e.g., a customer representative) or a combination of both (e.g., a human using a software program) [CasatiCPP95]. A workflow management system (WfMS) fully takes over the responsibility for the coordinated execution of tasks and cases [GeorgakopoulosHS95]. Activities are described by means of conceptual models (also named schema) capturing the behavior of the process, and provide a formal process model. Several conceptual models were defined in the literature - we mention here [CasatiCPP95,WfMC,vanderAalst02] - and any WfMS available on the market proposes its own one: despite the efforts from the Workflow Management Coalition [WfMC](WfMC). No widely accepted standard has been achieved yet for the definition of process models and the interoperability of process models among commercial WfMSs from different vendors still is far away. Many business processes have restrictions such as a limited duration of subprocesses, terms of delivery, dates of re-submission, or activity deadlines. Generally, time violations increase the cost of a business process because they lead to some form of exception handling [EderPR99,CasatiCPP95]. Therefore, a WfMS should provide the process manager with the necessary information about a process, its time restrictions, and its actual time requirements to avoid time constraint violations [EderP00,EderT08]. A recent research proposal deals with the concept of controllability extended to temporal workflow schemata [CombiP09,CombiP10,CombiG+12]: controllability is a concept stronger than that of consistency wrt a set of temporal constraints. A workflow schema is consistent if a combination of task durations and delays among tasks exist, satisfying all the given temporal constraints; a schema is controllable if it is possible to suitably set of task delays satisfying all the given temporal constraints for any possible set task durations (within the allowed range). Indeed, task durations are not under the control of the WfMS and are set at run-time by the agents executing tasks. When WfMSs are applied to health processes, temporal semantics can not be neglected: this widens a new frontier for the research over temporal data management and workflow systems. Indeed, health processes are processes where temporal deadlines must be matched: any deadline mismatch may lead to unacceptable consequences, similarly to what we may observe in a nuclear plant management. As an example of a health process, let us consider the guideline for the diagnosis and treatment of ST-segment Elevation Myocardial Infarction (STEMI), published by the American College of Cardiology/American Heart Association in 2004 [ACC/AHA2004]: there are some tasks (e.g., patient monitoring, patient therapy/intervention, ancillary therapies) which can be executed in parallel; other tasks need to be executed in a given sequence (e.g., patient admission, patient examination, therapy assessment); temporal constraints are part of the guideline 'core' (e.g., “fibrinolytic therapy must start within 30 min after the patient contact”). Without a strict control over temporal constraints and deadlines for the completion of tasks, a WfMS could hardly manage clinical/health business processes. The definition and the management of temporal information of processes will improve the management of processes by a WfMS and widen the applicability of WfMSs to many different clinical areas, including but not limited to ICU process management, administrative health process management, clinical protocols support, clinical guidelines support. The management of temporal aspects in WfMSs is important in all components of a WfMS and involves several methodological issues: from the conceptual modeling [CombiP03,CombiGJOP07], to the WfMS architecture [CombiP04], to the scheduling and resource management [CombiP06], to checking consistency and controllability both at designtime and at run-time [CombiP09,CombiP10,CombiG+12]. TEMPORAL DATA WAREHOUSE FOR HEALTH AND MEDICINE A further research area to be considered when we need to manage health and clinical processes is that of clinical data warehouses. Data warehouse systems allow one to integrate and manage clinical data, possibly coming from different database, in order to perform complex analyses and queries (OLAP: On Line Analytical Processing) ad to apply data mining techniques. In temporal data warehouse systems, the temporal dimension is explicitly considered both in modeling and querying a data warehouse [GolfarelliR09,GomezKMV09]; the study of temporal aspects in data warehouse systems requires both a deep research to consider the main issues in modeling and querying temporal data and a careful attention to the specific requirements from complex domain such as that of health and of medicine. Building and managing a data warehouse consist of a first phase (ETL: Extraction, Transformation, Loading) where data are extracted, cleaned, and tranformed to compose a consistent, correct, and suitably structured collection of data. Data warehouse are structured to allow an efficient data analysis even with a huge amount of data. In a second phase, data are structured for the specific analysis to perform (data mart or olap cube), according to a multidimensional data model; the last phases are related to reporting, OLAP, and data mining activities. Even in this phase, temporal aspects of data span from the management of different versions of data warehouse schemata, to modeling temporal data, to querying multidimensional temporal data cubes. Recently, data warehouse systems have been proposed, to manage process data (i.e., data related to the execution of business processes), even when process schemata are not available [KaldeichO04]. Process analysis could be useful in several situations, i.e. in identifying the more common execution patterns as well as in isolating strange or uncommon cases [CastellanosCDS04]. With respect to this scenario, modeling and analyzing/querying data related to executions of either clinical guidelines or clinical processes may allow us, for example,to evaluate the health care quality by comparing the similarity between the optimal case and the other clinical cases [CombiGJMO07,CombiGOJM09]. Further approaches to the intelligent analysis of temporal clinical data develop data mining techniques for the extraction of temporal association rules from clinical interval-based time series [SacchiLCB07,CombiS11]. 11 - Riferimenti bibliografici [ACC/AHA2004] E. M. Antman and et al. ACC/AHA guidelines for the management of patients with ST-elevation myocardial infarction. Circulation, 110(5):588–636, 2004. [BettiniWJ02] C. Bettini, X. Wang, S. Jajodia. Temporal Reasoning in Workflow Systems, Distributed and Parallel Databases, 11(3): 269-306 (2002). [BPMN06] Business Process Modeling Notation Specification. OMG Final Adopted Specification. February 2006 dtc/06-02-01. [CasatiCPP95] F. Casati, S. Ceri, B. Pernici, G. Pozzi. Conceptual Modeling of Workflows, Entity Relationship Int. Conf., Springer, 1995: 341-354. [CasatiCPP98] F. Casati, S. Ceri, B. Pernici, G. Pozzi. Workflow Evolution, Data and Knowledge Engineering, 24(3): 211-238 (1998). [CasatiCPP99] F. Casati, S. Ceri, S. Paraboschi, G. Pozzi. Specification and Implementation of Exceptions in Workflow Management Systems, ACM Transactions on Database Systems, 24(3): 405-451 (1999). [CastellanosCDW04] Malú Castellanos, Fabio Casati, Umeshwar Dayal, Ming-Chien Shan: A Comprehensive and Automated Approach to Intelligent Business Processes Execution Analysis. Distributed and Parallel Databases 16(3): 239-273 (2004) [CombiGJMO07] C. Combi, M. Gozzi, J. M. Juarez, R. Marin, B. Oliboni. Querying clinical workflows by temporal similarity, 11th Conference on Artificial Intelligence in Medicine. LNCS, Volume 4594, pp. 469--478. [CombiG09] C. Combi, M. Gambini. Flaws in the Flow: The Weakness of Unstructured Business Process Modeling Languages Dealing with Data. In: Proceedings On the Move to Meaningful Internet Systems 2009: CoopIS, DOA, and ODBASE, OTM Confederated International Conferences (CoopIS), LNCS 5870, Springer, 2006, p. 42-59 [CombiG+11] C. Combi, M. Gambini, S. Migliorini. The NestFlow Interpretation of Workflow Control-Flow Patterns. In EDER, J., BIELIKOVA, M., MIN TJOA, A. (eds.) Advances in Databases and Information Systems - 15th International Conference, ADBIS 2011, LNCS 6909, Springer, 2011, p. 316-332 [CombiG+12] C. Combi, M. Gambini, S. Migliorini, and R. Posenato. 2012. Modelling temporal, data-centric medical processes. In Proceedings of the 2nd ACM SIGHIT International Health Informatics Symposium (IHI '12). ACM, p. 141-150. [CombiGJOP07] C. Combi, M. Gozzi, J. M. Juarez, B. Oliboni, G. Pozzi. Conceptual modeling of Temporal Clinical Workflows, 14th International Symposium on Temporal Representation and Reasoning. IEEE Computer Society Press, pages 70--81. [CombiGOJM09] C. Combi, M. Gozzi, B. Oliboni, J. M. Juarez, R. Marin. Temporal Similarity Measures for Querying Clinical Workflows, Artificial Intelligence in Medicine (Special Issue on AIME 2007), 46(1): 37-54 (2009). [CombiM+11] C. Combi, A. Montanari, P. Sala. A Uniform Framework for Temporal Functional Dependencies with Multiple Granularities. In PFOSER, D., TAO, Y. et al. (Eds.): Advances in Spatial and Temporal Databases - 12th International Symposium, SSTD 2011, LNCS 6849, Springer, 2011, p. 404-421 [CombiP02] C. Combi, G. Pozzi. Towards Temporal Information in Workflow Systems, 2nd Int. Conf. on Evolution and Change in Data Management ECDM '02, LNCS, 2003, p. 13-25. [CombiP03] C. Combi, G. Pozzi. Temporal Conceptual Modelling of Workflows, Proc. of the 22nd Int. Conf. on Conceptual Modeling ER2003, LNCS, 2003 p. 59-76. [CombiP04] C. Combi, G. Pozzi. Architectures for a temporal workflow management system. In Hisham Haddad, Andrea Omicini, Roger L. Wainwright, and Lorie M. Liebrock, editors, ACM SAC - Symposium on Applied Computing, pp 659-666. ACM, 2004. [CombiP06] C. Combi, G. Pozzi. Task Scheduling for a Temporal Workflow Management System. In: Proceedings 13 international symposium on temporal representation and reasoning (TIME 2006). Los Alamitos, IEEE Computer Society Press, 2006, p. 61-68. [CombiP09] C. Combi, R. Posenato. Controllability in Temporal Conceptual Workflow Schemata. In: DAYAL, U., EDER, J., REIJERS, H.A. (eds.) Proceedings of the 7th International Conference on Business Process Management (BPM 2009), Berlin, Springer, LNCS 5701, 2009, p. 64-79. [CombiP10] C. Combi, R. Posenato: Towards Temporal Controllabilities for Workflow Schemata. TIME 2010 International Symposium on Temporal Representation and Reasoning. IEEE Computer Society Press, p. 129-136 [CombiS11] C. Combi, P. Sala: Temporal Functional Dependencies Based on Interval Relations. TIME 2011 International Symposium on Temporal Representation and Reasoning. IEEE Computer Society Press, p. 23-30 [DechterMP91] R. Dechter, I. Meiri, J. Pearl. Temporal Constraint Networks. Artif. Intell. 49(13): 61-95 (1991). [EderGP00] J. Eder, W. Gruber, E. Panagos. Temporal Modeling of Workflows with Conditional Execution Paths, DEXA 2000: 243-253. [EderP00] J. Eder, E. Panagos. Managing Time in Workflow Systems, Workflow Handbook 2001, Workflow Management Coalition (WfMC), 2000, pp. 109-132. [EderPR99] J. Eder, E. Panagos, M. Rabinovich. Time Constraints in Workflow Systems, Int. Conf. on Advanced Information Systems Engineering, Springer, 1999: 286-300. [EderT08] J. Eder, A. Tahamtan. Temporal Consistency of View Based Interorganizational Workflows. In Roland Kaschek, Christian Kop, Claudia Steinberger, Günther Fliedl (Eds.): Information Systems and e-Business Technologies, 2nd International United Information Systems Conference, UNISCON 2008, 2008, Lecture Notes in Business Information Processing Volume 5 Springer 2008: 96-107. [GeorgakopoulosHS95] D. Georgakopoulos, M. F. Hornick, A. P. Sheth. An Overview of Workflow Management: From Process Modeling to Workflow Automation Infrastructure. Distributed and Parallel Databases 3(2): 119-153(1995). [GolfarelliR09] M. Golfarelli, S. Rizzi. A Survey on Temporal Data Warehousing. IJDWM (JDWM) 5(1):1-17 (2009). [GomezKMV09] L. Gómez, B. Kuijpers, B. Moelans, A. Vaisman. A Survey of SpatioTemporal Data Warehousing. IJDWM (JDWM) 5(3):28-55 (2009). [GoralwallaLTSC01] I.A. Goralwalla, Y. Leontiev, M.T. Özsu, D. Szafron, C. Combi. Temporal Granularity: Completing the Puzzle. Journal of Intelligent Information Systems 16(1): 41-63 (2001). [HaimowitzFFSV94] I.J. Haimowitz, J. Farley, G.S. Fields, J. Stillman, B.J. Vivier. Temporal Reasoning for Automated Workflow in Health Care Enterprises. In: Electronic Commerce, Current Research Issues and Applications [Workshop at NIST, Gaithersburg, Maryland, USA, December 1, 1994]. LNCS 1028 Springer 1996, p. 87-113. [HedermanSWK02] L. Hederman, D. Smutek, V. Wade, T. Knape. Representing clinical guidelines in uml: a comparative study. In P. McNair G. Surjan, R. Engelbrecht, editor, Medical Informatics in Europe 2002, pages 471-477. European Federation for Medical Informatics, 2002. [Horizon] EUROPEAN COMMISSION: Proposal for .. establishing the Specific Programme Implementing Horizon 2020 - The Framework Programme for Research and Innovation (2014- 2020). Brussels, 30.11.2011 COM(2011) 811 final 2011/0402 (CNS) [KaldeichO04] Claus Kaldeich, Jorge Oliveira e Sá: Data Warehouse Methodology: A Process Driven Approach. CAiSE 2004: 536-549. [JensenS99] C.S. Jensen, R.T. Snodgrass. Temporal data management. IEEE Trans. Knowl. Data Eng., 11(1):36-44, 1999. [LanzWRD10] A. Lanz, B. Weber, M. Reichert. Workflow Time Patterns for Process-aware Information Systems. In: Proceedings Enterprise, Business-Process, and Information Systems Modelling: 11th International Workshop BPMDS and 15th International Conference EMMSAD at CAiSE 2010, Springer, LNBIP 50, pp. 94-107, 2010. [MarjanovicO99] O. Marjanovic, M.E. Orlowska. On Modeling and Verification of Temporal Constraints in Production Workflows, Knowledge and Information Systems, 1(2): 157-192 (1999). [SacchiLCB07] Lucia Sacchi, Cristiana Larizza, Carlo Combi, Riccardo Bellazzi: Data mining with Temporal Abstractions: learning rules from time series. Data Min. Knowl. Discov. 15(2): 217-247 (2007) [vanderAalst02] W.M. van der Aalst, K.M. van Hee. Workflow Management: Models, Methods, and Systems. MIT Press, 2002. [WfMC] The WorkFlow Management Coalition, http://www.wfmc.org 12 - Descrizione dei compiti dell'Unità di Ricerca Testo italiano FASI E COMPITI DELL'UNITA' DI VERONA Il programma di ricerca dell'unità di Verona (nel seguito UNIVR) consisterà delle seguenti linee di ricerca principali, che si integrano con quanto sarà fatto dalle altre unità di ricerca coinvolte nel processo. Nel seguito è adottata la strutturazione e numerazione comuni di attività e sottoattività del processo, come concordato con le altre unità di ricerca. 0. Analisi dello stato dell’arte e approfondimento dei domini clinici individuati (0 – 6° mese) 0.1 Analisi dello stato dell’arte e condivisione fra le unità In questa prima fase UNIVR si concentrerà sullo stato dell’arte della ricerca nell’ambito dei temporal constraints, dei sistemi di data warehouse temporali in medicina, dei modelli di workflow data-centric e temporali. 0.2 Specifica ed analisi dei casi di studio 0.2.1 Linee guida e relativi Clinical pathways STEMI (gestione infarto miocardico con livellamento del tratto ST) Queste linee guida sono relative alla gestione dei pazienti con infarto miocardico acuto con sovraslivellamento del tratto ST dall’insorgenza dei sintomi fino alla cura ospedaliera di riabilitazione [ACC/AHA2004]. Il trattamento efficace di pazienti con infarto miocardico acuto richiede strutture e organizzazioni con elevato grado di specializzazione e coordinamento, che permettano di ridurre i tempi che intercorrono fra la presentazione del paziente alla struttura sanitaria e l’inizio dei trattamenti. In particolare le raccomandazioni contenute in tali linee guida dettagliano, a seconda della situazione (presenza o assenza di sala operatoria adatta, ritardo rispetto alla presentazione dei sintomi) e della categoria di pazienti (per età, con patologie concomitanti), differenti tipi di trattamento: riperfusione farmacologia, angioplastica coronarica, o intervento cardiochirurgico. Vari aspetti verranno approfonditi in questa fase, con l’eventuale coinvolgimento di cardiologi: aspetti legati alla modellazione delle linee guida e della conoscenza inerente, gestione degli aspetti di flessibilità e temporali, adattamento delle linee guida agli specifici contesti organizzativi. 0.2.2 Farmacovigilanza La farmacovigilanza mira al rilevamento, valutazione e prevenzione di reazioni avverse e di ogni altro problema collegato all'uso di farmaci. Il processo che porta alla commercializzazione di un farmaco prevede studi preclinici e studi clinici. Mentre l'efficacia del farmaco è a questo punto nota, la sicurezza dello stesso non è sempre completamente determinabile. Reazioni avverse poco frequenti, che insorgono in determinate condizioni o in ritardo non possono essere messe in evidenza nella sperimentazione antecedente alla vendita del medicinale. Capita, pertanto, che nuovi farmaci vengano ritirati dal commercio in seguito all'identificazione di effetti collaterali o problemi prima sconosciuti. Nel mondo, nel periodo compreso tra il 1972 e il 1994, sono stati approvati 583 nuovi principi attivi, di cui 59 rimossi dal mercato per ragioni di sicurezza; altre sostanze hanno subito restrizioni nell'utilizzo o nei dosaggi. Nel 1996, negli Stati Uniti le reazioni avverse da farmaci sono state la quarta causa di morte. Rispetto a questo importante ambito verranno approfonditi gli aspetti legati alla modellazione dei processi legati alla farmacovigilanza, all’acquisizione e all’analisi dei dati provenienti dalle segnalazioni, alla individuazione di indici sintetici orientati al monitoraggio delle reazioni da farmaci. 0.2.4 Medicina d’urgenza: arresto cardiaco L'arresto cardiaco è una delle condizioni cliniche più frequenti nell'ambito della medicina d'urgenza e richiede interventi specialistici sotto stretti vincoli temporali: in questo ambito verranno analizzate le principali attività coinvolte e i relativi vincoli temporali e ambientali, che possano portare ad un approccio uniforme, coordinato e, per quanto possibile, predefinito nel trattamento dei pazienti in arresto cardiaco e nell'acquisizione dei dati relativi. 0.3. Individuazione dei casi di studio da focalizzare nel progetto UNIVR, oltre allo specifico contributo nell’analisi dei casi di studio relativi alla gestione dei pazienti con infarto miocardico acuto, alla farmacovigilanza e alla gestione dei pazienti in arresto cardiaco, collaborerà all’individuazione dei casi di studio ritenuti più significativi, sia rispetto a quanto i casi di studio sono di interesse per le varie unità di ricerca, sia rispetto al valore aggiunto che i risultati dei casi studio daranno al progetto complessivo. 1. Modellazione integrata di dati e di processi clinici e sanitari (6° - 24° mese) 1.2. Modellazione di linee guida 1.2.1 Formalismi Nell'ambito dei sistemi informativi, esistono varie linee di ricerca che recentemente hanno attirato un interesse significativo a livello internazionale: da una parte, è crescente lo sforzo nell'ambito della modellazione dei processi organizzativi (business process: BP) verso standard per la descrizione concettuale di BP e per la definizione di un linguaggio, basato su XML, per lo scambio di schemi di BP. BPMN (business process modeling notation) e BPEL4WS (business process execution language for web services) sono gli acronimi che identificano rispettivamente il modello concettuale definito ed il linguaggio di scambio di BP, all'interno di organizzazioni internazionali che si propongono lo studio di standard nell'ambito dei sistemi informativi, quali l'Object Management Group e la Business Process Management Initiative [BPMN06]. Dall'altra, continua ormai da anni lo sforzo della Workflow Management Coalition, che rappresenta la maggior parte di organizzazioni ed enti coinvolte nella realizzazione o nell'uso di sistemi di workflow, nella definizione di standard di riferimento per gli aspetti di modellazione, architetturali e di specifica di workflow [WFMC]. In prima approssimazione si può dire che i workflow sono la rappresentazione dei BP, orientata alla loro esecuzione attraverso il supporto di un sistema di workflow (WfMS). Recentemente è cresciuto l’interesse nell’uso di formalismi di BP e/o workflow per la rappresentazione degli aspetti organizzativi sottesi alle linee guida clinico-sanitarie: scopo di UNIVR in questo ambito è lo studio e la proposta di modelli strutturati di workflow per la rappresentazione di linee guida, con particolare riferimento alla gestione integrata di flussi di controllo e flussi di dati, sulla base di recenti proposte [CombiG09,CombiG+11]. 1.2.2 Aspetti temporali Nonostante gli aspetti temporali caratterizzano varie parti dei BP e della gestione dei BP attraverso i WfMS, non è stata posta alcuna attenzione particolare alla modellazione esplicita e supportata dai sistemi di tali temporalità. Nè la BPMN nè il modello di riferimento della WfMC permettono di rappresentare ad alto livello aspetti temporali: al più, specifici aspetti temporali possono essere esplicitamente trattati dai progettisti di BP, attraverso l'uso di timer e di altri costrutti a basso livello. Come già sottolineato, sottovalutare tali aspetti temporali specialmente nei BP sanitari può portare ad una scarsa applicabilità ai processi diffusi nel mondo reale o ad un grande sforzo dei progettisti per gestire ogni volta singoli casi di vincoli temporali con costrutti a basso livello. Una importante caratteristica degli aspetti temporali nei workflow è la granularità temporale, con la quale i vari aspetti temporali sono espressi. Ad esempio, nella definizione di un processo di cura potrebbero essere ammessi ritardi dell'ordine dei minuti nell'esecuzione di attività cliniche, mentre potrebbero essere posti dei vincoli espressi in ore per l'espletamento di attività burocratiche. D'altro canto, workflow all'interno di una unità di terapia intensiva hanno vincoli temporali espressi con unità temporali più fini di quelle usate per esprimere le temporalità di processi legati al follow-up di pazienti cronici. Rispetto a vincoli espressi a differenti granularità temporali, inoltre, andranno considerate varie possibili semantiche temporali, così come emerge dalla letteratura di riferimento [GoralwallaLTSC01, BettiniWJ02], dove si possono distinguere granularità ancorate e non ancorate e vincoli corrispondenti. Ad esempio, se si definisce che due attività devono essere eseguite entro un giorno una dall'altra, possono essere considerate due diverse semantiche: la prima interpretazione prevede che la seconda attività deve essere eseguita entro il giorno successivo alla prima; la seconda interpretazione, invece, prevede che passino non più di 24 ore fra la prima e la seconda attività. Lo scopo di questa linea di ricerca all'interno del progetto è quello di distinguere quali sono gli aspetti temporali principali da rappresentare nella modellazione concettuale di workflow, alla luce anche dei recenti contributi pubblicati dai componenti dell'unità operativa e da altri ricercatori [CombiGJOP07,CombiP04,CombiP03,BettiniWJ02]. Rispetto ai workflow clinici, infatti, sarà importante caratterizzare quali sono le dimensioni temporali considerate per le attività cliniche. Per tali dimensioni, siano esse ritardi ammessi o altri vincoli temporali, ci si focalizzerà sulle notazioni più opportune per rappresentare vincoli assoluti, periodici e di durata, caratterizzando l'espressività del modello rispetto alla complessità legata alla valutazione di vari livelli di consistenza di tali vincoli. 1.3 Modellazione di clinical Pathway (workflow) 1.3.1 Formalismi UNIVR si concentrerà sull’integrazione ed estensione di quanto proposto per il supporto di linee guida, al fine di permettere l’adattamento delle linee guida stesse allo specifico contesto organizzativo e tecnico dell’unità clinica dove le linee guida vengono applicate. 1.3.2 Aspetti temporali --- Temporal features Oltre agli aspetti temporali presenti nelle linee guida, ulteriori aspetti temporali sono da considerare rispetto al contesto nel quale le linee guida vengono introdotte: è dunque importante poter specificare aspetti temporali specifici, che vanno considerati e, eventualmente, opportunamente armonizzati con quanto espresso nelle linee guida. 2. Verifica design time e run time di processi clinici (13° - 30° mese) 2.1. Verifica design time Oltre alla consistenza, un concetto recentemente applicato all'ambito dei workflow è quello di "controllabilità". La controllabilità è una proprietà più forte della consistenza e prevede che un workflow possa essere eseguito rispettando tutti i vincoli temporali senza fissare a priori le durate delle attività cliniche, che sono fuori dal controllo del sistema di gestione di workflow [CombiP09,CombiP10,CombiG+12]. La controllabilità e gli algoritmi per la sua verifica saranno oggetto di studio e di applicazione in ambito clinico: in particolare, appare interessante in questo ambito il concetto di "controllabilità dinamica", che prevede la capacità di fissare di volta in volta i ritardi fra i singoli task da eseguire, in modo coerente con le durate dei task già eseguiti. 2.2 Verifica run time e adattività Oltre a verificare la controllabilità di un processo clinico in fase di progettazione, è poi indispensabile poter controllare run time tale controllabilità: essendo tale controllabilità dinamica è, infatti, necessario tenere conto di quanto già eseguito e avvenuto per poter affinare e modificare i ritardi nell’esecuzione dei task futuri. Allo stato dell’arte e per quanto a conoscenza di UNIVR, non esiste una soluzione alla verifica run time della controllabilità dinamica di processi clinici. E’ importante sottolineare che la verifica run time della controllabilità richiede che l’esecuzione del workflow abbia caratteristiche di adattività, in modo da poter gestire “aggiustamenti” rispetto a quanto avvenuto in precedenza. 3. Analisi intelligente ed integrata di dati e processi clinici e sanitari (6° – 24° mese) 3.2 Clinical Data mining Nell’analisi di dati e processi clinici, UNIVR si concentrerà sul data mining temporale di dati puntuali e intervallari: in particolare verranno estese ed adattate all’ambito clinico alcune recenti proposte inerenti la specifica e la scoperta di dipendenze funzionali temporali [CombiS11,CombiM+11]. 3.3 Clinical process mining Nella modellazione di linee guida per mezzo di workflow, le regole che un processo deve seguire sono descritte nello schema di workflow e devono essere soddisfatte dalle istanze (casi) del processo stesso. Uno schema di workflow descrive la struttura dei casi rispetto al coordinamento delle attività (attività parallele, attività sequenziali, fork totali/parziali, e join totali parziali). Inoltre, lo schema può contenere vincoli temporali qualitativi e quantitativi. Le istanze di uno stesso schema di workflow possono, quindi, essere differenti rispetto alla struttura e rispetto alle attività che compongono il caso, al loro ordine (temporale) e alla loro lunghezza. Quando uno schema di workflow rappresenta una linea guida, i suoi casi rappresentano istanze differenti derivanti dall'applicazione della linea guida a pazienti diversi in situazioni diverse. L'analisi intelligente dei dati relativi ai vari casi diviene quindi centrale nella valutazione dei singoli casi, rispetto alla corretta applicazione delle linee guida, rispetto al corretto trattamento del singolo paziente, e così via. L'analisi di casi di processi clinici permette di riconoscere insiemi di casi (istanze dello stesso schema di workflow) simili tra loro e quindi consente di scoprire modelli di processi clinici e sanitari a partire dai dati. Spesso, addirittura, i processi clinici possono essere osservati e analizzati solo in base ai dati dei processi stessi, senza che uno schema esplicito sia disponibile. Fuoco di tale questa attività consiste nello sviluppo di tecniche di data mining temporale su dati di workflow clinici: alcune tecniche potrebbero estendere la proposta per la stima di similarità tra due processi [CombiGJMO09], basata sul confronto tra attività (task) corrispondenti, sulla somiglianza tra le relazioni tra le attività e sul confronto tra l'insieme dei task eseguiti. Altre tecniche di data mining temporale su dati di processo potrebbero prendere spunto da quanto proposto in [SacchiLCB07], relativo al data mining di dati caratterizzati da dimensioni temporali intervallari. 4. Progettazione e implementazione di una suite di strumenti software per la gestione e l’analisi integrate di linee guida e di dati clinici (18° – 36° mese) 4.1 Progettazione e prototyping UNIVR si concentrerà sui seguenti aspetti. 1) Progettazione e implementazione di prototipi basati su software opensource (YAWL un WfMS opensource, e Pentaho, una suite di strumenti opensource per la gestione e l’analisi di data warehouse), e su prototipi sviluppati localmente, per la modellazione di workflow temporali e per la analisi di dati e processi clinici orientati temporalmente. Verranno considerate alcuni soluzioni prototipali per la modellazione concettuale di workflow e per l'analisi di data warehouse di dati e processi, basate sull'uso e sull'eventuale estensione di sofware opensource per la gestione di processi e per la gestione di data warehouse. Gli utenti clinici saranno coinvolti per dare indicazioni e suggerimenti al fine di raffinare i prototipi nella direzione di una loro facile applicabilità ad ambiti sanitari concreti. 2) Progettazione e realizzazione di tecniche basate sulla valutazione della similarità per l'esplorazione (mining) di basi di casi reali. Verranno considerate varie misure di similarità e verranno proposte tecniche di mining basate su tali misure. Le tecniche sviluppate verranno valutate su dati reali provenienti dagli ambiti applicativi individuati nella fase precedente e possibilmente integrate con il prototipo di analisi OLAP di processi clinici temporali. 3) Progettazione ed implementazione di tool e algoritmi per il mining di dipendenze funzionali temporali approssimate basate su punti e su intervalli con applicazione a dati clinici di processo. 4.2 Test e integrazione Il test dei prototipi verrà effettuato su dati reali o su opportuni set di dati sintetici considerando sia gli aspetti dei design time che run time, dove gli attori coinvolti sono differenti e con diverse familiarità con il sistema. L’integrazione, di concerto con tutte le altre unità del progetto, si fonderà per quanto possibile sulle piattaforme open source già individuate (Penthao e YAWL) o che verranno individuate nel corso del progetto, al fine di permettere un’ampia fruizione dei risultati “concreti” del progetto stesso. 4.3. Validazione finale su alcuni casi di studio La validazione finale di quanto realizzato da UNIVR avverrà sui casi di studio individuati nella prima fase del progetto in accordo con tutte le altre unità. Oltre a questo, UNIVR considererà con particolare attenzione i casi di studio individuati localmente: le linee guida per pazienti STEMI, l’ambito della farmacovigilanza e quello della gestione dei pazienti in arresto cardiaco. PRODOTTI DELLA RICERCA E RISULTATI ATTESI I prodotti della ricerca e i relativi risultati attesi sono sia di carattere teorico-metodologico sia di carattere pratico-applicativo. Oltre ai prodotti specifici del progetto, consistenti in rapporti di ricerca, documentazione di progetto e prototipi software, è precisa intenzione di UNIVR inviare pubblicazioni relative ai risultati ottenuti alle principali conferenze e riviste del settore. Per ogni macro-attività si dettagliano nel seguito i principali prodotti e risultati attesi. 0. Analisi dello stato dell’arte e approfondimento dei domini clinici individuati: rapporti di ricerca e/o presentazioni focalizzati sugli argomenti indicati; analisi e discussione dei casi di studio relativi a processi per pazienti con infarto miocardico acuto, a processi di farmacovigilanza, a processi relativi alla gestione di pazienti in arresto cardiaco. 1. Modellazione integrata di dati e di processi clinici e sanitari (6° - 24° mese): rapporti di ricerca relativi a modelli innovativi di workflow strutturati e temporali per linee guida e processi clinici e loro confronto con le proposte esistenti. 2. Verifica design time e run time di processi clinici: rapporti di ricerca relativi ad algoritmi innovativi ed efficienti per la verifica della controllabilità di schemi di processo a tempo di progettazione e a tempo di esecuzione con confronto rispetto a soluzioni esistenti e caratterizzazione della loro complessità computazionale. 3. Analisi intelligente ed integrata di dati e processi clinici e sanitari: rapporti di ricerca relativi a tecniche di data e process mining temporali per informazioni puntuali e intervallari (con particolare attenzione alle regole di associazione temporale e alle dipendenze funzionali temporali approssimate). 4. Progettazione e implementazione di una suite di strumenti software per la gestione e l'analisi integrate di linee guida e di dati clinici: documentazione di progetto e software prototipali integrati con quanto prodotto dalle altre unità relativi a sistemi di workflow per la progettazione e l'esecuzione di linee guida e processi clinici e sistemi di data mining per dati e processi clinici temporali. Tali sistemi saranno esplicitamente applicati ai casi di studio considerati in ambito clinico. Testo inglese PROJECT PHASES AND VERONA RESEARCH UNIT DUTIES The program of Verona research unit (hereinafter called UNIVR) will consist of the following main research directions that will merge with the research directions followed by the other research groups involved in the process. Below, the same structure and numbering of common tasks and subtasks of the process of other research units is adopted. 0. Analysis of the state-of-the-art and thoroughly analysis of the already identified clinical domains (0 - 6th month) 0.1 Analysis of the state-of-the-art and its sharing among the units In this first phase UNIVR will focus on the study of the state-of-the-art in temporal constraints research, in temporal data warehouse systems in medicine, and in models for temporal and datacentric workflows. 0.2 Specification and analysis of case studies 0.2.1 Guidelines and Clinical Pathways for STEMI (ST segment elevation myocardial infarction management) The STEMI guidelines focus on the management of patients with "acute myocardial infarction with ST-segment elevation" from the onset of symptoms to the hospital treatment and rehabilitation [ACC/AHA2004]. The effective treatment of patients with acute myocardial infarction requires clinical structures and organizations with a high degree of specialization and coordination to reduce the time elapsing between the arrival of the patient to the hospital and the beginning of treatments. In more details, the recommendations contained in these guidelines specify different types of treatment according to the actual situation (suitable operating theatre availability, symptoms presentation delay) and patient categories (age, accompanying symptoms,…): pharmacological reperfusion, percutaneous transluminal coronary angioplasty (PTCA), or cardiac surgery procedure. In this phase, different aspects of such guidelines will be analyzed with the possible involvement of cardiologists, such as issues regarding guidelines modeling and the related knowledge, management of flexibility and temporal aspects in guidelines, and guidelines adaptation to specific organizational contexts. 0.2.2 Pharmacovigilance Pharmacovigilance aims at the detection, assessment, and prevention of adverse reactions and any other problem related to drugs use. The process leading to commercialization of a drug requires preclinical and clinical studies. While the effectiveness of a drug is well known after such studies, its safety is not always completely determined. Uncommon adverse reactions, which occur under certain conditions or after some delay, may not have been highlighted in the trial prior to the appearance on the market. Therefore, it is possible that a new drug is withdrawn from the market following the identification of previously unknown side effects or problems. Between 1972 and 1994, in the world 583 new active principles were approved; 59 of them have been later removed from the market for safety reasons; other principles have been restricted in their applicability or dosage. In 1996, in the United States, adverse drug reactions were the fourth leading cause of death. Regarding such important area, in-depth studies will be performed about the modeling of processes related to pharmacovigilance, to the acquisition and analysis of data coming from reports, and to the identification of concise indices to monitor drug reactions. 0.2.4 Emergency Medicine: Cardiac Arrest Cardiac arrest is one of the most frequent clinical conditions in emergency medicine and requires specialistic interventions under strict temporal constraints: in this context a study about main activities with their temporal and environmental constraints will be executed in order to propose an uniform, coordinated and, as far as possible, default approach in the treatment of patients in cardiac arrest and in the acquisition of related data. 0.3. Identification of case studies for the project UNIVR, in addition to the specific contribution in the analysis of case studies related to the management of patients with acute myocardial infarction, drug monitoring, and management of patients in cardiac arrest, will collaborate to identify the most significant case studies according to their general meaningfulness for the different research units; moreover, case studies will be considered even according to the overall expected project results. 1. Integrated modeling of data and clinical/health processes (6th - 24th month) 1.2. Guidelines Modeling 1.2.1 Formalisms In the context of information systems there are several research directions that have recently attracted significant attention at international level: on the one hand, there is an increasing effort in the modeling of organizational processes (business process: BP) towards a standard for conceptual description of BP and in the definition of a language, based on XML, for the exchange of patterns of BP. BPMN (business process modeling notation) and BPEL4WS (business process execution language for web services) are the acronyms that identify the conceptual model and language, respectively, for the exchange of BPs proposed by international organizations, such as the Object Management Group and the Business Process Management Initiative [BPMN06]. On the other hand, Workflow Management Coalition, which represents the majority of organizations and institutions involved in implementation or use of workflow systems, is leading since several years the effort to define a standard reference for modeling aspects, for architectures and specification of workflows [WfMC]. As a first approximation one can say that workflows are the suitable representation of BPs for their execution through the support of a workflow system (WFMS). Recently, an increased interest has been shown in the use of formalisms about BP and/or workflow for the representation of organizational aspects underlying the clinical/health guidelines: the main goal of UNIVR in this area is the study and the proposal of structured models for workflow to represent clinical/health guidelines that make explicit and suitable the integrated management of control-flows and data-flows as suggested in recent proposals [CombiG09, CombiG +11]. 1.2.2 Temporal Aspects Despite the fact that temporal aspects characterize different parts of BPs and BP management through WFMSs, few attention has been spent until now to make their modeling and support explicit. Neither BPMN nor the reference model of WfMC allow the high-level representation of temporal aspects: at the most, detailed temporal aspects can be managed explicitly by BP designers through the use of timers and other low-level constructs. As already noted, the underestimation of these temporal issues in healthcare BPs can lead to a poor applicability of BPs to real world processes or to a request of a hard work for designers to manage any specific case of temporal constraints using low-level constructs. An important feature of the temporal constraints in workflows is the temporal granularity by which the different temporal constraints are expressed. For example, the definition of a medical process may admit delays in the order of minutes for the execution of clinical activities while defines temporal constraints in the order of hours for the completion of bureaucratic activities. In general, workflows within an intensive care unit have temporal constraints expressed in time units finer than those used to express the temporality of processes related to the follow-up of chronic patients. As regards the constraints expressed at different temporal granularities, several possible temporal semantics have to be considered as it is clear from the reference literature [GoralwallaLTSC01, BettiniWJ02], where we can distinguish anchored and unanchored granularity and corresponding constraints. For example, if it is defined that two tasks must be performed within a day one from the other, two different semantics may be considered to interpret the constraint: the first states that the second task must be done within the day after the first and the second one states that not more than 24 hours has to be spent between the first task and the second one. The purpose of this research direction within the project is to distinguish which are the key temporal aspects to be represented in the conceptual modeling of workflows also considering recent papers published by members of UNIVR and by other researchers [CombiGJOP07, CombiP04, CombiP03, BettiniWJ02]. Compared with clinical workflows, it will be important to characterize what are the considered temporal dimensions for clinical activities. For such dimensions or allowed delays or other time constraints, we will focus on the most appropriate notations to represent absolute, periodic and duration constraints, characterizing the expressiveness of the model compared to the complexities of assessing the various levels of consistency of these constraints. 1.3 Clinical Pathway (workflow) modeling 1.3.1 Formalisms UNIVR will focus on the integration and extension of what is proposed for the support of guidelines, in order to allow the adaptation of the guidelines in the specific organizational and technical context of the hospital unit where the guidelines are applied. 1.3.2 Temporal Aspects --- Temporal features In addition to the temporal aspects presented in guidelines, further temporal aspects have to be considered with respect to the context in which the guidelines are adopted: therefore, it is important to allow the specification of particular temporal aspects, which should be considered and, where appropriate, suitably harmonized with what is represented in the guidelines. 2. Design Time Verification and Run Time of clinical processes (13th - 30th month) 2.1. Design Time Verification In addition to consistency, in the workflow research field a new concept has been recently proposed and applied: the "controllability". Controllability is a property stronger than consistency and guarantees that a workflow can be executed complying with all temporal constraints without fixing a priori the duration of clinical activities, which are beyond the control of a workflow management system [CombiP09, CombiP10, CombiG+12]. In this phase, controllability concept and checking algorithms for it will be studied and applied in clinical settings: in particular, it is interesting to study the concept of "dynamic controllability", which provides the ability from time to time to set delays between successive tasks to be performed in a consistent way with the durations of tasks already performed maintaining the satisfiability of all temporal constraints of the process. 2.2 Run Time Verification and Adaptability In addition to assessing the controllability of a clinical process during the design phase, it is necessary to be able to manage the controllability at run time: since the controllability is dynamic, it must take into account what has already been executed and to refine/change the delays of execution of the following tasks. At the best of the knowledge of UNIVR, there is no solution to the run-time verification of dynamic controllability of clinical processes. The runtime controllability requires that the execution of a workflow has some kind of adaptability so that it is possible to manage "adjustments" according to what happened previously. 3. Integrated and intelligent analysis of data and clinical/health processes (6th - 24th month) 3.2 Clinical Data Mining In the analysis of clinical data and processes, UNIVR will focus on temporal data mining of point-based and interval-based temporal data: in particular, some recent proposals for the specification and discovery of temporal functional dependencies will be extended and adapted to the clinical setting [CombiS11, CombiM+11]. 3.3 Clinical Process Mining In modeling guidelines through workflows, rules that a process has to observe are described in the workflow schema and they have be satisfied by the instances (cases) of the process itself. A workflow schema describes the structure of cases compared to the coordination of the activities (parallel activities, sequential tasks, total/partial forks, and partial/total joins). Furthermore, the schema may contain qualitative and quantitative temporal constraints. Therefore, instances of a same schema may be different with respect to structure, with respect to the activities that make up the case, and with respect to the (temporal) order and span of the activities. When a workflow schema represents a guideline, its cases represent different instances derived from the application of the guideline to different patients and/or in different situations. Hence, intelligent analysis of data related to different cases becomes fundamental to the assessment of single cases, for the right implementation of the guidelines, for the correct treatment of the individual patient, and so on. The analysis of clinical process cases allows the determination of sets of cases (instances of the same schema of workflow) that are similar to each other and, therefore, allows the definition of patterns of clinical/health processes from the data. Often, the clinical processes can be observed and evaluated only according to data of the processes themselves, without the availability of an explicit schema. The goal of this phase is the development of temporal data mining techniques on data from clinical workflows: some techniques may extend the proposal for the evaluation of similarity between two processes made in [CombiGJMO09], that is based on a comparison of corresponding activities (tasks), on the similarity between activity relationships and on the comparison between the set of performed tasks. Other techniques of temporal data mining on process data could stem from what is proposed in [SacchiLCB07], where there are some proposals about interval-based temporal data mining. 4. Design and implementation of a suite of software tools for an integrated management and analysis of guidelines and clinical data (18th – 36th month) 4.1 Design e prototyping UNIVR will focus on the following aspects. 1) Design and implementation of prototypes based on open source software (YAWL, an open source WFMS, and Pentaho, an open source suite of tools for managing and analyzing data warehouse), and on locally developed prototypes in order to model temporal workflows and to analyze time-oriented clinical data and processes. We will consider some prototype solutions for conceptual modeling of workflow and for analysis of data warehouse of data and processes based on the use and possible extension of open source software for the management of processes and data warehouses. Clinical users will be involved to provide guidance and suggestions in order to refine the prototypes and make them easier to apply in the specific health setting. 2) Design and implementation of techniques based on the evaluation of similarity in order to explore (mining) common patterns of real cases. We will consider several similarity metrics and will propose some mining techniques based on these metrics. The developed techniques will be evaluated on real data from the application domains identified in the previous phase and possibly integrated with the prototype of OLAP analysis of temporal clinical processes. 3) Design and implementation of tools and algorithms for the mining of approximate temporal functional dependencies based on temporal points and intervals with application to clinical processes data. 4.2 Integration and testing The prototype testing will be performed on real data or on appropriate synthetic data sets considering both issues coming from design time and ones coming from run time, where the involved actors are different and with different familiarity with the system. The integration, together with all other units of the project, will be based wherever possible on open source platforms already identified (Penthao and YAWL) or on those that will be identified during the project, in order to allow a wide use of actual results of the project. 4.3. Final validation on some case studies The final validation of the work developed by UNIVR will be on case studies identified in the first phase of the project together with all other units. Besides this, UNIVR will pay particular attention to the case studies locally identified: guidelines for STEMI patients, pharmacovigilance, and the management of patients in cardiac arrest. EXPECTED RESEARCH PRODUCTS AND RESULTS The expected research products and results are both on theoretical-methodological side and practical-application one. In addition to the specific products of the project, consisting in technical reports, project documentation and software prototypes, UNIVR researchers will prepare publications related to the obtained results and send them to the main conferences and journals of this specific research area. For each macro-activity, main expected products and results are detailed in the following. 0. Analysis of the state of the art and analysis of identified clinical domains: research reports and / or presentations focusing on the mentioned topics, analysis and discussion of case studies relating to processes for patients with acute myocardial infarction, to pharmacovigilance processes, and to processes related to the management of patients in cardiac arrest. 1. Integrated modeling of clinical/health data and processes: technical reports on innovative models of structured and temporal workflow for the guidelines and clinical processes and their comparison with existing proposals. 2. Design time and run time checking of clinical processes: research reports related to innovative and efficient algorithms for checking the controllability of process schemata at design time and at run time where there will be a comparison with respect to existing solutions and an analysis of their computational complexity. 3. Integrated and intelligent analysis of clinical/health data and processes: research reports related to techniques for temporal data and process mining of point-based and interval-based data (with particular attention to the temporal association rules and to temporal approximate functional dependencies). 4. Design and implementation of a suite of software tools for the integrated management and analysis of guidelines and clinical data: project documentation and software prototypes integrated with the results determined by the other units on workflow systems for guidelines and clinical processes and on data mining systems for temporal clinical data and processes. These systems are specifically applied to the case studies considered in the clinical setting. 13 - Descrizione delle attrezzature già disponibili ed utilizzabili per la ricerca proposta Testo italiano Nessuna Testo inglese Nessuna 14 - Elenco dei partecipanti all'Unità di Ricerca 14.1 Personale dipendente dall'Ateneo/Ente cui afferisce l'Unità di ricerca 14.1.a - Docenti / ricercatori / tecnologi nº Cognome Nome Qualifica costo mesi/persona costo annuo previsti (b) attribuito lordo (a) al progetto ((a/12)*b) 1. COMBI Carlo 2. OLIBONI Professore Ordinario 0 6 0 Barbara Ricercatore confermato 0 6 0 3. POSENATO Roberto Ricercatore confermato 61.674 8,9 45.742 4. RIZZI Romeo Professore Associato confermato 0 5 0 5. MORETTI Ugo Ricercatore confermato 0 5 0 6. SCHWEIGER Vittorio Ricercatore confermato 0 5 0 35,9 45.742 TOTALE 14.1.b - Altro personale tecnico Nessuno 14.2 Personale dipendente da altri Atenei/Enti 14.2.a - Docenti / ricercatori / tecnologi nº Cognome Nome Università/Ente Qualifica 1. POZZI Giuseppe Politecnico di Professore costo mesi/persona costo annuo previsti (b) attribuito lordo al (a) progetto ((a/12)*b) 0 5 0 MILANO Associato confermato TOTALE 0 14.2.b - Altro personale tecnico nº Cognome Nome Università/Ente Qualifica 5 0 costo mesi/persona costo annuo previsti (b) attribuito lordo al (a) progetto ((a/12)*b) TOTALE 0 0 0 14.3 Personale non dipendente già presente presso l'Ateneo/Ente cui afferisce l'Unità di Ricerca alla data di presentazione del progetto (da inserire a costo zero): nº Cognome Nome Università/Ente Tipologia costo mesi/persona costo annuo previsti (b) attribuito lordo al (a) progetto ((a/12)*b) 1. SABAINI Alberto Università degli Dottorando Studi di VERONA TOTALE 0 8 0 0 8 0 14.4 - Personale dipendente e non dipendente da destinare a questo specifico Progetto: nº Tipologia di contratto 1. Assegnisti costo mesi/persona costo Note annuo previsti (b) attribuito lordo (a) al progetto ((a/12)*b) 23.000 12,00 23.000 Assegnista di ricerca (possibilmente post-doc), per ricerca e studio sui temi del progetto 2. co.co.co. 23.000 2,00 3.833 collaborazioni orientate alla progettazione e realizzazione dei prototipi 3. Assegnisti 23.000 12,00 23.000 Assegnista di ricerca (possibilmente post-doc), per ricerca e studio sui temi del progetto TOTALE 69.000,000 26,00 49.833 14.5 Personale di Enti/Istituzioni straniere nº Cognome Nome Qualifica Dipartimento/Istituto (Università/Ente) 15 - Mesi persona complessivi dedicati al Progetto Mesi/Persona a) docenti / ricercatori / tecnologi b) altro personale tecnico 15.2 Personale dipendente da altri Atenei/Enti a) docenti / ricercatori / tecnologi b) altro personale tecnico 15.3 Personale non dipendente già presente presso a) assegnisti 15.1 Personale dipendente dall'Ateneo/Ente cui afferisce l'Unità di ricerca 35,9 0 5 0 0 l'Ateneo/Ente cui afferisce l'Unità di ricerca alla data di presentazione del progetto (da inserire a costo zero) 15.4 Personale dipendente o non dipendente da destinare a questo specifico Progetto b) dottorandi c) professori a contratto d) co.co.co (solo per EPR) a) assegnisti b) ricercatori a tempo determinato c) dottorandi d) co.co.co. TOTALE 8 0 0 24 0 0 2 74,9 16 - Costo complessivo dell'Unità di Ricerca Voce di spesa Spesa in Descrizione dettagliata Euro (in italiano) 45.742 Il personale coinvolto A - Spese di personale prevede un prof. ordinario, (cofinanziamento due prof. associati (1 di altra ateneo/ente; punti 14.1 università), quattro (A.1) - 14.2 (A.2); non ricercatori e un dottorando. Il superiore al 30% del team ha competenze ed costo del progetto) esperienze complementari, anche medico-cliniche, che corrispondono ai temi indicati nel progetto. A - Spese di personale non dipendente da destinare a questo specifico progetto punto 14.4 (A.4) B - Spese generali (quota forfettaria pari al 60% del costo totale del personale, spesa A) C - Attrezzature, strumentazioni e prodotti software D - Servizi di Descrizione dettagliata (in inglese) The research team consists of a full professor, two associate professors (one from other university), four assistant professors, and one PhD student. This group has complementary skills and professional expertise, even in the clinical medicine, matching the research topics of the project. 49.833 personale per la ricerca personnel for research (possibilmente un post-doc) (possibly a Post Doc) and for e per la realizzazione dei the development of prototipi. prototypes. 57.345 Spese generali (quota forfettaria pari al 60% del costo totale del personale, spesa A) consulenza e simili E - Altri costi di esercizio Costo Complessivo 152.920 dell'Unità di Ricerca Finanziamento MIUR 107.044 Costo a carico Ateneo / 45.876 Ente N.B. - I costi relativi al personale dipendente già operante presso gli atenei e gli enti di ricerca alla data di scadenza del presente bando non possono superare il 30% del costo del progetto. “I dati contenuti nella domanda di finanziamento sono trattati esclusivamente per lo svolgimento delle funzioni istituzionali del MIUR. Incaricato del trattamento è il CINECA- Dipartimento Servizi per il MIUR. La consultazione è altresì riservata agli atenei e agli enti di ricerca (ciascuno per le parti di propria competenza), al MIUR - D.G. per il Coordinamento e lo Sviluppo della Ricerca - Ufficio V, al CNGR e ai CdS. Il MIUR potrà anche procedere alla diffusione dei principali dati economici e scientifici relativi ai progetti finanziati.” Firma _____________________________________ Data 09/03/2012 ore 08:44