ALLEGATO A Ricerca di soggetti disponibili a supportare attività aziendali mediante contratti di sponsorizzazione o liberalità Bando di riferimento: P16 deliberazione n. 1350 del 03/10/2013 Tipologia di riferimento: P16-03 “Sostegno ad attività di sperimentazione studio, ricerca e sviluppo in campo medico scientifico, clinico, di perfezionamento – formazione e ottimizzazione dei processi aziendali;” Scheda di progetto P16-03-63 Data di emissione Agosto 2016 Titolo Studio e sviluppo di piattaforme bioinformatiche per la ricerca biomedica e oncologica presso ASST Papa Giovanni XXIII di Bergamo “Qualità e ottimizzazione dei percorsi terapeutici oncologici” Periodo riferimento Ottobre 2016 / Ottobre 2019 Struttura proponente USC ONCOLOGIA Responsabile progetto Dott. Alberto Zambelli Medico Oncologo Tel. 035 2674661 / e-mail: [email protected] Stato di avanzamento Il progetto prevede una durata totale di 3 anni , con conclusione a Ottobre 2019, cosi suddivisi: - 1° anno: analisi del problema dell’integrazione/interrogazione dei dati di archivio ospedaliero in ambito oncologico presso ASST-PG23 Ricognizione di tutte le sorgenti di dati di archivio dei pazienti oncologici disponibili presso ASST-PG23. Identificazione di 1 o 2 patologie-indice, di rilievo oncologico per prevalenza e complessità, ove siano predisposti dei percorsi di cura (PDTA) specifici. Allineamento dei data-bases ospedalieri e predisposizione degli stessi per piattaforma di datawarehouse unitaria. SCHEDA DI PROGETTO P16-03.63 USC Oncologia Pag. 1 di 8 ALLEGATO A -2° anno: sviluppo e implementazione della piattaforma informatica i2b2 Implementazione della piattaforma I2B2 per un dataware-house integrato e interrogabile per i pazienti oncologici, capace di riconsegnare in forma aggregata tutte le informazioni clinicoassistenziali ora presenti in forma dispersa nei vari archivi informatici ospedalieri e capace di consentire un’analisi temporale dei dati. Sviluppo di algoritmi dedicati alla ricostruzione automatica dei PDTA. - 3° anno: ricostruzione e analisi dei percorsi di cura in ambito oncologico Ricostruzione dei percorsi di cura dei pazienti. Misura di indicatori di esito per efficacia di cura. Revisione dei PDTA e ottimizzazione dei percorsi sulla base dei risultati clinici osservati. Fasi e tempi di realizzazione stimati Collaborazioni con altre strutture aziendali o altri soggetti esterni Risorse Professionali 3 anni Università degli Studi di Pavia, Dipartimento di Ingegneria Industriale e dell’Informazione - Ingegnere bio-informatico dedicato (risorsa aggiuntiva) - Specialisti in oncologia (isorisorse) Strumentazione Piattaforma bio-informatica I2B2 (software accademico open-source), disponibile in ASST-PG23. Finanziamento richiesto Quota annuale: Euro 17.433,00/ 1 aa Criteri ed indicatori per la verifica del raggiungimento degli obiettivi Rapporti annuali e valutazione del raggiungimento degli obiettivi Totale triennale: Euro 52.300,00/ 3 aa In particolare: 1°anno: allineamento di tutti i data-bases oncologici ospedalieri e raccolta di tutte le informazioni oncologiche disponibili in dataware-house unitario 2°anno: implementazione della piattaforma i2b2 e sviluppo di algoritmi dedicati alla ricostruzione automatica dei percorsi di cura oncologici 3°anno : ricostruzione automatica dei PDTA; analisi dei risultati clinici e ottimizzazione dei PDTA sulla base dei risultati osservati Contropartita per i finanziatori Non prevista SCHEDA DI PROGETTO P16-03.63 USC Oncologia Pag. 2 di 8 ALLEGATO A APPENDICE Background e descrizione del progetto Dalla metà degli anni Novanta il tema dei cosiddetti ‘percorsi’ di cura è diventato di crescente interesse per istituzioni, aziende ospedalieri, operatori sanitari, associazioni di pazienti e ricercatori. Così come inteso, il percorso di cura, o percorso diagnostico terapeutico assistenziale (PDTA), indica quel macro-processo operativo che corrisponde alla gestione globale di un problema di salute, dal suo esordio all’esito finale. Il PDTA di fatto costituisce un piano di gestione sanitaria multidisciplinare e multiprofessionale, elaborato per una specifica categoria di pazienti, capace di definire l’ottimale sequenza di azioni/attività da effettuare al fine di conseguire la miglior efficienza ed efficacia di cura possibile in uno specifico contesto locale (Auder et al, 1990; Woolf, 1990; Shekim, 1994; Canadian Medical Association,1995; Pearson et al, 1995; Perkin, 1996; Wall e Proyect, 1998). Alla luce dei principi della EvidenceBased Medicine, il PDTA costituisce lo strumento finalizzato all'implementazione delle raccomandazioni scientifiche di buona pratica clinica, risultando dall'integrazione di due componenti: - (A) le raccomandazioni clinico-scientifiche delle linee guida di riferimento - (B) gli elementi di contesto locale in grado di condizionarne l'applicazione. I PDTA sono quindi strumenti locali di governo clinico che permettono alle Aziende Sanitarie di delineare, rispetto ad una patologia o ad un problema clinico, la migliore sequenza temporale e spaziale possibile degli interventi da effettuare per corrispondere efficacemente ai problemi di salute dei pazienti, sulla base delle conoscenze tecnico-scientifiche e sulla base delle risorse organizzative, professionali e tecnologiche disponibili. Da questo derivano gli obiettivi principali del PDTA, rappresentati dal: • Favorire l'accessibilità ai servizi ed alle prestazioni, migliorando i tempi di attesa dell'appropriato iter diagnostico terapeutico, fissando standard di riferimento. • Ridurre le variabilità e la personalizzazione dei comportamenti e favorire l'integrazione professionale ed il coordinamento delle strutture organizzative. • Ottimizzare e monitorare i livelli di qualità delle cure prestate attraverso la definizione di indicatori di processo e di esito e la messa a punto di un sistema di raccolta ed analisi dei dati. Come è facilmente comprensibile, la complessità del percorso di cura, specifico per ogni tipologia di malattia, non si esaurisce nell’azione del singolo intervento terapeutico ma prevede l’integrarsi e il susseguirsi di diversi interventi terapeutici, spesso realizzati da professionisti di differenti discipline e altrettanto spesso realizzati in reparti di diagnosi/cura diversi (servizi diagnostici, reparti chirurgici, reperti medici, reparti riabilitativi/di palliazione etc.). Quando un PDTA è capace di descrive il processo relativo ad un problema di salute nella sua gestione globale (sia ospedaliera sia territoriale) si parla di percorso integrato, orientato alla continuità di cura e alla completezza della presa in carico del paziente. In tale contesto è rilevante la capacità di coordinamento che SCHEDA DI PROGETTO P16-03.63 USC Oncologia Pag. 3 di 8 ALLEGATO A gli operatori sanitari sono in grado di assicurare, a miglior beneficio del paziente. La definizione e l’implementazione del percorso di cura, coordinata da esperti di Governo Clinico, dovrebbe al meglio delle sue potenzialità permettere di valutare l'appropriatezza degli interventi rispetto alle linee guida di riferimento e alle risorse disponibili e di misurare l'adeguatezza delle attività svolte con il confronto di risultato tra quanto atteso (benchmarking) e quanto osservato (real-life). Colta la complessità dei percorsi di cura, questa rilevantissima fase di misura dell’efficacia degli interventi terapeutici dei PDTA risulta nella realtà molto difficile, pur rappresentando agli occhi di ognuno un obiettivo imprescindibile. La più forte difficoltà che si incontra nella ricostruzione e analisi dei percorsi di cura, specie quando complessi come nei casi oncologici, è rappresentata dal limite del puntuale recupero delle informazioni cliniche-assistenziali dei pazienti, correttamente ricollocate nell’orizzonte temporale della cura del paziente. Infatti l’organizzazione generale dei dati di archivio ospedalieri, quand’anche informatizzata, risente dei limiti di un’impostazione di inputazione dei dati poco incline all’integrazione delle diverse sorgenti dati e alla libera interrogazione delle stesse. Per questa difficoltà nell’analisi di applicazione dei PDTA si adottano più spesso indicatori di qualità di processo (di più facile misura) piuttosto che di qualità di esito, derogando di fatto alla misura dell’efficacia/efficienza di cura che rappresenta invece la vera finalità dell’implementazione dei PDTA. La potenziale disponibilità di piattaforme bioinformatiche in grado di recuperare e integrare automaticamente tutti le informazioni clinico-assistenziali dei pazienti, così come archiviate lungo il percorso di cura nei differenti data-base ospedalieri/territoriali e la possibilità di interrogare liberamente tutti i database disponibili, consente di affrontare la sfida della misura dell’efficacia di cura dei percorsi di cura (PDTA) con strumenti innovativi e adeguati alla rilevanza dell’impegno. Finalità del progetto Il progetto che proponiamo intende investigare l’uso della piattaforma bioinformatica i2b2 quale strumento di data-warehouse, armonizzato con il sistema informativo di ASST-PG23 - USC Oncologia, capace di integrare, elaborare e rendere disponibili in modo automatico tutte le informazioni di archivio utili alla ricostruzione e all’analisi dei percorsi di cura (PDTA) dei pazienti oncologici, attualmente non disponibili se non in forma dispersa. La finalità del progetto è quello di implementare un sistema di monitoraggio della qualità dell’assistenza oncologica erogata e dei risultati clinici, attraverso la ricostruzione dei percorsi di cura (PDTA). Da questo ci attendiamo di poter ottimizzare il percorso di cura dei nostri pazienti e migliorare la qualità degli interventi terapeutici proposti. Obiettivi del progetto 1. Tramite i2b2 si intendono ottenere in modo automatico informazioni integrate e interrogabili da tutte le diverse sorgenti di dati disponibili presso gli SCHEDA DI PROGETTO P16-03.63 USC Oncologia Pag. 4 di 8 ALLEGATO A archivi informatici dell’ospedale relative ai pazienti oncologici 2. Tramite algoritmi informatici dedicati si intendono elaborare le informazioni raccolte al fine della ricostruzione automatica dei percorsi di cura (PDTA) e al fine della misura dell’efficacia degli interventi diagnostico-terapeutici attuati 3. Dai risultati prodotti si intende: investigare la fattibilità/esportabilità del modello informatico per la ricostruzione ed analisi dei PDTA sull’intera popolazione oncologica assicurare l’ottimizzazione dei PDTA e migliorare la qualità di cura oncologica sulla base delle evidenze prodotte garantire adeguata diffusione dei risultati nel contesto di iniziative formative/informative che saranno all’occasione proposte Materiali e Metodi Lo strumento identificato per l’integrazione e l’interrogazione dei dati di archivio è la piattaforma bio-informatica I2B2. i2b2 (Informatics for Integrating Biology & the Bedside) rappresenta una delle più incoraggianti espressioni accademiche di piattaforma informatica al servizio della ricerca bio-medica Il Centro Nazionale di i2b2 di Harvard, finanziato dal National Institutes of Health (NIH) e inizialmente basato su un partenariato di centri ospedalieri statunitensi (Partners Health-Care System), ha infatti sviluppato una piattaforma bioinformatica scalabile e interrogabile (datawarehouse), in grado di rendere disponibili ai ricercatori i dati clinici dei pazienti integrando, in modo automatico, le informazioni epidemiologiche con quelle disponibili dall’analisi biologica/clinica, opportunamente anonimizzate e originate da sorgenti differenti. Questa piattaforma attualmente gode di ampia adozione internazionale tra i numerosi centri sanitari accademici statunitensi, europei e ad oggi i2b2 supporta la gestione dei dati di oltre 100 milioni di pazienti in tutto il mondo. I2b2 (assieme ai progetti correlati) rappresenta la base per il programma di Precision Medicine recentemente finanziato dal governo statunitense. In Italia, il nodo di i2b2 è stato sviluppato dall’Università di Pavia (Facoltà di Ingegneria) in collaborazione con medici coinvolti nelle attività di ricerca clinica e sanitaria. ASST-PG23 intende implementare tale piattaforma a partire da un modello prototipale sviluppato in ambito oncologico. Il progetto prevede 3 fasi di sviluppo FASE 1: implementazione piattaforma i2b2 - Analisi dei requisiti per il progetto Definizione della tassonomia di termini necessaria per l’esplorazione dei dati, basandosi su codifiche standard per diagnosi, procedure, farmaci ed esami di laboratorio Identificazione delle sorgenti di dati (database ATS, SIO-HPG23: Galileo, Fraseggio, Oslo, …) SCHEDA DI PROGETTO P16-03.63 USC Oncologia Pag. 5 di 8 ALLEGATO A - Analisi dei database delle sorgenti identificate - Sviluppo di funzionalità aggiuntive Sviluppo di un modulo per analisi statistiche d’interesse nell’ottica di progetti di outcome research, nonché analisi più complesse per l’apprendimento automatico di regole Sviluppo di un modulo per l’estrazione automatica di osservazioni cliniche da referti medici non strutturati tramite algoritmi di Natural Language Processing (NLP) - Installazione e messa in opera - Installazione di un server dedicato al servizio i2b2 Installazione del core di i2b2 (database ed applicativo), comprensivo dell’interfaccia web utile per effettuare query sui dati al fine di estrarre gruppi di pazienti con le caratteristiche di interesse - Implementazione della tassonomia definita Implementazione delle procedure di sincronizzazione automatica del data-warehouse di i2b2 con le sorgenti di dati, utilizzando anche il modulo di NLP sviluppato - Installazione del modulo per le analisi statistiche - Rilascio - Collaudo del progetto - Rilascio del manuale utente - Training del personale utilizzatore interno al HPG23 FASE 2 ricostruzione percorsi di cura A valle della completa implementazione della piattaforma i2b2 saranno raccolti tutti i dati utili alla ricostruzione dei percorsi di cura dei pazienti. Per tale fase progettuale saranno sviluppati algoritmi informatici dedicati per la riorganizzazione dei dati In particolare i dati saranno distinti in dati di processo e dati clinici - I dati di processo saranno rappresentati dall’insieme d’informazioni relative al percorso clinico del paziente. Tra i dati di maggior interesse vi saranno quelli legati ai ricoveri ospedalieri, alle prescrizioni di farmaci e alle visite ambulatoriali. Molti di questi dati sono già disponibili in forma standardizzata (dati da ICD9 – CM: Classificazione internazionale delle malattie), DRG (Diagnosis Related Groups) e AT (Anatomical Therapeutic Chemical Classification) - I dati clinici saranno principalmente di derivazione SIO (cartella informatizzata, esami di laboratorio, referti da anatomia patologica etc..), in parte supportati da codifiche standard (SNOMED) in parte collezionati in NLP. Per estrarre le conoscenze cliniche utili agli obiettivi del progetto, ci si avvarrà di SCHEDA DI PROGETTO P16-03.63 USC Oncologia Pag. 6 di 8 ALLEGATO A metodologie di Data Mining (DM) e in particolare di tecniche di Temporal Data Mining (TDM) , di Sequential Pattern Mining (SPM) e di Process Mining (PM), così definiti: - Temporal Data Mining: database con supporto integrato per la gestione delle informazioni temporali in relazione a fatti clinici. - Sequential Pattern Mining: tecniche di TDM in grado di individuare pattern frequenti all’interno di un database sequenziale. - Process Mining: metodica per l’analisi dei processi basati sulla sequenza di eventi, capace di estrazione (automatica) di un modello di processo a partire da un log (discovery); - Implemetazione di software (i.e. ProM) per la rappresentazione grafica del processo risultante dall’applicazione di un algoritmo di process mining FASE 3 analisi dei risultati clinici Gli esiti attuali degli interventi realizzati nei percorsi di cura saranno valutati in termine di outcomes clinici e confrontati a quanto atteso e riportato in letteratura. In particolare questa fase progettuale prevede l’analisi dei percorsi di cura, così come ricostruiti, e la valutazione dei risultati clinici in relazione a quanto atteso e in base alle diverse caratteristiche di popolazione e di patologia. In particolare saranno riconosciuti indicatori di risultato che comprenderanno, tra gli altri: - l’intervallo libero da malattia, - la sopravvivenza globale, - l’insorgenza di complicanze precoci e tardive legate ai trattamenti. Sono previste analisi di statistica descrittiva della popolazione in esame e valutazione di impatto clinico in base a stratificazione per gruppi e per percorsi di cura prevalenti. E’ prevista un’analisi di farmaco-economia circa i più rilevanti interventi terapeutici, realizzati nelle diverse fasi di malattia, per una valutazione di ottimale allocazione di risorse lungo l’intero percorso di cura. Bibliografia [1] Richesson R, et al, Electronic health records-based Phenotyping, in “Rethinking Clinical Trials”, Duke University [http://sites.duke.edu/rethinkingclinicaltrials/ehr-phenotyping/] [2] Kohane IS. Using electronic health records to drive discovery in disease genomics. NatRevGenet. 2011;12(6):417–28. [3] Klann GJ, Murphy NS. Computing Health Quality Measures Using Informatics for Integrating Biology and the Bedside. J Med Internet Res. 2013;15(4):e75. [4] Alberset al, Dynamical phenotyping: Using temporal analysis of clinically collected physiologic data to stratify populations,” PLoS One, vol. 9, no. 6, 2014. SCHEDA DI PROGETTO P16-03.63 USC Oncologia Pag. 7 di 8 ALLEGATO A [5] Hripcsak Get al, Parameterizing time in electronic health record studies,” J. Am. Med. Informatics Assoc., vol. 18, no.Suppl 1, pp. i109–i115, 2015. [6] Mo et al, Desiderata for computable representations of electronic healthr ecords-driven phenotype algorithms, Journal of the American Medical Informatics Association, Sep 2015. [7] Panzarasa S et al, “A careflow management system for chronic patients,” Stud. Health Technol. Inform., vol. 107, pp. 673–677, 2004. [8] Chesani F et al, Compliance checking of cancer-screening careflows: An approach based on Computational Logic, in Studies in Health Technology and Informatics, 2008, vol. 139, pp. 183–192. [9] Huang P et al, Customer-centered careflow modeling based on guidelines, J. Med. Syst., vol. 36, no. 5, pp. 3307–3319, 2012. [10] Segagni D et al, An ICT infrastructure to integrate clinical and molecular data in oncology research,” BMC Bioinformatics, vol. 13, no. Suppl 4. p. S5, 2012. [11] Segagni D et al, Clinical and research data integration: the i2b2-FSM experience, AMIA SummitsTransl. Sci. Proc., vol. 2013, pp. 239–40, 2013. [12] Sacchi L et al. Analyzing complex patients' temporal histories: new frontiers in temporal data mining. MethodsMolBiol.2015;1246:89-105. [13] Sacchi L, et al. JTSA: an open source framework for time series abstractions. ComputMethods Programs Biomed. 2015 Oct;121(3):175-88. SCHEDA DI PROGETTO P16-03.63 USC Oncologia Pag. 8 di 8