Scheda di progetto P16-03-63 - ASST-PG23

ALLEGATO A
Ricerca di soggetti disponibili a supportare attività aziendali mediante contratti di
sponsorizzazione o liberalità
Bando di riferimento:
P16 deliberazione n. 1350 del 03/10/2013
Tipologia di riferimento:
P16-03 “Sostegno ad attività di sperimentazione studio, ricerca e sviluppo in campo medico
scientifico, clinico, di perfezionamento – formazione e ottimizzazione dei processi aziendali;”
Scheda di progetto P16-03-63
Data di emissione
Agosto 2016
Titolo
Studio e sviluppo di piattaforme bioinformatiche per la ricerca biomedica e
oncologica presso ASST Papa Giovanni XXIII di Bergamo
“Qualità e ottimizzazione dei percorsi terapeutici oncologici”
Periodo riferimento
Ottobre 2016 / Ottobre 2019
Struttura proponente
USC ONCOLOGIA
Responsabile progetto
Dott. Alberto Zambelli
Medico Oncologo
Tel. 035 2674661 / e-mail: [email protected]
Stato di avanzamento
Il progetto prevede una durata totale di 3 anni , con conclusione a Ottobre 2019,
cosi suddivisi:
- 1° anno: analisi del problema dell’integrazione/interrogazione dei dati di
archivio ospedaliero in ambito oncologico presso ASST-PG23
Ricognizione di tutte le sorgenti di dati di archivio dei pazienti oncologici
disponibili presso ASST-PG23. Identificazione di 1 o 2 patologie-indice,
di rilievo oncologico per prevalenza e complessità, ove siano predisposti
dei percorsi di cura (PDTA) specifici. Allineamento dei data-bases
ospedalieri e predisposizione degli stessi per piattaforma di datawarehouse unitaria.
SCHEDA DI PROGETTO P16-03.63 USC Oncologia
Pag. 1 di 8
ALLEGATO A
-2° anno: sviluppo e implementazione della piattaforma informatica i2b2
Implementazione della piattaforma I2B2 per un dataware-house
integrato e interrogabile per i pazienti oncologici, capace di
riconsegnare in forma aggregata tutte le informazioni clinicoassistenziali ora presenti in forma dispersa nei vari archivi informatici
ospedalieri e capace di consentire un’analisi temporale dei dati.
Sviluppo di algoritmi dedicati alla ricostruzione automatica dei PDTA.
- 3° anno: ricostruzione e analisi dei percorsi di cura in ambito oncologico
Ricostruzione dei percorsi di cura dei pazienti. Misura di indicatori di
esito per efficacia di cura. Revisione dei PDTA e ottimizzazione dei
percorsi sulla base dei risultati clinici osservati.
Fasi e tempi di
realizzazione stimati
Collaborazioni con
altre strutture aziendali
o altri soggetti esterni
Risorse Professionali
3 anni
Università degli Studi di Pavia,
Dipartimento di Ingegneria Industriale e dell’Informazione
-
Ingegnere bio-informatico dedicato (risorsa aggiuntiva)
-
Specialisti in oncologia (isorisorse)
Strumentazione
Piattaforma bio-informatica I2B2 (software accademico open-source),
disponibile in ASST-PG23.
Finanziamento
richiesto
Quota annuale: Euro 17.433,00/ 1 aa
Criteri ed indicatori per
la verifica del
raggiungimento degli
obiettivi
Rapporti annuali e valutazione del raggiungimento degli obiettivi
Totale triennale: Euro 52.300,00/ 3 aa
In particolare:
1°anno: allineamento di tutti i data-bases oncologici ospedalieri e raccolta di
tutte le informazioni oncologiche disponibili in dataware-house unitario
2°anno: implementazione della piattaforma i2b2 e sviluppo di algoritmi dedicati
alla ricostruzione automatica dei percorsi di cura oncologici
3°anno : ricostruzione automatica dei PDTA; analisi dei risultati clinici e
ottimizzazione dei PDTA sulla base dei risultati osservati
Contropartita per i
finanziatori
Non prevista
SCHEDA DI PROGETTO P16-03.63 USC Oncologia
Pag. 2 di 8
ALLEGATO A
APPENDICE
Background e
descrizione del
progetto
Dalla metà degli anni Novanta il tema dei cosiddetti ‘percorsi’ di cura è diventato
di crescente interesse per istituzioni, aziende ospedalieri, operatori sanitari,
associazioni di pazienti e ricercatori.
Così come inteso, il percorso di cura, o percorso diagnostico terapeutico
assistenziale (PDTA), indica quel macro-processo operativo che corrisponde
alla gestione globale di un problema di salute, dal suo esordio all’esito finale.
Il PDTA di fatto costituisce un piano di gestione sanitaria multidisciplinare e
multiprofessionale, elaborato per una specifica categoria di pazienti, capace di
definire l’ottimale sequenza di azioni/attività da effettuare al fine di conseguire la
miglior efficienza ed efficacia di cura possibile in uno specifico contesto locale
(Auder et al, 1990; Woolf, 1990; Shekim, 1994; Canadian Medical Association,1995;
Pearson et al, 1995; Perkin, 1996; Wall e Proyect, 1998).
Alla luce dei principi della EvidenceBased Medicine, il PDTA costituisce lo
strumento finalizzato all'implementazione delle raccomandazioni scientifiche di
buona pratica clinica, risultando dall'integrazione di due componenti:
- (A) le raccomandazioni clinico-scientifiche delle linee guida di riferimento
- (B) gli elementi di contesto locale in grado di condizionarne l'applicazione.
I PDTA sono quindi strumenti locali di governo clinico che permettono alle
Aziende Sanitarie di delineare, rispetto ad una patologia o ad un problema
clinico, la migliore sequenza temporale e spaziale possibile degli interventi da
effettuare per corrispondere efficacemente ai problemi di salute dei pazienti,
sulla base delle conoscenze tecnico-scientifiche e sulla base delle risorse
organizzative, professionali e tecnologiche disponibili.
Da questo derivano gli obiettivi principali del PDTA, rappresentati dal:
•
Favorire l'accessibilità ai servizi ed alle prestazioni, migliorando i tempi
di attesa dell'appropriato iter diagnostico terapeutico, fissando standard di
riferimento.
•
Ridurre le variabilità e la personalizzazione dei comportamenti e favorire
l'integrazione professionale ed il coordinamento delle strutture organizzative.
•
Ottimizzare e monitorare i livelli di qualità delle cure prestate attraverso
la definizione di indicatori di processo e di esito e la messa a punto di un
sistema di raccolta ed analisi dei dati.
Come è facilmente comprensibile, la complessità del percorso di cura, specifico
per ogni tipologia di malattia, non si esaurisce nell’azione del singolo intervento
terapeutico ma prevede l’integrarsi e il susseguirsi di diversi interventi
terapeutici, spesso realizzati da professionisti di differenti discipline e altrettanto
spesso realizzati in reparti di diagnosi/cura diversi (servizi diagnostici, reparti
chirurgici, reperti medici, reparti riabilitativi/di palliazione etc.). Quando un
PDTA è capace di descrive il processo relativo ad un problema di salute nella
sua gestione globale (sia ospedaliera sia territoriale) si parla di percorso
integrato, orientato alla continuità di cura e alla completezza della presa in
carico del paziente. In tale contesto è rilevante la capacità di coordinamento che
SCHEDA DI PROGETTO P16-03.63 USC Oncologia
Pag. 3 di 8
ALLEGATO A
gli operatori sanitari sono in grado di assicurare, a miglior beneficio del paziente.
La definizione e l’implementazione del percorso di cura, coordinata da esperti di
Governo Clinico, dovrebbe al meglio delle sue potenzialità permettere di
valutare l'appropriatezza degli interventi rispetto alle linee guida di riferimento e
alle risorse disponibili e di misurare l'adeguatezza delle attività svolte con il
confronto di risultato tra quanto atteso (benchmarking) e quanto osservato
(real-life).
Colta la complessità dei percorsi di cura, questa rilevantissima fase di misura
dell’efficacia degli interventi terapeutici dei PDTA risulta nella realtà molto
difficile, pur rappresentando agli occhi di ognuno un obiettivo imprescindibile.
La più forte difficoltà che si incontra nella ricostruzione e analisi dei percorsi di
cura, specie quando complessi come nei casi oncologici, è rappresentata dal
limite del puntuale recupero delle informazioni cliniche-assistenziali dei pazienti,
correttamente ricollocate nell’orizzonte temporale della cura del paziente. Infatti
l’organizzazione generale dei dati di archivio ospedalieri, quand’anche
informatizzata, risente dei limiti di un’impostazione di inputazione dei dati poco
incline all’integrazione delle diverse sorgenti dati e alla libera interrogazione
delle stesse.
Per questa difficoltà nell’analisi di applicazione dei PDTA si adottano più spesso
indicatori di qualità di processo (di più facile misura) piuttosto che di qualità di
esito, derogando di fatto alla misura dell’efficacia/efficienza di cura che
rappresenta invece la vera finalità dell’implementazione dei PDTA.
La potenziale disponibilità di piattaforme bioinformatiche in grado di recuperare
e integrare automaticamente tutti le informazioni clinico-assistenziali dei
pazienti, così come archiviate lungo il percorso di cura nei differenti data-base
ospedalieri/territoriali e la possibilità di interrogare liberamente tutti i database
disponibili, consente di affrontare la sfida della misura dell’efficacia di cura dei
percorsi di cura (PDTA) con strumenti innovativi e adeguati alla rilevanza
dell’impegno.
Finalità del progetto
Il progetto che proponiamo intende investigare l’uso della piattaforma
bioinformatica i2b2 quale strumento di data-warehouse, armonizzato con il
sistema informativo di ASST-PG23 - USC Oncologia, capace di integrare,
elaborare e rendere disponibili in modo automatico tutte le informazioni di
archivio utili alla ricostruzione e all’analisi dei percorsi di cura (PDTA) dei
pazienti oncologici, attualmente non disponibili se non in forma dispersa.
La finalità del progetto è quello di implementare un sistema di monitoraggio
della qualità dell’assistenza oncologica erogata e dei risultati clinici, attraverso la
ricostruzione dei percorsi di cura (PDTA). Da questo ci attendiamo di poter
ottimizzare il percorso di cura dei nostri pazienti e migliorare la qualità degli
interventi terapeutici proposti.
Obiettivi del progetto
1.
Tramite i2b2 si intendono ottenere in modo automatico informazioni
integrate e interrogabili da tutte le diverse sorgenti di dati disponibili presso gli
SCHEDA DI PROGETTO P16-03.63 USC Oncologia
Pag. 4 di 8
ALLEGATO A
archivi informatici dell’ospedale relative ai pazienti oncologici
2.
Tramite algoritmi informatici dedicati si intendono elaborare le
informazioni raccolte al fine della ricostruzione automatica dei percorsi di cura
(PDTA) e al fine della misura dell’efficacia degli interventi diagnostico-terapeutici
attuati
3.
Dai risultati prodotti si intende:
investigare la fattibilità/esportabilità del modello informatico per la
ricostruzione ed analisi dei PDTA sull’intera popolazione oncologica
assicurare l’ottimizzazione dei PDTA e migliorare la qualità di cura
oncologica sulla base delle evidenze prodotte
garantire adeguata diffusione dei risultati nel contesto di iniziative
formative/informative che saranno all’occasione proposte
Materiali e Metodi
Lo strumento identificato per l’integrazione e l’interrogazione dei dati di archivio
è la piattaforma bio-informatica I2B2.
i2b2 (Informatics for Integrating Biology & the Bedside) rappresenta una delle
più incoraggianti espressioni accademiche di piattaforma informatica al servizio
della ricerca bio-medica
Il Centro Nazionale di i2b2 di Harvard, finanziato dal National Institutes of Health
(NIH) e inizialmente basato su un partenariato di centri ospedalieri statunitensi
(Partners Health-Care System), ha infatti sviluppato una piattaforma
bioinformatica scalabile e interrogabile (datawarehouse), in grado di rendere
disponibili ai ricercatori i dati clinici dei pazienti integrando, in modo automatico,
le informazioni epidemiologiche con quelle disponibili dall’analisi
biologica/clinica, opportunamente anonimizzate e originate da sorgenti differenti.
Questa piattaforma attualmente gode di ampia adozione internazionale tra i
numerosi centri sanitari accademici statunitensi, europei e ad oggi i2b2 supporta
la gestione dei dati di oltre 100 milioni di pazienti in tutto il mondo. I2b2
(assieme ai progetti correlati) rappresenta la base per il programma di Precision
Medicine recentemente finanziato dal governo statunitense. In Italia, il nodo di
i2b2 è stato sviluppato dall’Università di Pavia (Facoltà di Ingegneria) in
collaborazione con medici coinvolti nelle attività di ricerca clinica e sanitaria.
ASST-PG23 intende implementare tale piattaforma a partire da un modello
prototipale sviluppato in ambito oncologico.
Il progetto prevede 3 fasi di sviluppo
FASE 1: implementazione piattaforma i2b2
-
Analisi dei requisiti per il progetto
Definizione della tassonomia di termini necessaria per l’esplorazione dei
dati, basandosi su codifiche standard per diagnosi, procedure, farmaci ed esami
di laboratorio
Identificazione delle sorgenti di dati (database ATS, SIO-HPG23:
Galileo, Fraseggio, Oslo, …)
SCHEDA DI PROGETTO P16-03.63 USC Oncologia
Pag. 5 di 8
ALLEGATO A
-
Analisi dei database delle sorgenti identificate
-
Sviluppo di funzionalità aggiuntive
Sviluppo di un modulo per analisi statistiche d’interesse nell’ottica di
progetti di outcome research, nonché analisi più complesse per l’apprendimento
automatico di regole
Sviluppo di un modulo per l’estrazione automatica di osservazioni
cliniche da referti medici non strutturati tramite algoritmi di Natural Language
Processing (NLP)
-
Installazione e messa in opera
-
Installazione di un server dedicato al servizio i2b2
Installazione del core di i2b2 (database ed applicativo), comprensivo
dell’interfaccia web utile per effettuare query sui dati al fine di estrarre gruppi di
pazienti con le caratteristiche di interesse
-
Implementazione della tassonomia definita
Implementazione delle procedure di sincronizzazione automatica del
data-warehouse di i2b2 con le sorgenti di dati, utilizzando anche il modulo di
NLP sviluppato
-
Installazione del modulo per le analisi statistiche
-
Rilascio
-
Collaudo del progetto
-
Rilascio del manuale utente
-
Training del personale utilizzatore interno al HPG23
FASE 2 ricostruzione percorsi di cura
A valle della completa implementazione della piattaforma i2b2 saranno raccolti
tutti i dati utili alla ricostruzione dei percorsi di cura dei pazienti.
Per tale fase progettuale saranno sviluppati algoritmi informatici dedicati per la
riorganizzazione dei dati
In particolare i dati saranno distinti in dati di processo e dati clinici
-
I dati di processo saranno rappresentati dall’insieme d’informazioni
relative al percorso clinico del paziente. Tra i dati di maggior interesse vi
saranno quelli legati ai ricoveri ospedalieri, alle prescrizioni di farmaci e
alle visite ambulatoriali. Molti di questi dati sono già disponibili in forma
standardizzata (dati da ICD9 – CM: Classificazione internazionale delle
malattie), DRG (Diagnosis Related Groups) e AT (Anatomical
Therapeutic Chemical Classification)
-
I dati clinici saranno principalmente di derivazione SIO (cartella
informatizzata, esami di laboratorio, referti da anatomia patologica
etc..), in parte supportati da codifiche standard (SNOMED) in parte
collezionati in NLP.
Per estrarre le conoscenze cliniche utili agli obiettivi del progetto, ci si avvarrà di
SCHEDA DI PROGETTO P16-03.63 USC Oncologia
Pag. 6 di 8
ALLEGATO A
metodologie di Data Mining (DM) e in particolare di tecniche di Temporal Data
Mining (TDM) , di Sequential Pattern Mining (SPM) e di Process Mining (PM),
così definiti:
-
Temporal Data Mining: database con supporto integrato per la gestione
delle informazioni temporali in relazione a fatti clinici.
-
Sequential Pattern Mining: tecniche di TDM in grado di individuare
pattern frequenti all’interno di un database sequenziale.
-
Process Mining: metodica per l’analisi dei processi basati sulla
sequenza di eventi, capace di estrazione (automatica) di un modello di
processo a partire da un log (discovery);
-
Implemetazione di software (i.e. ProM) per la rappresentazione grafica
del processo risultante dall’applicazione di un algoritmo di process
mining
FASE 3 analisi dei risultati clinici
Gli esiti attuali degli interventi realizzati nei percorsi di cura saranno valutati in
termine di outcomes clinici e confrontati a quanto atteso e riportato in letteratura.
In particolare questa fase progettuale prevede l’analisi dei percorsi di cura, così
come ricostruiti, e la valutazione dei risultati clinici in relazione a quanto atteso e
in base alle diverse caratteristiche di popolazione e di patologia. In particolare
saranno riconosciuti indicatori di risultato che comprenderanno, tra gli altri:
- l’intervallo libero da malattia,
- la sopravvivenza globale,
- l’insorgenza di complicanze precoci e tardive legate ai trattamenti.
Sono previste analisi di statistica descrittiva della popolazione in esame e
valutazione di impatto clinico in base a stratificazione per gruppi e per percorsi
di cura prevalenti.
E’ prevista un’analisi di farmaco-economia circa i più rilevanti interventi
terapeutici, realizzati nelle diverse fasi di malattia, per una valutazione di
ottimale allocazione di risorse lungo l’intero percorso di cura.
Bibliografia
[1]
Richesson R, et al, Electronic health records-based Phenotyping, in
“Rethinking
Clinical
Trials”,
Duke
University
[http://sites.duke.edu/rethinkingclinicaltrials/ehr-phenotyping/]
[2]
Kohane IS. Using electronic health records to drive discovery in disease
genomics. NatRevGenet. 2011;12(6):417–28.
[3]
Klann GJ, Murphy NS. Computing Health Quality Measures Using
Informatics for Integrating Biology and the Bedside. J Med Internet Res.
2013;15(4):e75.
[4]
Alberset al, Dynamical phenotyping: Using temporal analysis of clinically
collected physiologic data to stratify populations,” PLoS One, vol. 9, no. 6, 2014.
SCHEDA DI PROGETTO P16-03.63 USC Oncologia
Pag. 7 di 8
ALLEGATO A
[5]
Hripcsak Get al, Parameterizing time in electronic health record
studies,” J. Am. Med. Informatics Assoc., vol. 18, no.Suppl 1, pp. i109–i115,
2015.
[6]
Mo et al, Desiderata for computable representations of electronic
healthr ecords-driven phenotype algorithms, Journal of the American Medical
Informatics Association, Sep 2015.
[7]
Panzarasa S et al, “A careflow management system for chronic
patients,” Stud. Health Technol. Inform., vol. 107, pp. 673–677, 2004.
[8]
Chesani F et al, Compliance checking of cancer-screening careflows:
An approach based on Computational Logic, in Studies in Health Technology
and Informatics, 2008, vol. 139, pp. 183–192.
[9]
Huang P et al, Customer-centered careflow modeling based on
guidelines, J. Med. Syst., vol. 36, no. 5, pp. 3307–3319, 2012.
[10]
Segagni D et al, An ICT infrastructure to integrate clinical and molecular
data in oncology research,” BMC Bioinformatics, vol. 13, no. Suppl 4. p. S5,
2012.
[11]
Segagni D et al, Clinical and research data integration: the i2b2-FSM
experience, AMIA SummitsTransl. Sci. Proc., vol. 2013, pp. 239–40, 2013.
[12]
Sacchi L et al. Analyzing complex patients' temporal histories: new
frontiers in temporal data mining. MethodsMolBiol.2015;1246:89-105.
[13]
Sacchi L, et al. JTSA: an open source framework for time series
abstractions. ComputMethods Programs Biomed. 2015 Oct;121(3):175-88.
SCHEDA DI PROGETTO P16-03.63 USC Oncologia
Pag. 8 di 8