L`infrastruttura informatica del Progetto MATRICE

annuncio pubblicitario
L’infrastruttura informatica del Progetto MATRICE:
TheMatrix a confronto con altri network internazionali
Autori: Gini R∗ , Coppola M∗∗ , Vacchi E◦ , Cazzola W◦ , Berni R∗ , Bellentani M×
∗ Osservatorio di Epidemiologia, Agenzia regionale di sanità della Toscana; ∗∗ CNR-ISTI; ◦ Dipartimento di Informatica, Università degli studi di Milano × Agenas
Introduzione
Il progetto MATRICE dell’Agenzia Nazionale per i Servizi Sanitari Regionali, finanziato dal Ministero della Salute nell’ambito del Programma MATTONI, per
realizzare i propri obbiettivi specifici ha messo tra le proprie attività il disegno e sviluppo di un software, denominato TheMatrix, in grado di funzionare come
strumento di raccolta dati per qualsiasi studio epidemiologico che faccia un uso secondario dei dati amministrativi custoditi nelle ASL o presso le Regioni.
Questo software svolge un ruolo simile a quello svolto da altri strumenti in altri network internazionali. Un requisito di qualità all’interno di una rete è la
possibilità di coniugare la flessibilità nell’interrogazione della rete con il controllo dell’omogeneità dei processi. In questo studio si confrontano da un punto di
vista concettuale e materiale le infrastrutture informatiche di tre grandi network internazionali: in Europa EU-ADR e negli Stati Uniti Mini-Sentinel e OMOP.
Metodi
DDRUG
PERSON ID
DRUG DISPENSING DATE
ATC
DURATION
Il confronto viene operato introducendo uno schema concettuale che spezza
le trasformazioni di dati in tre fasi
T1 la mappatura dai dati locali in uno schema di dati comune individuato dal
network (nel caso di MATRICE è riportato qui a fianco)
PERSONS
PERSON ID
GENDER CONCEPT ID
DATE OF BIRTH
STARTDATE
ENDDATE
GP ID
T2 la manipolazione dei dati volta a creare variabili aggiuntive rispetto a quelle
raccolte originariamente
T3 l’applicazione del disegno di studio per ottenere il dataset da inserire
nell’analisi statistica
Terminato T3 si ottiene un dataset di dati aggregati che possono essere
condivisi all’interno del network. In ciascuna fase vengono anche individuate
le procedure che garantiscono la qualità della trasformazione.
OUTPAT
PERSON ID
PROC CODE
PROC START DATE
GROUP CODE
EXE
PERSON ID
EXEMPTION CODE
EXE START DATE
DRUGS
PERSON ID
DRUG DISPENSING DATE
ATC
DURATION
HOSP
PERSON ID
START DATE
MAIN DIAGNOSIS
SECONDARY DIAGNOSIS 1-5
PROCEDURE CODE 1-6
PROCEDURE DATE
Diagramma di flusso dello schema concettuale
D1
Database
originali
D2
Schema
globale
T1
Riorganizzazione
T2
Manipolazione
D3
Dati derivati
T3
Applicazione del
disegno di studio
D4
Dataset per
l’analisi
Risultati
T1 Nel caso italiano, la mappatura T1 si ottiene compilando un file di testo durante l’installazione del software TheMatrix. Tuttavia
è disponibile, nel caso in cui la ASL non possieda un datawarehouse tra MySQL, Oracle e MS SQL Server, la possibilità di
costruire i file di input a mano; nei due progetti statunitensi si opera una trasformazione in linguaggio SQL. EU-ADR è l’unica
rete che mette a sistema database di paesi diversi, e quindi ha la fase T1 più complessa e gestita localmente in modo non
omogeneo
T2 La fase T2 è gestita in TheMatrix da un linguaggio di scripting creato ad hoc, con un ottimo livello di flessibilità e
programmabile via un’interfaccia grafica da utenti non esperti. Nei casi statunitensi si utilizzano linguaggi esistenti
(principalmente SQL, SAS o Java), nel caso di EU-ADR non omogenei tra partner
T3 Per gestire T3 tutti i network utilizzano un software comune tra partner (TheMatrix, SQL, SAS, Java, Jerboa)
La validazione di T2 è effettuata tramite comparazione di misure di frequenza tra i partner della rete e con la letteratura. Inoltre in
alcuni network, specialmente Mini-Sentinel e MATRICE, si assegna particolare importanza a studi di validazione formali
Conclusioni
L’infrastruttura informatica realizzata all’interno del progetto MATRICE implementa molte delle migliori caratteristiche di
omogeneità tra partner implementate in altri network internazionali
XXXVII Congresso dell’Associazione Italiana di Epidemiologia - novembre 2013
Scarica