L’infrastruttura informatica del Progetto MATRICE: TheMatrix a confronto con altri network internazionali Autori: Gini R∗ , Coppola M∗∗ , Vacchi E◦ , Cazzola W◦ , Berni R∗ , Bellentani M× ∗ Osservatorio di Epidemiologia, Agenzia regionale di sanità della Toscana; ∗∗ CNR-ISTI; ◦ Dipartimento di Informatica, Università degli studi di Milano × Agenas Introduzione Il progetto MATRICE dell’Agenzia Nazionale per i Servizi Sanitari Regionali, finanziato dal Ministero della Salute nell’ambito del Programma MATTONI, per realizzare i propri obbiettivi specifici ha messo tra le proprie attività il disegno e sviluppo di un software, denominato TheMatrix, in grado di funzionare come strumento di raccolta dati per qualsiasi studio epidemiologico che faccia un uso secondario dei dati amministrativi custoditi nelle ASL o presso le Regioni. Questo software svolge un ruolo simile a quello svolto da altri strumenti in altri network internazionali. Un requisito di qualità all’interno di una rete è la possibilità di coniugare la flessibilità nell’interrogazione della rete con il controllo dell’omogeneità dei processi. In questo studio si confrontano da un punto di vista concettuale e materiale le infrastrutture informatiche di tre grandi network internazionali: in Europa EU-ADR e negli Stati Uniti Mini-Sentinel e OMOP. Metodi DDRUG PERSON ID DRUG DISPENSING DATE ATC DURATION Il confronto viene operato introducendo uno schema concettuale che spezza le trasformazioni di dati in tre fasi T1 la mappatura dai dati locali in uno schema di dati comune individuato dal network (nel caso di MATRICE è riportato qui a fianco) PERSONS PERSON ID GENDER CONCEPT ID DATE OF BIRTH STARTDATE ENDDATE GP ID T2 la manipolazione dei dati volta a creare variabili aggiuntive rispetto a quelle raccolte originariamente T3 l’applicazione del disegno di studio per ottenere il dataset da inserire nell’analisi statistica Terminato T3 si ottiene un dataset di dati aggregati che possono essere condivisi all’interno del network. In ciascuna fase vengono anche individuate le procedure che garantiscono la qualità della trasformazione. OUTPAT PERSON ID PROC CODE PROC START DATE GROUP CODE EXE PERSON ID EXEMPTION CODE EXE START DATE DRUGS PERSON ID DRUG DISPENSING DATE ATC DURATION HOSP PERSON ID START DATE MAIN DIAGNOSIS SECONDARY DIAGNOSIS 1-5 PROCEDURE CODE 1-6 PROCEDURE DATE Diagramma di flusso dello schema concettuale D1 Database originali D2 Schema globale T1 Riorganizzazione T2 Manipolazione D3 Dati derivati T3 Applicazione del disegno di studio D4 Dataset per l’analisi Risultati T1 Nel caso italiano, la mappatura T1 si ottiene compilando un file di testo durante l’installazione del software TheMatrix. Tuttavia è disponibile, nel caso in cui la ASL non possieda un datawarehouse tra MySQL, Oracle e MS SQL Server, la possibilità di costruire i file di input a mano; nei due progetti statunitensi si opera una trasformazione in linguaggio SQL. EU-ADR è l’unica rete che mette a sistema database di paesi diversi, e quindi ha la fase T1 più complessa e gestita localmente in modo non omogeneo T2 La fase T2 è gestita in TheMatrix da un linguaggio di scripting creato ad hoc, con un ottimo livello di flessibilità e programmabile via un’interfaccia grafica da utenti non esperti. Nei casi statunitensi si utilizzano linguaggi esistenti (principalmente SQL, SAS o Java), nel caso di EU-ADR non omogenei tra partner T3 Per gestire T3 tutti i network utilizzano un software comune tra partner (TheMatrix, SQL, SAS, Java, Jerboa) La validazione di T2 è effettuata tramite comparazione di misure di frequenza tra i partner della rete e con la letteratura. Inoltre in alcuni network, specialmente Mini-Sentinel e MATRICE, si assegna particolare importanza a studi di validazione formali Conclusioni L’infrastruttura informatica realizzata all’interno del progetto MATRICE implementa molte delle migliori caratteristiche di omogeneità tra partner implementate in altri network internazionali XXXVII Congresso dell’Associazione Italiana di Epidemiologia - novembre 2013