Bursi_La nuova sfida della data integrity e anonymized data

La nuova sfida della Data
Integrity e Anonymized Data
Massimo Bursi
VIII CONGRESSO NAZIONALE BIAS - Verona
20151223
2
Dedagroup at a glance
Chi siamo
Mission
Siamo fra i primi Gruppi IT a
capitale italiano.
Supportiamo Aziende, Enti
Pubblici e Istituti Finanziari
nelle loro strategie IT con
competenze applicative,
tecnologiche e di system
integration.
Accompagniamo aziende ed
enti nella trasformazione
digitale, aiutandoli a progettare
il cambiamento.
Con i nostri clienti e per i nostri
clienti individuiamo strategie,
architetture, soluzioni e
competenze perché possano
crescere e rimanere innovativi
nel tempo. Partendo dall’Italia,
terra d’eccellenza, portiamo le
nostre soluzioni in tutto il
mondo.
L’headquarter si trova a
Trento – terra d’eccellenza per
esperienze d’innovazione –
ma il nostro Gruppo, con filiali
in Italia e all’estero, supporta
oltre 3.600 clienti in tutto il
mondo.
Numeri
225 M€
FATTURATO
10
ANNI CONSECUTIVI DI CRESCITA
1.600+
PERSONE
40
PAESI IN CUI ABBIAMO CLIENTI
3
Forti delle nostre competenze
Aree di intervento
 Consulenza di processo (IDMP)
 System Integration e Application Management (applicazioni SAS)
 Software House: eCRF (PheedIt)
 Transition e trasformation di sistemi
 Change Management
 Qualifica, audit e validazione sistemi e infrastrutture
 Architetture IT e governo dei servizi
 Cloud Services e Outsourcing
Esperienze sui processi farmaceutici e soluzioni
Treasury
HCM
WM
OEE
BPC
Marketing
HR
Dispensing
Corporate
Affairs
Finance
DP
Sales
Sales & Marketing
Operation
Manuf
Supply Chain
PVG
Regulatory
Clinical
Pre clinical
QA
Supply Chain, Manufacturing,
Quality
Research & Development
R&D
4
EDMS
Clinical Data Management
LIMS
IDMP
Health & Safety
MES
Lab. Noteb.
REACH & CO2
Asset Management
ERP
BPO, CALL CENTERS
ESF
BI
Serialization
CHANGE MANAGEMENT
CRM
Social
Media
5
eCRF PheedIt
PAESI
Italia
Europa
India
PheedIt è un'applicazione che supporta le industrie farmaceutiche nel monitoraggio e
nell’analisi dei test clinici
DDway acquisisce PheedIt da SAS per completare la propria offerta per l'industria
farmaceutica
Attualmente supportiamo svariati clienti nel mondo: in India, in Europa, in Italia
Data Integrity
7
Data Integrity!
8
Data Integrity
L’integrità dei dati generati e
registrati all'interno di
un’Azienda farmaceutica, sia
elettronicamente sia su
supporto cartaceo (carta), è
fondamentale per garantire la
qualità, l’efficacia e la sicurezza
dei prodotti fabbricati, nonché
il successo di un’ispezione da
parte delle Autorità e/o di
Clienti terzi.
9
Contesto Normativo
 EU GMP Volume 4, Cap.4 – Documentazione
 EU GMP Volume 4, Annex11
 FDA CFR21part11, 1998 e successivo
 MHRA, MHRA GMP Data Integrity Definition and Guidance for
Industry, March 2015
 WHO, Guidance On Good Data And Record Management Practices,
September 2015 (draft)
 FDA, Data Integrity and Compliance with cGMP – Guidance for
Industry, April 2016 (draft)
10
Perché tanta attenzione?
 Esito delle ispezioni testimonia che le aziende non hanno adottato
pratiche e/o sistemi adeguati e alle volte (spesso) la mancata
integrità e/o rintracciabilità dei dati è correlata a frode.
 Esposizione reale a rischi di business e di compliance GxP.
11
Avoiding the Data Integrity iceberg
NSF The Journal issue 32, 2015
“Getting the Bottom of Data Integrity”











LOSS OF DATA TRACEABILITY
OVER-COMPLEXITY
DISEMPOWERMENT
LOSS OF ACCOUNTABILITY
POOR EDUCATION
BLAME CULTURE – FEAR
POOR OWNERSHIP
KPI: DRIVE POOR LEADERSHIP BEHAVIORS
HIDDEN FAILURE MODES
MINDSET & CULTURAL CONCERNS
LACK OF CONFIDENCE IN DATA
12
Situazione attuale
 Minor accuratezza/completezza per le registrazioni cartacee
 Convalida delegata al fornitore
 Convalida ma non completa conformità ai requisiti ER-ES (Electronic Record – Electronic
Signature)
 Sistemi convalidati, ER-ES conformi, ma utilizzo non conformi (es. utente Jolly o password
divulgate; utente con privilegi di System Administrator con possibilità di disattivare audit trail)
 Documenti/dati, elettronici e cartacei, «sparsi» nell’azienda (o anche all’esterno)
 Responsabili (process owner; non IT) non pienamente consapevoli:
 requisiti (quali dati conservare, per quanto tempo, audit trail, …)
 rischi (impatto dei guasti, durata dei supporti magnetici, …)
 Gestione/sicurezza del dato non sistematica o delegata all’IT
…occorre impostare una Governance
13
Una definizione
DATA GOVERNANCE
Il complesso delle misure messe in atto per assicurare che il
dato, indipendentemente dal formato in cui viene generato,
venga registrato, elaborato, conservato ed utilizzato in modo da
assicurarne l’integrità (ovvero la completezza, consistenza e
accuratezza) per tutto il suo ciclo di vita.
14
Esempio Ciclo di Vita dei Dati
Generazione/
Registrazione
(raw data*)
Elaborazione/
migrazione e/o
trasformazione
Uso
Conservazione
Archiviazione/
Recupero e/o
Distruzione
15
ALCOA
 Attribuibili: è possibile risalire a chi ha acquisito o inserito un
dato o eseguito un’azione
 Leggibili: deve essere possibile leggere i dati per tutto il periodo
di vita del dato
 Contemporanei: registrati al momento dell’attività
 Originali o «copie conformi»: dato generato in elettronico o una
copia con le stesse informazioni
 Accurati: privi di errori o con modifiche documentate (per
esempio , audit trail elettronico)
16
EMA GCP
ALCOA+




Complete (completo)
Consistent (coerente)
Enduring (durevole)
Available when needed (Disponibile quando richiesto)
‘‘Reflection paper on expectations for electronic source data and
data transcribed to electronic data collection tools in clinical trials"
[European Medicines Agency, 2007].
17
MHRA Guidance (March 2015)
18
Esempio di ciclo di vita del dato
19
Un Medical Device (Parkinson)
Elettromiografo a 8 canali
Sensore Inerziale
Bluetooth
Batteria al litio (1 giorno autonomia)
20
Framework tecnologico
Applications
BIG DATA ANALYTICS
LEARNING MACHINE
eCRF
IoT Application Enablement
Application
Development and
Runtime Tools
IoT Connectivity Middleware
Device
Management and
Connectivity
Bluetooth
Sensors, Devices &
Equipment
Enterprise
Applications,
database
solutions, big data
analytics
Edge connectivity
Hardware and
Sensor devices
21
Integrity is doing the right thing,
even when no one is watching.
Clive Staples Lewis (1898-1963). Scrittore, autore delle ‘‘Cronache di Narnia’’
Anonymized Data
23
Data Anonymization
 Data Anonymization can be defined as removing identifiable and traceable links
to an individual; the links from the original data to the new are completely
destroyed and it is no longer possible to go back to the original dataset.
 Data anonymization is crucial for clinical data transparency since any patient data
that is shared has to be anonymized to “protect personally identifiable
information” (PhRMA).
 To anonymize clinical datasets, a standard macro can be developed along with
data definition and anonymization mode attributes. Attributes can then be
passed to the anonymization macro via a SAS definition dataset. The definition
dataset lists all variables from the datasets to be anonymized. The dataset can be
standardized and then maintained through a quality controlled change
management system with proper versioning and approval processes.
24
Characteristics of open/closed data
(Source McKinsey Global Institute)
25
A conceptual five-level model of the identifiability continuum
26
Data Identificability continuum
All individual
level data
Identifer columns are hidden/
tranformed (de-identified)
Data is coded or masked (surrogate keys)
Data is masked irreversibly (anonymized)
Quasi-identifier columns
are hidden/transformed
Data is masked and the
Identifiability is measurable
(low risk for re-identification)
Data is aggregated and individual
data cannot be re-identificed
27
What models of Data Anonymization
Cfr CASE STUDY 2
Angelo Tinazzi - Cytel
 None: straight copy of the variable
 Missing: keeping the variable but removing its contents
 Drop: dropping the variable
 Ageint: grouping ages 89+ (U.S. requirement according to HIPPA act)
 Date
 Translate
 Traceable (CDISC standard helps)
28
Esempi
Research Database
Identification Database
AF09XY John Smith
(613-737-7600)
PHI
AF09XY
An example of severing the PHI from the identifying information and using a code to link the two data sets
29
Esempi
Research Database
Linking Database
Identification Database
QZ54MA
John Smith
(613-737-7600)
PHI
AF09XY
AF09XY
QZ54MA
An example showing the use of a separate linking database to match the subjects in the
research database with the subjects in the identification database
30
Privacy Enhancing Technologies
De-identification… pseudonymisation… sticky policies…
Reconciling the concept of a “central anonymous database” with “nominative access database”
Doctor
(Dealing with
nominative patient
information)
On-the-fly
–Pseudonymisation
–Encryption
Pseudonymisation
server at TTP
Nominative Data Realm
Doctor
(Dealing with
nominative patient
information)
Clinical Studies Repository
Pseudonymous Data Realm
Register
Pseudonymous Database
(at data warehouse)
}
Collective Records
Access
(Claerhout Brecht, Custodix NV, Belgium)
Research
Community
Clinical Studies Data Transparency
31
Data Privacy Protection versus Data Utility
The Myth of Anonymization:
Is Big Data Killing Anonymity?
33
18 millioni di dati per paziente per giorno (GSK-Medidata)
34
Cosa possiamo fare insieme?
Chiedi
Massimo Bursi
Life Sciences Manager Dedagroup
[email protected]
Dedagroup LifeSciences
Supportiamo le aziende manifatturiere nel ridurre i
tempi di sviluppo di nuovi prodotti e ottimizzare i
processi di supply chain e produzione. Chiedici come.
www.dedagroup.it/industrial/life-sciences
www.dedagroup.it
[email protected]