Dati 25012-25024 (ISO/IEC 2008-2015)
La qualità dei dati e la ISO/IEC 25012 (Articolo Rivista UNI, 2009)
La qualità dei dati e l'informazione statistica (Articolo Rivista INAIL, 2012) (Assicurazioni e statistica)
La qualità dei dati: concetti e misure (Articolo Rivista UNI, 2016)
Decalogo dati
ISO/IEC 25012 “Data quality model”
Lo standard ISO/IEC 25012, pubblicato nel 2008, e riconfermato nel 2014 e 2019, definisce le caratteristiche di qualità dei dati. E' complementare al modello di qualità del software ISO/IEC 25010 e considerato nell'ISO/IEC TS 25011 sulla qualità dei servizi. Tali standard sono anche norme nazionali UNI CEI.
La qualità dei dati non si raggiunge da soli, da singole imprese, ma dall'intero sistema. La qualità dei dati aiuta lo sviluppo del Paese e la Trasformazione digitale. La qualità dei dati è al servizio non solo del committente ma anche dell'utente finale.
Sul tema della qualità dei dati è bene tener presente numerosi elementi: processo, dati, metadati, valori, modelli, caratteristiche, requisiti, misure, ciclo di vita, valutazione, assessment, certificazione.
La prima certificazione relativa all'ISO/IEC 25012 è stata rilasciata in Italia nel 2020 ad Infocamere, dall'Ente di certificazione AENOR, relativamente alla qualità dei dati del Registro delle Imprese.
Lo standard 25012 descrive in generale un modello di qualità dei dati strutturati che categorizza gli attributi di qualità in 15 caratteristiche: inerenti e dipendenti dal sistema.
Fonte: Rivista U&C UNI, Marzo 2009 D.N. "La qualità dei dati e la ISO/IEC 25012"
Esso può essere utilizzato in un quadro integrato di qualità del software, processi e servizi volto a prevenire la qualità di un "Data Lake" caratterizzato dalla armonizzazione semantica di informazioni, prescelte nel contesto di utilizzo, per un efficiente interscambio di dati.
Lo standard è un riferimento per le parti interessate alla qualità dei dati, dallo sviluppo alla manutenzione, secondo le priorità dei responsabili del software, dati e servizi.
Il modello si propone di rispondere alle esigenze di qualità dei dati, anche in vista di integrazioni tra sistemi e di una effettiva "Data Governance". In Italia tale tematica di integrazione è già affiorata dagli albori dell'informatica, fin dal 1962, come documentato da cenni storici.
Questo standard internazionale è divenuto nel 2014 norma nazionale con la sigla UNI CEI ISO/IEC 25012 "Modello di qualità dei dati". Esso è stato sviluppato in ambito ISO con il contributo della Commissione Ingegneria del Software dell’UNINFO. Definisce un modello generale di qualità applicabile ad ogni dominio applicativo e utilizzabile da vari utenti.
Lo standard descrive un modello di qualità dei dati strutturati che categorizza gli attributi di qualità.
Le caratteristiche di qualità sono considerate da due punti di vista: inerenti e dipendenti dal sistema.
Inerenti:
- accuratezza
- attualità
- coerenza
- completezza
- credibilità
Inerenti e dipendenti dal sistema:
- accessibilità
- comprensibilità
- conformità
- efficienza
- precisione
- riservatezza
- tracciabilità
Dipendenti dal sistema:
- disponibilità
- portabilità
- ripristinabilità
Il modello di qualità dei dati è stato definito per i dati strutturati di un sistema informatico. Tiene in conto tutti i tipi di dati (es. stringhe di caratteri, testi, numeri, immagini, suoni, ecc.), valori assegnati e relazioni tra dati (nello stesso sistema o tra sistemi diversi). Include i metadati (dati che descrivono altri dati). A seconda del processo o dell'uso che se ne fa, assumono diverso significato.
Nell'archivistica (documentale) si prevedono "metadati minimi" che sembrano essere insieme di dati: codice, data, produttore. Anch'essi sono dati se presi singolarmente. La gestione dei dati e metadati cambia nell'Agile approach, come oggetti di particolari processi che favoriscono integrazioni e interoperabilità. Nell'aspetto elementare (atomico) dell'informazione comunque devono essere coerenti, aggiornati, credibili, comprensibili, ecc.
La qualità delle caratteristiche è influenzata dalla qualità dei requisiti e da una buona progettazione del modello dati. La valutazione derivante dall' analisi dei livelli di qualità raggiunti offre feedback per migliorare il processo e i requisiti.
L'ISO/IEC 25012 è anche alla base del nuovo standard in realizzazione ISO/IEC CD 5259-2 Data quality measure (in sviluppo) gestito dall'ISO/IEC JTC1 SC42. Introduce 9 caratteristiche di qualità e 24 nuove misure di qualità per dataset, ad esempio relative a Balance del campione, rappresentatività, ecc. Alcune informazioni nell'articolo sulla qualità di modelli per l'Intelligenza Artificiale
ISO/IEC 25024 "Measurement of data quality"
Il 25012 è alla base dell'ISO/IEC 25024 sulla misurazione della qualità dei dati, che fornisce 63 misure di qualità. Una delle prime misurazioni fu effettuata sperimentalmente nel 2009.
Nel 2016 è divenuto anche norma nazionale UNI CEI ISO/IEC 25024. Nel 2018 l'UNI ha pubblicato la Linea guida per la sua applicazione UNI TS 11725.
E' importante sottolineare che nell'ISO/IEC 25024 (fig. 4) è contenuto l'inedito CVD - Ciclo di vita dei dati così definito:
- progettazione dei dati (design)
- raccolta dei dati (collection)
- acquisizione dati esterni (external data)
- integrazione dei dati (integrazione)
- elaborazioni dati (processing)
- presentazione (presentation)
- altro uso (other use)
- archivio dati (data store)
- cancellazione (delete)
Tornando alle caratteristiche di accessibilità e comprensibilità dei dati sono fortemente connesse con le proprietà di accessibilità e usabilità.
Secondo l'ISO/IEC 25012 la caratteristica di accessibilità, è riferita ai dati e documenti, mentre secondo l'ISO/IEC 25010 viene riferita alla navigazione dei siti web e app.
Le caratteristiche di accuratezza e completezza, conformità, riservatezza, tracciabilità, disponibilità e ripristinabilità sono indirettamente connesse con le problematiche della sicurezza.
Il modello prende in considerazione i dati strutturati, utile in generale per tutti i tipi di dati (stringhe, testi, date, numeri, immagini, suoni, ecc.).
Lo standard può essere usato per:
- valutare i requisiti di qualità dei dati nella produzione, acquisizione e integrazione;
- migliorare la qualità dei dati da esporre in modalità "Open data";
- individuare i dati che necessitano prioritariamente di un trattamento automatico (o manuale) di correzione;
- descrivere un’ontologia di un sistema informativo-informatico;
- identificare i criteri di assicurazione di qualità, utili anche per re-ingegnerizzazioni, assessment e miglioramenti dei dati;
- contribuire alla qualità degli "immissari" e "affluenti" di un "Data Lake" e del "Data Lake" stesso;
- esaminare la conformità dei dati alle legislazioni o requisiti vigenti;
- disporre di elementi concreti per stimare i costi della non qualità dei dati e attuare miglioramenti organizzativi.
In generale lo standard propone il perseguimento della qualità dei dati strutturati e concorre al miglioramento dei sistemi informatici e delle organizzazioni. Contribuisce a individuare le azioni di bonifica necessarie fornendo orientamenti di miglioramento per eventuali aspetti procedurali dei dati non automatizzati.
La sua applicazione è propedeutica e complementare rispetto alle finalità dei Big data e del Cloud in una prospettiva di Data Lake.
Alcune caratteristiche del modello della qualità dei dati possono essere anche applicate ad oggetti, come per esempio la segnaletica.
E' cosa nota come nel campo della qualità dei dati ricadono numerosi fenomeni socio-economici attuali come anche agli ambiti della salute e dell'ambiente. Molte problematiche decisionali possono essere generate da dati la cui qualità non è conosciuta.
Si precisa infine che la serie ISO 8000 sull'Industrial Data dichiara nel paragrafo 4 dell'ISO 8000-1:2022 che l'ISO/IEC 25000 è considerato fuori campo della sua applicazione riguardando la qualità del prodotto, non essendoci quindi sovrapposizioni.
Link
Ulteriori informazioni:
AgID
L'Agenzia per l'Italia Digitale, con sede a Roma, ha contribuito alla diffusione dell'utilizzo delle tecnologie digitali. Tra le varie funzioni, ha approfondito anche standard della serie ISO 25000 come l'ISO/IEC 25012. Sono fornite varie informazioni sui dati, formati, open, ecc., alcuni principi della qualità dei dati ripresi dal Piano triennale per l'Informatica nella Pubblica Amministrazione 2017-2019: www.agid.gov.it
Il Piano triennale per l'informatica nella PA 2017-2019 dedica il capitolo 4 alle infrastrutture immateriali rimarcando la valorizzazione del patrimonio informativo della PA con particolare riguardo alle basi dati di interesse nazionale indicando l'obiettivo strategico di qualità dei dati come definito dall'ISO/IEC 25012: Piano triennale PA
Le Linee Guida per la Valorizzazione del Patrimonio Informativo Pubblico partono dalle caratteristiche di qualità inerenti dell'UNI ISO 25012 per garantire il costante rispetto in tutto il processo di gestione dei dati anche aperti: readthedocs
La qualità dei dati e la loro integrazione nel 2015 è stata approfondita al Forum PA della PA con un evento inedito che ha contribuito a sensibilizzare sul tema molti partecipanti.
La qualità dei dati è stata anche oggetto di formazione nel 2021 nei Webinar del Formez sulla transizione digitale nella PA
DQTeam
Data quality Team è una impresa spagnola di innovazione, di cui ISO 25000 è Partner, nel governo della qualità dei dati secondo l'ISO 25012; effettua valutazioni indipendenti propedeutiche alle attività di certificazione; svolge anche attività di formazione su vari standard della serie ISO 25000: www.dqteam.es
Per i termini di Privacy e Cookies si rinvia alla informativa generale di Shinystat