Cosa s'intende per dati sintetici?
I dati sintetici sono dati artificiali creati da un algoritmo, o da un programma informatico, che rispecchiano in modo accurato i dati reali. Tali input sono creati sinteticamente al fine di raffigurare la realtà con precisione e completezza. I dati sintetici sono spesso usati per la ricerca e lo sviluppo di nuove tecnologie, per lo studio dei dati storici, per l'addestramento di reti neurali e molto altro ancora.
Possono essere utilizzati per simulare scenari di sviluppo e testare le ipotesi prima di prendere importanti decisioni aziendali.
Come si svolge il processo di data synthetization?
Il processo di sintetizzazione dei dati inizia con un insieme di informazioni esistenti come fonte di partenza. Quest'ultimi possono provenire da una varietà di fonti, come database di un'organizzazione, archivi pubblici o dati raccolti da sensori. Una volta ottenuti i riferimenti utili all'indagine, si avvia un'analisi statistica volta alla identificazione di modelli di dati rilevanti.
Successivamente, i gruppi di dati raccolti vengono sintetizzati in forma di nuovi dati artificiali che rispecchiano accuratamente le informazioni originali, ma si sostanziano in risultanze del tutto nuove, elaborate dal sistema. Questo processo di creazione di nuovi input permette di utilizzare soltanto in minima parte informazioni eventualmente reali.
I dati sintetici come influenzeranno la nostra privacy?
I dati sintetici possono, dunque, influenzare la nostra privacy in diversi modi. Innanzitutto, possono essere utilizzati da organizzazioni come autorità governative o aziende per raccogliere informazioni su individui o gruppi specifici. Il fatto che siano in grado di rispecchiare accuratamente i dati reali può rendere più facile per chi ne ha interesse monitorare e raccogliere informazioni su una grande quantità di utenza.
Inoltre, i dati sintetici possono essere usati per creare profili di consumo più accurati, consentendo alle aziende di personalizzare e ottimizzare la loro offerta di prodotti e servizi.
Molto prima dell’entrata in vigore del GDPR, la maggior parte degli italiani era preoccupata per la tutela della propria privacy online. Una ricerca condotta da PHD Italia nel 2018 ha evidenziato che circa sei italiani su dieci erano preoccupati per le informazioni personali che condividono online. Questa crescente apprensione è in gran parte dovuta all'iperproduzione di dati che molti utenti online condividono quotidianamente. Sotto tale profilo, i synthetic data sono una innovativa soluzione di tutela della privacy rappresentando una rielaborazione che parte da una variabile quantità di dati reali e sfocia nella sintesi di dati artificiali. Questo permetterebbe di evitare l'uso di soli dati reali per l'elaborazione delle statistiche.
Vi invitiamo a leggere l'articolo di Gabriele Franco di Repubblica per una riflessione mirata su: "Cosa sono i dati sintetici e come potrebbero cambiare la nostra idea di privacy".
Il team di bitCorp