📣 Associazione onData - Newsletter #33
Le linee guida open data comode da leggere, il Festival della Partecipazione 2024, lavorare i dati "a mano", come assicurarsi che nessuno si interessi ai tuoi dati e tanto altro
Ciao,
grazie per essere qui a leggere questa newsletter, per avere invitato altre/i a iscriversi, per darci spesso spunti per i contenuti che pubblichiamo.
🙏Se vuoi sostenerci, puoi farlo in questi modi.
👉 Se ci leggi da e-mail, fai click qui per leggerla per intero
📖 Le linee guida open data, in un formato più leggibile e “comodo”
Nell’estate del 2023 l’Agenzia per l’Italia Digitale (AgID) ha pubblicato le linee guida sui dati aperti, anzi per l’esattezza le “Linee Guida recanti regole tecniche per l’apertura dei dati e il riutilizzo dell’informazione del settore pubblico”.
Purtroppo il documento è pubblicato soltanto come PDF.
💡 Allora ne abbiamo creato una versione HTML
, consultabile e condivisibile da qualsiasi terminale, per garantirne una diffusione più ampia ed efficace.
È molto scomodo leggere un PDF in alcuni dispositivi e diventa pressoché impossibile fare un semplice passaparola e inviare ad esempio in chat, in un’e-mail, in una condivisione su un social network, ecc. il riferimento a una sezione di interesse:
Ehi, guarda che spettacolo! Il requisito 2 delle linee guida open data dice che i dati devono essere pubblicati in formato CSV, non in quei terribili PDF che non servono a nulla! https://ondata.github.io/linee-guida-opendata/capitolo-4.html#req-2
Per realizzare il tutto, abbiamo chiesto ad AgID il documento da cui hanno esportato il PDF ufficiale, lo abbiamo convertito in Markdown
e infine esportato in HTML
con l’eccezionale Quarto.
Abbiamo apportato alcune modifiche al documento originale, per renderlo più leggibile e navigabile. Ma nessuna alterazione del contenuto o di significato.
Questi e altri dettagli nelle “note di redazione”.
Non è la prima volta che facciamo un lavoro di questo: lo abbiamo ad esempio già fatto per la versione HTML della “Guida dei diritti di cittadinanza digitali”.
🗓️ AwareEU: promuovere la consapevolezza sui Fondi Europei!
Siamo lieti di annunciare la partecipazione del progetto AwareEU alla nona edizione del Festival della Partecipazione 2024, iniziativa organizzata a Bologna da ActionAid Italia per celebrare il ruolo dei cittadini come fautori dell’azione democratica.
Cos'è AwareEU?
AwareEU mira a diffondere una maggiore consapevolezza e rendere più trasparente e accessibile l'informazione su come i fondi di Coesione e del PNRR vengono investiti nei territori locali, favorendo una partecipazione più attiva dei cittadini.
Il progetto, promosso da @actionaiditalia in collaborazione con @monithon.europe, Osservatorio Civico PNRR, info.nodes e noi di onData, si propone di contrastare la mancanza di informazioni e la comunicazione inefficace che spesso circonda l'uso dei fondi europei. Grazie ad attività di monitoraggio civico e alla promozione di buone pratiche di trasparenza, AwareEU contribuisce a rendere più chiaro l'impatto reale di questi finanziamenti sulle nostre vite.
Durante il Festival, AwareEU organizzerà l’evento pubblico “Colmare il divario: quali i rischi di una scarsa comunicazione dei Fondi europei nei territori e come la partecipazione civica può contribuire a prevenirli”.
Sarà un’occasione per discutere di come migliorare la trasparenza e la partecipazione civica: il 14 settembre 17:00 - 19:00, Auditorium Enzo Biagi, Biblioteca Sala Borsa - Bologna.
L’evento farà seguito al workshop su invito "Aware of Europe: opportunità e rischi della comunicazione dei fondi di Coesione e del PNRR", dedicato a organizzazioni civiche, e professionisti del mondo della comunicazione.
✍️ Lavorare i dati “a mano”
Venerdì 28 giugno abbiamo tenuto un workshop per l’appena nominato progetto AwareEU intitolato "Lavorare i dati a mano".
Martina Pugliese (socia di onData) ha parlato di come realizza visualizzazioni dati “fatte a mano”, del processo che va dall'analisi di un dataset alla realizzazione su carta.
Ha approfondito alcuni dati di Open Coesione, il portale istituzionale che raccoglie e presenta i dati dei fondi europei di Coesione, con una dashboard semplice e accessibile. I dati sono disponibili al pubblico via API o in formati aperti come CSV e Parquet, uno dei pochi esempi in Italia di veri open data utilizzabili.
Nel workshop ci siamo rivolti in particolare a giornalisti interessati ad acquisire competenza sull'uso dei dati e di creazione di contenuti basati su dati, e abbiamo presentato una prima "viz" a cui ne seguiranno altre.
➡️ La puoi vedere qui e leggerne i dettagli.
🏅 Abbiamo chiesto dati aperti sul PNRR con “link stabili”
Perché chiediamo “link stabili” quando parliamo di dati aperti? Avere un collegamento che non cambia è essenziale per chi vuole lavorare con quei dati in modo efficiente. Immagina di creare una dashboard automatizzata che, ogni giorno, raccoglie i dati direttamente dalla fonte. Se il link cambia, il processo si blocca e tutto si rompe!
NdR: non dovremmo parlare di "link", ma di URL (o meglio ancora di URI).
Ma andiamo ai dati del PNRR. Sono pubblicati sul “Catalogo Open Data” di Italiadomani. Uno dei dataset di maggior interesse è quello dei Progetti del PNRR – Universo ReGiS e i file sono pubblicati in formato CSV, JSON e XLSX.
L’URL del CSV potrebbe essere qualcosa come:
https://www.esempio.it/opendata/pnrr_progetti_universo_regis.csv
E man mano che si aggiornano i dati questo URL dovrebbe rimanere stabile, non modificato, e si potrebbe creare il prezioso archivio delle versioni precedenti, ma con “link stabile” alla versione più recente.
Mentre nel tempo c’è stata una variazione continua, fra l’altro non preceduta da alcuna notizia di preavviso e la versione più recente di quel file, con il prefisso “https://www.italiadomani.gov.it/content/dam/sogei-ng/” ha avuto questi URL:
opendata_luglio2024/PNRR_Progetti-Universo_REGIS.csv
opendata__/PNRR_Progetti-Universo_REGIS.csv
open-data/progetti-universo-regis/PNRR_Progetti-Universo_REGIS.csv
open_data/progetti/PNRR_Progetti-Universo_REGIS_v2.csv
open_data/progetti/PNRR_Progetti-Universo_REGIS_v2.1.csv
open-data_/pnrr-progetti-universo-regis/PNRR_Progetti-Universo_REGIS_v3.csv
opendata_/pnrr_progetti-universo_regis_v4/PNRR_Progetti-Universo_REGIS_v4.csv
open_data_2024/PNRR_Progetti-Universo_REGIS_v5.csv
open_data__/PNRR_Progetti-Universo_REGIS_v5.csv
opendata-aprile2024/PNRR_Progetti-Universo_REGIS_v6.csv
_opendata_/PNRR_Progetti-Universo_REGIS_v6.csv
Abbiamo fatto richiesta di avere un URL persistenti e abbiamo osservato che la versione più recente non ha finalmente nel nome o nel percorso del file qualcosa che sia correlata al tempo di pubblicazione:
https://www.italiadomani.gov.it/content/dam/sogei-ng/opendata__/PNRR_Progetti-Universo_REGIS.csv
E a proposito di linee guida open data, il requisito 10 indica - per i dati aperti della ricerca scientifica - di assegnare a dati e metadati un identificatore univoco e persistente e raccomanda di applicare questi principi non soltanto ai dati della ricerca.
I dati del PNRR, il più importante progetto di finanziamento mai ricevuto dall'Italia, non sono presenti nel portale nazionale italiano dei dati aperti. E questo va contro il requisito 29 delle linee guida.
Un aspetto molto positivo dei dati pubblicati sul sito del PNRR è la presenza di tutte le versioni nel tempo e così è possibile osservarne le variazioni. In Italia, per i portali open data, avviene molto, ma molto, raramente.
💡 Come assicurarsi che nessuno si interessi ai tuoi dati aperti
Marco Cortella ci ha scritto a luglio:
mi piace questa guida "al contrario" sugli open-data https://www.heltweg.org/posts/how-to-make-sure-no-one-cares-about-your-open-data/
Dopo qualche minuto è partita l’idea di crearne la versione italiana e i nostri Marco Cortella e Antonio Vivace l’hanno realizzata.
Antonio fra l’altro ha contattato l’autore - Philip Heltweg - per essere autorizzati a pubblicare la versione italiana e suggerirgli di associare a quel testo una licenza aperta. Philip ci ha autorizzati e ha associato una licenza Creative Commons Attribution 4.0 al suo testo.
Inizia così:
Condividere dati aperti è un’impresa nobile. Può stimolare la ricerca, l’innovazione e la trasparenza. È anche molto difficile e fastidioso da fare, e in più si perde il controllo: chissà cosa combinerà la gente. Purtroppo, pubblicare dati aperti è spesso un obbligo legale.
Jessica si è innamorata di Roger Rabbit perché lo fa ridere. Questo testo fa ridere e sorridere, e per questo stimola riflessioni ed è più didattico di tante guide “serie” (comprese le nostre).
📺 Riutilizzo dei dati statistici: open standard, dashboard e intelligenza artificiale
Sappiamo bene come il valore dei dati stia nella possibilità di metterli assieme e guardarli come un tutt’uno. Per poter fare questo diventa importante costruire i dati secondo standard comuni di riferimento. Sono infatti proprio gli standard che consentono di rendere i dati interoperabili tra loro. Standard che tornano utili anche per visualizzare, navigare e costruire dashboard interattive in modo automatico.
Ti invitiamo ad ascoltare il nostro Vincenzo Patruno, nell’Academy di FORUM PA 2024.
🔍 È difficile raccontare la disabilità senza dati
Siamo entrati in contatto con questo tema grazie a Fightthestroke e al progetto Disabled data, in cui è stato un piacere ed un onore aver dato un contributo:
Se volessimo raccontare la disabilità attraverso i suoi dati ci troveremmo immediatamente in una condizione di disabilità, impossibilitati/e nell’attività di ricerca, raccolta, analisi ed elaborazione, a causa di barriere strutturali e contestuali. Quali sono le barriere strutturali e contestuali che limitano l’accesso ai dati sulla disabilità?
Tanto mesi dopo Disabled data, ci finisce di nuovo sotto gli occhi uno stimolo molto simile: quello di Francesca Sanna!
Voleva raccontare visivamente la disabilità a partire anche dai numeri correlati, ma le fonti a cui voleva accedere erano “scomode” o non funzionanti. Come ha scritto in modo molto efficace: “La disabilità è esclusa dai nostri ragionamenti, dagli studi, dai libri, dalla fantasia”.
Abbiamo provato a darle una mano su una delle fonti dati, quella dell’Istituto Nazionale Assicurazione contro gli Infortuni sul Lavoro (INAIL), ma non siamo riusciti a fare in modo di restituire quei dati alla fantasia di Francesca. Abbiamo contattato l’INAIL in due modalità e abbiamo avuto grande prontezza e gentilezza nelle risposte (un plauso). Dopo un lungo scambio purtroppo è emerso che la loro Banca dati disabili non è più funzionante: dovrà essere riprogettata, ma al momento non sono stati fissati dei tempi.
👀 Possiamo parlare di diseguaglianza digitale di genere?
Così come il femminismo non è stato soltanto un atto di rivendicazione dei diritti delle donne ma un movimento politico che ha interessato l'intera società, oggi il tecnofemminismo è la chiave, il grimaldello per mettere in evidenza i punti oscuri delle nuove tecnologie, una cartina di tornasole che ne rivela discriminazioni e diseguaglianze. In questa puntata analizziamo le nuove forme di sfruttamento digitale e le ingiustizie algoritmiche, la violenza online e le possibili pratiche di resistenza, grazie alle testimonianze che abbiamo raccolto all'Intenet Festival di Pisa.
Digital World è un programma condotto da Matteo Bordone. Il programma si occupa di esplorare e spiegare le nuove tecnologie e il loro impatto sulla nostra vita quotidiana, aiutando gli spettatori a comprendere meglio il mondo digitale in cui viviamo.
➡️ In questo episodio sono state raccolte le belle testimonianze di Donata Columbro, Diletta Huyskes, Lilia Giugni, Laura Carrer, Daniela Tafani e Oyidiya Oji Palino. A tutte loro, grazie.
📊 Aggiornata l’analisi sugli impatti di genere del PNNR
Period Think Tank ha aggiornato a luglio la dashboard per l’analisi sugli impatti di genere del PNNR, sviluppata da Giuditta Bellosi, Dylan Tartarini e Alessandra Pomella.
🫶 Piccole soddisfazioni
Per segnalare fatti, cose e persone, che ci hanno restituito piccole soddisfazioni
➡️ Agnese Baini, che cura su substack “Matilda, 📚 Consigli non richiesti di libri squisiti”, che non si occupa di dati e ci legge e ci scrive: “Ma grazie a voi per il lavoro che fate!!! Sto imparando un saaaaaaaaaaacco di cose!”
➡️ I dati che abbiamo liberato sulla “Piattaforma Unica Nazionale dei punti di ricarica per i veicoli elettrici” sono stati usati da Lorenzo Stucchi per la sua presentazione al FOSS4G Europe 2024 dal titolo “Analyzing Charging and Petrol Station Distribution with FOSS4G: Implications for Energy Transition Monitoring in European Regions”.
➡️ I dati sul Superbonus 110%, pubblicati sul numero 7 di Liberiamoli tutti!" sono stati usati da “Ambiente e non solo…” per il loro post “Efficientamento energetico degli edifici residenziali e i dati del superbonus”.
Strumenti/risorse
📖 Una breve guida alla visualizzazione dei dati dal Governo del Regno Unito, che inizia dal citare “Alice nel Paese delle Meraviglie”;
🏅 Chi ha vinto il concorso sulle “belle tabelle”;
📖 “Il ruolo dell'intelligenza artificiale negli open data: sfide legali e politiche”, il report della “Unit G.1 Data Policy and Innovation” della Commissione Europea;
📖 “La riduzione della combustione di biomassa è fondamentale per diminuire l'esposizione al PM2.5 nelle città europee”, uno studio del Joint Research Centre (JRC);
📺 La presentazione del Rapporto "Il clima in Italia nel 2023", a cura dell’Istituto Superiore per la Protezione e la Ricerca Ambientale;
🔧 I dati di Overture Maps, sono adesso consultabile con un’applicazione accessibile via browser;
🧮 Da dieci anni, Justin Meyers raccoglie dati geospaziali provenienti da più di 150 paesi in tutto il mondo e li segnala sul suo blog;
📺 Tutti i talk di Outlier2024, l'evento sulla data visualization della Data Visualization Society, sono ora disponibili online gratuitamente in questa playlist YouTube;
👀 Un osservatorio e una raccolta di esempi su come si “incrocino” i dati aperti e l’intelligenza artificiale generativa;
📺 Un ottimo talk di Rahul Bhargava al CSVConf 2024 sulle rappresentazioni alternative dei dati per avvicinare le persone non esperte del campo;
👀 I dati sul sovraffollamento delle carceri italiane nell'articolo di Riccardo Saporiti su Wired;
🔧 Google ha aggiornato con nuove feature il suo storico strumento per la creazione di dataviz come gif animate o video;
🔧 Un gioco divertente in cui devi indovinare il dataset corretto partendo da un grafico, una sorta di “wordle” per i grafici;
📺 Per gli appassionati di duckdb, tutti i video della DuckCon #5 di Seattle;
📖 Pubblicata la versione 2.0 delle specifiche Data Package;
🔧 Uscita la versione 2.0 di Magrit;
👀 “Think small, develop locally, ship joyfully”, è lo “Small data manifesto”.
💘