📣 Associazione onData - Newsletter #29
L'importanza di pubblicare in HTML i documenti pubblici, pochissime "cartacce" per terra in Italia, iniziative sostenibili sui dati aperti e tanto altro.
Ciao,
grazie per essere qui a leggere questa newsletter, per avere invitato altre/i a iscriversi, per darci spesso spunti per i contenuti che pubblichiamo.
🙏Se vuoi sostenerci, puoi farlo in questi modi.
Ma soprattutto buon 2024.
Noi staremo sul tema del valore che i dati aperti di qualità possono avere per le persone, con l’obiettivo di farlo diventare sempre di più un argomento di interesse generale: in modo che si possa essere sempre di più a chiedere di pubblicarli e manutenerli, ma soprattutto a utilizzarli per fare cose utili e/o divertenti e/o con un impatto positivo su di noi.
👉 Se ci leggi da e-mail, fai click qui per leggerla per intero
📖 L’importanza di pubblicare Linee Guida in formato HTML
Alcuni anni fa il governo inglese avviava diverse iniziative importanti e pubblicava raccomandazioni per avere dati e documenti aperti e accessibili disponibili a un pubblico vasto. Sebbene con il tempo quel governo si sia un po' spento su certi fronti, è pur vero che online si trovano ancora articoli e raccomandazioni che riteniamo importanti evidenziare e che ci auspichiamo vengano un po' più adottati anche nel nostro paese. È questo il caso dei documenti pubblicati online in formato HTML da parte di istituzioni pubbliche.
Gli enti pubblici producono una mole di documenti piuttosto significativa: a volte pubblicano documenti per rendere disponibili dati, e questo è il male assoluto, ma diverse altre volte pubblicano proprio informazioni documentali come il caso dei vari documenti degli albi pretori dei comuni, oppure linee guida o ogni altro documento che indirizza tematiche di impatto sociale. Per rendere i documenti il più possibile accessibili, come si ricorda in questo articolo dal titolo (traducendolo in italiano) "Perché il contenuto GOV.UK dovrebbe essere pubblicato in HTML e non in PDF", è bene seguire una serie di accorgimenti.
Dall'articolo è nata nel 2020 la relativa guida dello stesso governo dal titolo "Pubblicare documenti accessibili". Il primo punto riguarda il formato dei documenti. Si suggerisce infatti di pubblicare il più possibile in HTML, prima di altri formati tipici documentali come il PDF.
Questo perché:
l'HTML si presta molto bene a letture online,
è più facile referenziare singole sezioni per esempio quando si deve enunciare un certo periodo scritto in una linea guida,
è più facile leggerlo su dispositivi mobili in siti responsive,
è più facile creare collegamenti tra pagine diverse che si richiamano a vicenda,
è più facile perché è il formato naturale per l'accesso via Web.
Di contro, leggere un PDF online diventa più difficile: su dispositivi mobili si deve a volte ingrandire, spostandosi continuamente lungo lo schermo, se ci si deve riferire a un passaggio del documento con un interlocutore si è costretti necessariamente a indicare il numero della pagina e il numero di sezione in un testo scritto, senza poter incollare il link diretto alla sezione in questione, è più difficile tracciare quanti utenti hanno interagito con il file PDF,
Anche in Italia, in questo senso, sono stati fatti passi da gigante anni fa. Ai tempi dell'allora commissario straordinario Diego Piacentini, fu introdotta la piattaforma docs.italia. La piattaforma, si legge sul sito relativo, "è un servizio a disposizione delle Pubbliche Amministrazioni per pubblicare documenti tecnici e amministrativi, e offre ai cittadini la possibilità di leggere e commentare documenti pubblici ed essere informati sull’andamento dei progetti". Tutto questo attraverso strumenti di navigazione noti ormai a (quasi) tutti, rendendo il documento scaricabile anche in altri formati preferiti, tra cui il PDF.
Grazie anche all'uso di docs.italia vengono messe a disposizione, in bozza, linee guida così che utenti possano poi contribuire in fase di consultazione pubblica. Insomma, una piattaforma molto utile per l'accesso digitale ai vari documenti della pubblica amministrazione.
Docs.italia è stata usata negli anni anche per la pubblicazione delle linee guida sulla valorizzazione del patrimonio informativo pubblico, sia in versione bozza che nella loro versione stabile, e per le recenti linee guida open data, presentate l'anno scorso attraverso quella piattaforma per dare il via alla consultazione pubblica (qui le note che riportammo). Purtroppo però, disponibile in HTML è rimasta solo la bozza.
Considerando quelle linee guida particolarmente rilevanti, abbiamo chiesto ad AGID, titolare del documento, di rendere disponibile anche la versione stabile via HTML, e in altri formati tra cui PDF, sempre attraverso docs.italia. A tale richiesta, ci è stato risposto come di seguito riportato.
Non sembra esserci quindi intenzione di andare verso la direzione che il governo inglese, già diversi anni fa, auspicava per i documenti pubblici, nonostante gli strumenti per farlo esistano.
Un vero peccato, ma anche questa storia ha un lieto fine: siccome è un documento aperto e a noi piace il riutilizzo, stiamo lavorando per pubblicare in HTML la versione stabile, facilitando così la consultazione da parte di tutti!
🙃 In Italia non si buttano le “cartacce” per terra
Il titolo è scelto per attirare un po’ la tua attenzione, è un po’ una bugia, ma è una storia interessante.
Volevamo sapere, tramite richiesta al Ministero dell'Ambiente e della Sicurezza Energetica (MASE), quante sanzioni fossero state fatte in Italia per abbandono di rifiuti di piccolissime dimensioni e per quale valore.
Il riferimento è l’articolo 255, comma 1-bis del Decreto Legislativo 3 aprile 2006, n. 152:
Chiunque viola il divieto di cui all'articolo 232-ter è punito con la sanzione amministrativa pecuniaria da euro trenta a euro centocinquanta. Se l'abbandono riguarda i rifiuti di prodotti da fumo di cui all'articolo 232-bis, la sanzione amministrativa è aumentata fino al doppio.
L’articolo 232-ter citato, precisa il contesto della norma:
Al fine di preservare il decoro urbano dei centri abitati e per limitare gli impatti negativi derivanti dalla dispersione incontrollata nell'ambiente di rifiuti di piccolissime dimensioni, quali anche scontrini, fazzoletti di carta e gomme da masticare, è vietato l'abbandono di tali rifiuti sul suolo, nelle acque, nelle caditoie e negli scarichi.
Ebbene il 50% delle somme derivanti dai proventi delle suddette sanzioni sono versate in Entrata al bilancio dello Stato e successivamente riassegnate su un apposito Fondo istituito presso il MASE.
Ci aspettavamo di ricevere tante “pagine” di dati. Abbiamo chiesto i dati per ogni Comune, e invece sono arrivate 4 righe di dati per l’anno 2022 e 5 per il 2023.
Tenendo contro che si tratta del 50% delle somme e facendo riferimento alla tabella sottostante, si tratta di sanzioni pari a:
700,00 € per il 2022. Ipotizzando un valore di circa 50,00 € a sanzione, 14 sanzioni;
1440,00 € per il 2023, ovvero circa il doppio dell’anno precedente.
Se si osserva la distribuzione geografica delle sanzioni nel 2023, le regioni interessate sono soltanto 3 su 20.
Ovviamente non c’è purtroppo alcuna correlazione tra il numero di queste sanzioni e quanto osservato nella realtà delle strade: in tanti dei Comuni di Italia è pressoché impossibile passeggiare senza osservare uno o più rifiuti di piccole dimensioni abbandonati per terra.
Dalla tabella (per il 2023) emergono spannometricamente 30 sanzioni in un anno per tutto il paese (ipotizzando un valore sempre di 50 € a sanzione), mentre nella realtà in alcune città italiane si potrebbero emettere 30 sanzioni in una mattinata in una sola strada.
Sono due gli elementi che troviamo di interesse:
che le richieste di accesso civico generalizzato per accedere ai dati funzionano. Se ti interessano dati e le informazioni gestite dalla Pubblica Amministrazione, fai una richiesta;
che le norme andrebbero monitorate molto anche nella loro efficacia. Il fine di preservare il decoro urbano dei centri abitati ci sembra largamente non raggiunto.
🔥 Il numero #1 di Liberiamoli tutti!
Liberiamoli tutti è un'iniziativa della campagna #DatiBeneComune per individuare, ottenere, riformattare, pulire, documentare, pubblicare e diffondere dati di interesse pubblico.
Dopo il “numero zero”, è stato pubblicato il primo numero “ufficiale”: stavolta sono stati liberati i dati sugli edifici segnalati con presenza di amianto, gestiti dell'Agenzia di Tutela della Salute (ATS) della Città Metropolitana di Milano.
Erano intrappolati ancora una volta in un grande file PDF, pieno di pagine di tabelle non leggibili meccanicamente.
Ha chiesto di liberali Luca Rinaldi, che coordina Dossier, la sezione di inchiesta e approfondimento di MilanoToday e sono stati utili per la redazione di due articoli - "L’amianto è sparito dalle scuole di Milano?" e "Abitazioni, fabbriche e depositi: l'amianto da eliminare a Milano entro il 2032".
Ci piace quanto ci ha detto Luca:
Il valore dei dati che abbiamo liberato, o meglio, che abbiamo iniziato a liberare in questa inchiesta, è duplice: da una parte portarli in una modalità leggibile per la cittadinanza, dall’altra pungolare le istituzioni lombarde perché operino in maniera più trasparente e in coerenza con la disposizione di legge riguardo il rilascio dei dati stessi.
Se sei interessato, iscriviti alla newsletter di Liberiamoli tutti!, se vuoi segnalare o proporre dei dati da liberare, scrivi a 📧 info@datibenecomune.it.
📺 Open Science Café - Riuso dei dati: quale ruolo per la semantica
Il GARR cura da diverso tempo l’Open Science Café (qui tutte le registrazioni), per offrire alla comunità scientifica italiana un appuntamento mensile per informare e discutere di vari aspetti legati alla scienza aperta. Ogni puntata dura un'ora ed è focalizzata su un tema specifico, lasciando sempre uno spazio per la discussione.
Questo episodio è dedicato all'importanza della semantica nel contesto dei dati (aperti e non), che gioca un ruolo cruciale nell'attuazione dei principi FAIR (Findable, Accessible, Interoperable, Reusable), nell’efficacia nel produrre dati più riutilizzabili, interoperabili e accessibili.
I relatori sono la nostra cara Giorgia Lodi e Andrea Nuzzolese, entrambi del CNR. A gestire il tutto è stata la dott.ssa Elena Giglia.
L’Osservatorio Civico PNRR è stato finalmente convocato in cabina di regia PNRR
L'Osservatorio Civico PNRR - di cui facciamo parte - ha partecipato alla riunione della cabina di regia PNRR, convocata dopo la presentazione ufficiale del nuovo Piano. Si tratta di una convocazione attesa da tempo, che è arrivata grazie alle pressioni dell'Osservatorio e delle organizzazioni che ne fanno parte.
Durante la riunione, le organizzazioni hanno sottolineato l'importanza di una partecipazione stabile della società civile nell'implementazione del Piano e hanno chiesto maggiore trasparenza sulle informazioni relative all'avanzamento del Piano. Inoltre, hanno posto l'accento sulle questioni ambientali e di genere, chiedendo dati e indicatori per valutare l'impatto del PNRR su tali tematiche.
📊 Identificazione di modelli di valutazione e raccomandazioni, per iniziative sostenibili sui dati aperti
È stata da poco pubblicata un'analisi basata sul benchmarking delle iniziative di open government data tra i paesi europei. Questo documento è un elenco delle raccomandazioni per l'implementazione e il miglioramento delle iniziative di Open Government Data (OGD) e della loro valutazione.
Il governo aperto e i dati aperti del governo sono descritti da più di dieci anni come strumenti per creare nuove opportunità, eliminare o ridurre le disuguaglianze informative e migliorare i servizi pubblici.
È stata validata una lista finale di 94 modelli di benchmarking , includendo la loro frequenza e gli effetti sui rispettivi paesi e sono state definite 21 raccomandazioni, per iniziative e ecosistemi di dati aperti governativi più resilienti e sostenibili e per la loro valutazione. Tra queste:
Rivedere e aggiornare regolarmente i portali open data, in linea con le esigenze e le aspettative degli utenti
Sviluppare competenze sui dati aperti per diversi stakeholder e utenti attivi
Istituire un hub nazionale per supportare la pubblica amministrazione nell'utilizzo dei progressi tecnologici
Stabilire un'interazione e una cooperazione a lungo termine con la comunità e gli stakeholder dell'ecosistema
Definire, aprire e mantenere dataset ad alto valore
Considerare la qualità e la maturità dell'adempimento dei criteri, anziché usare una valutazione booleana
Non fare affidamento solo su benchmarking e report internazionali
L'iniziativa open data non è un processo una tantum, ma un processo continuo e in corso
È necessaria una comprensione di chi fa parte dell’ecosistema open data di un’organizzazione, con riferimento ai suoi componenti, attori e stakeholder.
Molte di questi punti potranno sembrare ovvi e scontati. Sono molto spesso però anche inattesi. E quindi spesso si fanno valutazioni su ecosistemi “deboli” e non sostenibili.
🔧 IMAGE, per generare la mappa “giusta” per la tua “storia”
IMAGE è un generatore di mappe interattive fornito da Eurostat. Si tratta di uno strumento che consente agli utenti di creare rapidamente mappe statistiche professionali, a partire da diversi modelli predefiniti.
Possono essere generate a partire da dati Eurostat, ma anche da dati a propria disposizione; include anche una verifica finale per garantire che siano soddisfatti tutti i requisiti per ottenere una mappa perfetta e seguire le migliori pratiche.
I modelli di mappa sono basati sia sul tipo output (inserire un’immagine in un foglio A4, piuttosto che in una condivisione su un social network), che sul contesto geografico (una nazione, il continente, l’intero pianeta).
È possibile inoltre scegliere il tipo di mappa: se coropletica (come questa di sotto), se a simboli proporzionali e se categorica.
L’utente, come fatto in questo esempio, sceglierà il tema/dataset a cui è interessato, l’area geografica, quali etichette inserire, le classi di legenda, la classificazione cromatica/simbolica e il formato di download.
Qui la scelta è ampia, perché si ha il PNG, il PDF, ma anche il vettoriale SVG (ulteriormente quindi poi modificabile) e infine anche un HTML autoconsistente, che si potrà utilizzare nei propri spazi web.
Troviamo molto interessante e da emulare l’opportunità che viene data agli utenti di creare in modo rapido, semplice e anche didattico, un output di qualità da usare per raccontare una storia basata sui dati.
🧮 L’osservatorio globale della pesca
Un decennio fa, la creazione di un pannello di controllo ad accesso aperto per monitorare l'attività di pesca globale era fuori portata. Ma grazie ai progressi della tecnologia satellitare e del machine learning, Global Fishing Watch sta diventando realtà.
La salute dei nostri oceani è sottoposta a un'immensa pressione a causa dell'intensa attività umana e dei cambiamenti climatici. E nonostante la sua importanza, l'oceano rimane la parte del nostro pianeta meno osservata.
Global Fishing Watch nasce proprio per monitorala a partire da un requisito: l'attività umana in mare deve essere di dominio pubblico, deve essera “nota”. E per questo hanno creato un progetto che si propone di far progredire la governance degli oceani attraverso una maggiore trasparenza di queste attività. Creando e condividendo pubblicamente visualizzazioni cartografiche, dati e strumenti di analisi, con l’obiettivo di stimolare la ricerca scientifica e promuovere una trasformazione del modo in cui si gestiscono gli oceani.
Non conoscevamo questo progetto, che abbiamo scoperto grazie a questa interessantissma pubblicazione: “Satellite mapping reveals extensive industrial activity at sea”.
Sono stati analizzati 2 milioni di gigabyte di immagini satellitari nel periodo 2017-2021 per individuare le imbarcazioni e le infrastrutture offshore nelle acque costiere di sei continenti, dove si concentrano più di tre quarti delle attività industriali.
È emerso che il 75% dei pescherecci industriali del mondo fanno attività non note pubblicamente. Sotto ad esempio un’area del Mediterraneo, con 495.000 navi, di cui il 63% non svolge attività “note”.
I dati, il codice e ulteriori informazioni sono disponibili in questa pagina dedicata.
🪛 È uscito Visidata 3.0
VisiData è un fantastico strumento open source per esplorare e manipolare dati. Mette insieme la chiarezza di un foglio di calcolo, con l'efficienza del terminale e la potenza di Python, in una utility leggera in grado di gestire milioni di righe con facilità.
È uno strumento che consigliamo sempre e a cui abbiamo dedicato una guida in italiano. È uscita da pochi giorni la release 3.0, che regala ai suoi utenti tantissimi elementi che rendondo più facile e più “spiegato” l’utilizzo dell’applicazione. Sotto un esempio della nuova sidebar, che dà i suggerimenti di contesto: in questo caso si stava applicando un filtro tramite espressione regolare, e vengono suggerite agli utenti alcune regole di base delle regex.
📖 I dati sul clima possono salvare vite umane, ma la maggior parte dei Paesi non può accedervi
L'agenzia per il clima delle Nazioni Unite prevede che entro la fine di questo decennio il pianeta sarà colpito da disastri naturali significativi 560 volte all'anno.
Inoltre, i Paesi che non dispongono di sistemi di allerta precoce, come gli allarmi per il caldo estremo, registreranno un numero di decessi legati al clima otto volte superiore rispetto ai Paesi più preparati.
Entro la metà del secolo, circa il 50% di questi decessi si verificherà in Africa, un continente che ogni anno è responsabile di circa il 4% delle emissioni mondiali di gas serra.
Sono alcuni dei punti del report pubblicato dall’Organizzazione meteorologica mondiale (la WMO).
Da questo emerge come appena il 23% dei Paesi, utilizza i dati climatologici per informare sui potenziali rischi per la salute legati al clima, il che significa che gran parte del mondo è svantaggiata.
Strumenti/risorse
📺 La playlist dei video degli interventi di “State of the Map Europe 2023”.
📅 Unwrapped, la conferenza di Datawrapper, il 14 e 15 marzo 2024.
🗺️ Protomaps, una mappa del mondo gratuita e open source (è molto di più, è anche modo “nuovo” di pubblicare dati cartografici).
📖 “European Drought Risk Atlas”, una pubblicazione del JRC Publications Repository sull'Atlante europeo del rischio siccità.
📰 Un articolo che come le “note” della comunità su X/Twitter non riescano a combattere la disinformazione sulla guerra Israele-Hamas.
📖 The State of Open Data 2023, giunto all'ottava edizione, è la più lunga analisi degli atteggiamenti e delle esperienze dei ricercatori nei confronti dei dati aperti.
📰 Un post su come l’open source intorno all'intelligenza artificiale, al cloud e a Git sta cambiando l'esperienza degli sviluppatori.
📰 L’intersezionalità che manca ai dati sulla violenza di genere: dove sono le donne disabili? Donata Columbro su La Stampa.
🔧 Pubblicata la versione 6.10 di Miller, uno strumento molto comodo per leggere, trasformare e analizzare file di testo strutturati.
📖 Il nuovo Open Data Maturity Report 2023.
👨💻 Il calcolo del “volto medio” a partire da un insieme di foto.
📺 “Cosa abbiamo guardato?” I dati sugli show più visti su Netflix nel primo semestre 2023. Scaricabili qui.
🗺️ 15 min City, per capire se in un città i cittadini possano soddisfare le loro esigenze personali viaggiando a non più di 15 minuti di distanza dalla loro casa in bicicletta o a piedi.
Post strepitoso! Complimenti 😄
HTML What? Qua nel paesello siamo ancora a “Stampo il PDF, lo scannerizzo e poi te lo invio via mail” :/