📣 Associazione onData - Newsletter #26
Ciao,
grazie per essere qui a leggere questa newsletter, per avere invitato altre/i a iscriversi, per darci spesso spunti per i contenuti che pubblichiamo.
🙏Se vuoi sostenerci, puoi farlo in questi modi.
🧮 Omicidi volontari e violenza di genere: nuove modalità di pubblicazione dei dati
Il Ministero dell’Interno cura da tempo una pagina dedicata al tema, in una sezione denominata Dati e statistiche. Fino a poche settimane fa l’unica modalità di pubblicazione era quella dei file in formato PDF, un formato pensato per la stampa e la visualizzazione, non per l'elaborazione automatica dei dati.
Abbiamo fatto delle segnalazioni al Difensore Civico per il Digitale (se non sai cosa sia, è utile la Guida dei diritti di cittadinanza digitali) e interloquito in modo diretto con gli uffici responsabili, proprio per chiedere di pubblicare questi dati anche in modalità più adeguate all’analisi degli stessi.
Da qualche settimana sono disponibili alcuni file in formato CSV, aggiornati settimanalmente di lunedì.
Non crediamo sia merito delle nostre segnalazioni, ma è probabile che abbiano contribuito a “oliare” gli ingranaggi di rilascio online.
Siamo lieti di tutto questo e abbiamo già riscontrato dei segnali che ci fanno pensare/sperare che siano i primi passi di un nuovo percorso (prima un solo file, poi dopo alcuni giorni un secondo).
E a maggior forza vogliamo sottolineare alcune cose:
la modalità di pubblicazione dei file CSV va rivista, perché ci sono diverse problematicità (ad esempio, riga di intestazione da rimuovere, colonna senza nome, righe vuote e colonne vuote, nome colonna con data errata);
nei report in PDF ci sono molte più informazioni, che andrebbero parimenti rese disponibili in formato CSV. Come quelle presenti nel report regionale sugli omicidi o in quello su “Costrizione o induzione al matrimonio”;
i due CSV sono molto aggregati a livello geografico (solo dati nazionali) e (per uno di questi) relativi a un piccolo intervallo temporale, e diventa impossibile o poco significativo fare analisi geografiche e temporali.
La terribile cronaca di queste settimane è piena di casi di omicidi volontari: da questi dati emerge che dal 1° gennaio al 24 settembre 2023 (ultimo aggiornamento) sono stati registrati 243 omicidi, con 84 vittime donne, di cui 69 uccise in ambito familiare/affettivo e di queste, 44 hanno trovato la morte per mano del partner/ex partner.
Questo orrore non si cancella con i dati aperti, ma avere maggiori informazioni su demografia, luoghi, motivazioni, contesto sociale, tassi di denuncia, esiti giudiziari, ecc., aiuta ad avere una visione più chiara, aiutando nella formulazione di politiche e interventi mirati per prevenirlo e affrontarlo in modo più efficace.
E non sono dati soltanto per esperti, perché diffonderli e ben raccontarli, aumenta la responsabilità delle istituzioni e degli organi responsabili dell'applicazione della legge, sensibilizza e coinvolge l'opinione pubblica, consente di fare monitoraggio, aiuta a individuare lacune nei servizi di supporto per le vittime, può rendere le persone più in grado di proteggersi.
Un’informazione che manca è ad esempio e quella dei figli delle vittime di questi omicidi. Lo dice bene Donata Columbro su L’Essenziale:
Conoscere la situazione di bambini e bambine rimasti orfani della madre uccisa dal padre e che sono accuditi da altri familiari è fondamentale per capire che tipo di assistenza garantirgli
È essenziale pubblicare dati “buoni” e aperti, ma soprattutto che riescano a far risolvere dei problemi, stimolare nuove domande, guidare le azioni politiche.
🔬 Riscrivere la scienza attraverso narrazioni di apertura
L'Open Science Ambassadors è un programma della Max Planck Society che vuole promuovere pratiche di ricerca aperta (open science) all'interno degli istituti Max Planck (ce ne sono più di 80). Tutti gli anni, la rete di ambasciatori e ambasciatrici organizza un incontro per fare il punto sulla scienza aperta, mappare lo stato di implementazione di pratiche di ricerca aperta all'interno degli istituti (dall'open access alla pubblicazione open dei dati della ricerca), e promuovere uno scambio interdisciplinare sulle sfide e opportunità che queste pratiche comportano. Per l'edizione 2023 di questo incontro, la nostra socia Paola Masuzzo è stata invitata a parlare di open science, e in particolare a condividere la sua personale esperienza nel mondo della ricerca.
La presentazione si è sviluppata in tre punti.
La prima parte parla della scienza come di un'istituzione sociale guidata e regolamentata da norme, principi, e valori. Lo scriveva Richard Lewontin nel suo "A Reasonable Skepticism":
la scienza, come altre attività produttive, come lo Stato, la famiglia, lo sport, è un’istituzione sociale completamente integrata e influenzata dalla struttura di tutte le altre nostre istituzioni sociali.
Pensare che la scienza sia immune da forze di natura diversa, a volte contrastanti, persino pericolose, pensare che sia una manna dal cielo, è ingenuo e poco onesto. In particolare, una serie di metriche di giudizio che sono state scelte negli ultimi decenni, hanno finito per distorcere completamente il quadro di valori che dovrebbe guidare la conduzione della ricerca. La retorica dell'eccellenza non ha fatto altro che inasprire disuguaglianze e alimentare dinamiche di potere, nutrendo fenomeni come l'effetto Matteo e l'effetto Matilda.
La seconda parte prova a presentare la scienza aperta come uno strumento che può aiutare la comunità scientifica a riscrivere i processi di ricerca: non è soltanto una questione di open access (poter leggere gli articoli scientifici online gratuitamente), ma è anche, e soprattutto, una questione di nuovi valori. I principi dell'open science possono aiutarci a riflettere su che cosa significhi praticare della 'buona scienza' - rispettare le tradizioni di comunità e discipline, favorire il multilinguismo, progettare degli spazi etici per lo scambio multidirezionale di conoscenza (dove, ad esempio, la raccolta e l'analisi di dati hanno come scopo il beneficio collettivo di tutte le comunità coinvolte).
Le questioni relative al copyright e all'accesso aperto diventano così piccole, quasi insignificanti, quando messe vicino alle grandi crisi di oggi - la crisi climatica, la polarizzazione sociale, la violenza politica. Allora la domanda è: come possiamo fare in modo che i movimenti per l'apertura della conoscenza (open movements) riscrivano le proprie agende per abbracciare, sostenere, e alimentare altre lotte?
La terza parte chiude la presentazione con storie di vita vissuta: gli spazi alternativi di onData e di IGDORE sono per Paola luoghi in cui la conoscenza aperta, che circola liberamente e si fa bene comune, diventa strumento per lotte di liberazione collettiva, una lente intersezionale per capire meglio la realtà in cui viviamo, e renderla un po' più giusta.
La presentazione è stata pubblicata su Zenodo.
Il progetto ODECO – Open Data Ecosystem
Se da un lato gli Open Data sono diventati a pieno titolo un pezzo della strategia europea sui dati, dall’altra sono diventati spesso oggetto di studio nell’ambito della Ricerca Scientifica. Sappiamo infatti che i dati aperti hanno un’importante valenza sia di tipo sia sociale che economico. Su quest’ultimo punto, si ritiene che il potenziale dell’intera data economy a livello europeo sia valutato attorno ai 739 miliardi di euro, una parte dei quali generati proprio dagli Open Data. E sono dati destinati a crescere. Il progetto ODECO (Open data Ecosystem) è un’iniziativa della rete di formazione innovativa delle azioni Marie Skłodowska-Curie che ha consentito a 15 giovani ricercatori provenienti da tutto il mondo di sviluppare e approfondire progetti di ricerca sui dati aperti all’interno di Università europee. L’idea è quella di dare risposte innovative ai tanti temi che coinvolgono gli Open Data e di favorire così la creazione di un ecosistema dei dati aperti a livello europeo.
Alcuni esperti italiani di primo piano sugli Open Data, tra loro diversi soci di onData, li hanno incontrati nella sede di Ascoli Piceno dell’università di Camerino su invito del Prof. Andrea Polini. Una giornata di lavoro in cui ogni ricercatore ha presentato brevemente il proprio progetto di ricerca. Progetti che vanno a guardare nell’articolato mondo degli Open Data toccandone innumerevoli aspetti: dall’uso degli Open Data nelle scuole, al mercato e ai modelli di business sugli Open Data, dall’interoperabilità semantica al Data Journalism e alla creazione di servizi pubblici. Tanti aspetti da poter mettere assieme per immaginare così un vero e proprio ecosistema dei dati aperti, un ecosistema in cui settore pubblico e settore privato possono operare e soprattutto cooperare.
EURIO Knowledge Graph: il grafo di conoscenza dei progetti di ricerca finanziati dell’Unione Europea
Il grafo di conoscenza EURIO rende disponibili le informazioni relative ai progetti di ricerca finanziati nell’ambito del settimo programma quadro e del programma Horizon2020. Si tratta pertanto di tutti i progetti di ricerca finanziati dalla comunità Europea dal 2007 al 2020, su una varietà di argomenti, come l'agricoltura, l'ambiente, l'energia, la salute, i trasporti e molti altri.
Va evidenziato che i dati relativi ai progetti del settimo programma quadro e del programma Horizon2020 erano già disponibili in formati più comuni come JSON, CSV.
Il grafo di conoscenza EURIO utilizza altri formati come RDF, n-turtle, JSON-LD per pubblicare i dati seguendo il formalismo proprio dell’ontologia EURIO (EUropean Research Information Ontology). Questa ontologia è stata creata con l’obiettivo di formalizzare tutti i concetti necessari per rappresentare i progetti di ricerca finanziati dai programmi quadro dell'UE e renderli disponibili in un formato strutturato, aperto, leggibile da una macchina e pronti per essere collegati con altri dati. Di fatto il grafo di conoscenza utilizzando identificativi univoci per riferirsi ai progetti di ricerca e alle organizzazioni finanziate, apre la strada alla creazione di applicazioni basate sui Linked Open Data.
Inoltre, i dati presenti nel grafo di conoscenza per la loro struttura possono essere interrogati non solo dagli umani ma anche da agenti software. Tramite un apposito linguaggio di interrogazione utilizzato in questi contesti (chiamato SPARQL) è possibile formulare delle domande per conoscere ad esempio quali nazioni hanno ricevuto maggiori finanziamenti, quali organizzazioni hanno avuto finanziati più progetti e quali tematiche sono state più esplorate dai progetti di ricerca.
Interessante… ma tutto ciò riguarda solo gli addetti ai lavori? Assolutamente no! In generale, e non solo per i dati dei progetti di ricerca, mettere a disposizione un grafo di conoscenza è un passo importante. Sistemi più o meno intelligenti con cui dialoghiamo in linguaggio naturale sono sempre più diffusi, e tali sistemi hanno un enorme bisogno di dati, possibilmente strutturati in modo opportuno, come in un grafo di conoscenza, per fornire le risposte corrette alle nostre domande.
Ritornando al nostro grafo di conoscenza EURIO, purtroppo il grafo è scaricabile nei tipici formati utilizzati per la pubblicazione dei dati linked come detto prima, ma non viene reso accessibile e interrogabile online tramite linguaggio SPARQL. Per beneficiare delle caratteristiche summenzionate bisogna caricarlo su un triple store o utilizzare il linguaggio di programmazione preferito o un programma specifico … eh, sì questa volta ci rivolgiamo solo agli addetti ai lavori!!
📺 Dati aperti per il monitoraggio dei progetti pubblici
Giovedì 28 settembre 2023 si è svolto, presso la sala conferenze dell’Autorità Nazionale Anticorruzione, il seminario “Dati aperti per il monitoraggio dei progetti pubblici“. L’incontro si inserisce all’interno del programma del gruppo di lavoro dell'impegno 5.02 del V Piano d’Azione Nazionale per il governo aperto 2022-2023.
Siamo intervenuti anche noi e siamo in “conflitto di interessi”, ma vi consigliamo la visione:
I nuovi dati sugli appalti disponibili per il riuso, Giampaolo Sellitto, ANAC - Ufficio Relazioni Internazionali
Facilitare il riuso dei dati a tutti. La guida ai dati del PNRR: Andrea Borruso, Ondata
Le novità sulle API per l'interoperabilità dei dati per la PA e per i cittadini, Matteo Fortini Dipartimento Trasformazione digitale, Presidenza del Consiglio dei Ministri
Le nuove Linee guida Open data: indicazioni e casi applicativi - Antonio Rotundo - AgID
Dati di avanzamento delle misure e dei progetti del PNRR, Chiara Ricci, MEF - Unità di missione NG-EU
Presente e futuro di Opencoesione, Nicola De Chiara, Simona de Luca - Dipartimento per le politiche di coesione (DPCoe) della Presidenza del Consiglio dei Ministri, Progetto OpenCoesione
Dati aperti del PNRR nel territorio regionale, Alessandra de Renzis - Regione Toscana
Le assegnazioni PNRR ai comuni italiani, Giorgia Marinuzzi - IFEL-Fondazione ANCI
Il monitoraggio civico dei progetti pubblici: pratiche esistenti e prospettive future, Luigi Reggi - Monithon
L’esperienza della Regione Puglia sul monitoraggio dei progetti pubblici, Morena Ragone - Supporto giuridico specialistico per la transizione alla modalità digitale" - Ufficio RTD - Regione Puglia
Chiusura dei lavori, Giampaolo Sellitto, Ugo Bonelli
🧮 Pubblicati i dati del progetto Mapping Diversity
Lo European Data Journalism Network (EDJNet) ha pubblicato i dati completi del progetto Mapping Diversity, un'indagine sui nomi delle strade nelle città d’Europa. Inizialmente erano stati riservati ai partner di EDJNet e a un gruppo selezionato di media e ricercatori: ora sono disponibili pubblicamente.
È un progetto - basato sui dati aperti di OpenStreetMap e Wikidata - che nasce per suscitare un dibattito su chi manca nei nostri spazi urbani: più del 90% delle strade intitolate a individui sono ad esempio dedicate a uomini bianchi. Dove sono finite tutte le altre persone?
Grazie Federico Caruso per avercelo segnalato.
Dati aperti geografici: se ci sono i dati, le persone si attivano
Da un po’ di tempo il panorama dei dati geografici aperti dà tanti bei segnali di vita. Tra questi, in ordine casuale:
il primo rilascio di dati di OvertureMaps Foundation (confini amministrativi, luoghi di interesse, edifici e reti di trasporto), per i quali ti consiglio di leggere l’articolo di Maurizio Napolitano;
la versione 3 di Google Open Buildings, i contorni degli edifici derivati da immagini satellitari ad alta risoluzione;
e i Microsoft Building Footprints, sempre i contorni degli edifici derivati da immagini satellitari ad alta risoluzione;
il DBSN (DataBase di Sintesi Nazionale) dell’IGM (Istituto Geografico Militare), un archivio diviso per regioni e province di Italia, multi-tematico (viabilità, mobilità e trasporti, immobili ed antropizzazioni, idrografia, orografia, vegetazione, reti di sottoservizi, località significative e scritte cartografiche, ambiti amministrativi e aree di pertinenza).
Sono dati preziosi sia per fare analisi, che per rappresentare il territorio. Ma sono pubblicati in modalità non pronte all’uso per tutte le persone.
E qui viene il bello di rendere disponibili dati aperti: una persona, un’azienda, un’organizzazione li può elaborare e ripubblicare in modo che sia più facile utilizzarli.
Alcuni esempi:
I dati aperti di OvertureMaps, estratti per l’Italia, con taglio regionale e in formato GeoPackage. Grazie a Maurizio Napolitano.
I dati aperti globali sugli edifici di Google e Microsoft, unificati in un unico dataset. Poco più di 2,5 miliardi di edifici, in formato GeoParquet, FlatGeobuf e PMTiles, suddivisi per nazione (e per griglia S2). Grazie a Vida.
I dati del DBSN, suddivisi per Regioni e Province, scaricabili in un click (sul sito dell’IGM è necessario registrarsi e fare il login). Grazie alla comunità OpenStreetMap Italia.
😲 Crea una “piccola” visualizzazione per aumentare la consapevolezza sul clima
Little Pictures è un meraviglioso concorso dell’Agenzia Spaziale Europea (ESA) che premierà quelle visualizzazioni “piccole” che siano:
super semplici, e “distillino” un messaggio sul clima nella sua forma più chiara e senza fronzoli;
belle by design, ispirate al design grafico, industriale e di prodotto;
autoconsistenti, e incorporabili in siti web, app, articoli, ecc.;
data-driven, e realizzate con gli strumenti utilizzati nel data journalism per ra i dati climatici.
Il sito dedicato è una piccola gemma in termini di contenuti. Tre sezioni “wow”: la galleria di esempi, l’elenco di alcuni dei dati usabili per il concorso e soprattutto quella delle guide per creare queste “piccole” visualizzazioni.
Il concorso è aperto sino al 4 novembre 2023. Chi vincerà potrà mostrare il proprio lavoro al COP28 e potrà godere di un tour con spese pagate presso la ESA's data-visualisation suite di Firenze.
🧮 Dati per i disastri di Libia e Marocco
Sul portale dati dell’Humanitarian Data Exchange sono stati pubblicati dati a supporto del terremoto in Marocco e alle inondazioni in Libia. Oltre cinquanta dataset resi disponibili dal Team Humanitarian OpenStreetMap, dall'OCHA, dall'UNOSAT, dal WorldPop e altri: i confini amministrativi, i luoghi popolati, le valutazioni dei danni e altro ancora.
Tra questi anche i poligoni degli edifici, derivati dal progetto di Google citato sopra.
🚀 Hackathon Open Data Regione Puglia
Il 12 ottobre 2023, dalle 8.30 alle 19.30 si terrà un hackathon dedicato all'innovazione attraverso l'utilizzo dei dati aperti del portale dati.puglia.it.
Possono partecipare, previa iscrizione, tutte le cittadine ed i cittadini maggiorenni di ogni nazionalità. È pensato soprattutto per studenti di ITS, istituti superiori, università, sviluppatori, professionisti e ricercatori. La partecipazione è gratuita.
Gli obiettivi: sviluppare app e web app innovative, prototipi o applicazioni concrete che possano generare nuove opportunità economiche nell'ambito dell'innovazione tecnologica. Inoltre, creare storytelling e dashboard per migliorare la trasparenza e coinvolgere le comunità nelle decisioni locali e regionali.
È un’iniziativa del progetto Opentusk.
🫶 Piccole soddisfazioni
Per segnalare fatti, cose e persone, che ci hanno restituito piccole soddisfazioni
1️⃣ Che la campagna DatiBeneComune sia citata nell’editoriale de “le Scienze”, “Il peso dei dati che non abbiamo”
2️⃣ Laura Bartolini, che scrive “Grazie a quella miniera d'oro che è la newsletter di @ondatait sto passando la pausa pranzo a scrollare questo sito https://violencespolicieres.fr”
3️⃣E poi le parole di una bella persona che legge questa newsletter
Ciao, ci tenevo a farvi i complimenti per la newsletter di Ondata di stamattina. Oltre al lavoro sui dati PNRR è figa e spiegata bene anche per i non nerd. L’ho girata alle mie colleghe che si occupano di policy.
Ci tenevo a farvi sapere che OnData spacca e rispetto ad altri enti del terzo settore che si occupano di dati, siete una spanna sopra in chiarezza, correttezza e spirito di condivisione.
Strumenti/risorse
📖 Geospatial Data Science with Earth Engine and Geemap, un bel libro a tema datascience geografica, basatp sull’utilizzo di Google Earth Engine in geemap.
🔧 Dopo 5 anni dall’ultima, arriva una nuova release di jq, uno straordinario strumento per lavorare con in file JSON. La notizia importante è quella di nuovi gestori e manutentori del progetto, jq è vivo.
🔧 Una notizia simile alla precedente: anche uMap è vivo! È una bella piattaforma open source per la creazione di mappe online, ma lo sviluppo si era un po’ fermato.
🗞️ Fields of open. Mapping the open movement, uno studio molto interessante per mappare il movimento OPEN, le sue origini, le sue evoluzioni, le sue cause, il suo futuro (grazie Marco Cortella per la segnalazione).
📺 Cinque video corsi su D3, una della più importanti librerie di visualizzazione, nel contesto di Observable (un data notebook, javascript): parte 1, 2, 3, 4 e 5.
🔧 MotherDuck, il data notebook basato su duckdb, è adesso disponibile per tutte/i.
📰 Non sappiamo quanti siano gli orfani di femminicidio in Italia, Donata Columbro su “L’Essenziale”.
📰 Aborto sicuro, il ministero della salute continua a non comunicare i dati sull’applicazione della 194, sempre Donata Columbro su “La Stampa”.
🧮 Rilasciati i dati sulle indagini Flash Eurobarometer su “Imprenditorialità sociale e giovani”, “Integrazione dei giovani nel mercato del lavoro” e “Monitoraggio del livello di alfabetizzazione finanziaria nell’UE” (qui il feed RSS, per le notifiche).
🧮 Rilasciati su ItaliaDomani dati PNRR nuovi e aggiornati.
📺 Generative AI: What journalists need to know about ChatGPT and other tools.
🧮 Agosto 2023 è stato il mese di agosto più caldo mai registrato e più caldo di tutti gli altri mesi, ad eccezione di luglio 2023. Dati dal progetto Copernicus.
📺 Un webinar su come usare i dati OvertureMaps Foundation
📖 ggplot2: Elegant Graphics for Data Analysis, una guida all’uso di ggplot2.
📖 Attuazione del PNRR, a che punto siamo? Cosa dicono i dati, cosa fare per cambiare marcia, un report a cura di Paola Conio e Federico Morando.