📣 Associazione onData - Newsletter #7

dic 02, 2021

Ciao,

grazie per essere qui a leggere questa newsletter, per invitare altre/i a iscriversi e per alimentarla (in modo diretto e indiretto).

🙏Se vuoi sostenerci, puoi farlo con una donazione o con il 5 x 1000.

📍 Se hai qualche problema di lettura di questa newsletter, apri questo link.

Mai più invisibili: una fotografia della condizione di donne e bambinз in Italia

È possibile stimare il grado d'inclusione di donne, bambini e bambine sul territorio italiano? La risposta è sì, ed è quello che l'organizzazione WeWorld fa dal 2020 pubblicando il rapporto Mai più invisibili, che è arrivato nel 2021 alla seconda edizione.

Il rapporto fornisce uno spaccato sulla condizione di inclusione di donne e bambinз in Italia, con dettaglio regionale, e utilizza un indice ad hoc costruito sulla base di 38 indicatori (40 nell'edizione 2021, con 2 indicatori aggiunti per tener presente gli effetti della pandemia COVID-19), raggruppati in 12 dimensioni. Queste dimensioni attingono a loro volta a quattro macro aree in cui è necessario agire per affermare e rendere operativi i diritti di donne e bambinз: educazione, salute, economia, società.

Le quattro macro aree da cui derivano gli indicatori usati per costruire l'indice WeWorld (fonte: report Mai più invisibili 2021).

Ma cosa sono questi indicatori? E come sono stati scelti?

Gli indicatori non sono nient'altro che dati scelti sulla base di alcune considerazioni: la loro pertinenza rispetto al tema dell'inclusione di donne e bambinз, ovvero la capacità di rappresentare il fenomeno che vogliamo rappresentare e comprendere; l'accuratezza delle fonti; la possibilità di avere dati il più possibile completi, disponibili per tutte le regioni d'Italia, aggiornati e raccolti con cadenza regolare; la facilità di accesso a questi dati. Per avere dei dati aperti, accessibili, e riutilizzabili, le fonti utilizzate nel rapporto WeWorld sono pubbliche: il sito dell'ISTAT, da cui ad esempio sono tratti gli indicatori territoriali, i dati Noi Italia 2021, e i dati resi disponibili dal rapporto Bes 2020.

Alcuni esempi di indicatori sono: percentuale di bambinз che utilizzano il servizio di asilo nido, irregolarità nella distribuzione dell'acqua, percentuale di donne che praticano sport in modo continuativo. L'indice che misura l'inclusione di donne e bambinз è la media aritmetica dei 38 indicatori totali, che vengono normalizzati e ponderati (la metodologia statistica è riportata in dettaglio nel rapporto).

Infine, per tenere conto delle conseguenze della pandemia (nonostante la situazione sia ancora in evoluzione), nell'edizione 2021 sono stati aggiunti altri 2 indicatori: il numero di persone risultate positive al COVID-19 sul totale della popolazione residente, e la disponibilità in famiglia di almeno un computer connesso a Internet (bene prezioso per la didattica a distanza).

La fotografia che ne viene fuori

Lo spaccato che viene fuori dalla raccolta e dall'analisi di questi indicatori è informativo tanto quanto doloroso: in un mondo in cui le disuguaglianze permangono e la povertà e l'esclusione sono un problema globale, reso ancora più grande dalla pandemia COVID-19, donne e bambinз sono le categorie di persone più a rischio. E questo non ha niente a che vedere con la presunta fragilità di donne e bambinз, ma piuttosto con tante, troppe, criticità strutturali, e una cultura che penalizza il genere femminile e le generazioni più giovani.

La classifica finale pubblicata da WeWorld sull'indice di inclusione di donne e bambinз nelle regioni italiane (fonte: report Mai più invisibili 2021).

Come lo sappiamo? Attraverso i dati.

L'istantanea che viene fuori dal rapporto WeWorld 2021 coglie le specificità territoriali su inclusione di donne e bambinз (con Friuli-Venezia Giulia al primo posto, e Sicilia all'ultimo), evidenzia le differenze di genere e quelle generazionali, ma soprattutto dimostra che condizione imprescindibile per realizzare azioni di inclusione è una conoscenza il più possibile esaustiva delle condizioni di vita delle persone marginalizzate. Una conoscenza che si può ottenere attraverso una raccolta attenta di dati, unita a esperienze dirette nei territori e al dialogo con le persone e le comunità interessate. Una conoscenza che dovrebbe poi alimentare interventi strutturali e nuove politiche, per promuovere il cambiamento e costruire una visione del mondo che non sia più maschio-centrica e patriarcale, e che si preoccupi finalmente di tutte e di tutti.

Mentre noi si uccideva Cesare... - Open History Map

"Mentre noi, a Roma, si uccideva Cesare, loro andavano a raccogliere bacche", sosteneva Corrado Guzzanti. Ma, aldilà della battuta, mentre a Roma Cesare veniva pugnalato, cosa stava succedendo in Cina? E in medio oriente? E in Mesoamerica?

Durante l'ultimo FOSS4G (Free and Open Source Software for Geospatial), svoltosi online dal 27 Settembre al 3 Ottobre il nostro socio Marco Montanari ha presentato le ultime evoluzioni del progetto Open History Map, un progetto nato a Bologna nel 2016 che ha come obiettivo quello di realizzare una mappa interattiva, come lo sono Open Street Map e Google Maps, ma del passato, in modo da rendere l'esplorazione della storia una operazione più semplice e immediata.

Il progetto nasceva in origine come "mappa" ma è oramai diventato un intero ecosistema di strumenti per l'esplorazione della storia e delle ricerche storiche e della branca detta "Data Driven Humanities". In primis, a supporto della mappa, cuore ed elemento centrale del progetto, è stato sviluppato uno strumento di raccolta di metadati descrittivi delle informazioni caricate: l'OHMData Index, ispirato all'open data index di Open Knowledge Foundation, si basa su una api di raccordo connessa con Zotero che fa da collettore aperto e comune delle ricerche utilizzando in modo originale i tag. Il secondo strumento è l'Open History Viewer, strumento per visualizzare foto, dipinti e ricostruzioni contestualizzati nel loro momento storico e nella loro collocazione spaziale, in modo da consentire ai visitatori di comprendere l'impatto (o la mancanza di impatto) di particolari eventi storici o di particolari luoghi sugli osservatori. In aggiunta a questi tre modi di "vedere" i dati, sono previsti già ora un indice degli eventi storici in raccordo con il sistema semantico di perio.do e un raccoglitore di indicatori aggregabili nel tempo e nello spazio, come possono essere indicatori economici, sociali o politici.

Oltre a questi elementi di fruizione è già pianificato lo sviluppo di uno strumento di editing collaborativo per la digitalizzazione strutturata di mappe storiche e di contenuti bibliografici e nozioni storiche con l'ausilio delle principali rappresentazioni semantiche diffuse nell'ambito delle Digital Humanities.

Per questo progetto sono state utilizzate tecnologie completamente open e tutti gli strumenti realizzati sono aperti o in via di apertura. Ogni pezzo di codice in via di sviluppo sarà rilasciato appena sufficientemente stabile. Infatti, sempre durante il FOSS4G, è stato presentato in un secondo talk specifico un sistema di caching specializzato per rappresentare e gestire nel modo migliore dati spazio-temporali.

L'idea di fondo è quella di riuscire a razionalizzare un settore complesso come quello della ricerca in ambito umanistico fornendo piattaforme comuni, strumenti moderni e processi strutturati, cercando di valorizzare i tantissimi progetti di Digital Humanities già fatti da gruppi formali e non, di provenienze varie, senza snaturare la loro originalità e il loro background.

L'aspetto più affascinante è sicuramente quello della ricerca di dataset da fonti "strane" e l'aspetto narrativo dato dalla normalizzazione di tabelle e dati che nascono per loro natura disaggregati da tanti punti di vista diversi e che comunque ci raccontano una storia. Qui sotto l'immagine del primo dei viaggi della nave Endeavor, capitanata da James Cook, nell'esplorazione dell'oceano pacifico meridionale. I dati sono provenienti da un progetto di ricerca sul cambiamento climatico (CLIWOC), conclusosi anni fa.

Per concludere, siamo in un periodo storico in cui la verificabilità delle informazioni diventa ogni giorno più importante. Questo ci consente di capire quanto il passato fosse in realtà simile ad oggi e quanto fosse nei fatti diverso.

Per dirlo con le parole di Dickens,

Era il tempo migliore e il tempo peggiore, la stagione della saggezza e la stagione della follia, l'epoca della fede e l'epoca dell'incredulità, il periodo della luce e il periodo delle tenebre, la rimavera della speranza e l'inverno della disperazione. Avevamo tutto dinanzi a noi, non avevamo nulla dinanzi a noi; eravamo tutti diretti al cielo, eravamo tutti diretti a quell'altra parte — a farla breve, gli anni erano così simili ai nostri, che alcuni i quali li conoscevano profondamente sostenevano che, in bene o in male, se ne potesse parlare soltanto al superlativo.

Dal Data Analytics Framework (DAF) alla Piattaforma Digitale Nazionale Dati (PDND)

C'era una volta il DAF, il Data Analytics Framework. È stata una delle primissime iniziative messe in campo dall'allora Commissario Straordinario per l’attuazione dell’Agenda Digitale Diego Piacentini e dal neonato Team Digitale.

Il DAF, come descritto nell’articolo dell'allora Chief Data Officer del progetto, sarebbe dovuto essere una piattaforma Big Data, con due team alle spalle, uno di “data scientist” e un altro costituito da esperti di data visualization. I dati della pubblica amministrazione sarebbero dovuti essere acquisiti e canalizzati in un unico framework centrale, per garantirne la standardizzazione, l'interconnessione e consentirne così la fruizione attraverso API e dashboard tematiche.

Ha avuto dei momenti di pausa, è andato un po' in sordina, ha cambiato nome in PDND, ossia Piattaforma Digitale Nazionale Dati e oggi è inserito oggi PNRR (Piano Nazionale di Ripresa e Resilienza).

📍 Vincenzo Patruno, vice presidente di onData, racconta di questo progetto in questo post sul nostro blog.

Mappare il rischio infettivo con gli open data: RISVO - un progetto pilota triregionale

Il 13 dicembre onData terrà una diretta live con il gruppo di lavoro RISVO, un progetto di ricerca e condivisione che si pone l'obiettivo di aprire i dati sul rischio infettivo.

Quale è la situazione attuale di questi dati? Cosa può significare per le professioni nel settore sanitario rendere aperti e accessibili questi dati? Quali le conseguenze per la ricerca e la produzione scientifica?

Queste e tante altre le domande a cui proveranno a rispondere Federico Monaco e Andrea Pazzini del progetto RISVO, assieme a Paola Masuzzo, socia onData. Un grazie a datiBeneComune che ha creato questo ponte tra onData e Risvo.

La live si potrà seguire su YouTube, il 13 dicembre alle 18.30, al seguente link: https://youtu.be/zLQ3DvgSaq8

Puoi impostare comodamente un promemoria 🙃

"Nel tuo nome": le disuguaglianze di genere negli spazi universitari fisici e immateriali

"A Tu Nombre, Udelar" (Udelar, Universidad de la República, è la più antica università dell'Uruguay) è un progetto per visualizzare diverse forme di disuguaglianze di genere, riflesse nella designazione di spazi universitari fisici e immateriali. Soltanto 0.6 spazi universitari su 10, sono intestati a donne.

L'obiettivo è quello di migliorare una rappresentazione squilibrata, utilizzando anche meccanismi partecipativi; allo stesso tempo, la proposta cerca di contestualizzare queste informazioni e arricchirle, comprendendo la distribuzione dei ruoli per genere nell'Udelar, sia a livello di corpo studentesco che di dipendenti.

Le analisi e le visualizzazioni sono realizzate da DATA Uruguay, una ONG la cui missione è creare strumenti per un'azione collettiva, partecipata e collaborativa, facendo affidamento sulla comunità attraverso le tecnologie dell'informazione e della comunicazione.

L'applicazione è basata su dati aperti e il codice è liberamente utilizzabile.

Soltanto 0.6 spazi universitari su 10, sono intestati a donne

Le "metriche" delle visualizzazioni dei dati, sul portale COVID19 del Regno Unito

Anche in Gran Bretagna esiste un portale ufficiale dedicato alla attuale pandemia. Con dati, tabelle, grafici, mappe e API.

A tutto questo hanno da poco aggiunto qualcosa di non molto diffuso, di grande interesse e molto stimolante: la documentazione di tutte le "metriche" usate nel sito. Per ogni parola chiave, etichetta, categoria, variabile, ecc. utilizzata nel sito, viene data la spiegazione (sintetica e di dettaglio), la categorizzazione e la tipologia.

Quindi ad esempio per "Cumulative admissions" leggiamo che si tratta del "Total number of patients admitted to hospital with COVID-19 since the start of the pandemic", che ricade nella categoria "Healthcare" e che è di tipo cumulativo. Ed è documentato anche il significato di ogni categoria e tipologia.

Alle volte le persone hanno avuto difficoltà qui in Italia a leggere dati, testi, grafici, report, tabelle, mappe, ecc. pubblicati su siti ufficiali. Avere a disposizione una risorsa come questa del Governo britannico - soprattutto dopo averla scoperta - sembra essenziale e irrinunciabile.

Sarà una buona pratica a cui potremmo fare riferimento in termini di modalità di pubblicazione di dati e informazioni.

Pouria Hadjibagheri @Pouriaaa

After 11 months of work, we have finally created a comprehensive "Metrics documentation" page for the UK Coronavirus Dashboard. Quite a few people had asked for it... so please don't forget to send us your feedback. Stay safe 😷 #UKCovid19

Open Science: non ci sono alternative

La nostra socia Paola Masuzzo ha condotto un seminario per l'Università di Camerino sul tema dell'Open Science, ponendo domande fondamentali per chi si occupa di ricerca scientifica: cosa significa fare scienza aperta? Cosa fa bene alla scienza? Come rendere la ricerca più trasparente e inclusiva? Le slide dell'intervento sono disponibili a questo indirizzo.

I metadati sui dati aperti sui Green Pass: quando la forma è sostanza

Il Ministero della Salute ha pubblicato da alcune settimane i dati aperti su "EU Digital Covid Certificate", ovvero sui Green Pass.

Da circa un mese sono stati associati a dei metadati, sono stati descritti in modo che il portale nazionale dei dati aperti e a cascata quello europeo, li possano automaticamente indicizzare e rendere disponibili.

Questa che sembra soltanto una formalità, li rende più "trovabili", aumenta la cosiddetta findability, uno dei principi chiave dei "FAIR data" (findability, accessibility, interoperability, e reusability). Perché il web è pieno di dati interessanti e di valore, ma non indicizzati, non presenti in alcun motore di ricerca, è pieno quindi di dati "invisibili".

Questo lavoro di descrizione dei dati è stato fatto in due modalità:

quello previsto dalle Linee guida nazionali per la valorizzazione del patrimonio informativo pubblico;
quello secondo lo standard Frictionless Data.

🙏 Grazie a Matteo Fortini e a tutto il gruppo di lavoro per essersene occupati.

La nostra amica Marla

Marla è il magazine di info.nodes, un bel progetto di persone a noi care e vicine. Di Marla si dice che:

è fragile, insicura, isterica. Non ha alcuna pretesa di salvare il mondo - già fatica a salvare sé stessa - ma prova fatalmente attrazione per chi tenta di ribaltare il tavolo delle ingiustizie e delle iniquità. [...] Ti parlerà di questioni importanti, ti porterà in luoghi che non hai mai visitato, non ti aiuterà a comprendere il passato o il presente, ma ti darà degli spunti per immaginare il futuro.

L'ultimo numero si intitola "Sesso è potere": è uno speciale dedicato al potere e del ruolo marginale che troppo spesso hanno le donne laddove si prendono decisioni. Di grande interesse il "pezzo" di Davide Del Monte - presente all'inizio di questo numero - con l'analisi del potere per genere, di giornali, aziende controllate e partecipate dal Ministero dell'Economia e delle Finanze, aziende capitalizzate e banche. Emergono dati che fanno rabbia e che devono spingerci a pretendere un futuro diverso e migliore.

E Marla ce lo fa immaginare. Non ti resta che leggerla, che c'è tanto altro.

Due letture correlate: una sezione del sito della commissione europea, EU action for equal pay e questa analisi sull'occupazione femminile in Argentina.

OpenDataScience Europe Workshop 2021

Nell'ambito del progetto GeoHarmonizer, finanziato dall'UE, è stato organizzato l'Open Data Science Europe Workshop, un evento ibrido di 5 giorni: due giorni di sessioni di formazione sull'elaborazione di "cubi di dati" e sull'utilizzo del machine learning per estrarre contenuti e tre giorni di sessioni orali e gruppi di discussione su scienza, tecnologia e business negli open data.

Il tema speciale del workshop 2021 è stato "Spatiotemporal modeling of European Landscapes and Climate 2000–2020: using EO and Machine Learning".

Qui tutti i video: https://tinyurl.com/mrx5wsnh

Il report dell'Agenzia europea dell'ambiente sugli impatti sulla salute dell'inquinamento atmosferico

Il 15 novembre 2021 l'Agenzia europea dell'ambiente ha pubblicato un report sugli impatti sulla nostra salute dell'inquinamento atmosferico in Europa.

L'inquinamento atmosferico è una delle principali cause di morte prematura e malattie ed è il più grande rischio per la salute ambientale in Europa. Le malattie cardiache e l'ictus sono le ragioni più comuni di morti premature attribuibili all'inquinamento atmosferico, seguite dalle malattie polmonari e dal cancro ai polmoni.

Questo report stima i potenziali benefici per la salute derivanti dal raggiungimento degli standard di qualità dell'aria dell'UE e presenta le ultime stime degli impatti sulla salute dell'esposizione ai seguenti principali inquinanti atmosferici: particolato fine, biossido di azoto e ozono.

Nel 2019 nell'UE (27 paesi):

307.000 morti premature sono state attribuite all'esposizione a PM 2,5;
40.400 all'esposizione a biossido di azoto (NO 2 );
16.800 all'ozono (O 3 ).

Se nel 2019 avessimo già raggiunto gli obiettivi previsti dalle linee guida OMS sulla qualità dell'aria per il PM 2,5, ci sarebbe stata una riduzione delle morti premature di almeno il 72% rispetto ai livelli del 2005.

È un tema di enorme impatto, su cui troppo spesso non si pone la dovuta attenzione, né quotidiana, né governativa.

Sul sito dedicato tutti i dettagli, gli indicatori e i dati.

Strumenti/risorse

📌 Da pochissimo la prima edizione degli #EUOpenDataDays. Ecco le tre playlist video di tantissimi e interessantissimi interventi: giorno 1, giorno 2 e giorno 3;
📚 "Geospatial data and API delivery", un corso per imparare a cercare e utilizzare dati spaziali sul portale europeo dei dati aperti;
📩 l'ultimo numero della newsletter dell'Ufficio delle pubblicazioni dell'Unione europea è dedicato ai dati aperti;
📌 a fine ottobre 2021 si è tenuta la conferenza Inspire 2021. Inspire è un direttiva EU sull'interoperabilità dei dati spaziali, con l'obiettivo finale di avere un impatto diretto o indiretto sull'ambiente. Il programma;
📖 è uscito l'Eurostat regional yearbook — 2021, che fornisce un quadro dettagliato relativo a un'ampia gamma di argomenti statistici nelle regioni degli Stati membri dell'UE, nonché nelle regioni dell'EFTA;
🧮 Giorgio Comai ha pubblicato (grazie) il dataset dei "centri" delle unità amministrativi "pesati" sulla popolazione;
📹 le registrazione del webinar di Creative Commons, intitolato The Future of Open;
📰 "Per affrontare i problemi globali, il mondo deve creare dati aperti", un articolo tutto da leggere di Hannah Ritchie su nature;
🗺 se vuoi estrarre dati da Open Street Map, la più importante banca dati cartografica aperta, lo strumento migliore è Overpass e questa è la guida migliore;
🗺 Cosa ci faccio con i dati aperti? Ti costruisco Helsinki dentro Minecraft;
📰 In che modo ProPublica ha utilizzato i dati aperti del sequenziamento genomico per monitorare un'epidemia di salmonella in corso;

Per sostenerci

Se vuoi sostenerci questo il link per farlo. E invita per favore i tuoi contatti a iscriversi alla nostra newsletter.

🙏Ti ringraziamo e ti diamo appuntamento tra un mese.

Associazione onData newsletter

Discussione su questo Post