Associazione onData newsletter

Share this post

📣 Associazione onData newsletter - Newsletter #11

ondata.substack.com

📣 Associazione onData newsletter - Newsletter #11

Associazione onData
Apr 4, 2022
Share this post

📣 Associazione onData newsletter - Newsletter #11

ondata.substack.com

Ciao,

grazie per essere qui a leggere questa newsletter, per avere invitato altre/i a iscriversi e per darci spesso spunti per i contenuti che pubblichiamo.

🙏Se vuoi sostenerci, puoi farlo con una donazione.

📍 Se hai qualche problema di lettura di questa newsletter, apri questo link.

🔗 twitter | youtube


A Yulia Zdanovska

Questa newsletter è dedicata Yulia Zdanovska, 21 anni, medaglia d’Argento alle European Girls’ Mathematical Olympics 2017, socia dell'associazione di volontariato "Teach for Ukraine", uccisa l'8 marzo 2022 a Kharkiv mentre stava aiutando i civili a scappare dalla guerra in corso in Ucraina.

Yulia Zdanovska

Online il nuovo sito di onData

Il nuovo sito di onData è online! In questa versione aggiornata abbiamo voluto valorizzare e dare ancora più spazio alle azioni e ai progetti portati avanti quotidianamente dall’associazione.

Dentro la sezione Azioni troverete tutte le azioni di advocacy che abbiamo portato avanti per stimolare la Pubblica Amministrazione italiana all’apertura e alla pubblicazione dei dati, mentre dentro la sezione Progetti potete dare uno sguardo a iniziative come #DatiBeneComune o Vaccini Per Tutti.

Se volete approfondire alcuni temi, come la storia dell’associazione e le persone che partecipano alle sue attività, date un’occhiata alla sezione Noi, oppure alla sezione Guide e Strumenti per studiare e conoscere alcune delle tecnologie che usiamo tutti i giorni per trattare i dati.

https://ondata.it/

I dati che vorrei: pubblicato il dossier sul divario di genere

A febbraio abbiamo lanciato “I dati che vorrei” - un progetto dentro #DatiBeneComune che si occupa e preoccupa di chiedere che i dati del PNRR siano pubblicati in modalità che consentano di progettare - e vivere - una società più giusta, inclusiva e collaborativa.

Il 29 marzo, in collaborazione con Period Think Tank, abbiamo pubblicato il secondo dossier del progetto, tutto dedicato al PNRR e al divario di genere. Il PNRR si prefigge infatti di destinare parte dei fondi alla riduzione delle disuguaglianze di genere attraverso lo sviluppo di infrastrutture sociali e la progettazione di politiche pubbliche. Noi crediamo fermamente che la raccolta di dati disaggregati di genere, liberi da stereotipi, e accessibili in formato aperto, interoperabili e disponibili a tutti i livelli territoriali, da quello nazionale a quello comunale, sia assolutamente cruciale per monitorare l’impatto delle politiche adottate sul divario di genere.

Twitter avatar for @ondatait
onData @ondatait
💡È necessario produrre statistiche di genere in formato aperto e interoperabili. Tutto ciò che non misuriamo rimane invisibile, è una scelta politica che non possiamo più permettere #PNRR #datiBeneComune datibenecomune.it/2022/03/29/pnr… @ActionAidItalia @transparency_it
datibenecomune.itPNRR: per ridurre le disuguaglianze di genere abbiamo bisogno dei dati#DatiBeneComune pubblica oggi il secondo dossier I dati che vorrei per monitorare l’impatto del PNRR sulla parità di genere
9:41 AM ∙ Mar 29, 2022
30Likes22Retweets

Il dossier offre una panoramica su “I dati che non vorremmo più dover commentare” e offre proposte concrete per una raccolta di dati precisa che consenta la misurazione di impatto di genere.

Il progetto, supportato da Open Society Foundations, continuera’ nei prossimi mesi, affrontando anche il divario di territorio e quello di generazione.

Tutto ciò che non misuriamo rimane invisibile, è una scelta politica che non possiamo più permettere.

Pubblicati i dati relativi alle prove INVALSI in formato machine readable

A seguito anche di una nostra richiesta l’Istituto Nazionale per la Valutazione del Sistema Educativo di Istruzione e di Formazione (INVALSI) ha pubblicato le matrici campione e i tracciati (fare click sul menu, su Open Data e poi su Open data campionari) relativi ai risultati delle prove INVALSI per gli studenti di ogni grado dall’anno scolastico 2012-2013, e una serie di dati relativi ai punteggi su diverse basi territoriali.

Queste matrici sono i dati grezzi anonimizzati. È un gran bel risultato, perché prima c'erano dati più aggregati.

Avevamo già parlato nel nostro blog dell’importanza di avere questo tipo di dati: l’analisi e l’interpretazione di dati come le prove INVALSI può infatti fornirci uno spaccato interessante sul mondo della scuola e sull’istruzione. Il nostro lavoro di analisi viene certamente agevolato dalla presenza di dati in formato aperto e disaggregato ed è importante che istituzioni pubbliche come INVALSI condividano questa idea.

Dati sui delitti denunciati all'Autorità Giudiziaria dalle forze di Polizia

Da alcune settimane stiamo dialogando con alcune associazioni che si occupano del tema degli abusi su bambine e bambini. Al primo incontro ci hanno riportato questa considerazione: “ci sono pochi dati disponili su questi orrendi fenomeni, e non riusciamo a raccontarli bene”.

Sul tema non abbiamo esperienza e si sta rivelando un’opportunità di crescita personale e professionale. Abbiamo condiviso e sviluppato con loro un primo piccolo passo: fare aggiornare un dataset di riferimento, ovvero quello sul “Numero dei Delitti denunciati all'autorità Giudiziaria dalle forze di Polizia”, pubblicato dall’Ufficio Centrale di Statistica del Ministero degli Interni.

Abbiamo scritto a inizio febbraio del 2022 al Ministero, e a marzo dello stesso anno, gli uffici hanno aggiornato i dati, e aggiunto quelli del 2020. Siamo contenti, sia perché abbiamo avuto presto un riscontro, sia perché abbiamo stimolato l’aggiornamento dati, che era in ritardo di qualche mese. Sono infatti dati che vengono pubblicati una volta l’anno, dopo l’estate:

Si comunica infine che i dati relativi alla delittuosità — Anno 2021 non sono ancora disponibili perché in fase di consolidamento da parte dell’ufficio competente. Come ogni anno saranno disponibili nel periodo settembre/ottobre per i dati che si riferiscono all'anno precedente.

Ci sono alcune criticità, che riporteremo all’ufficio statistico:

  • manca un file unico, con i valori di tutti gli anni, per fare un’analisi nel tempo;

  • negli anni, è cambiato lo schema dati, anche in modo importante;

  • i codici di classificazione dei reati non sono omogenei, in termini di etichette;

  • non ci sono i codici geografici né di regioni, né di province.

Abbiamo eseguito una prima elaborazione per risolvere questi punti, e prodotto un file di insieme, per gli anni che vanno dal 2017 al 2020. Il taglio territoriale è quello provinciale.

A che servono i dati? A fare un bot sulla disparità salariale

Twitter avatar for @PayGapApp
Gender Pay Gap Bot @PayGapApp
In this organisation, women's median hourly pay is 31.4% lower than men's.
Twitter avatar for @BouxAvenue
Boux Avenue @BouxAvenue
Every. Body. Is. Beautiful. 💙 Together, we can #BreakTheBias 💪🏼 Tag your girl gang in the comments below to spread some love this Hump Day ⬇️ https://t.co/Mk2VGXOBSo
9:03 AM ∙ Mar 16, 2022
9,876Likes975Retweets

Gender Pay Gap Bot è un bot Twitter che, quando una compagnia o un'organizzazione inglese posta un tweet con parole chiave collegate alla Giornata Internazionale delle Donne, risponde loro direttamente citando le differenze salariali tra uomini e donne delle/dei dipendenti.

Tutto ciò è possibile grazie ai dati sul gender pay gap che nel Regno Unito ogni azienda con più di 250 dipendenti è obbligata a comunicare.

Si può fare in Italia?

No, perché al momento non sappiamo quanto sono discriminate le donne, sul piano lavorativo, contrattuale e salariale. Avere dati su questo tipo di informazioni è un elemento fondamentale per orientare politiche del lavoro, aziendali e nazionali, che mirino ad appianare i divari di genere nel mondo del lavoro italiano. Alcune aziende, nei loro bilanci di sostenibilità, hanno iniziato a pubblicare questi dati, ma manca ancora una base dati nazionale aggiornata.

Gli ultimi dati disponibili sul gender pay gap risalgono infatti al 2008: "la legge sulla parità salariale è stata pubblicata sulla Gazzetta ufficiale all’inizio di novembre 2021", scrive Giovanna Faggionato su Domani "e impone un sistema capillare di raccolta dati che finora è sempre mancato, tramite la creazione di una piattaforma nazionale a cui possono accedere anche le consigliere di parità e i rappresentanti sindacali". I dati da raccogliere riguarderebbero non solo le retribuzioni, ma anche "non solo il salario, ma anche i livelli e le qualifiche, il tipo di contratti, la formazione, i licenziamenti e la distribuzione degli ammortizzatori sociali".

Da questo punto di vista si sta muovendo anche l'Unione Europea, con il lancio del Gender Equality Strategy Monitoring Portal, un portale di monitoraggio delle disuguaglianze di genere nell'Unione Europea dove è possibile comparare i dati dei paesi europei su alcuni indicatori chiave, legati a violenza di genere, stereotipi ed economia.

Twitter avatar for @Mcx83
Marco Cortella @Mcx83
In Italia gli ultimi dati sulla disparità salariale risalgono al 2008. Oggi ne parla @francescocosta in #Morning citando questo articolo di @DomaniGiornale. Sono stati stanziati 3 milioni € per la piattaforma di raccolta dati. editorialedomani.it/economia/disug… #8marzo #datibenecomune
Image
8:49 AM ∙ Mar 8, 2022
3Likes4Retweets

Il comune di Napoli è in ascolto, e applica una licenza aperta ai suoi contenuti

Il 18 marzo 2022 Simone Aliprandi ha pubblicato un tweet in cui faceva notare che la licenza sui contenuti del sito del Comune di Napoli, riportasse un vincolo e un link errati.

La cosa ci ha incuriosito e siamo andati a leggere la pagina (era così in quella data). Nel verificare quanto riportato dall’ottimo Simone, ci rendiamo conto di un altro aspetto: la licenza non era una licenza aperta, perché non consentiva l’uso commerciale di quanto pubblicato. Allora abbiamo aggiunto questo tweet, per chiedere di una licenza aperta, così come previsto per i contenuti dei siti della pubblica amministrazione:

Twitter avatar for @ondatait
onData @ondatait
@ComuneNapoli @simonealiprandi @aborruso @napo @Piersoft @CrespiDaniele Buonasera. Alle note di Simone, aggiungiamo un punto: quella non è una licenza adatta come licenza generale a un sito della PA. Dovreste scegliere, come previsto dal CAD, una licenza aperta e quindi consentire l'uso commerciale.
7:00 PM ∙ Mar 18, 2022

Il Comune di Napoli è stato in ascolto da subito e ha corretto presto gli errori segnalati da Simone, e dopo soli 5 giorni ha cambiato la licenza generale del sito, scegliendo una licenza CC BY 4.0, che consente a chiunque di accedere ai contenuti, utilizzarli, modificarli e condividerli a qualsiasi scopo, anche commerciale, avendo l’obbligo di riconoscere una menzione adeguata della fonte e indicare se sono state fatte modifiche.

Grazie a Simone per averci fatto scoprire la cosa e grazie soprattutto al Comune di Napoli.

🗺️ Le Concessioni Demaniali agli stabilimenti balneari: quanto è difficile poter dare valore ai dati

Il 1 marzo 2022 Isaia Invernizzi ha pubblicato un post su twitter, in cui annunciava un suo bell'articolo su Il Post: "Quanto costano le concessioni agli stabilimenti balneari".

L'articolo - tra le altre cose - è basato sui dati aperti del Ministero delle Infrastrutture e della Mobilità Sostenibili, ovvero i dati delle concessioni demaniali marittime in Italia, Sistema informativo demanio marittimo.  Le informazioni contengono anche la geolocalizzazione nonché il valore di canone dovuto.

Vi consigliamo di leggerlo, ma qui vogliamo sottolineare quanto possa essere difficile alle volte per un/a giornalista dare valore ai dati, quando ci sono dei problemi di qualità.

In questo caso ad esempio:

  • non è associato un sistema di coordinate ai dati, né nella modalità standard per quel formato (aggiungere un file prj, né inserito come nota di testo;

  • i due file geografici (almeno sino a inizio marzo 2022) avevano un'estensione geografica errata, con alcuni valori di coordinate che nulla avevano a che fare con l'Italia;

  • il file CSV sulle concessioni riporta per circa 40 righe valori di coordinate che non numerici, quindi inusabili.

Abbiamo scritto al Ministero per segnalare questi punti (sembrano tutti ancora non risolti), ma soprattutto abbiamo provato a superare questi ostacoli facendo un po' di pulizia e trasformazione dei dati.

Una volta fatto, il nostro Guenter Richter - un esperto di cartografia dinamica interattiva basata sui dati - ha iniziato a lavorarci e a produrre ad esempio queste belle mappe online (da guardare da PC).

E anche Guenter, come Isaia, non è riuscito subito a lavorarci, perché la qualità dei dati non era buona.

Ne parleremo in un video incontro (avviseremo non appena sarà pronto), con Isaia, Guenter e Andrea Borruso.

I dati sui fondi europei per la coesione li trovi su Kohesio

La Commissione europea ha lanciato Kohesio, una piattaforma pubblica che traccia oltre 1,5 milioni di progetti finanziati attraverso la politica di coesione 2014-2020 nei 27 Stati Membri.

Il sito si apre con un messaggio invitante, “Kohesio: discover EU projects in your region”, e una mappa navigabile che arriva al sodo: quanti e quali progetti sono stati finanziati in ogni Stato e, a un livello successivo, in ogni regione, attingendo dal Fondo europeo di sviluppo regionale (Fesr), dal Fondo di coesione (Fc) e dal Fondo sociale europeo (Fse), a partire dal 2014 e fino al 2020.

Il tasto “projects near me” sulla mappa - costruita con OpenStreetMap - consente di geolocalizzarsi e, quindi, cercare i progetti più vicini al proprio punto di osservazione.

E’ possibile fare ricerche tra Progetti e Beneficiari, realizzare “classifiche”, scaricare in dati in due formati, csv e xlsx.

Apprezzabile il tentativo della piattaforma “Kohesio” di avvicinarsi al cittadino, mostrando anche gli effetti della politica di coesione. Come? Prevedendo per ogni progetto finanziato anche una sezione Audiovisual, che consiste in immagini di repertorio e una breve descrizione. Per l’Italia manca, ad esempio, qualsiasi contenuto audiovisivo.

Qui i dati grezzi:

  • https://kohesio.ec.europa.eu/data/projects/

  • https://kohesio.ec.europa.eu/data/nuts/

  • https://kohesio.ec.europa.eu/data/beneficiaries/

Dati: Bene Comune? Davide Del Monte fa il punto sulla campagna, nel podcast di "Cominciamo Bene"

"Cominciamo Bene" è la "rassegna stampa ragionata" di rbe, un'emittente radiofonica locale a carattere comunitario dell’Associazione culturale “Francesco Lo Bue”.

Il 15 marzo 2022 ha pubblicato una bella intervista a Davide Del Monte, uno dei coordinatori della campagna "#datiBeneComune", in cui racconta come è nata la campagna, come si è evoluta e come si sta muovendo in queste ultime settimane: la divulgazione del tema dei dati pubblici come bene comune, e l'attenzione sugli appalti del PNRR.

Dati non dati: quelli sui profughi che scappano dalla guerra in Ucraina e arrivano in Italia

Ad oggi più di 80.000 persone sono arrivate in Italia dall’Ucraina, circa il 50% donne, il 40% minori e il 10% uomini. Numeri pesanti, che aiutano ad aver un quadro sia dell’orrore che c’è a monte, sia di quanto ci sia da fare qui in Italia per gestire bene l’accoglienza.

Numeri per i quali oggi non c’è una fonte ufficiale machine readable e aggiornata quotidianamente.

Questi vuoti sono spesso l’ispirazione per una o più persone e lo sono stati sicuramente per Carlo Campa, che a inizio marzo 2022 a iniziato a raccogliere i dati che il Ministero degli interni pubblica giornalmente come news di testo (un esempio), e che Carlo trascrive ogni giorno su questo foglio elettronico.

⚠️Purtroppo al sito del Ministero degli Interni è applicata ancora una volta una licenza non adeguata, una CC BY-NC-SA 3.0, che non consente l’uso commerciale dei prodotti derivati. Carlo non ne fa uso commerciale, ma la questione sarebbe da risolvere in termini generali (faremo una segnalazione al Difensore Civico per il Digitale). 

Twitter avatar for @CarloCampa
Carlo Campa @CarloCampa
La differenza fra il numero di profughi ucraini che è stato comunicato essere arrivati in Italia entro le 8 di sta mattina e l'analogo per le 8 di ieri mattina (≈ numero di ucraini arrivati ieri) è la più grande registrata finora (non che lo storico sia enorme, eh): circa 4500
Image
4:07 PM ∙ Mar 11, 2022
6Likes1Retweet

E questi vuoti informativi hanno ispirato il nostro caro Vittorio Nicoletta (in collaborazione con Dennis Angemi che sta curando la metadatazione), che invece li estrae in modo automatico, con uno script R, che li estrae dai tweet che contengono la stringa #accoglienzaucraina sono pubblicati dall’account twitter del Viminale. Tutto in questo repository su GitHub.

La trascrizione da una pagina web e lo script automatico da un tweet, non sono per niente l’ideale, ma 🙏 grazie mille a Carlo, Vittorio e Dennis, che con il loro lavoro, fanno comprendere quanto sia necessaria una fonte ufficiale machine readable, aggiornata e ben descritta sui dati sui profughi provenienti in Italia dall’Ucraina.

Lo stato di attuazione del Piano Nazionale di Ripresa e Resilienza e l’audizione parlamentare di DatiBeneComune e Osservatorio Civico PNRR

Federico Anghelé (The Good Lobby) e Susanna Ferro (Transparency International Italia) hanno partecipato al ciclo di audizioni della Commissione Affari Costituzionali della Camera dei Deputati, nell’ambito dell’esame della relazione sullo stato di attuazione del Piano nazionale di ripresa e resilienza (Pnrr), riferita all’anno 2021.

Hanno informato su alcune criticità legate all’attuazione del Piano Nazionale di Ripresa e Resilienza legate alla trasparenza, alla partecipazione dei cittadini e delle cittadine ma anche sulla regolamentazione delle rappresentanze di interessi e su alcuni strumenti di lotta alla corruzione (come il whistleblowing).

Susanna e Federico hanno lasciato queste memorie (DatiBeneComune e Osservatorio Civico PNRR)

Festival del giornalismo, tutti gli eventi che parlano di dati

Torna il Festival Internazionale del Giornalismo di Perugia, da sedici edizioni appuntamento fisso per giornalisti, comunicatori, attivisti e accademici. Dopo due anni di pausa a causa della pandemia, dal 6 al 10 aprile il centro storico di Perugia sarà di nuovo location di 240 incontri, tavole rotonde e interviste, per un totale di oltre 600 speaker provenienti da tutto il mondo. Anche in questa XVI edizione il mondo dei dati è ben rappresentato con una serie di panel su data journalism, inchieste data-driven e l’uso intelligenza artificiale per le investigazioni. Ve ne segnaliamo sette, ma il programma è tutto da esplorare:

  • Data journalism, dialogo coi lettori e anonimato delle fonti: gli strumenti della nuova informazione

  • Perché il giornalismo deve occuparsi di intelligenza artificiale

  • Come usare l'intelligenza artificiale per inchieste 'impossibili'

  • Lo stato del data journalism

  • Contenuti e riuso di informazioni tra plagio, open data e diritti

  • Data-checking: come verificare dati, grafici e tabelle

  • Lezioni dai Sigma Award: il meglio del data journalism nel mondo

I video del workshop su Wikidata e media

LA European Broadcasting Union ha organizzato un workshop su Wikidata, in quanto è una delle banche dati aperti più ricche e utili oggi disponibili.

È molto interessante il target, che è principalmente quello delle emittenti TV.

Qui i video: https://tech.ebu.ch/events/2022/wikidata-workshop

OpenAntani fa cambiare la licenza dei dati dell'EcoAtlante di ISPRA

L'Istituto Superiore per la Protezione e la Ricerca Ambientale (ISPRA) ha da poco pubblicato l'EcoAtlante dell'Italia, che nella sua prima versione era pubblicato con un licenza chiusa, perché valeva quella generale dell'Istituto.

E allora è arrivato in aiuto l'account twitter OpenAntani - un profilo anonimo che in modo periodico pubblica buffi tweet sui dati aperti (soprattutto) della pubblica amministrazione - che ha fatto una richiesta e ha ottenuto il cambio di licenza sull'atlante (prima e dopo, guardare il piede della pagina).

Viva OpenAntani e grazie al dott. Munafò per l'ascolto delle istanze che gli sono state presentate.

Certo rimane il tema grande della licenza generale di ISPRA, che è totalmente inadeguata e su cui abbiamo fatto una segnalazione al difensore civico per il digitale.

Twitter avatar for @openantani
openantani @openantani
gentile @ISPRA_Press il lavoro del suo ecoatlante ecoatlante.isprambiente.it è lodevole solo che non permettere l'accesso ai dati grezzi suona male. Ci sarebbe il servizio REST, ma con le vostre note legali è inutilizzabile #datibenecomune sinacloud.isprambiente.it/arcgisadv/rest…
Image
2:29 PM ∙ Mar 1, 2022
10Likes4Retweets

Strumenti/risorse

  • 🧮 the AIDS Data repository, una banca dati centralizzata per chi vuole accedere e/o pubblicare dati sulla sindrome da immunodeficienza acquisita;

  • 🪛 World Bank ha aggiornato il suo portale sui dati di genere;

  • 📄 La Commissione Europea ha pubblicato la versione finale della proposta di normativa sui dati;

  • 💡Salvare il patrimonio culturale online dell'Ucraina: Saving Ukrainian Cultural Heritage Online (SUCHO), un'iniziativa in collaborazione con Internet Archive;

  • 🧮 Eurostat ha rilasciato un nuovo strumento di visualizzazione interattivo, con le statistiche rilevanti sul Green Deal europeo;

  • 📄 Vuoi sapere di più su dati aperti e archeologia? Ecco "Digital Archiving in Archaeology: The State of the Art";

  • 🪛 Su Document Cloud, arrivano nuovi strumenti (tutto il thread) per analizzare, estrarre e condividere dati a partire da documenti;

  • 🗨️ Using non traditional data to expand data journalism education, una interessantissima presentazione sulle scelte didattiche nel data journalism;

  • 📄 Il 53° report della Commissione Statistica delle Nazioni Unite sancisce in particolare il principio e il valore degli “Open Data by Default”;

  • 🗺️ un lungo e ricco thread twitter, su come mostrare flussi di rifugiate/i in una mappa;

  • 🧮 pubblicati dati aperti sull'uso del suolo in Australia, dal 1988 al 2020, con risoluzione di 25 metri;

  • 🎓 Paris 21 academy, risorse didattiche sui dati e statistiche, nel contesto dello sviluppo sostenibile;

  • 🎓 I dati aperti sui trasporti, nel contesto di Open Street Map. Una guida per saperne di più.

Per sostenerci

Se vuoi sostenerci, questo il link per farlo. E invita per favore i tuoi contatti a iscriversi alla nostra newsletter.

🙏Ti ringraziamo e ti diamo appuntamento tra un mese.

Share this post

📣 Associazione onData newsletter - Newsletter #11

ondata.substack.com
Previous
Next
Comments
TopNewCommunity

No posts

Ready for more?

© 2023 Associazione onData
Privacy ∙ Terms ∙ Collection notice
Start WritingGet the app
Substack is the home for great writing