📣 Associazione onData - Newsletter #24
Aggiornamento dei dati aperti sul PNRR, spazi di partecipazione per politiche condivise, misurare l'impatto delle politiche pubbliche e tanto altro.
Ciao,
grazie per essere qui a leggere questa newsletter, per avere invitato altre/i a iscriversi, per darci spesso spunti per i contenuti che pubblichiamo.
🙏Se vuoi sostenerci, è il momento del 5x1000.
🧮 Aggiornamento dati aperti sul Piano Nazionale di Ripresa e Resilienza
Il 16 giugno 2023 sono stati aggiornati diversi dati pubblicati nel “catalogo open data” di Italiadomani (il sito ufficiale del Piano Nazionale di Ripresa e Resilienza).
Una cosa che non ci piace è che la pubblicazione non sia stata annunciata nella sezione delle News e che in alternativa non ci sia nemmeno un modo per iscriversi a degli avvisi automatici (come un Feed RSS).
Noi ne abbiamo avuto riscontro perché abbiamo costruito un piccolo sistema di monitoraggio di questa sezione.
Chi si occupa della pubblicazione dei dati su Italiadomani dovrebbe fare come è stato fatto dalla Protezione Civile per i dati COVID-19: documentare le variazioni e farlo con un po’ di anticipo rispetto alla data di pubblicazione.
Tra i dati aggiornati, quelli da fonte ReGiS, ovvero il sistema creato per fare adempiere le amministrazioni agli obblighi di monitoraggio.
Questo aggiornamento di giugno era previsto nella recente “Relazione sullo stato di attuazione del Piano nazionale di ripresa e resilienza (PNRR), aggiornata al 31 maggio 2023” (si veda la sezione “5.4.8 Italiadomani: i prossimi passi”).
Nel dataset sui Progetti (ancora non validati) - rispetto alla precedente versione del dataset - 60.000 progetti in più e circa 90.000 record in cui sono state fatte modifiche.
È un importante aggiornamento in termini numerici, e consentirà di avere una visione più completa dei progetti, ma non è ancora possibile monitorarne l’attuazione, perché mancano ancora dei campi/colonne che consentano di farlo.
Ci sono anche alcune criticità nei dati, che abbiamo documentato in una sezione del nostro Vademecum sui dati aperti sul PNRR, che invieremo al Ministero dell’Economia (OpenPolis ha già segnalato queste anomalie, relative alla precedente versione dei dati).
🙏 Guenter Richter ha aggiornato la mappa per esplorare i dati sui progetti da fonte ReGiS.
📺 Costruire spazi di partecipazione per politiche e opere pubbliche condivise
Il 6 giugno 2023 si è svolto al Senato il convegno "Costruire spazi di partecipazione per politiche e opere pubbliche condivise", promosso dall'Osservatorio civico PNRR, dal Forum Disuguaglianze e Diversità e dalla campagna #datibenecomune.
Davide Del Monte di info.nodes, collaboratore di onData e coordinatore della campagna, ha tenuto uno degli interventi. Ha sottolineato la necessità di una maggiore partecipazione della società civile nella politica e nell'amministrazione pubblica e di come questa sia attualmente scarsa e limitata, con buone pratiche ancora troppo rare e straordinarie.
Per Davide la trasparenza e la partecipazione sono elementi essenziali per ristabilire quella fiducia tra cittadinanza e istituzioni, che al momento appare ai minimi storici: da una parte la cittadinanza non ha alcuna fiducia nei suoi rappresentanti, come dimostrano le percentuali di votanti alle elezioni; ma dall’altra parte anche la classe politica mostra pochissimo interesse nella partecipazione di cittadini e organizzazioni al processo decisionale.
Una soluzione sarebbe quella di passare dall’idea di cessione del potere a quella di condivisione del potere, attraverso processi partecipativi concreti e orizzontali che coinvolgano le reti e le competenze della società civile, e che condividano gli obiettivi e i processi di trasformazione del paese.
L'intervento di Davide inizia circa al tempo 2:37:05 e vale l’ascolto. Fuor di retorica ti consigliamo di ascoltare un po' tutti gli interventi, nel video reso disponibile da Radio Radicale (grazie).
🖥️ Parlamento: intelligenza artificiale e open data per prevedere i cambi di “casacca”
Ci siamo spesso chiesti a cosa potessero servire i numerosi set di open data messi a disposizione dagli organi parlamentari, come Camera e Senato. Votazioni, proposte di legge, emendamenti, composizione di gruppi parlamentari, età e professione di deputati e senatori sembravano dati buoni solo per la curiosità e lo studio degli addetti ai lavori.
Invece, utilizzando l'intelligenza artificiale, si può ottenere di più.
Grazie a un algoritmo, progettato dalla Scuola Superiore Sant'Anna di Pisa, è possibile prevedere i "cambi di casacca" dei parlamentari.
La ricerca nasce dalla collaborazione tra due Istituti della Scuola Superiore Sant’Anna di Pisa, l’Istituto di BioRobotica e l’Istituto Dirpolis, e muove dall'analisi delle ultime due legislature della Camera dei Deputati (quelle del 2013-2018 e del 2018-2022).
Lo strumento potrebbe rivelarsi molto importante, sia per le decisioni dei capigruppo che per la trasparenza nei confronti degli elettori. Va considerato che negli ultimi dieci anni quasi un deputato su tre ha cambiato gruppo di elezione. Come è possibile prevedere i cambi futuri? Combinando intelligenza artificiale e linked open data.
L'algoritmo, "allenato" a studiare e analizzare i comportamenti dei parlamentari, raccoglie i dati relativi alle loro singole votazioni, sia in aula che nelle commissioni. In base all' azione di ogni singolo onorevole - ricavabile dai linked open data istituzionali-, che sia coerente o discordante con il proprio partito di appartenenza - è possibile prevedere se resterà o meno in quel gruppo.
Molti fattori determinano questa previsione. Il più curioso è la partecipazione più frequente del parlamentare a votazioni segrete, secondo l'algoritmo segnale di un imminente cambio di casacca.
💾 Abbiamo creato la copia dei dati aperti del PNRR su Internet Archive
L'archiviazione digitale è diventata un tema sempre più importante e rilevante, sia per la conservazione della memoria storica che per la tutela dei diritti e della privacy degli utenti. In questo contesto, Internet Archive e la sua "Wayback Machine" rappresentano uno strumento importante per la conservazione e l'accesso a informazioni e dati digitali.
La Wayback Machine è un servizio che consente di accedere a versioni archiviate di siti web, documenti, filmati, immagini, ecc., in diverse date. È possibile visualizzare come un sito web appariva in passato, ad esempio per recuperare informazioni che sono state rimosse o modificate successivamente. È quindi preziosa per la conservazione della memoria storica del web, per il monitoraggio delle variazioni di una risorsa digitale pubblicata online e anche per avere una copia.
Il sito ufficiale del PNRR - Italiadomani - ha la sezione “Catalogo Open Data”, con i dati aperti sul Piano. Potrebbero essere rimossi o modificati senza preavviso, o essere persi a causa di guasti tecnici o di errori umani.
Non c’era una copia aggiornata sulla "Wayback Machine" e l’abbiamo creata.
Nel tempo è cambiato l’URL principale dei dati. La copia dei dati del primo URL è qui, mentre la seconda, quello con i dati dell’aggiornamento recente, è qui (sono anche leggibili in formato JSON).
Archiviare risorse online può essere utilissimo per molti di voi, e vorremmo dedicare una delle nostre guide al come farlo con la "Wayback Machine".
Nell’attesa alcune informazioni utili (un elenco parziale):
la pagina web per farlo a partire da un URL (se ti fai un account su Internet Archive, la pagina ha più funzioni);
la comoda estensione per browser;
savepagenow@archive.org, l’indirizzo e-mail a cui inviare un elenco di URL, che saranno “magicamente” archiviati;
ci sono le API e le modalità per farlo a partire da un google sheet. Per entrambe le modalità, bisogna richiedere informazioni a info@archive.org;
l’applicazione a riga di comando.
✍️ Abbiamo scritto al Ministero dell'Economia e delle Finanze a proposito dei dati sul PNRR
Giorno 8 giugno 2023 abbiamo scritto al Ministero dell'Economia e delle Finanze per segnalare alcune criticità di alcuni dati sul PNRR pubblicati sul catalogo dei dati aperti di Italiadomani, in modo che possano essere risolte.
Abbiamo chiesto di specificare nei metadati, quale sia la codifica dei caratteri, altrimenti si hanno dei problemi di leggibilità (vedi esempio immagine sottostante). Risolvibili, ma inutili (in ogni caso sembra essere Windows-1252
).
A proposito di metadati, abbiamo proposto di definirli anche nella modalità prevista dalle norme e linee guida nazionali sui dati aperti, ovvero applicare il profilo nazionale DCAT-AP_IT. Questa mancanza rende queste risorse più difficilmente trovabili, accessibili, interoperabili e riutilizzabili (se le cerchi ad esempio sul catalogo nazionale e su quello europeo dei dati aperti, non le trovi).
🥇 C’erano dei Codici Fiscali rappresentati in modo non uniforme. Nel dataset "Lista Regolamento (UE) 2023/435" ad esempio il "Codice fiscale P. IVA soggetto" della Regione Liguria era indicato come "00849050109", mentre nel dataset "Universo ReGiS - Progetti" era riportato come "849050109".
Questo è stato risolto con il nuovo aggiornamento.
Il dataset "Interoperabilità - Amministrazioni Titolari" riporta scorrettamente i valori del campo Id_Ente BDAP
. Al posto del codice identificativo ci sono delle stringhe in notazione scientifica. Ad esempio, per il "MINISTERO DELLA CULTURA" è presente il valore "4,99543E+17" e non il corretto identificativo che è “499542930481209501” (e non 499,5 trilioni).
🧮 La banca dati sulla raccolta PET (che ancora non espone i dati)
Il 31 maggio 2023 è stata presentata la banca dati e i risultati di gestione del triennio dell’accordo tra l’”Associazione Nazionale Comuni Italiani” (ANCI) e il “Consorzio volontario per riciclo del PET” (Coripet), sugli imballaggi in PET (il Polietilentereftalato, un tipo di plastica utilizzata per la produzione di bottiglie e altri contenitori per bevande e alimenti).
La collaborazione fra ANCI e CORIPET è stata avviata nel 2020, attraverso la sottoscrizione di uno specifico accordo finalizzato alla raccolta ed al riciclo del PET. È un accordo che prevede dei corrispettivi ai Comuni per la raccolta del PET.
Il numero di convenzioni stipulate è passato da 477 nel 2020, a 676 nel 2021, per arrivare ad un totale di 737 convenzioni nel 2022, per un totale di circa 58 milioni di cittadini coinvolti ed oltre 6500 comuni interessati. […] Il totale dei volumi di contenitori in PET gestiti per abitante si è attestato a 1,2 Kg/ab nel 2020 e 2,1 kg/ab nel 2021 (+75%).
Per farti un’idea di questi numeri: pensa a quante bottiglie di plastica da 2 litri di acqua minerale consumi alla settimana, e che ognuna pesa circa 50 grammi. Ecco, per la provincia di Palermo per il 2021 il volume per abitante per il 2021 si è attestato a 1,25 chilogrammi, pari a circa 25 bottiglie.
Non sappiamo perché questa banca dati sia relativa agli anni 2020 e 2021 e non ci sia già il “vecchio” 2022. In ogni caso al momento è soltanto una “fotografia” di una banca dati, una sua rappresentazione tramite una piccola dashboard. Non sono disponibili i dati al download, ma l’account twitter di ANCI ha scritto che nel futuro questa cosa potrebbe cambiare.
Nell’attesa li abbiamo estratti, aggiungendo le colonne di classificazione delle province da base Istat.
📰 Qual è l’impatto delle politiche pubbliche? Ci aiuta l’Inventario dei Problemi, delle Soluzioni e dell'Evidenza sugli Effetti
Una delle ragioni per cui spingiamo affinché i dati pubblici possano essere un bene comune, è perché danno un contributo alla misura dell’impatto delle politiche pubbliche.
Per valutare questo impatto alcuni anni fa è nato l’IPSEE, l’Inventario dei Problemi, delle Soluzioni e dell'Evidenza sugli Effetti:
Se le scienze naturali offrono informazioni basate sulla sperimentazione empirica, altrettanto non si può dire per le scienze umane. Capita di assistere a dibattiti guidati dal pregiudizio ideologico, piuttosto che da solida evidenza.
Per decidere con intelligenza dove allocare risorse pubbliche sempre più scarse occorre riconoscere quali sono le politiche efficaci e quali lo sono meno, o non lo sono affatto, e per farlo non esistono scorciatoie: o si ricorre ad una rigorosa valutazione degli effetti, oppure si agisce per intuito e per ideologia.
IPSEE offre una rassegna dei problemi che le politiche pubbliche dovrebbero affrontare, delle soluzioni adottate e dell'evidenza empirica prodotta sui loro effetti. Il tutto è basato sul paradigma controfattuale, che prevede di confrontare ciò che è accaduto nel mondo reale con ciò che sarebbe accaduto se una certa politica non fosse stata implementata. Per approfondire ti consigliamo di leggere l’interessante pagina “La valutazione d’impatto (o degli effetti) e il paradigma controfattuale”.
È una rassegna di pubblicazioni, in cui per ognuna c’è una pagina di sintesi e poi la possibilità di approfondire. Ad esempio, una delle ultime ricerche pubblicate ha per titolo “È possibile promuovere la partecipazione delle ragazze ai corsi di studio STEM?”.
I divari di genere passano anche attraverso le scelte di studio e di carriera dei più giovani e questo articolo racconta di un programma focalizzato prevalentemente sull’ambito tecnologico-informatico, che si è proposto di stimolare l’interesse degli studenti attraverso la formazione e l’incontro con figure di spicco del settore (anche e soprattutto femminili).
I risultati non sono quelli attesi: gli studenti percepiscono un miglioramento nelle loro competenze, ma la propensione a proseguire gli studi in ambito scientifico cresce solo tra i maschi.
E se chi legge vuole approfondire sono disponibili una scheda sintetica di poche pagine a cura di IPSEE e l’articolo completo.
Ogni articolo inoltre è classificato in termini di ambito di policy, di strumento di policy e di metodo di valutazione. Per l’articolo soprastante ad esempio l’ambito è “Istruzione”, gli strumenti “Formazione” e “Informazione” e il metodo è “Esperimenti”.
Per seguire gli aggiornamenti, c’è anche un comodo Feed RSS.
È interessante come nel parere “Una nuova agenda europea per l'innovazione”, del 2 marzo 2023, ci sia un blocco denominato “Migliorare gli strumenti di elaborazione delle politiche”, in cui il Comitato europeo delle regioni dell’Unione Europea concorda la
necessità di definire e utilizzare la terminologia chiave, gli opportuni indicatori, una tassonomia dei dati e serie di dati comparabili per sostenere un processo di elaborazione delle politiche basato su elementi concreti, che saranno pubblicati su portali di dati aperti istituzionali per favorirne l'accesso, l'utilizzo e la consultazione.
Sembra un po’ di sognare, ma fa comunque piacere leggerlo.
🧮 Dati sulla violenza della polizia in Francia
Il progetto violencespolicieres.fr ha lo scopo di creare un censimento unificato dei casi di violenza e pratiche irregolari commesse da agenti di polizia in Francia.
Il censimento mira a facilitare il lavoro giornalistico, nonché a offrire al pubblico una visione d'insieme chiara e documentata di questa problematica, attraverso la raccolta strutturata di numerosi lavori esistenti e segnalazioni fornite da vari partner.
In totale, tra novembre 2018 e giugno 2023 sono state registrate dal progetto 5.019 segnalazioni, tra cui 542 vittime gravi che hanno richiesto cure mediche.
Abbiamo scoperto questo progetto, grazie al bravissimo Nicolas Lambert, che ha creato una visualizzazione basata sui dati di violencespolicieres.fr.
Le API dell’”osservatorio siccità” dell’Istituto per la BioEconomia del CNR
L’IBE rende disponibili le API per accedere in modalità machine to machine (che abilitano accessi automatici ed efficienti) ai dati sulla siccità in Italia.
I dati sono scaricabili in diversi formati immagine (anche geotiff), e interrogabili per anno, mese e giorno e per una certa area geografica.
È possibile fare il download anche di statistiche spaziali di base in formato CSV
e JSON
.
C’è anche un catalogo Open Data e un WebGIS dedicato.
Strumenti/risorse
📺 Il webinar del 12 luglio “Introducing accessible data visualisation”;
📖 Nella nostra guida su VisiData, abbiamo aggiunto un paragrafo sul come aggiungere il separatore delle migliaia nei campi numerici, in modo che siano;
🧮 Istat ha aggiornato le matrici di contiguità, distanza e pendolarismo;
🎙️ Il podcast How to Save a Country, e l’episodio “How Feminist Economics Brought Us the Care Agenda”;
🪛 Observable Plot, una fantastica libreria Javascript per esplorare e visualizzare i dati. Documentazione molto ricca e tantissimi esempi;
🏫 Il corso di KoboToolBox, per imparare a costruire moduli, raccogliere dati spaziali, creare report, ecc.;
🧮 Ember, strumenti e dati per comprendere il settore energetico globale e il suo impatto sul clima;
📖 Nuove raccomandazioni sui concetti statistici, a cura di Eurostat;
📖 Condivisione efficace ed etica dei dati su larga scala. Una guida pratica per produttori di dati, responsabili politici e altri operatori dello sviluppo;
🧮 Pubblicato il Digital Maturity Index delle amministrazioni locali catalane;
🧮 La pagina del Dipartimento della Protezione Civile sull’attuazione Misure PNRR;
📖 Quantificare il costo umano del riscaldamento globale (grazie A Sud per la segnalazione);
📖 L'ecosistema Interoperabilità progettato per tutte le Pubbliche Amministrazioni, a cura del Dipartimento per la Trasformazione Digitale e AgID
📖 “Spatial Statistics for Data Science: Theory and Practice with R”;
📖 Una guida sull’Open Science, per ricercatori e ricercatrici all’inizio della loro carriera;
🧮 tutte online le oltre 5.500 immagini di 2.300 reperti del Museo Egizio resi disponibili grazie alla collaborazione tra Wikimedia Italia, Museo Egizio e Creative Commons Italia (grazie Ilaria Vitellio per la segnalazione);
📅 venerdì 7 luglio alle ore 11 la presentazione del rapporto Annuale Istat 2023.