📣 Associazione onData - Newsletter #37
Dati per combattere la violenza di genere, monitorare i cataloghi, farsi sentire.
Ciao,
grazie per essere qui a leggere questa newsletter, per avere invitato altre/i a iscriversi, per darci spesso spunti per i contenuti che pubblichiamo.
E BUON 2026!!
🙏Se vuoi sostenerci, puoi farlo in questi modi.
👉 Se ci leggi da e-mail, fai click qui per leggerla per intero
📊 Liberiamoli tutti! Dati sulla violenza di genere
I dati aperti pubblici sulla violenza di genere sono incompleti, difficili da consultare, pubblicati in modo frammentario. Risultato: la violenza rimane nebulosa, difficile valutare se le politiche pubbliche funzionano.
Ecco perché con info.Nodes, Transparency International Italia, ActionAid e la rete D.i.Re – Donne in rete contro la violenza, Period Think Tank, abbiamo lanciato una campagna per chiedere trasparenza e accesso ai dati sulla violenza di genere, affinché le istituzioni rispettino il diritto di conoscere e agire con consapevolezza e costruire, insieme, una società più giusta e più sicura.
👉 Abbiamo ad oggi raccolto più di 24.000 firme (GRAZIE!) ed è possibile ancora firmare la petizione su change.org/dativiolenzadigenere. Se invece vuoi aderire con la tua organizzazione, firmando la lettera aperta che consegneremo al governo, puoi chiederlo per email a info@datibenecomune.it.
Il 17 dicembre ne abbiamo parlato in una live dal titolo Perché è così difficile avere i dati sulla violenza di genere?, con Donata Columbro e Andrea Borruso per onData, Simona Ammerata per D.i.Re, Giuditta Bellosi per Period Think Tank e Rossella Silvestre per ActionAid. Tra i punti emersi dalla discussione:
la mancanza di dati non è un dettaglio tecnico: incide su politiche, finanziamenti e servizi territoriali, e quindi sulla possibilità concreta di prevenire e sostenere chi subisce violenza;
esiste già una base normativa in Italia (legge 53/2022) che punta a migliorare raccolta e diffusione delle statistiche, ma nella discussione è stata descritta come non ancora pienamente attuata;
viene rivendicato il coinvolgimento di chi ha competenze sul campo nella costruzione e lettura dei dati, perché “i dati non sono neutrali” né quando mancano, né quando vengono interpretati;
oltre alle fonti istituzionali, si è ricordato il lavoro “dal basso”: i centri antiviolenza producono e raccolgono dati utili al monitoraggio, proprio per colmare pezzi mancanti.
Infine, in questo numero della “Liberiamoli tutti!” sono stati pubblicati due dataset sui femminicidi. Il primo proviene dalla richiesta FOIA che Period Think Tank ha presentato al Ministero dell’Interno, ottenendo dati sui reati di genere dal 2019-2024. Il secondo è il dataset della RAI sui femminicidi 2012-2018. Per quest’ultimo un grazie speciale a Sabino Metta (data collector), e grazie anche Donata Columbro (data curator), Andrea Borruso (data curator), Paola Masuzzo (data curator).
🧮 Tutti contano: contare chi non conta
Tutti contano è la campagna di reclutamento per una Rilevazione sulle Persone Senza Dimora — un progetto del Censimento ISTAT coordinato da fio.PSD (Federazione Italiana Organismi per le Persone Senza Dimora).
Quando e dove: 26, 28 e 29 gennaio 2026 in 14 città metropolitane (Bari, Bologna, Cagliari, Catania, Firenze, Genova, Messina, Milano, Napoli, Palermo, Reggio Calabria, Roma, Torino, Venezia).
Come funziona: il 26 gennaio ci sarà una conta diretta, il 28 e 29 gennaio interviste. Migliaia di persone volontarie organizzate in squadre da 2-3 persone, coordinate da 22 Coordinatori e Coordinatrici Metropolitani e 180 Responsabili della Rilevazione, con la collaborazione dei Comuni.
Se vuoi partecipare: candidature su www.tutticontano.fiopsd.org entro il 20 gennaio. Tutte e tutti i volontari riceveranno formazione (in presenza o online), copertura assicurativa e attestato.
Perché è importante? il principio è semplice: senza contare, non contano. Se non esisti nei dati, sei invisibile alle politiche pubbliche. Questa rilevazione raccoglie informazioni cruciali per programmazione di politiche pubbliche più efficaci e mirate.
Alcune persone di onData parteciperanno alle attività a Roma, Palermo e Torino.
Grazie al nostro Marco Cortella per avercelo segnalato.
🔄 Normattiva2md: le norme italiane in Markdown
Avevamo bisogno di analizzare la legge legge 53/2022 citata sopra, in “materia di statistiche in tema di violenza di genere”: avere una mano a comprendere quelle parti scritte in linguaggio giuridico più complesso, avere un quadro delle leggi correlate, comprendere quali dati è previsto che vengano raccolti, da quale enti e con quali modalità. Ci serviva per progettare e sostenere meglio la campagna sulla pubblicazione dei dati sulla violenza di genere.
Questa norma e quelle correlate sono disponibili su Normattiva, il sito che centralizza e pubblica le norme italiane. Lo fa in diversi formati, tra cui l’XML (Akoma Ntoso), ottimo per archivi governativi e sistemi informatici che dialogano tra loro, ma meno adatto per usi legati all’intelligenza artificiale (AI) da parte un’utenza non esperta di sviluppo software.
Allora abbiamo creato normattiva2md, uno strumento che trasforma l’XML di normattiva in formato Markdown, un formato di testo semplice e strutturato, leggibile sia da umani che da macchine, che sta diventando quasi il de facto standard per l’AI. Facile da leggere per una persona, facile da processare per un algoritmo.
È uno strumento open source, potenzialmente utilizzabile da chiunque, che funziona o a riga di comando o come libreria Python.
Tre modalità di esempio per usarlo:
Da URL:
normattiva2md "https://www.normattiva.it/..." output.md— copia-incolla il link dalla pagina normattivaDa file XML locale:
normattiva2md input.xml output.md— se hai già il file XML scaricato da normattivaDa ricerca in linguaggio naturale:
normattiva2md -s "legge stanca accessibilità" output.md— digita cosa cerchi, e l’API di Exa (da configurare) trova la norma per te.
Che cosa ottieni? Un file Markdown che mantiene la struttura originale, esporta i metadati YAML, ed è subito usabile da umani, personal computer e AI.
Vuoi provarlo? Qui le informazioni utili https://ondata.github.io/normattiva_2_md/

⚖️ I dati di Normattiva sono diventati dati aperti
In queste settimane in cui abbiamo lavorato a normattiva2md, abbiamo scoperto una novità importante: a decorrere dal 1° gennaio 2026, i dati di Normattiva sono finalmente dati aperti. È possibile scaricarli e utilizzarli con licenza Creative Commons CC BY 4.0.
Non troviamo il link alla pagina “dati” nei menu del sito, ma l’URL si trova utilizzando i motori di ricerca: https://dati.normattiva.it/home.
La pubblicazione dei dati e le modalità di accesso sono pensate per consentire il riuso della normativa vigente e la costruzione di servizi a valore aggiunto, a supporto della ricerca, della diffusione dell’informazione e dello sviluppo di applicazioni e servizi.
È accessibile anche in modalità machine-to-machine tramite API RESTful.
🔓 Come fare richieste di dati aperti alla pubblica amministrazione
Questo è un tema che ci sta molto a cuore. Non è nuovo, ma in una discussione fatta in una riunione del tavolo di lavoro dell’“Obiettivo C” del 6° Piano d’Azione Nazionale per il governo aperto è emerso che probabilmente nessuno ha mai richiesto dati aperti, secondo le modalità introdotte con le ultime Linee guida Open Data dell’Agenzia per l’Italia Digitale (AgID).
Abbiamo quindi pensato di aggiungere una nuova pagina dedicata alla versione HTML delle suddette linee. Versione creata da noi a partire dal PDF di AgID.
Nel paragrafo 5.2 delle linee guida infatti si riporta:
L’apertura dei dati può essere un’operazione conseguente anche ad una esplicita richiesta da parte di un soggetto interessato.
La pubblica amministrazione deve rispondere entro 30 giorni. Se la richiesta è particolarmente complessa o se ne ricevono molte contemporaneamente, il termine può essere prorogato di altri 20 giorni, ma solo con comunicazione motivata. Se la richiesta viene respinta, l’amministrazione deve spiegare il motivo del diniego.
Non si tratta quindi di una richiesta di accesso civico generalizzato (FOIA), né di una richiesta di accesso documentale, né di una richiesta di accesso civico semplice, legata agli obblighi di pubblicazione previsti dalle norme sulla trasparenza.
È una richiesta di pubblicazione di dati aperti, i cui eventuali buoni esiti diventano un bene comune: i dati infatti verranno pubblicati e resi disponibili a chiunque, a differenza delle richieste di accesso, dove i dati sono restituiti solitamente soltanto a chi li ha richiesti.
La richiesta fatta per i dati sulle firme per referendum e iniziative popolari
Il Ministero della Giustizia gestisce il portale per la raccolta delle firme per referendum e iniziative popolari - firmereferendum.giustizia.it - tramite il quale le persone possono firmare online per sostenere referendum o iniziative popolari, e un comitato promotore può promuovere la propria iniziativa.
Non ha una sezione dedicata ai dati raccolti. I numeri delle firme sono disponibili soltanto come grafici, immagini e tabelle HTML. È una grave lacuna, perché sarebbe molto utile poter seguire e monitorare l’andamento delle firme raccolte nel tempo, per iniziativa, per area geografica, per fascia di età e sesso.
Non è possibile ad esempio generare un grafico come questo sulla attuale raccolta firme sul Referendum costituzionale confermativo sulla riforma della magistratura (art. 138 Cost.).

E la mancanza di dati è inoltre in contrasto con il quadro normativo su trasparenza digitale e riutilizzo dei dati pubblici.
Sfogliando il sito è possibile visualizzare diverse informazioni di interesse. Oltre al numero di firme, anche il numero di voti per aggregati territoriali, fasce di età e sesso.
Abbiamo fatto allora una richiesta di pubblicazione dati, nelle modalità previste dalle linee guida AgID descritte poco sopra. Al momento nessuna risposta, ma vi terremo aggiornati.
⚠️ Su alcuni dati e cataloghi di dati
Poco dopo l’estate abbiamo fatto verifiche su alcuni cataloghi di dati aperti di pubbliche amministrazioni italiane, partendo dal catalogo nazionale dati.gov.it, che indicizza i cataloghi di dati aperti delle PA italiane.
E sono emerse criticità su alcuni dei cataloghi più importanti. Ad esempio:
OpenCoesione, il portale dei dati su programmazione e attuazione delle politiche di coesione comunitarie e nazionali;
INPS, il portale dei dati dell’Istituto Nazionale della Previdenza Sociale.
Molti dati erano in catalogo, ma non erano realmente accessibili. Abbiamo fatto allora una segnalazione ad AgID con il modulo “Scrivi alla redazione”, che ci ha risposto e si è attivata per chiedere alle amministrazioni di correggere i problemi. I problemi si sono risolti in tempi rapidi (grazie a chi ci ha lavorato).
Abbiamo segnalato anche un altro catalogo molto importante, quello del Ministero della Salute. AgID anche stavolta ci ha risposto e si è attivata, ma dopo mesi il Ministero ancora non ha corretto la cosa. E al 3 gennaio 2026 per questi 45 dataset i file CSV non sono scaricabili dal portale dati.gov.it e danno “Pagina non trovata”.
E qualcosa di simile è successo con i circa 700 dataset del Comune di Pisa, resi disponibili sul portale nazionale tramite il portale dati della Regione Toscana. Anche qui AgID prima e poi Regione Toscana ci hanno dato un riscontro rapido e cortese, ma il Comune di Pisa non ha ancora risolto il problema. E se si apre ad esempio il dataset “Biblio SMS, eventi (2014)” e si scorre la pagina per scaricare il file CSV, si ottiene “Dataset csv export error: dataset non found or insufficient permissions”. Qui l’elenco completo di quelli problematici.
Nell’Open Data Maturity Report 2025 l’Italia è tra i paesi con l’indice di maturità dei dati aperti più alto in Europa. Su questo facciamo i complimenti ad AgID e a tutte le amministrazioni che lavorano per migliorare la pubblicazione di dati aperti in Italia.
Sarebbe necessario che AgID - confrontandosi con PA, aziende, utenti, ecc. - attivasse azioni e procedure che stimolino le amministrazioni a risolvere problemi come questi e a mantenere i dati aperti accessibili e usabili nel tempo. Ad esempio: se un dataset non è scaricabile per più di X giorni consecutivi, dovrebbe essere rimosso dal catalogo nazionale o etichettato pubblicamente come non usabile.
Strumenti/risorse
🔧 opendatalab/MinerU — Trasforma PDF e documenti complessi in markdown e JSON pronti per LLM e agenti AI
🔧 Miller Release 6.16.0 — Tool per manipolazione CSV e JSON: grep, sort, aggregazioni direttamente da CLI
📖 AI Sheets — Interroga e analizza dataset con linguaggio naturale grazie agli LLM integrati
🎙️ AI for data engineers with Simon Willison — Podcast: come gli LLM cambiano i workflow dei data engineer
📺 Potenzia il tuo lavoro con gli LLM — Video di Hadley Wickham su come usare modelli linguistici per automatizzare coding e analisi dati
📖 Catalogo Nazionale Dati - Tre talk Istat — Approfondimento su schema.gov.it e sul catalogo dati della PA italiana
🎙️ Unlock the power of open data and teach open research — Podcast della Sheffield Hallam University: come i dati aperti abilitano la ricerca e la didattica
📖 A friendly guide to choosing a chart type — Guida pratica di Datawrapper: quale visualizzazione scegliere in base ai tuoi dati
📖 Fourth Wave of Open Data Seminar — Come rendere i dati aperti pronti per l’intelligenza artificiale
🪛 CatastoIT_GML_Merger_Pro — Plugin QGIS per elaborare dati catastali in formato GML







Ciao! Sapete se la richiesta di pubblicazione di dati aperti si applica anche alle imprese pubbliche (società di diritto privato con controllo pubblico, come le aziende di trasporti)? Il decreto legislativo linkato le nomina nel campo di applicazione all'art. 1, ma non esplicitamente nell'art. 5. Grazie!
EDIT: direi di sì, ci provo!
Molto interessante la novità su Normattiva!