📣 Associazione onData - Newsletter #38
25.000 firme al Governo per chiedere i dati sui femminicidi, l'archivio personale di una malattia, e uno strumento AI per esplorare i portali open data.
Ciao, grazie per essere qui a leggere questa newsletter, per avere invitato altre/i a iscriversi, per darci spesso spunti per i contenuti che pubblichiamo.
🙏Se vuoi sostenerci, puoi farlo in questi modi.
Immagine di Giulio Di Meo - licenza CC BY-SA 4.0
👉 Se ci leggi da e-mail, fai click qui per leggerla per intero
🟣 #datiBeneComune: 25.000 firme e un dialogo aperto con il governo sui dati dei femminicidi
Il 12 febbraio abbiamo consegnato alla Presidenza del Consiglio le oltre 25.000 firme della petizione #datiBeneComune che chiede dati aperti, aggiornati e disaggregati sulla violenza di genere e sui femminicidi. Alla campagna hanno aderito 39 organizzazioni — tra cui Action Aid Italia, Transparency International Italia, Info.Nodes, Period Think Tank e D.i.Re – Donne in Rete contro la violenza.
Ci ha ricevuto una delegazione del Dipartimento per le Pari Opportunità insieme al Servizio Analisi Criminale del Ministero dell’Interno e al Ministero della Giustizia. Abbiamo presentato una proposta tecnica (sotto i dettagli) che, partendo dalla legge 53/2022, indica cosa si potrebbe pubblicare subito.
Cosa abbiamo chiesto? Quello che sembra ovvio ma non lo è ancora: sapere ad esempio come sono distribuiti territorialmente i femminicidi, avere serie storiche, incrociare i dati con le relazioni vittima-autore. Dati che le amministrazioni già hanno, ma non rendono pubblici in forma fruibile e comparabile.
Dall’altra parte, abbiamo raccolto disponibilità. Il Servizio Analisi Criminale ha confermato che aggiungeranno alle pubblicazioni oggi esistenti dati aggregati per nazionalità, fasce d’età e distribuzione geografica. In questa occasione si è anche voluto sottolineare che la legge 53 è stata applicata solo dal 1° gennaio 2024, quando è stato introdotto nel sistema informatico il campo “relazione vittima-autore”.
Period Think Tank ha portato all’attenzione i problemi concreti dei dati richiesti e ricevuti via FOIA: righe duplicate, metadati assenti, e la gran parte delle informazioni riferite solo al 2024 — nonostante la richiesta coprisse il periodo 2019-2024. Questi dati sono disponibili in questo numero della newsletter “Liberiamoli tutti!”.
Il quadro istituzionale punta al recepimento della direttiva europea (entro giugno 2027) come occasione principale per sistematizzare tutto. Nel frattempo, l’Osservatorio sulla violenza contro le donne resta la una sede formale di confronto e un’opportunità che presidieremo.
La porta a questo punto è aperta e continueremo a bussare. Perché con questa consegna della nostra richiesta, abbiamo fissato e anche formalizzato l’inizio. Con tutte le organizzazioni aderenti e con il sostegno delle persone che hanno firmato, continueremo a monitorare e a chiedere la pubblicazione di questi dati.
🙏 Per l’associazione onData è motivo di orgoglio essere arrivata sino a qui. Ed è un piacere mettere in fila un po’ di grazie:
a Action AID, info.nodes, Transparency International Italia, con cui da tante settimane ci riuniamo per immaginare, costruire e portare avanti la campagna;
a change.org, che ha ospitato la petizione e ci ha supportato nella raccolta firme;
a Patrizia Caruso, Daniela Casula, Davide Del Monte, Andrea Nelson Mauro e Alberto Pampalone Morisani
alla nostra Donata Columbro - per chiudere in bellezza - che ha usato tanti dei suoi super poteri per fare “volare” questa iniziativa.
Video realizzato da Angela Nittoli
🦆 L’archivio del mio cancro
Paola Chiara Masuzzo, la vicepresidente di onData, ha costruito qualcosa che vale la pena leggere e guardare. Non solo per la storia che contiene, ma soprattutto per l’idea che ci sta dietro, e per come la realizza.
Si chiama L’archivio del mio cancro ed è esattamente quello che dice: un archivio personale costruito attorno ai dati della propria malattia. Quattro progetti, ciascuno con un disegno preciso.
Cosa c’è nel mio sangue: durante la chemioterapia, Paola scaricava i referti in PDF (sì, il formato di cui “sparliamo” spesso) ed estraeva i valori di emoglobina e neutrofili, salvandoli in un CSV. Ha poi imparato a leggere il proprio corpo attraverso quei numeri.
Quanto è grande il mio tumore: ha preso le dimensioni del tumore dai referti e si è chiesta — se lo tenessi in mano, quanto grande sarebbe? Ha cercato oggetti di tutti i giorni di quelle stesse dimensioni. Un mattoncino LEGO, un chicco di mais, una gomma per matita, una caramella, un chicco di caffè, una biglia, un dado da gioco. Un ponte tra dato medico e realtà percepibile.
Il collage delle mie pillole chemioterapiche: 224 fotografie, due al giorno per ogni giorno di chemioterapia. Un collage che è anche un calendario, con ricordi agganciati ad alcune foto. I metadati dei file (orario esatto dello scatto) sono stati usati per ricostruire la distanza tra le dosi mattutine e serali. Dodici ore, sempre rispettate.
La cronistoria del mio cancro: una timeline che va dalla prima ecografia alla prima chemioterapia. I dati vengono dalla cartella clinica — e qui emerge il tema più interessante: le immagini mediche sono in formato DICOM, uno standard aperto ma di fatto inaccessibile senza strumenti specialistici. Paola le ha convertite, liberate, e messe nel suo archivio. Perché quei dati sono suoi.
Quello che colpisce non è solo la cura messa nel fare tutto questo, ma l’energia con cui Paola trasforma un’esperienza difficile in un atto di riappropriazione e di senso. Nel mondo dei dati spesso mancano freschezza, diversità di sguardi e voglia di sperimentare, e questo archivio è un esempio raro e prezioso di cosa si può fare quando le idee hanno spazio per respirare.
👉 La newsletter di Paola si chiama Fate ə monellə — iscriviti.

🤖 Cercare dati aperti con l’AI: il nostro CKAN MCP server
Hai mai aperto un portale open data come dati.gov.it e passato minuti a capire come cercare, quale filtro usare, come si chiama la Pubblica Amministrazione giusta, se i dati che cercavi erano lì o altrove?
Abbiamo allora costruito ckan-mcp-server, che trasforma qualunque portale dati basato su CKAN in un’interfaccia conversazionale.
Descrivi in linguaggio naturale cosa stai cercando, e l’AI interroga il portale, restituisce informazioni sui dati, link di download, in che formato sono disponibili, e tanto altro. Puoi anche fare query SQL sui dati tabellari direttamente dalla chat — senza aprire un browser, senza conoscere le API (nei portali che lo supportano, come quello del Comune di Messina).
Ad esempio potresti chiedere:
“Cerca su dati.gov.it i dataset sulla qualità dell’aria a Milano, poi riassumi cosa contiene ciascuno — copertura temporale, licenza e formato migliore per il download.”
In output un riepilogo strutturato dei dati del Comune di Milano/AMAT, con informazioni sui parametri ambientali, copertura temporale, aggiornamento, ecc..
CKAN è la piattaforma open source usata da decine di portali in tutto il mondo: ad esempio dati.gov.it (Italia), data.gov (Stati Uniti), open.canada.ca (Canada), data.gov.uk (Regno Unito), data.gov.au (Australia). Il server funziona con qualunque strumento AI che supporti MCP — Claude, ChatGPT, Gemini e molti altri. Per i portali italiani, supporta anche le metriche MQA — la misura di qualità europea dei metadati dei dati aperti.
👉 Per installare questo strumento, puoi seguire una di queste modalità.
Può essere utile a giornaliste e giornalisti che cercano fonti, ricercatrici e ricercatori che esplorano dataset, funzionarie e funzionari pubblici che vogliono capire cosa pubblicano altre amministrazioni, attiviste e attivisti civici che monitorano la trasparenza. Abbassa la barriera di accesso per chi non ha competenze tecniche, ma è anche un acceleratore per usi machine-to-machine — e un punto di ingresso immediato per dirigenti e responsabili della PA che vogliono esplorare i portali open data senza dipendere da uno specialista.
Non è necessario installare nuovi tool, perché c’è un servizio pronto all’uso (100.000 richieste al giorno condivise tra chi lo usa). Se diventerà una modalità di esplorazione che userai frequentemente, ti consigliamo l’installazione locale. Il codice è open source.
Nel video (con audio) sottostante qualche esempio d’uso.
📐 Come dovrebbero essere pubblicati i dati sui femminicidi: la nostra proposta
Il 12 febbraio, come detto all’inizio, non abbiamo consegnato solo le firme. Insieme alla lettera aperta abbiamo portato una proposta tecnica concreta: uno schema dati che descrive come potrebbero essere strutturati e pubblicati i dati sui femminicidi e sulla violenza di genere.
Il punto di partenza per lo sviluppo del lavoro è stato questo: la Legge 53 del 5 maggio 2022 (“Disposizioni in materia di statistiche in tema di violenza di genere”) prevede già che questi dati vengano raccolti. Lo chiede alle forze dell’ordine, al sistema sanitario, ai centri antiviolenza. I dati esistono, ma quello che manca è la loro pubblicazione in forma aperta, leggibile, utilizzabile e continua.
E la pubblicazione non è solo auspicabile: il Codice dell’Amministrazione Digitale (D.Lgs. 82/2005) e il D.Lgs. 36/2006 prevedono che le pubbliche amministrazioni rendano disponibili i propri dati in formato aperto, con le necessarie misure di anonimizzazione.
Quattro dataset, quattro pilastri normativi. La L. 53/2022 articola la raccolta in diversi sistemi: i dati dei pronto soccorso (Art. 4), i dati penali del Ministero dell’Interno e della Giustizia (Art. 5) e i dati dai centri antiviolenza (Art. 7). Per ciascuno abbiamo proposto uno schema concreto: nomi dei campi, tipi di dato, valori controllati.
Il nodo tecnico: gli identificativi anonimi. Una delle sfide più delicate è che nella realtà un singolo episodio di violenza può coinvolgere più autori, più vittime o più reati. Se non si gestisce bene questa complessità, i numeri diventano inaffidabili. La nostra proposta introduce identificativi anonimi che permettono di contare correttamente senza esporre dati personali.
Il contesto normativo si è arricchito. Abbiamo integrato nello schema anche elementi della Legge 181 del 2 dicembre 2025, che introduce il nuovo reato di femminicidio e prevede una relazione annuale al Parlamento con dati disaggregati per sesso della vittima.
E l’Europa? La Direttiva UE 2024/1385 sulla violenza contro le donne impone agli Stati membri di raccogliere e pubblicare statistiche annuali entro il 14 giugno 2027. L’Italia con la legge 53/2022 ha già anticipato questo obbligo — e in alcuni aspetti lo supera (27 reati specifici, 15 modalità di relazione autore-vittima). Pubblicare ora i dati significherebbe dare piena attuazione a una norma vigente, anticipare virtuosamente il 2027 e dimostrare che si può fare.
📄 Leggi la proposta tecnica completa
🤔 Nota tecnica: per costruire la proposta è stato molto comodo usare normattiva2md, lo strumento che abbiamo costruito per scaricare le leggi italiane da normattiva e trasformarle in un formato “pronto” per l’analisi con il supporto dell’AI.
🔍 avalpdf: validare l’accessibilità dei PDF da riga di comando
Quante volte hai ricevuto un PDF inaccessibile — senza testo alternativo sulle immagini, senza una struttura leggibile da uno screen reader — e non avevi strumenti semplici per capire dove stesse il problema?
Dennis Angemi, nostro socio, ha costruito avalpdf: uno strumento da riga di comando per validare l’accessibilità dei PDF. Analizza la struttura del documento, verifica i tag, controlla la gerarchia delle intestazioni, l’alt text delle immagini, la struttura di tabelle e liste, la validità dei link e altro. Alla fine produce un report con errori, avvisi e successi, e assegna un punteggio di accessibilità.
È uno strumento pratico e open source (licenza MIT), che risolve un problema reale: sapere se un PDF rispetta gli standard di accessibilità. Per chi lavora con dati pubblici, atti amministrativi o documentazione tecnica, è esattamente il tipo di strumento che fa risparmiare tempo e aumenta la qualità del lavoro.
📸 Zappa News: una redazione che educa a guardare il mondo
La copertina di questo numero viene da un progetto che vale la pena conoscere.
Zappa News nasce nell’anno scolastico 2017/2018 dall’idea di Giulio Di Meo, fotografo e fotogiornalista con oltre vent’anni di lavoro nel reportage sociale. L’obiettivo: avvicinare ragazze e ragazzi al racconto della realtà attraverso gli strumenti del giornalismo e della fotografia. Non come esercizio scolastico, ma come pratica reale — una redazione attiva dove si impara a osservare, a fare domande, a verificare le fonti, a costruire notizie mettendo insieme parole e immagini.
Il progetto coltiva spirito critico e consapevolezza civica. Le studentesse e gli studenti fanno inchieste sul territorio, intervistano rappresentanti istituzionali, affrontano temi come crisi climatica, legalità e diritti umani. La redazione diventa uno spazio di cittadinanza attiva, dove le opinioni hanno valore nel presente — non in un futuro astratto.
L’immagine che apre questo numero viene dal numero 16 di gennaio 2026 (Anno 10), dedicato alle donne, nato da una domanda provocatoria: “E se fossero le donne a governare il mondo?”. Da lì prende forma un percorso tra storie di resistenza e impegno civile — dall’Iran all’Ucraina, dalla Palestina al Brasile — accanto a figure femminili significative per la comunità scolastica e il territorio bolognese.
Quando Lorenzo Perone ci ha fatto scoprire questo numero di Zappa News (grazie), ci è sembrata un’occasione imperdibile usare una delle sue immagini per la copertina di questo numero della nostra newsletter. Era un modo per firmare in modo bello questo numero.
Ancora un grazie a Giulio e a Lorenzo.
Strumenti/risorse
🗺️ MapFight: confronta visivamente la dimensione reale di paesi, regioni e città. Corregge le distorsioni della proiezione di Mercatore — quella che fa sembrare la Groenlandia grande quanto l’Africa
🪛 QMD – Quick Markdown Search: motore di ricerca locale per appunti e documenti Markdown. Gira interamente in locale, senza inviare dati a servizi esterni
🪛 Estensione Eurostat per DuckDB: interroga direttamente i dataset di Eurostat con SQL. Migliaia di dataset statistici europei a portata di query
🪛 Nuove prospettive per SpatiaLite: si prevede un aggiornamento a SpatiaLite 6.0 in primavera e una versione completa 6.1 in autunno (grazie Salvatore Fiandaca per la segnalazione)
🎓 Hello Data Science: libro open access che introduce R, RStudio e Quarto per chi vuole avvicinarsi all’analisi dati con strumenti open source
📊 Data to Art: galleria online di opere artistiche nate dai dati. Esplora il confine tra scienza e astrazione, con mostre fisiche e digitali in tutto il mondo
📺 Visualising Climate 2026: prima conferenza globale sulla visualizzazione dei dati climatici e ambientali. Si terrà a Bologna il 4-6 novembre 2026. La call for submissions è aperta fino al 30 aprile





