Alcune ore di lavoro per convertire in forma utile decine di pagine di numeri astrusi. Grazie mille a Franco Morelli (Open Data Bassa Romagna) per tutte le spiegazioni e ad Alessandra Farabegoli che ha portato lo speech di Franco al RomagnaCamp.
Note:
- chiedo a chi è esperto di verificare che i dati siano ok (ad esempio, dal pdf ho preso la colonna 7 – somme risultanti. E’ quella giusta?)
- queste sono le spese, chi si vuole cimentare con le entrate come esercizio?
- p.s.: c’è movimento su Facebook
Di seguito raccolgo in grande sintesi, sotto forma di appunti, i vari passaggi per ottenere i grafici sul Bilancio Comunale.
- Lettura e iscrizione al gruppo Google “Spaghetti Open Data” https://groups.google.com/forum/#!forum/spaghettiopendata
- Lettura delle agili slides di Franco Morelli (http://opendatabassaromagna.blogspot.it/) presentate al Romagnacamp (http://www.romagnacamp.org/gli-speech-del-sabato-mattina/)
- Consultazione del sito web del Comune di Imola: home » vivere » amministrazione trasparente » Bilanci
- Scaricato il BILANCIO DI PREVISIONE per l’esercizio finanziario 2013
- Un’occhiata alle proprietà del file, dove si scopre che deriva da un .doc e l’autore è presumibilmente A. Landini, ultima modifica 6 marzo 2013:
- Si utilizzano nell’ordine i software o servizi suggeriti da Franco Morelli nella sua slide n.12: Zamzar e Tabula.
Se i risultati sono scarsi, si può provare Pdftotext:
pdftotext.exe -layout -enc ASCII7 -nopgbrk "BilancioAnnuale2013(1).pdf"
- Apro il file risultante in OpenOffice, avendo cura di aprirlo come foglio di calcolo in formato Testo CSV. Nella finestra di importazione regolare la separazione delle colonne stando attenti a non ‘tagliare’ dei valori a metà.
- Una volta importato il file, selezionare le colonne con i valori (nel mio caso dalla D alla H) e fare “Cerca e sostituisci”, solo nella selezione, di tutti i punti (“.”) con una stringa vuota, in modo che Openoffice riconosce i numeri come numeri e non come testo. Inoltre sostituire nelle stesse colonne anche tutti gli spazi. Questo dovrebbe rendere tutti i numeri riconoscibili e sommabili da OpenOffice
- Il file OpenOffice contiene diversi trucchetti, tra cui formule SE annidate e filtri tabella con utilizzo di espressioni regolari. Servono inoltre alcuni passaggi manuali di copia e incolla come valori. Il tutto condito con abbondanti verifiche incrociate. Ecco il file .ods annotato: [Download non trovato]
[ripulisco e verifico il file poi lo posterò qui, se lo volete in anteprima mandatemi un email] - Per passare dal formato .ods al software Tableau Public (da installare qui: http://www.tableausoftware.com/public/download) basta copiare le celle finali in un nuovo file e salvarlo come .xls (Excel)
Tableau Public lo importerà senza problemi. - I dati su Tabelau Public sono, appunto, pubblici. Quindi per creare la visualizzazione per il comune di Imola ho scaricato il documento di Franco Morelli su Bagnacavallo da qui: http://public.tableausoftware.com/views/Bilancio2013Bagnacavallo-Uscite/PerServizio e poi ho ‘imitato’ il lavoro di Franco.
Send to Kindle
Condividi questa pagina: Twitter | StumbleUpon | Facebook | Delicious | digg | LinkedIn