elezioni-comunali-2016

Un web scraper per creare un set di dati dalle pagine del ministero degli interni per le elezioni comunali del 2016.

Lo scraper e' basato su scrapy (http://scrapy.org) un semplice framework python per estrarre dati dai siti web. Non ha pretesa di essere perfetto (anzi ha ancora qualche baco, e.g., non tutte le pagine sono strutturate uguali, e quindi ogni tanto fa casino sulle schede bianche e nulle, funzionalita' quindi al momento "commentata" nel codice), ma volevo solo avere qualche dato da poter usare di prima mano per fare conti, invece che ascoltare chi "manipola" i dati.

Putroppo, dato che Friuli e Sicilia non pubblicano i dati sul sito del ministero, non sono ancora inclusi (anche se probabilmente il lavoro per estendere lo scraper, non sarebbe cosi' complesso).

Dato che scrapy ha una struttura molto semplice per i dati, durante nell'estrazione non e' facile creare "relazioni", a questo proposito, ho semplificato molto lo script permettendo due modalita', con la prima modalita' (sindaco) si estraggono i dati per ogni comune relativi ai voti per i candidati sindaco (sarebbe da aggiungere un campo con la lista delle liste, per avere piu' chiaro lo schieramento), con la seconda modalita' (lista) si estraggono i voti per le singole liste.

installazione

installa python 2.7 (per ubuntu)

$ sudo apt-get install python-dev python-pip libxml2-dev libxslt1-dev zlib1g-dev libffi-dev libssl-dev

### installa scrapy

$ pip install scrapy

uso

$ git clone https://github.com/chicco785/elezioni-comunali-2016.git

$ cd elezioni-comunali-2016

$ scrapy crawl -o lista.csv -s MODE=lista comunali-2016

oppure

$ scrapy crawl -o sindaco.csv -s MODE=sindaco comunali-2016

dati estratti

trovate nella cartella dati i due file csv con i dati estratti per sindaci e liste

enjoy federico

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
dati		dati
elezioni_comunali_2016		elezioni_comunali_2016
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

elezioni-comunali-2016

installazione

installa python 2.7 (per ubuntu)

uso

dati estratti

About

Releases

Packages

Languages

License

chicco785/elezioni-comunali-2016

Folders and files

Latest commit

History

Repository files navigation

elezioni-comunali-2016

installazione

installa python 2.7 (per ubuntu)

uso

dati estratti

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages