Mirror of ProPublica's Congress Expenditures data

This is a single page with links to a bunch of large CSV files. This is a nice example of a web-scrape-to-data-crunching workflow, in either Python or plain old Bash+grep.

Last updated: 2020-09-08

Mirror page:

https://wgetsnaps.github.io/propublica-congress-expenditures/

Original page:

https://projects.propublica.org/represent/expenditures

Script

See wgetsnap.sh to see the code.

https://projects.propublica.org/congress/assets/staffers/2020Q1-house-disburse-detail.csv https://projects.propublica.org/congress/assets/staffers/2016Q4-house-disburse-detail.csv

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
congress/assets/staffers		congress/assets/staffers
js/public/assets		js/public/assets
rails/assets/congress		rails/assets/congress
.gitignore		.gitignore
README.md		README.md
favicon.ico		favicon.ico
index.html		index.html
robots.txt		robots.txt
wget.log		wget.log
wgetsnap.sh		wgetsnap.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Mirror of ProPublica's Congress Expenditures data

Script

About

Languages

wgetsnaps/propublica-congress-expenditures

Folders and files

Latest commit

History

Repository files navigation

Mirror of ProPublica's Congress Expenditures data

Script

About

Topics

Resources

Stars

Watchers

Forks

Languages