新型冠状病毒防疫防控物资信息自动收集器

针对2019年末发现的新型冠状病毒疫情，本项目旨在通过爬虫收集全国最新的各机构所需的物资信息。点击查看最新物资需求表。

项目内容

1、自动抓取和更新(暂时手动更新，每天保证至少更新一次)

2、自动解析公告信息以减少人工工作，主要包括：

所需物资：常见的物资已支持（详见物资需求表示例）
发布时间（日期）
信息来源：目前只收集政府网站发布的公告以保证信息可靠性
需求方信息：机构、地址、联系信息等（主要功能已开发，待完善）
紧急程度：暂不支持

3、数据编辑、审核、导出（项目介绍中的链接即最新的清单文件，点击下载）

4、提供查询功能，如按地区、发布时间、物资需求筛选

5、数据可视化

操作指引

本项目使用Python3开发，请先安装Python3后安装依赖库

pip install -r requirement.txt

爬取最新的公告并更新数据库，同时生成清单(csv格式)

python main.py

此命令相当于分步执行以下三条命令

1、搜索最新公告

scrapy runspider crawler.py
# 此脚本将查询最新（近一天，关键字为：'接受 捐赠 公告'）发布的公告，
# 并保存到数据库

2、下载公告内容

python downloader.py
# 此脚本用于下载（数据库中未下载的）公告

3、提取需求内容，并生成物资需求清单

python parse.py
# 此脚本会将所有公告内容进行解析，并生成清单保存到data/demands.csv中

注意：执行此命令会覆盖原清单文件！

开发指引

开发语言：Python3
相关依赖：Scrapy、BeautifulSoup、requests
数据库：SQLite3，并且数据文件提交到代码库，以减少重复工作

相关表结构，请查看

Name	Name	Last commit message	Last commit date
Latest commit Anthony1874 update notices Feb 1, 2020 9a60a15 · Feb 1, 2020 History 45 Commits
data	data	update notices	Feb 1, 2020
extractors	extractors	remove duplicates	Jan 31, 2020
utils	utils	add site name & add more notices	Jan 31, 2020
.gitignore	.gitignore	add table header:receiver	Jan 29, 2020
README.md	README.md	update README	Jan 30, 2020
bing.py	bing.py	add notices from other sites	Jan 31, 2020
crawler.py	crawler.py	update notices	Feb 1, 2020
database.py	database.py	update readme & add db file	Jan 29, 2020
downloader.py	downloader.py	add notices from other sites	Jan 31, 2020
item.py	item.py	update readme & add db file	Jan 29, 2020
main.py	main.py	update README	Jan 30, 2020
notice.db	notice.db	update notices	Feb 1, 2020
parse.py	parse.py	district	Feb 1, 2020
requirement.txt	requirement.txt	update readme & add db file	Jan 29, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

新型冠状病毒防疫防控物资信息自动收集器

项目内容

1、自动抓取和更新(暂时手动更新，每天保证至少更新一次)

2、自动解析公告信息以减少人工工作，主要包括：

3、数据编辑、审核、导出（项目介绍中的链接即最新的清单文件，点击下载）

4、提供查询功能，如按地区、发布时间、物资需求筛选

5、数据可视化

操作指引

本项目使用Python3开发，请先安装Python3后安装依赖库

爬取最新的公告并更新数据库，同时生成清单(csv格式)

1、搜索最新公告

2、下载公告内容

3、提取需求内容，并生成物资需求清单

开发指引

欢迎fork和提issue，如能提供技术帮助，请联系我

About

Releases

Packages

Languages

PyBeaner/nCoV-supplies

Folders and files

Latest commit

History

Repository files navigation

新型冠状病毒防疫防控物资信息自动收集器

项目内容

1、自动抓取和更新(暂时手动更新，每天保证至少更新一次)

2、自动解析公告信息以减少人工工作，主要包括：

3、数据编辑、审核、导出（项目介绍中的链接即最新的清单文件，点击下载）

4、提供查询功能，如按地区、发布时间、物资需求筛选

5、数据可视化

操作指引

本项目使用Python3开发，请先安装Python3后安装依赖库

爬取最新的公告并更新数据库，同时生成清单(csv格式)

1、搜索最新公告

2、下载公告内容

3、提取需求内容，并生成物资需求清单

开发指引

欢迎fork和提issue，如能提供技术帮助，请联系我

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages