Простой парсер статусов PEP для https://peps.python.org.
В папке results создает два csv файла:
- Список PEP вида Номер, Название, Статус - pep_ДатаВремя.csv.
- Количество уникальных статусов, так же подсчитывает общее количество PEP - status_summary_ДатаВремя.csv.
Клонировать репозиторий и перейти в него в командной строке:
git clone https://github.com/Esedess/scrapy_parser_pepcd scrapy_parser_pepCоздать и активировать виртуальное окружение:
python -m venv envsource env/bin/activateУстановить зависимости из файла requirements.txt:
python -m pip install --upgrade pippip install -r requirements.txtЗапустить с логом в терминал:
scrapy crawl pepЗапустить с логом в файл scrapy.log:
scrapy crawl pep -s LOG_FILE=scrapy.logPython: https://github.com/pythonScrapy: https://github.com/scrapy/scrapy- .css
- .xpath
- Pipelines
- Feeds
- Items