Skip to content
This repository was archived by the owner on May 6, 2020. It is now read-only.
/ Crawler Public archive

Crawler de notícias relacionado ao COVID-19

License

Notifications You must be signed in to change notification settings

CovidZero/Crawler

Repository files navigation

Bem-vindo ao Crawler 📰🔍👋

License: Apache--2.0

> Crawler de notícias relacionado ao COVID-19

PROJETO ARQUIVADO E FORA DE UTILIZAÇÃO

Pré-requisitos

  • 1 - Ambiente Windows, Linux ou Mac
  • 2 - Python3

para baixar o projeto utilizando o git, rode o comando abaixo:

git clone -b crawler_sites https://github.com/CovidZero/Crawler.git

Instalando as bibliotecas necessarias

pip install -r requirements.txt

Usage

python app.py --salvar (Salvando no Git)
python app.py --salvars3 (Salvando no S3)

OBS

Para que os arquivos .csv sejam salvos no S3 você precisa:

  • Definir o nome do bucket na variavel BUCKET_NAME do arquivo config.py
  • Definir as variaveis de ambiente AWS_ACCESS_KEY_ID e AWS_SECRET_ACCESS_KEY com uma credential que tenha permissão de leitura e escrita de objetos no bucket

Docker Usage

Install Docker

Install Docker Compose

docker-compose build
docker-compose up -d

See os logs

docker logs -f [container-name]

Stop the Crawler

docker-compose down 

🤝 Contribuidores

👤 Vinicius Rodrigues

👤 Elder Santos

👤 Jaime Ricardo

👤 Thiago Fortunato


Como contribuir?

Contribuições e solicitações de recursos são bem-vindos!
Sinta-se à vontade para abrir uma issue.

📝 Licença

Copyright © 2020 CovidZero.
This project is Apache-2.0 licensed.

About

Crawler de notícias relacionado ao COVID-19

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published