Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Adiciona spider para Sergipe (SE) (#23) #168

Closed
wants to merge 3 commits into from

Conversation

vitorbaptista
Copy link

Sergipe agora tem os dados em uma tabela no site https://todoscontraocorona.net.br/. Esse scraper raspa essa tabela do HTML.

Não sei se esse é a melhor forma de rodar o scraper, mas consegui rodar localmente com python web/run_spider.py SE.

@endersonmaia
Copy link
Collaborator

#23 linkando à issue do Estado

@augusto-herrmann
Copy link
Contributor

Esse site é uma fonte oficial, mesmo. Eu tinha ficado um pouco na dúvida, porque apesar de no cabeçalho dizer "Governo do Estado de Sergipe", o domínio é .net.br. Mas fui no site da Secretaria de Saúde e de lá tem um link para esse site.


def parse(self, response):
last_updated = self._parse_last_updated(response)
table_rows = response.xpath("//table[@id='footable_4258']//tr")
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

@vitorbaptista esse id da tabela muda diariamente, vi hoje quando fui rodar o meu script.

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Valeu! Corrigido em 041bfbe

@vitorbaptista
Copy link
Author

Fechando esse PR em favor do #175. Criei outro PR porque este foi feito no master do meu fork, o que torna mais difícil adicionar novos commits.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

Successfully merging this pull request may close these issues.

4 participants