Skip to content

Latest commit

 

History

History
18 lines (9 loc) · 1.71 KB

aula-02.md

File metadata and controls

18 lines (9 loc) · 1.71 KB

Aula 2 - Raspando uma página em html e uma sequência de páginas com tabela

Objetivos gerais

No primeiro encontro demos os passos passos para entendermos como coletar dados na internet usando R. Neste segundo encontro teremos 3 objetivos: (1) fazer uma rápida introdução a bases de dados em R para quem foi apresentado à linguagem recentemente; (2) aprender a raspar uma sequência de páginas com tabela usando um "loop"; e (3) extrair conteúdo de uma página de internet e conhecer um pouco sobre XML.

Roteiro

0 - Faremos nosso encontro virtual às 9h30. Discutiremos um pouco sobre raspagem de sequências de páginas de internet e sobre extração de conteúdo de um página.

1 - Comece às 9h do ponto onde tiver parado (Tutorial 1 e Tutorial 2).

2 - Se tiver terminado todo o conteúdo do encontro anterior, vá para o Tutorial 3 e Tutorial 4 para aprender um pouco sobre base de dados em R. Se você já familiaridade com bases de dados em R, pode pular esta dupla de tutoriais.

3 - A seguir, faça o Tutorial 5, que apresenta um exemplo simples de raspagem de uma sequência de páginas de internet.

4 - Para encerrar, vá para o Tutorial 6, no qual veremos um pouco sobre XML e extração de conteúdo de 1 página de internet.