Leonardo S. Barone e Jonathan Phillips
O curso oferece aos estudantes de pós-graduação em ciências sociais uma iniciação à lógica de programação e ao uso de ferramentas computacionais para (1) coleta (2) organização e preparação e (3) apresentação de dados para pesquisa social. O foco do curso é o desenvolvimento da habilidade de programação para solução de problemas diversos relacionados ao manejo de dados com fins de pesquisa. Note-se que não é um curso de metodologia de pesquisa, análise de dados ou de ciências sociais computacionais.
Este curso pretende preencher uma lacuna de formação comum em alunas e alunos de pós-graduação em ciências sociais referente à habilidade de lidar com dados e ferramentas computacionais para a condução de suas pesquisas.
O curso está dividido em duas partes. A primeira parte do curso foca na preparação do ambiente computacional, apresentação de ferramentas e "alfabetização" e nas linguagens de programação utilizadas no curso -- R, Git, SQL, Markdown, etc. A segunda parte foca em aplicações das habilidades desenvolvidas a problemas de manipulação de grandes bases de dados, coleta de dados na internet e via uso de APIs de terceiros, organização de documentos para análise textual, confecção de gráficos e mapas ou demais tópicos de interesse da turma.
- Informações básicas
- [Syllabus] - Em breve
- Página da disciplina no sistema Janus.
Calendário e tópicos sujeitos a alteração
OBS: alteramos a ordem dos tópicos das aulas 8 e 9. A ordem abaixo é a correta.
- 19/03/2018 - Aula 1 - Introdução ao curso e R Básico.
- 02/04/2018 - Aula 2 - Do básico ao intermediário.
- 09/04/2018 - Aula 3 - Abrindo e manipulando data frames
- 16/04/2018 - Aula 4 - Primeiros passos no tidyverse
- 23/04/2018 - Aula 5 - RMarkdown, git, e integração R e servidores SQL
- 14/05/2018 - Aula 6 - Visualização de dados e a gramática de gráficos ggplot2
- 21/05/2018 - Aula 7 - Funções, iteração e vetorialização
- 28/05/2018 - Aula 8 - CANCELADA - GREVE DE CAMINHONEIROS
- 04/06/2018 - Aula 9 - Raspagem de dados na internet com R (invertida com aula 10 por falta de internet em sala de aula)
- 11/06/2018 - Aula 10 - Strings e Mineração de Textos com R (invertida com aula 09)
- 25/06/2018 - Aula 11 - Mapas e GIS com R
- 18/06/2018 - Aula 12 - Programação Funcional com purrr
- Grolemund, Garrett (2014). Hands-On Programming with R. Ed: O'Reilly Media. Não distribuído gratuitamente. Informações no site da editora aqui
- Wichkam, Hadley e Grolemund, Garrett (2016). R for Data Science. Ed: O'Reilly Media. Disponível gratuitamente Disponível gratuitamente aqui
- Silge, Julia e Robinson, David (2017). Text Mining with R: A Tidy Approach. Ed: O'Reilly Media. Disponível gratuitamente aqui
- Wichkam, Hadley (2014). Advanced R. Ed: Chapman and Hall/CRC. Disponível gratuitamente Disponível gratuitamente aqui
- Gillespie, Colin e Lovelace, Robin (2016). Efficient R programming. Ed: O'Reilly Media. Disponível gratuitamente Disponível gratuitamente aqui
AVISO: Entregar 4 de 5
- 20/04/2018 - Desafio 1 - R base
- 08/05/2018 - Desafio 2 - Manipulação de dados com dplyr
- 01/06/2018 - Desafio 3 - Gráficos com ggplot2
- 02/07/2018 - Desafio 4 - Mapas (requisito: desafio 2)
- 02/07/2018 - Desafio 5 - Raspagem de dados e mineração de texto
AVISO: Projeto em grupo excluído da avaliação
- 18/06/2018 - Discussão em aula sobre projeto final individual
- 31/07/2018 - Entrega do projeto final individual