--
DISCLAIMER: Este repositório foi feito pela e para a comunidade. Existem opiniões divergentes sobre o que básico e o que é avançado entre outros temas. Caso discorde de alguma coisa que está escrita aqui, fique a vontade para fazer um pull request melhorando as descrições feitas aqui.
O intuito é agregar o conhecimento que se espalha em diversos grupos e iniciativas. Muitas vezes esse conhecimento fica espalhado em drives, pockets e outros meios... Dessa forma, esse repositório visa ajudar os iniciantes e servir como referência para os experientes.
Se possuir material interessante, por favor compartilhe com a comunidade. Estamos aqui para crescermos juntos.
Dessa iniciativa também nasceu o Pizza de Dados, um podcast brasileiro focado em ciência de dados. Se tiver um tempinho, prestigie esse trabalho 100% brasileiro.
No mais, é isso. Bem vinda(o), pequena(o) padawan :)
Algumas dicas sobre o que estudar para ser um cientista de dados hoje:
- Recomendações
- Vídeos
- Datasets
- Dicionário de termos em português
- Empresas no Brasil que trabalham com DS
- Grupos
- Metodologias Ágeis
- Dados em Imagens
- Tópicos específicos:
- Python (lib Pandas) ou R
- SQL
- Jupyter Notebook
- Estatística Descritiva
- Machine Learning
- Cálculo
- Álgebra Linear
- Deep Learning
- Processamento de Linguagem Natural
- NoSQL
- Scala
- Spark
- Estatística Bayesiana
- Hive
- Hadoop
- Julia
- Computação distribuída com AWS e Google Cloud
- Numpy
- Pandas
- Scipy
- Matplotlib (Visualização)
- Seaborn (Visualização)
- Bokeh (Visualização)
- Sklearn
- NLTK
- PyTorch
- h2o (Machine Learning)
- mlr(Machine Learning)
- xgboost(Machine Learning)
- dplyr(Manipulação de Dados)
- ggplot2 (Visualização)
- Lista de cursos online by KDnuggets
- Playlist de Treinamento by Edureka!
- Lista dos próximos by KDnuggets
- Curso de Python3 by Curso em Vídeo
- Aulas de Python by Ignorância Zero
- Datasets for Machine Learning
- Datasets for Data Mining and Data Science
- Datasets - Kaggle
- UCI Machine Learning Repository
- data.world
- Amazon Public Datasets
- brasil.io
- Microsoft Research Open Data
- Datasets for Recommender Systems
- Data Science & Python - Telegram
- PyData BH - Telegram
- PyData BsB - Telegram
- Python Brasil Programadores - Facebook
- Machine & Deep Learning Brasil - Facebook
- Machine Learning & Data Science no Garoa - Telegram
- Dados Abertos - Telegram
- R Brasil Programadores - Facebook
- R Brasil - Telegram
- R-Ladies - Telegram
- Data Science Brasil - Facebook
- Data Science São Carlos (SP) Meetup
- IA Brasil - Telegram
- Open Data Science
- Big Data BR
- nlpbr(Processamento de Linguagem Natural)
- Python Brasil
- Estatística e Probabilidade
- CRISP-DM [pt-br]