You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
:class: tip
Para execução dos códigos, é necessário instalar as seguintes bibliotecas:
- *!pip install seaborn*
- *!pip install matplotlib*
- *!pip install wordcloud*
- *!pip install plotly==5.13.1*
:tags: [remove-output]
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import plotly
import plotly.graph_objects as go
plotly.offline.init_notebook_mode(connected=True)
Gráficos de Barras ou Colunas
:tags: [remove-output]
data = df_brasil.groupby(by=['STATE']).mean()['GDP_CAPITA']
ax = data.plot.bar(figsize=(10,5))
_ = ax.set(xlabel='Estados', ylabel='Produto interno Bruto (PIB) per capita')
:tags: [remove-output]
data = df_brasil.groupby(by=['REGION']).agg({'CITY': 'count', 'POPULATION_2018': 'sum'})
data['CITY'] = (data['CITY'] / data['CITY'].sum()) * 100
data['POPULATION_2018'] = (data['POPULATION_2018'] / data['POPULATION_2018'].sum()) * 100
ax = data.plot.barh(figsize=(10,5))
_ = ax.set(xlabel='Porcentagem com relação ao Brasil', ylabel='Região')
_ = ax.legend(['Porcentagem de cidades por região no Brasil', 'Porcentagem de pessoas por região no Brasil'])
Gráfico de Setor
:tags: [remove-output]
# Especifica a sequência de cores a ser utilizada na visualização
colors = ['lightskyblue', 'red', 'blue', 'green', 'gold']
fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(15, 15))
_ = df_brasil.groupby(by=['REGION']).sum()['TAXES'].plot.pie(colors=colors, autopct='%1.1f%%', ax=axes[0])
_ = df_brasil.groupby(by=['REGION']).sum()['GDP'].plot.pie(colors=colors, autopct='%1.1f%%', ax=axes[1])
_ = axes[0].set(xlabel='Distribuição do volume de impostos pagos por região do Brasil em 2016', ylabel='')
_ = axes[1].set(xlabel='Distribuição do PIB por região do Brasil em 2016', ylabel='')
Gráficos de Dispersão
:tags: [remove-output]
# O valor de despesas de alguns municípios não foi disponibilizado na base de dados
data = df_brasil.query("MUN_EXPENDIT != 0")
f, ax = plt.subplots(figsize=(10, 6))
plt.yscale('log')
sct_plot = sns.scatterplot(x=data['IDHM'],
y=data['MUN_EXPENDIT'],
hue=data['REGION'])
sct_plot.set_xlabel(xlabel = 'IDH do município', fontsize = 12)
sct_plot.set_ylabel(ylabel = 'Gastos do município', fontsize = 12)
:tags: [remove-output]
f, ax = plt.subplots(figsize=(8, 8))
sns.scatterplot(x=data.LONG,
y=data.LAT ,
hue=data['IDHM'],
size=data['MUN_EXPENDIT'])
_ = plt.title("Distribuição de municípios brasileiros de acordo com o seu IDH, suas despesas e a região onde se encontram."
:tags: [remove-output]
text = ' '.join(df_brasil['CITY'])
# Remoção de palavras repetidas irrelevantes
stop_words = ['De', 'Do', 'Da']
# Mapeamento da frequência de cada palavra e produção da nuvem de palavras
wordcloud = WordCloud(background_color="white",
max_words=len(df_brasil),
max_font_size=70,
stopwords=stop_words,
height=300,
width=600).generate(text)
plt.figure(figsize=(20,12))
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")