Hoje abrimos o arquivo movies.csv e logo em seguida alteramos o nome
Nomeamos como "filmes" o aquivo movies.csv e substituímos os nomes das colunas.
Fazendo uso da função query temos uma maneira mais legível e concisa de filtrar dados em um DataFrame com base em condições específicas.
Neste exemplo o query foi usada para filtrar todas notas do filmeID igual a 1. O resultado foi uma coluna com todos os notas atribuídas a ele e logo embaixo uma média. Porém na imagem ao lado agrupamos a coluna filmesId e nota (médias) no mesmo dataframe.
Abaixo veremos a média por filme em um gráfico histograma que apresentará a frequência com que o dado se repete. Quando atribuimos valores, é importante estar atento, para não correr o risco de trabalhar com a média da média e acabar por replicar um erro em escala.
Em um gráfico de barras, no exemplo a seguir o mesmo tem 10 caixas (colunas/bins). E foi gerado na biblioteca seaborn.
Nenhum comentário:
Postar um comentário