Para a prova de nível médio do Bacen faltam

sábado, 17 de fevereiro de 2024

Vigésimo tijolo - Python Pandas: tratando e analisando dados

  

A função cut() é uma ferramenta do pandas que auxilia na criação distribuições de frequências e é possível criar labels para as classes criadas pela função cut(). Ela também permite que sejam especificados os limites de cada classe.

No quadro abaixo trouxemos nosso arquivo já conhecido. e logo abaixo criamos uma classe com as quantidades de quartos possíveis.




Lembrando que podemos selecionar uma colunas de várias maneiras, porém vamos relembrar as duas maneiras usadas no nosso estudo.


Os ( parenteses aqui tem um sentido de intervalo aberto e os [ de intervalo fechado.



Para verificarmos a veracidade de um dataset, precisamos pensar a respeito da construção do mesmo.
cada detalhe conta neste caso vamos procurar por imoveis com o valor de 0 quartos. Durante o processo de criação de um dataset pode ter sido cometido este erro.



Como foi possivel verificar os imoveis de 0-2 quartos foram de 11.855 para 21.692 isso poderia representar uma distorção no resultado final.

 





Nenhum comentário:

Postar um comentário