Para a prova de nível médio do Bacen faltam

quarta-feira, 14 de fevereiro de 2024

Sexto tijolo - Python Pandas: tratando e analisando dados

 Vamos aprender a realizar a alteração do indexador, primeiramente vamos importar nosso dataset.



Em seguida vamos criar uma Series apenas com os dados da coluna 'Tipo', logo em seguida fizemos uma varredura com o drop_duplicates para não apresentar nenhum tipo de imóvel duplicado.


Pronto, o novo dataframe apenas com os tipos de imóveis designados foi criado, mas se notar bem a coluna indexadora apresenta números desordenados, ou seja apenas as linhas recortadas do dataframe inicial.



Antes de se realizar alguma alteração se faz necessário conferir quantos tipos de imóveis nós temos, neste caso são 22. Número que será usado no nosso range.




Nosso range tem o tampo do dataframe tipos_de_imoveis, ou seja 22 linhas, ele começa do 0, e de uma em uma unidade vai até a linha de número 21.



Após a alteração da coluna do indice os números agora seguem uma sequencia lógica.

Mas eu não estava gostando, afinal a Series não estava em ordem alfabética. Por isso criei uma nova variável e chamei de Imoveis_em_ordem_alfabetica. Chamei a variável tipos_de_imóvel acresci o método sort_values puxando da coluna Tipo.


Criamos uma Series sem imóveis repetidos, em seguida uma outra apenas com imóveis residenciais.



Agora faremos uso do método isin() retorna uma série booleana a partir de uma coluna de um DataFrame.



E vamos agora conferir se há itens repetidos. 



No próximo dataframe os dados apresentados são apenas de imóveis residenciais




Nenhum comentário:

Postar um comentário