Para a prova de nível médio do Bacen faltam

sexta-feira, 16 de fevereiro de 2024

Décimo quinto tijolo - Python Pandas: tratando e analisando dados

 Criando/inserindo novas variáveis. Inicialização básica.



No próximo quadro iremos acrescer uma nova coluna, chamada de Valor Bruto.


Agora vamos inserir a coluna por metro quadrado.


Como podemos observar os valores da coluna por metro quadrado estão com muitas casas decimais, para torná-los apresentáveis, vamos aposicionar um método chamado round(2).


Todos os tipos de casas serão agregados ao termo casa enquanto as demais ao termo apartamento.

Vamos agora excluir colunas usando o del


E neste método vamos excluir utilizando-se do pop


Assim ficou nosso dataframe


lembrando que o axis 1 corresponde as colunas e o axis 0 as linhas


abaixo salvamos nosso arquivo para uso no futuro e tiramos a média dos valores da coluna 'Valor'.



O conteudo dos proximos quadros é grande e será separado.



Vejamos como ficou:



Passamos um laço, porém há um erro aqui. Não podemos colocar  "dados" no laço porque irá alterar o nosso dataframe. Iremos corrigir isso no décimo oitavo tijolo.


Passamos o metodo do tipo para confirmar cada tipo de dataframe. Não podemos colocar  "dados" no laço porque irá alterar o nosso dataframe. Iremos corrigir isso no décimo oitavo tijolo.


E por ultimo, usando o grupo_bairro e as colunas ficou mais facil saber as médias no quadro acima.


















Nenhum comentário:

Postar um comentário