Para a prova de nível médio do Bacen faltam

sexta-feira, 16 de fevereiro de 2024

Décimo terceiro tijolo - Python Pandas: tratando e analisando dados

 

Vamos pensar um pouco no que fazer no caso de dados faltantes ou nulos. Não podemos deixar de analisar um dataset com estas caracteristicas, mas é preciso analisar caso a caso.





Criamos um dataset com essas caracteristicas e usamos o fillna(5), com este parametro todos os numeros nulos passaram a ser 5. No exemplo abaixo escolhemos o numero zero.

Com o método ffill, de cima para baixo o preenchimento ocorre da seguinte maneira: 
O sucessor recebe o valor do anterior. Já no bfill apenas o sentido muda, a substituição ocorre de baixo para cima.


Porém neste exemplo específico foram nos apresentado um número com 3 casas decimais após o zero, e podemos reduzir para duas casas, caso voce tenha interesse.



Voltemos ao datafame original:



quando usamos o ffill com o (limit = 1) estamos pedindo para que seja preenchido apenas um número se forem mais com o antecessor, e o próximo numero faltante passara pelo mesmo processo, limitado a 1 por sequencia.

Neste exemplo usamos o 2 para que a cada dois numeros faltantes, ambos seja subistituidos pelos antecesssores. E para finalizar faremos uma junção dos dois métodos.



 







Nenhum comentário:

Postar um comentário