Para a prova de nível médio do Bacen faltam

quarta-feira, 21 de fevereiro de 2024

Vigésimo sexto tijolo - Preenchendo dados faltantes


Note que o tempo de alguns atletas não foi registrado por algum erro no processo de medição. 

Observando os dados e tendo um conhecimento prévio do desempenho de cada atleta, você, como cientista de dados, resolve que é razoável para este caso específico atribuir o tempo médio de todos os atletas aos dados faltantes.

Primeiramente importamos a biblioteca pandas, a seguir o matplotlib.
Definimos que haverá uma figura e seu tamanho.

import pandas as pd

import matplotlib.pyplot as plt
plt.rc('figure', figsize = (15, 7))

dados = pd.read_csv('amostrado.csv', sep = ';')


Veja que no nosso dataframe columns= Corredor (Nome da pessoa), Melhor tempo (desempenho)



Como é possivel de se notar alguns atletas não possuem dados sobre seus desempenhos. Por isso podemos utilizar uma instrução chamada de fillna. No pandas ela é usada para preencher valores faltantes nas tabelas NaN.


Neste caso ela repitiu o valor do atleta anterior. O atleta Pedro antes sem valor definido recebeu o valor de Marcos. Sandro recebeu o valor de Denis.

Nenhum comentário:

Postar um comentário