Note que o tempo de alguns atletas não foi registrado por algum erro no processo de medição.
Observando os dados e tendo um conhecimento prévio do desempenho de cada atleta, você, como cientista de dados, resolve que é razoável para este caso específico atribuir o tempo médio de todos os atletas aos dados faltantes.
Primeiramente importamos a biblioteca pandas, a seguir o matplotlib.
Definimos que haverá uma figura e seu tamanho.
import pandas as pd
import matplotlib.pyplot as plt
plt.rc('figure', figsize = (15, 7))
dados = pd.read_csv('amostrado.csv', sep = ';')
Veja que no nosso dataframe columns= Corredor (Nome da pessoa), Melhor tempo (desempenho)
Como é possivel de se notar alguns atletas não possuem dados sobre seus desempenhos. Por isso podemos utilizar uma instrução chamada de fillna. No pandas ela é usada para preencher valores faltantes nas tabelas NaN.
Nenhum comentário:
Postar um comentário