Em um banco de dados, muitas vezes, encontramos dados nulos. Esses valores precisam ser removidos do DataFrame antes da exploração de dados. O Python fornece vários métodos para limpeza e tratamento. Portanto, ao analisar o conjunto de dados a seguir, notamos que existem alguns valores nulos.
Figura 1 – Conjunto de dados
Fonte: elaborada pela autora.
Vamos supor que seja necessário substituir os valores nulos pelas médias dos valores. Qual opção a seguir indica o método para substituir os valores pela média?
Alternativas:
a) data.fillna(data.mean(A)). b) data.fillna(data.mean(0)). c) data.drop('data', inplace=True, axis=mediana). d) data.fillna(data.mean(A e C)). e) data.drop('data', inplace=True, axis=media).
A resposta correta é "b) data.fillna(data.mean(0))."
O método "fillna" é usado para preencher os valores nulos em um DataFrame do Pandas. Ele permite especificar um valor para substituir os valores nulos. No caso de querer substituir os valores nulos pela média dos valores, podemos usar a função "mean" para calcular a média e passá-la como argumento para o método "fillna". Para calcular a média de todas as colunas do DataFrame, podemos usar o argumento "0" (ou "axis=0"). A opção "a) data.fillna(data.mean(A))" está incorreta, pois o argumento "A" não é válido. As opções "c) data.drop('data', inplace=True, axis=mediana)" e "d) data.fillna(data.mean(A e C))" também estão incorretas, pois não fazem sentido os argumentos "mediana" e "A e C". A opção "e) data.drop('data', inplace=True, axis=media)" está incorreta, pois o método "drop" é usado para remover linhas ou colunas de um DataFrame, e não para preencher valores nulos.
Lista de comentários
A resposta correta é "b) data.fillna(data.mean(0))."
O método "fillna" é usado para preencher os valores nulos em um DataFrame do Pandas. Ele permite especificar um valor para substituir os valores nulos. No caso de querer substituir os valores nulos pela média dos valores, podemos usar a função "mean" para calcular a média e passá-la como argumento para o método "fillna". Para calcular a média de todas as colunas do DataFrame, podemos usar o argumento "0" (ou "axis=0"). A opção "a) data.fillna(data.mean(A))" está incorreta, pois o argumento "A" não é válido. As opções "c) data.drop('data', inplace=True, axis=mediana)" e "d) data.fillna(data.mean(A e C))" também estão incorretas, pois não fazem sentido os argumentos "mediana" e "A e C". A opção "e) data.drop('data', inplace=True, axis=media)" está incorreta, pois o método "drop" é usado para remover linhas ou colunas de um DataFrame, e não para preencher valores nulos.