A normalização é um processo de transformação de dados que tem como objetivo torná-los mais adequados para a aplicação de algoritmos de mineração, tais como redes neurais artificiais ou métodos baseados em distância. A normalização pode ser necessária por diversos motivos, como prevenir a saturação dos neurônios em redes neurais artificiais com múltiplas camadas e garantir que cada atributo de entrada tenha o mesmo intervalo de valores.
Em relação aos quatro tipos de normalização, avalie as afirmativas a seguir.
Normalização Max-Min: uma técnica de pré-processamento de dados que transforma os valores de um atributo em uma escala entre 0 e 1, usando o valor máximo e mínimo do atributo. Essa técnica é útil para padronizar os dados e evitar a influência de valores extremos ou discrepantes.
Normalização pelo escore-z: um método estatístico que unifica os valores de uma variável em unidades de desvio padrão em relação à média. Esse método permite comparar variáveis iguais que possuem escalas ou unidades iguais.
Normalização pelo escalonamento decimal: um método de transformar dados numéricos em valores entre 0 e 1, dividindo cada valor pelo maior valor absoluto da coluna. Esse método preserva a proporção e a ordem dos valores originais, mas pode ser sensível a outliers.
Normalização pelo range interquartil: um método estatístico que visa reduzir a influência de valores extremos nos dados. Consiste em subtrair a mediana dos dados e dividir pelo intervalo interquartil, que é a diferença entre o terceiro e o primeiro quartil.
Portanto, as afirmativas I, III e IV estão corretas.
Explicação passo a passo:
I. Normalização Max-Min é uma técnica que transforma os valores de um atributo em uma escala entre 0 e 1, usando o valor máximo e mínimo do atributo. Isso está correto.
II. Normalização pelo escore-z não foi mencionada nas afirmativas.
III. Normalização pelo escalonamento decimal foi mencionada e é um método de transformar dados numéricos em valores entre 0 e 1, dividindo cada valor pelo maior valor absoluto da coluna. Isso está correto.
IV. Normalização pelo range interquartil foi mencionada e é um método estatístico que visa reduzir a influência de valores extremos nos dados, subtraindo a mediana dos dados e dividindo pelo intervalo interquartil. Isso está correto.
Lista de comentários
Resposta:
A afirmativa correta é:
Letra C -> I, III e IV, apenas.
Portanto, as afirmativas I, III e IV estão corretas.
Explicação passo a passo:
I. Normalização Max-Min é uma técnica que transforma os valores de um atributo em uma escala entre 0 e 1, usando o valor máximo e mínimo do atributo. Isso está correto.
II. Normalização pelo escore-z não foi mencionada nas afirmativas.
III. Normalização pelo escalonamento decimal foi mencionada e é um método de transformar dados numéricos em valores entre 0 e 1, dividindo cada valor pelo maior valor absoluto da coluna. Isso está correto.
IV. Normalização pelo range interquartil foi mencionada e é um método estatístico que visa reduzir a influência de valores extremos nos dados, subtraindo a mediana dos dados e dividindo pelo intervalo interquartil. Isso está correto.