Pode-se considerar intuitivamente que quanto maior a quantidade de objetos e atributos, maior a quantidade de informações disponíveis para o algoritmo de mineração de dados. No entanto, um aumento no número de objetos e na dimensão do espaço (número de atributos na base) pode resultar em dados esparsos e medidas matemáticas instáveis na análise. Além disso, uma grande quantidade de objetos e atributos pode tornar o processamento dos algoritmos de mineração complexo, assim como os modelos gerados. No entanto, é importante destacar que os métodos de redução de dados devem manter a integridade dos dados originais. A mineração dos dados reduzidos deve ser mais eficiente, mas não menos eficaz.
Em relação aos tipos de redução de dados, observe as afirmativas a seguir.
Seleção de atributos (ou características): realiza-se uma técnica de redução de dimensionalidade em que atributos considerados irrelevantes, pouco relevantes ou redundantes são identificados e eliminados.
Discretização: os valores de atributos são substituídos por intervalos ou níveis conceituais mais baixos, aumentando a quantidade final de atributos, deixando informações mais completas.
Compressão de atributos: realiza-se uma técnica de redução de dimensionalidade por meio da aplicação de algoritmos de codificação ou transformação de atributos, em vez de selecionar atributos para remoção.
Isso significa que a seleção de atributos (afirmação I) e a compressão de atributos (afirmação III) são métodos de redução de dados, enquanto a discretização (afirmação II) não é uma técnica de redução de dimensionalidade, mas sim uma transformação dos valores dos atributos.
Lista de comentários
c. I e III, apenas.
Isso significa que a seleção de atributos (afirmação I) e a compressão de atributos (afirmação III) são métodos de redução de dados, enquanto a discretização (afirmação II) não é uma técnica de redução de dimensionalidade, mas sim uma transformação dos valores dos atributos.