Quando se integram bases de dados diferentes, que podem ter valores ausentes ou ruídos, é comum encontrar dados que não seguem um padrão único. Por exemplo, um mesmo atributo pode ter variações na escrita ou na unidade de medida. Para resolver esses problemas, é necessário padronizar os dados.
Em relação ao objetivo principal da padronização , avalie as afirmativas a seguir.
Capitalização: costuma-se padronizar as fontes, geralmente para maiúsculas.
Conversão de unidades: todas as informações precisam ser mudadas para ficarem com diferentes tipos.
Caracteres especiais: conjunto de caracteres pode influenciar o desempenho de certas ferramentas de mineração de dados.
Padronização de formatos: podemos usar formatos variados para certos atributos, como números de documentos e datas.
A padronização de dados inclui a capitalização (afirmação I) para uniformizar a escrita, a conversão de unidades (afirmação II) para garantir que todas as informações estejam em unidades consistentes e a consideração de caracteres especiais (afirmação III) que podem afetar o desempenho das ferramentas de mineração de dados. A afirmação IV não se refere diretamente ao objetivo principal da padronização, pois formatos variados não são mencionados como um objetivo principal da padronização.
Lista de comentários
c. I, II e III, apenas.
A padronização de dados inclui a capitalização (afirmação I) para uniformizar a escrita, a conversão de unidades (afirmação II) para garantir que todas as informações estejam em unidades consistentes e a consideração de caracteres especiais (afirmação III) que podem afetar o desempenho das ferramentas de mineração de dados. A afirmação IV não se refere diretamente ao objetivo principal da padronização, pois formatos variados não são mencionados como um objetivo principal da padronização.
Resposta: a.
I, III e IV, apenas.
Explicação passo a passo:
AVA