A exploração de dados no aprendizado de máquina se refere ao processo de examinar e resumir um conjunto de dados para obter uma melhor compreensão de suas características, estrutura e relacionamentos entre as variáveis. O objetivo da exploração de dados é identificar padrões, outliers e relacionamentos entre variáveis, que podem informar a escolha de recursos e modelos para um problema de aprendizado de máquina.
Considerando o apresentado, analise as afirmativas a seguir sobre a exploração de dados e as correlacione adequadamente aos termos ou ferramentas às quais se referem.
Técnica de visualização Técnica de limpeza de dados Técnica de redução de dimensionalidade
Processo de identificação e remoção de dados incorretos, incompletos ou irrelevantes de um conjunto de dados. Processo de redução do número de variáveis ou recursos em um conjunto de dados. Gráficos de dispersão, histogramas e gráficos de caixa podem ajudar a visualizar a distribuição e as relações entre as variáveis em um conjunto de dados.
Assinale a alternativa que correlaciona adequadamente os dois grupos de informação.
Técnica de visualização (1) - (III) Gráficos de dispersão, histogramas e gráficos de caixa podem ajudar a visualizar a distribuição e as relações entre as variáveis em um conjunto de dados.
Técnica de limpeza de dados (2) - (I) Processo de identificação e remoção de dados incorretos, incompletos ou irrelevantes de um conjunto de dados.
Técnica de redução de dimensionalidade (3) - (II) Processo de redução do número de variáveis ou recursos em um conjunto de dados.
Lista de comentários
Resposta:
1-III; 2-I; 3-II.
Explicação:
Técnica de visualização (1) - (III) Gráficos de dispersão, histogramas e gráficos de caixa podem ajudar a visualizar a distribuição e as relações entre as variáveis em um conjunto de dados.
Técnica de limpeza de dados (2) - (I) Processo de identificação e remoção de dados incorretos, incompletos ou irrelevantes de um conjunto de dados.
Técnica de redução de dimensionalidade (3) - (II) Processo de redução do número de variáveis ou recursos em um conjunto de dados.
Resposta:
1-III; 2-I; 3-II
Explicação: