Os métodos que levam em conta a proximidade são fáceis de criar e não exigem suposições sobre a distribuição dos dados subjacentes. Eles podem ser aplicados sem supervisão ou supervisionados e dependem do cálculo de alguma distância entre pares de objetos no banco de dados. Esse cálculo define um espaço métrico definido sobre um número finito de atributos. Os objetos, então, são mapeados nesse espaço por métrica. Diferentes medições podem ser usadas para determinar a distância entre os objetos. Uma escolha comum para bases univariadas ou multivariadas que contêm atributos contínuos é a distância euclidiana, que assume contribuição igual para cada atributo. No entanto, esse método não é adequado para muitas aplicações devido à sua falta de eficácia. Avalie as afirmações a seguir sobre métodos baseados em proximidade e as correlacione adequadamente aos termos ou às ferramentas às quais se referem. 1. k-NN (tipo 1). 2. k-NN (tipo 2). 3. Fator local de anomalia (tipo 1). I. Procedimento fundamentado no algoritmo dos k vizinhos mais adjacentes. II. Procedimento em que os k vizinhos mais adjacentes de determinado objeto são rotulados de acordo com o posto dos vizinhos mais próximos. III. Um algoritmo chamado Local Outlier Factor (LOF) procura desvios entre determinado objeto e seus vizinhos. Assinale a alternativa que correlaciona adequadamente os dois grupos de informações. a. 1-I; 2-II; 3-III. b. 1-II; 2-I; 3-III. c. 1-III; 2-I; 3-II. d. 1-III; 2-II; 3-I. e. 1-I; 2-III; 3-II.
Lista de comentários
a. 1-I; 2-II; 3-III.