Ao contrário das regras de classificação, as regras de associação podem prever qualquer atributo em vez de apenas classe. Isso leva à capacidade de prever qualquer combinação de atributos junto com suas regras associadas. Eles não devem ser usados ​​juntos e raramente são aplicados ​​em conjunto com as regras de classificação. Diferentes regras de associação avaliam diferentes regularidades de banco de dados e, geralmente, correlacionam coisas diferentes de uma forma que se estimam relacionamentos entre objetos diferentes. A mineração de regras de associação pode ser realizada com diferentes algoritmos. Apriori, foi o primeiro algoritmo de mineração de regras de associação que foi criado. Outros métodos de mineração de dados usam variações de Apriori. Com relação ao processo geral de minerar regras de associação, avalie as afirmativas a seguir. I. Pré-processamento da base: preparar um banco de dados transacional para mineração de regras II. Análise das regras: análise de metodologia a ser utilizada para as regras de associação ocorrerem da melhor forma. III. Geração do conjunto de itens frequentes: é formada quando ocorre pelo menos um certo número de transações. IV. Mineração das regras: é utilizado um processo que envolve o uso apenas de itens de base frequentes em uma ordem específica. É correto o que se afirma em: a. I, II e III, apenas. b. I e III, apenas. c. I e II, apenas. d. I, apenas. e. I, III e IV, apenas.
Responda
A mineração de itens frequentes requer a mineração de um algoritmo eficiente que possa minerar todo o conjunto. No entanto, construir uma FP-Tree não é suficiente. Pesquisas adicionais são necessárias para criar um algoritmo eficiente que também possa minerar itens frequentes com eficiência. Esse processo envolve uma técnica de “avançar e dividir” chamada “FP-Crescimento”. Ele divide o problema em subproblemas menores para que um método de “dividir e conquistar”, chamado “FP-Growth”, possa ser aplicado. Com base no método de construção de uma FP-Tree compacta, assinale a alternativa que melhor descreve esse processo. a. As regras com confiança mínima de 30% ou mais devem ser selecionadas antes de qualquer outra regra. Isso ocorre porque todas as regras suportadas têm uma confiança superior a 30%, e o cálculo da confiança é necessário ao selecionar quais regras usar. b. No algoritmo Apriori, que gera repetidamente um conjunto de itens de ocorrência frequente, é necessário combinar os dois itens selecionados em três, com o objetivo de determinar seu suporte. c. Para o algoritmo Apriori e o algoritmo FP-Growth, um conjunto inicial de itens com frequência maior do que o suporte mínimo atribuído, minsup, deve ser selecionado. Isso pode ser feito usando o algoritmo FP-Growth ou o algoritmo Apriori. d. O algoritmo explora a FP-Tree das folhas até a raiz. Seja um nó na folha da FP-Tree. Em seguida, ele encontra os conjuntos de itens frequentes de o e continua até o-1. Após a exploração até a raiz, ele continua explorando as árvores até o-2, e assim por diante. e. Primeiro, combine dois itens do conjunto inicial em um único item. Em seguida, determine o suporte para cada par de itens e elimine quaisquer pares com menos de 30% de suporte. Em seguida, o algoritmo Apriori é usado para gerar o conjunto de itens frequentes.
Responda
Pode-se considerar intuitivamente que quanto maior a quantidade de objetos e atributos, maior a quantidade de informações disponíveis para o algoritmo de mineração de dados. No entanto, um aumento no número de objetos e na dimensão do espaço (número de atributos na base) pode resultar em dados esparsos e medidas matemáticas instáveis na análise. Além disso, uma grande quantidade de objetos e atributos pode tornar o processamento dos algoritmos de mineração complexo, assim como os modelos gerados. No entanto, é importante destacar que os métodos de redução de dados devem manter a integridade dos dados originais. A mineração dos dados reduzidos deve ser mais eficiente, mas não menos eficaz. Em relação aos tipos de redução de dados, observe as afirmativas a seguir. Seleção de atributos (ou características): realiza-se uma técnica de redução de dimensionalidade em que atributos considerados irrelevantes, pouco relevantes ou redundantes são identificados e eliminados. Discretização: os valores de atributos são substituídos por intervalos ou níveis conceituais mais baixos, aumentando a quantidade final de atributos, deixando informações mais completas. Compressão de atributos: realiza-se uma técnica de redução de dimensionalidade por meio da aplicação de algoritmos de codificação ou transformação de atributos, em vez de selecionar atributos para remoção. Está correto o que se afirma em: a. I, II e III, apenas. b. I e II, apenas. c. I e III, apenas. d. I, apenas. e. II e III , apenas
Responda
A normalização é um processo de transformação de dados que tem como objetivo torná-los mais adequados para a aplicação de algoritmos de mineração, tais como redes neurais artificiais ou métodos baseados em distância. A normalização pode ser necessária por diversos motivos, como prevenir a saturação dos neurônios em redes neurais artificiais com múltiplas camadas e garantir que cada atributo de entrada tenha o mesmo intervalo de valores. Em relação aos quatro tipos de normalização, avalie as afirmativas a seguir. Normalização Max-Min: uma técnica de pré-processamento de dados que transforma os valores de um atributo em uma escala entre 0 e 1, usando o valor máximo e mínimo do atributo. Essa técnica é útil para padronizar os dados e evitar a influência de valores extremos ou discrepantes. Normalização pelo escore-z: um método estatístico que unifica os valores de uma variável em unidades de desvio padrão em relação à média. Esse método permite comparar variáveis iguais que possuem escalas ou unidades iguais. Normalização pelo escalonamento decimal: um método de transformar dados numéricos em valores entre 0 e 1, dividindo cada valor pelo maior valor absoluto da coluna. Esse método preserva a proporção e a ordem dos valores originais, mas pode ser sensível a outliers. Normalização pelo range interquartil: um método estatístico que visa reduzir a influência de valores extremos nos dados. Consiste em subtrair a mediana dos dados e dividir pelo intervalo interquartil, que é a diferença entre o terceiro e o primeiro quartil. Está correto o que se afirma em: a. II e III apenas. b. I, II e III, apenas. c. I, III e IV, apenas. d. I, apenas. e. III e IV apenas.
Responda
Os Bancos de Dados (BD) estão presentes no cotidiano das pessoas de maneira completamente onipresente. Toda a operação realizada, na atualidade, passa por um BD para que possa ser concluída de maneira positiva ou negativa. Evidentemente, ao se buscar uma definição mais genérica sobre BD, a primeira que se pode lembrar/pensar é a de que bancos de dados são coleções de dados. Entretanto, a cada dia essa definição é enriquecida de significado, resultando em definições cada vez mais completas. Considerando o contexto dado, avalie as seguintes asserções e a relação proposta entre elas. Um banco de dados representa algum aspecto do mundo real, às vezes chamado de “minimundo” ou de “universo de discurso”. As mudanças no minimundo são refletidas no banco de dados. PORQUE Um banco de dados é uma coleção logicamente coerente de dados com algum significado inerente. Uma variedade aleatória de dados não pode ser corretamente chamada de banco de dados. A respeito dessas asserções, assinale a alternativa correta. a. A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. b. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I. c. As asserções I e II são proposições falsas. d. As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I. e. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
Responda

Helpful Social

Copyright © 2024 ELIBRARY.TIPS - All rights reserved.