Aap4 - Data Mining
1) Dados o conjunto de representações de indução de hipóteses:
Árvore de Decisão
Se peso >=50 então Doente;
Se peso > 50 e Sexo = M então Doente
Se peso < 50 e Sexo = F então Saudável
0,45 -0,40 0,54 0,12 0,98 0,37
-0,45 0,11 0,91 0,34 -0,20 0,83
Relacione os vieses das técnicas de indução de hipóteses com suas representações ilustradas na tabela do texto base:
Alternativas:
a) 1. Árvore de decisão; 2.critérios neurais; 3. Critérios estatísticos.
b) 1. Árvore de dedutiva; 2. Conjunto de regras; 3. Pesos de conexões de rede neural.
c) 1. Árvore de decisão; 2. Critérios de previsibilidade; 3. pesos de conexões de rede neural.
d) 1. Árvore dedutiva; 2. Conjunto de regras; 3. Critérios estatísticos.
e) 1. Árvore de decisão; 2. Conjunto de regras; 3. Matrizes de uma rede neural.
2) Em uma aprendizagem máquina de classificação, deve ser analisada quais são as características que definem cada forma e atribui ela a cada um dos grupos, como mostra a figura abaixo:
Classificação
Classificação de elementos
Fonte: elaborado pelo autor
Com relação ao exceto e a imagem de classificação em grupo é correto afirmar que:
Alternativas:
a) Todas as formas de representação apresentadas na figura como o triangulo, quadrado e círculo não estão classificadas.
b) Em uma base relacional equivale à exemplificação da classificação das formas como a figura apresenta.
c) A mineração de dados é um processo que não classifica as possíveis formas, mas atribuem grupos.
d) Em uma base não relacional não equivale à exemplificação da classificação das formas como a figura apresenta.
e) Qualquer nova forma externa ao retângulo já teve seu tipo identificado
3) "Os problemas podem gerados pelo mau planejamento de um banco de dados são conhecidos como anomalias, que podem ser de inserção, alteração ou exclusão e suas soluções estão intimamente ligadas com o relacionamento entre as tabelas do banco."
Com base nas informações descritas e no conceito sobre as categorias de anomalias, avalie as seguintes asserções e a relação proposta entre elas:
A categoria ponto indica que a anomalia ocorre quando um dado for anormal
PORQUE
A categoria contextual considera que se uma parte dos dados pertence a uma instancia anormal, o restante também terá o memso status classificatório.
Enunciado.
A respeito dessas asserções, assinale a alternativa correta.
Alternativas:
a) As asserções I e II são proposições verdadeiras, mas a II não justifica a I.
b) As asserções I e II são proposições verdadeiras e a II justifica a I.
c) A asserção I é uma proposição verdadeira e a II, falsa.
d) A asserção I é uma proposição falsa e a II, verdadeira.
e) As asserções I e II são proposições falsas.
4) Os Algoritmos Genéticos (AG) podem ser aplicados a diversas tarefas de Mineração de Dados. Para ilustrar o potencial de aplicação desta técnica em Mineração de Dados, considere inicialmente um exemplo em que desejamos utilizar um AG para extrair regras que descrevam as características dos clientes de uma empresa de telecomunicações que pertençam a um determinado grupo. Uma regra R é da forma Se X então Y, onde X e Y representam predicados envolvendo atributos do conjunto de dados. O antecedente X pode ser um predicado composto pela conjunção de diversos predicados mais simples. Observe que o antecedente da regra acima apresenta restrições acerca dos possíveis valores de vários atributos associados aos clientes. Além disso, o consequente dessa mesma regra apresenta uma conclusão acerca do grupo ao qual um cliente pertence. Na modelagem por AGs, cada cromossoma da população representa uma regra e cada gene representa um atributo do banco de dados. Assinale a alternativa que apresenta corretamente o operador genético voltado exclusivamente para aplicação nos genes referentes a atributos categóricos.
Alternativas:
a) Crossover de um ponto.
b) Crossover de dois pontos.
c) Crossover lógico.
d) Crossover uniforme.
e) Crossover de média.
Lista de comentários
Resposta:
1-) e)
1. Árvore de decisão; 2. Conjunto de regras; 3. Matrizes de uma rede neural.
2-)c)
A mineração de dados é um processo que não classifica as possíveis formas, mas atribuem grupos.
3-)c)
A asserção I é uma proposição verdadeira e a II, falsa.
4-)c)
Crossover lógico.