Aap4 - Data Mining 1) Dados o conjunto de representações de indução de hipóteses: Árvore de Decisão Se peso >=50 então Doente; Se peso > 50 e Sexo = M então Doente Se peso < 50 e Sexo = F então Saudável 0,45 -0,40 0,54 0,12 0,98 0,37 -0,45 0,11 0,91 0,34 -0,20 0,83 Relacione os vieses das técnicas de indução de hipóteses com suas representações ilustradas na tabela do texto base: Alternativas: a) 1. Árvore de decisão; 2.critérios neurais; 3. Critérios estatísticos. b) 1. Árvore de dedutiva; 2. Conjunto de regras; 3. Pesos de conexões de rede neural. c) 1. Árvore de decisão; 2. Critérios de previsibilidade; 3. pesos de conexões de rede neural. d) 1. Árvore dedutiva; 2. Conjunto de regras; 3. Critérios estatísticos. e) 1. Árvore de decisão; 2. Conjunto de regras; 3. Matrizes de uma rede neural. 2) Em uma aprendizagem máquina de classificação, deve ser analisada quais são as características que definem cada forma e atribui ela a cada um dos grupos, como mostra a figura abaixo: Classificação Classificação de elementos Fonte: elaborado pelo autor Com relação ao exceto e a imagem de classificação em grupo é correto afirmar que: Alternativas: a) Todas as formas de representação apresentadas na figura como o triangulo, quadrado e círculo não estão classificadas. b) Em uma base relacional equivale à exemplificação da classificação das formas como a figura apresenta. c) A mineração de dados é um processo que não classifica as possíveis formas, mas atribuem grupos. d) Em uma base não relacional não equivale à exemplificação da classificação das formas como a figura apresenta. e) Qualquer nova forma externa ao retângulo já teve seu tipo identificado 3) "Os problemas podem gerados pelo mau planejamento de um banco de dados são conhecidos como anomalias, que podem ser de inserção, alteração ou exclusão e suas soluções estão intimamente ligadas com o relacionamento entre as tabelas do banco." Com base nas informações descritas e no conceito sobre as categorias de anomalias, avalie as seguintes asserções e a relação proposta entre elas: A categoria ponto indica que a anomalia ocorre quando um dado for anormal PORQUE A categoria contextual considera que se uma parte dos dados pertence a uma instancia anormal, o restante também terá o memso status classificatório. Enunciado. A respeito dessas asserções, assinale a alternativa correta. Alternativas: a) As asserções I e II são proposições verdadeiras, mas a II não justifica a I. b) As asserções I e II são proposições verdadeiras e a II justifica a I. c) A asserção I é uma proposição verdadeira e a II, falsa. d) A asserção I é uma proposição falsa e a II, verdadeira. e) As asserções I e II são proposições falsas. 4) Os Algoritmos Genéticos (AG) podem ser aplicados a diversas tarefas de Mineração de Dados. Para ilustrar o potencial de aplicação desta técnica em Mineração de Dados, considere inicialmente um exemplo em que desejamos utilizar um AG para extrair regras que descrevam as características dos clientes de uma empresa de telecomunicações que pertençam a um determinado grupo. Uma regra R é da forma Se X então Y, onde X e Y representam predicados envolvendo atributos do conjunto de dados. O antecedente X pode ser um predicado composto pela conjunção de diversos predicados mais simples. Observe que o antecedente da regra acima apresenta restrições acerca dos possíveis valores de vários atributos associados aos clientes. Além disso, o consequente dessa mesma regra apresenta uma conclusão acerca do grupo ao qual um cliente pertence. Na modelagem por AGs, cada cromossoma da população representa uma regra e cada gene representa um atributo do banco de dados. Assinale a alternativa que apresenta corretamente o operador genético voltado exclusivamente para aplicação nos genes referentes a atributos categóricos. Alternativas: a) Crossover de um ponto. b) Crossover de dois pontos. c) Crossover lógico. d) Crossover uniforme. e) Crossover de média.
Responda
Adg1 - Data Mining 1) Deter conhecimentos mais profundos e extensos dá área de mineração de dados, facilita a adaptação de profissionais em trabalhar com diferentes cenários, portanto, diferentes objetos de estudos, pois este conteúdo possibilita flexibilidade da implementação de suas técnicas com variáveis e grandezas de múltiplos campos de estudo. Com base no contexto flexibilidade das técnicas de mineração de dados, é correto afirmar que: Alternativas: a) A mineração de dados é capaz de trabalhar com diversos cenários de estudo com facilidade, bastando haver uma excelente conexão com a internet, para que seja possível processar o alto fluxo de dados presente. b) A capacidade da flexibilidade da implementação das técnicas de mineração de dados para diferentes áreas de estudos ocorre graças ao desenvolvimento das tecnologias de armazenamento em nuvem, dessa forma é possível relacionar elementos de diferentes campos de análise em tempo real. c) Para executar os processos da mineração de dados em diferentes contextos de aplicação, é indispensável a utilização dos programas adequados, pois estes são responsáveis por realizar a conversão dos dados de um estudo para o outro, sem que haja perda de informação. d) Ainda que sejam aplicados em estudos diferentes, se as técnicas de mineração de dados utilizadas forem as mesmas, os resultados esperados serão os mesmos, já que tais técnicas apresentam como principal característica sua consistência nos resultados. e) A característica que permite que as técnicas de mineração de dados sejam aplicadas em diversas áreas, é a utilização de dados extraídos do fenômeno analisado, portanto os resultados sempre irão refletir comportamentos do respectivo cenário estudado. 2) Em qualquer ambiente operacional, os agentes encarregados pela área de administração e gerenciamento da instituição, necessitam realizar análises preditivas para que as tomadas de decisão possam antecipar, ou até evitar, certos acontecimentos, além de garantir maior certeza de alcançar os resultados desejados. Com base no contexto de gerenciamento, o processo em que são elaboradas as ações que serão executadas é: Alternativas: a) A mineração de dados. b) A produção de conhecimento. c) O planejamento. d) O ajuste. e) A extração. 3) Em atividades de gerenciamento e administração, várias tarefas são realizadas para que a instituição em questão alcance seus objetivos. Para que tudo ocorra de forma mais suave possível, as tarefas são adequadamente designadas para pessoas responsáveis, assim dentro de um grupo, são criados sub-grupos responsáveis por gerenciar certas atividades, e lidar com possíveis imprevistos. No contexto de gerenciamento, a importância produção de conhecimento se dá por causa da sua influência direta no processo de: Alternativas: a) Geração de Informações. b) Aumento do fluxo de dados. c) Comunicação remota. d) Interação homem-máquina. e) Tomada de decisão. 4) Ao longo do avanço em diversas áreas de estudo, são elaboradas e incorporadas estruturas de organização, sistema de medidas e esquemas de cores, para ajudar a facilitar a compreensão de quem está visualizando um conjunto de dados. Com base no texto acima, assinale a alternativa que apresenta estruturas organizadas de dados obedecendo um ou mais padrões. Alternativas: a) Calendário e Tabela Periódica. b) Mapa e Fotografia. c) Planilha eletrônica e Fotografia. d) Calendário e Fotografia. e) Planilha eletrônica e Tabela.
Responda
Adg3 - Data Mining 1) Um ponto importante a ser observado é o fato da correlação entre variáveis ser efetivamente medida através de coeficientes, que são técnicas utilizadas para mensurar se duas variáveis se relacionam linearmente. Com base nas informações descritas e no conceito de correlação, avalie as seguintes asserções e a relação proposta entre elas: Nas correlações lógicas as relações baseadas na causalidade acabam sendo entendidas de maneira mais assertiva. PORQUE nas correlações ilusórias existe a possibilidade de adotar uma conexão com alto nível de razoabilidade entre as variáveis A respeito dessas asserções, assinale a alternativa correta. Alternativas: a) As asserções I e II são proposições verdadeiras, mas a II não justifica a I. b) As asserções I e II são proposições verdadeiras e a II justifica a I. c) A asserção I é uma proposição verdadeira e a II, falsa. d) A asserção I é uma proposição falsa e a II, verdadeira. e) As asserções I e II são proposições falsas. 2) "Redes neurais são sistemas de computação com nós interconectados que funcionam como os neurônios do cérebro humano. Usando algoritmos, elas podem reconhecer padrões escondidos e correlações em dados brutos, agrupá-los e classificá-los." Com base nas informações descritas e no conceito sobre redes neurais, avalie as seguintes asserções e a relação proposta entre elas: As redes neurais são adotadas com maior frequência nos estágios finais. PORQUE A sua função básica é limitar relações entre os processos. A respeito dessas asserções, assinale a alternativa correta. Alternativas: a) As asserções I e II são proposições verdadeiras, mas a II não justifica a I. b) As asserções I e II são proposições verdadeiras e a II justifica a I. c) A asserção I é uma proposição verdadeira e a II, falsa. d) A asserção I é uma proposição falsa e a II, verdadeira. e) As asserções I e II são proposições falsas. 3) O agrupamento de dados, ou clustering são técnicas computacionais que consistem em separar dados em grupos, de acordo com suas similaridades. Existem diferentes modelos ou técnicas de agrupamento de dados, dentre podemos destacar o método por partição. Considerando o contexto apresentado sobre os modelos de agrupamento de dados por partição, avalie as seguintes asserções e a relação proposta entre elas: Quanto aos modelos de agrupamento dados, estes podem ser hierárquico ou por partição. No caso dos modelos tipo partição, os algoritmos como o K-Means podem ser classificados como não supervisionados. PORQUE Os algoritmos por partição, como o K-Means não requerem a necessidade de confirmação de imputs, promovendo a comparação estre os valores dos objetos. A respeito dessas asserções, assinale a alternativa correta. Alternativas: a) As asserções I e II são proposições verdadeiras, mas a II não justifica a I. b) As asserções I e II são proposições verdadeiras e a II justifica a I. c) A asserção I é uma proposição verdadeira e a II, falsa. d) A asserção I é uma proposição falsa e a II, verdadeira. e) As asserções I e II são proposições falsas. 4) O mundo conheceu nestas ultimas décadas uma revolução tecnológica e computacional muito intensa, que alterou de maneira irreversível as interações sociais e empresariais. A informação exacerba seu valor, obrigando o desenvolvimento de tecnologias cada vez mais eficientes de gerar conhecimento e extrair informações úteis de um volume cada vez maiores dos bancos de dados. Desta forma sugue novos campos de conhecimentos e teorias, como o KDD (Knowledge Discovery in Databases). Considerando as informações apresentadas sobre o KDD (Knowledge Discovery in Databases) e suas etapas, analise as afirmativas a seguir: I. Estas etapas são necessárias para a extração de novos conhecimentos de banco de dados em estado bruto. II. As etapas de seleção, processamento e prospecção de dados está entre as principais do KDD; III. A etapa de pré-processamento posteriormente a etapa de seleção de dados que serão tratados. IV. A transformação e as avaliação de dados são importantes etapas do modelo de KDD. Considerando o contexto apresentado, é correto o que se afirma em: Alternativas: a) II, III e IV, apenas. b) I, III e IV, apenas. c) I, II e III, apenas. d) I, II e IV, apenas. e) I, II, III e IV.
Responda
Av - Substituta. 1 - Arquitetura de Dados1)Na visão de Abraham existem algumas formas de usabilidade computação em nuvem ou Cloud Computing ou modelos, vamos analisa-los: infraestrutura como um serviço, plataforma como um serviço e software como um serviço, agora observe a figura a seguir:Considerando as informações apresentadas, analise as afirmativas a seguir:I. Infraestrutura como um serviço: oferece provedores ou abstração de uma ou mais (maquinas virtuais), simuladas pelo software em diversas formas e características.II. Software como um serviço: Pode implantar e gerenciar plataformas como armazenadores de dados, banco de dados e também servidores de aplicação, comandados pelo software de aplicação;III. Modelo de plataforma como um serviço: o intuito é fornecer o software de aplicação como serviço, os provedores de servidos cuidam da implementação, atualizações e afins. É correto o que se afirma em:Alternativas: a) Apenas I. b) Apenas I e II. c) I, II e III. d) Apenas II e III. e) Apenas II.2) Abraham (2020, p. 559), cita dois trechos importantes sobre o Armazenamento de Dados, acompanhe: Tradicionalmente, as empresas compravam e utilizam servidores que executam o banco de dados e as aplicações. Existe um alto custo para a manutenção de servidores, incluindo a montagem da infraestrutura da sala do servidor, que enfrenta todos os tipos de falhas, como ar condicionado e faltas de energia, sem falar nas falhas de CPUs, discos e outros componentes dos servidores. Além disso, se houver um aumento repentino na demanda, é muito difícil acrescentar infraestrutura para atendê-la e, se a demanda cair, a infraestrutura poderá ficar ociosa. Por outro lado, no modelo de computação em nuvem, as aplicações de uma empresa são executadas em uma infraestrutura gerenciada por outra empresa, geralmente em um datacenter que hospeda grande número de máquinas usadas por muitas empresas/usuários diferentes. O provedor de serviços pode fornecer não apenas hardware, mas também plataformas de suporte, como bancos de dados e software de aplicação. Note que o autor fala de dois tipos de armazenamento de dados: um dos tipos são os servidores físicos instalados na própria empresa e o outro tipo são os servidores em nuvem. Sobre o armazenamento em nuvem, a década de 90, por volta do ano de ______________. Esta data marcou e revolucionou o processo no armazenamento de dados, em uma das palestras do professor Assinale a alternativa que preenche corretamente a lacuna.Alternativas: a) 1996. b) 1995. c) 1998. d) 1999. e) 1997.3) Os Data Stewards ou Administradores de Dados, são profissionais responsáveis por receber, armazenar, analisar, monitorar entre outras ações referentes tecnologia da informação, sendo esta, homogênea, heterogênea, estruturada, não estruturada ou semiestruturada, ou seja, de grande importância para o mercado de trabalho, estes profissionais se dividem em diversos grupos que compõem o gerenciamento de dados, entre eles: Domínio de Dados; Data Owner; Business Data Steward; Techinical Data Steward e Governança de Dados. Acompanhe o trecho:"São Profissionais que garantem a disponibilização dos dados, , atualizam e ou fazem a correção se necessário for, antes do uso desta informação". Assinale a alternativa que apresenta corretamente as características do texto em evidencia com relação aos grupos de Data Stewards.Alternativas: a) Domínio de Dados. b) Data Owner. c) Business Data Steward. d) Technical data steward. e) Governança de dados.4) Sobre o gerenciamento de dados heterogêneos, analise o trecho a seguir: "Heterogeneidade de dados é um desafio importante em qualquer contexto onde um software lida diretamente com os dados. Nos dias atuais, a necessidade de homogeneização está conduzindo várias técnicas e práticas da indústria, conhecidas com várias expressões similares tais como federação de dados e integração de dados empresariais, que pode ser classificada em dois tipos de abordagens gerais para o problema: gerenciamento de dados mestres (master data management); e transformação de dados". Os quadros 1 e 2 a seguir mostram um exemplo de distribuição de Dados Heterogêneos, seus identificadores e dados relativos as condições meteorologicas :Com base nas informações apresentadas nos quadros 1 e 2 sobre os identificadores e dados relativos, avalie as seguintes asserções e a relação proposta entre elas.I. O exemplo de distribuição heterogênea dos dados. O quadro (1) e o quadro (2) contém, respectivamente, dados relativos às condições meteorológicas e à demografia das mesmas cidades. Isto é de suma importância.PorqueII. Neste caso o campo "Comércio" é um identificador que relaciona (a) com (b) e vice-versa.Alternativas:
Responda
1) No contexto de banco de dados, escalabilidade é a maneira e qualidade com que um sistema retorna sobre investimento, à medida que recursos são acrescentados, para aumentar a capacidade. Esta definição é extremamente importante, pois o objetivo de um sistema é fornecer um serviço de qualidade com o menor custo. Sobre o fundamento de escalabilidade podemos afirmar que: I - na forma como um sistema consegue suportar as modificações, suprindo o aumento de demanda e serviços. II - é heterogêneo, o que garante mais confiabilidade perante a falhas comuns de componentes III - demonstra a habilidade de um sistema adaptar um crescente número de componentes IV - para adequar cargas crescentes de trabalhos elegantemente e suscetíveis a aplicações. Assinale a alternativa que apresenta as afirmativas corretas: Alternativas: a) I e II apenas. b) II, III e IV apenas. c) I, III e IV apenas. d) II e IV apenas. e) I e III apenas. 2) O conceito de replicação consiste em um processo no qual os dados de um servidor são copiados para um ou mais ambientes, mantendo a configuração original. Isto não significa simplesmente duplicar, pois as cópias devem ser administradas, para garantir consistência, disponibilidade e autonomia. A replicação é necessária para _________ os dados e as operações no banco de dados. Usuários __________ necessitam de replicação para armazenar dados utilizados mais frequentemente durante o período de _________. Assinale a alternativa que apresenta as palavras correspondentes as lacunas. Alternativas: a) sincronizar, experientes, desconexão. b) gravar, móveis, desconexão. c) gravar, móveis, conexão. d) sincronizar, experientes, conexão. e) sincronizar, móveis, desconexão. 3) Em um sistema distribuído, é importante que os componentes executem suas funções. Porém eles podem falhar, ocasionando um resultado diferente do esperado por quem o desenvolveu. Caso um sistema não tenha capacidade de tolerar falha, a falha de um dos componentes pode afetar todo o sistema. Existem diferentes classificações dos tipos de falhas, dependendo de como o componente a apresenta. Segundo Hadzilacos e Toueg (1994), é possível classificar os tipos de falhas de processo como: I - Crash: ocorre quando o processo encerra sua execução precipitadamente. II - Omissão de envio: acontece quando o processo deixa de enviar uma mensagem que deveria. III - Omissão de recebimento: quando o processo deixa de receber uma mensagem destinada a ele. IV - Arbitrária: quando o processo exibe um comportamento arbitrariamente diferente do que deveria, como retornar um valor errado. Assinale a alternativa que apresenta as afirmativas corretas: Alternativas: a) I, II e III apenas. b) II e III apenas. c) II, III e IV apenas. d) I, II, III e IV apenas. e) I, III e IV apenas. 4) O processamento de dados em transmissão streaming permite resultados com tempos reduzidos. Esta forma de processamento surgiu para resolver o problema da latência elevada que o processo de dados em lote apresenta. Está atrelado à maioria das características que o processamento em lote fornece, é tolerante a falhas e otimiza a utilização dos recursos. Dado as características abaixo: I - Manter os dados em movimento. II - Utilização de NoSQL (StreamNoSQL). III - Gerar resultados imprevisíveis. IV - Integrar dados armazenados e em streaming. V - Garantir a segurança e disponibilidade dos dados. Assinale a alternativa que possui as características do processo de streaming de dados em tempo real: Alternativas: a) I, II e III apenas. b) II, IV e V apenas. c) I, II e IV apenas d) I, IV e V apenas. e) III, IV e V apenas.
Responda
Aap3 - Data Mining1) "Importante frisar que os coeficientes de correlação acabam informando três características essenciais. A primeira está relacionada ao nível de intensidade de uma variável, a segunda trata basicamente do seu direcionamento (positivo, negativo ou nulo) e o terceiro aspecto observa o nível de significância. Um valor deste coefieciente próximo a 1, em modulo, indica apenas que existe um elevado grau de associação linear e estatísticas entre as variáveis, mas nada diz sobre a natureza de uma relação de causalidade."Com base nas informações descritas e no conceito sobre tipos de correlação, avalie as seguintes asserções e a relação proposta entre elas:A correlação simples indica o relacionamento entre uma variável dependente com outras várias independentes PORQUEA correlação múltipla indica a relação existente entre duas variáveis.A respeito dessas asserções, assinale a alternativa correta.Alternativas: a) As asserções I e II são proposições verdadeiras, mas a II não justifica a I. b) As asserções I e II são proposições verdadeiras e a II justifica a I. c) A asserção I é uma proposição verdadeira e a II, falsa. d) A asserção I é uma proposição falsa e a II, verdadeira. e) As asserções I e II são proposições falsas.2) A regressão linear é usada em tudo, desde ciências biológicas, comportamentais, ambientais e sociais até negócios. Modelos de regressão linear se tornaram uma forma comprovada de prever o futuro cientificamente e com confiança. Como a regressão linear é um procedimento estatístico há muito estabelecido, as propriedades de modelos de regressão linear são bem compreendidas e podem ser treinadas muito rapidamente.Com base nas informações descritas e no conceito sobre regressão linear, avalie as seguintes asserções e a relação proposta entre elas:A regressão linear é considerada simplista, dentre outros aspectos, por causa do uso de um modelo bivariadoPORQUEO RMSE simboliza a distância média entre as previsões e a linha de regressão. A respeito dessas asserções, assinale a alternativa correta.Alternativas: a) As asserções I e II são proposições verdadeiras, mas a II não justifica a I. b) As asserções I e II são proposições verdadeiras e a II justifica a I. c) A asserção I é uma proposição verdadeira e a II, falsa. d) A asserção I é uma proposição falsa e a II, verdadeira. e) As asserções I e II são proposições falsas.3) A análise de cluster, ou clustering, representa o agrupamento de objetos de forma que cada um destes objetos tenha alguma similaridade com os outros membros do grupo. Estes elementos podem se agrupar se utilizando de diferentes parâmetros, como a densidade nas áreas de seu espaço amostral.Sobre o agrupamento de dados por densidade, julgue as afirmativas a seguir em (V) Verdadeiras ou (F) Falsas.( ) Os grupos de dados recebem a cada interação, novos objetos.( ) Os objetos que tem maior proximidade são inseridos aos grupos.( ) São ideais por demandas por agrupamentos com formas arbitrárias.( ) Os objetos mais distantes são inseridos aos grupos.Assinale a alternativa que apresenta a sequência CORRETA:Alternativas: a) V – V – F – F. b) F – F – V – V. c) V – F – V – F. d) V – F – V – V. e) V – V – V – F.4) As regras de associação de dados estão inseridas em um contexto de tratamento de dados, e seguem determinadas regras e modelos que garantem a construção de uma boa base, eficiente e confiável de informações. Sobre os modelos de seguidos pelas regras de associação de dados analise o excerto a seguir, completando suas lacunas.O modelo das regras de associação de dados tipo ____________ está baseado nas associações significantes, que são representados pelas ____________, em que são contados os ____________ englobando todas com ocorrência anterior e posterior a utilização da regra.Assinale a alternativa que preenche corretamente as lacunas.Alternativas: a) suporte / transações / itemsets. b) confiança / anomalias / domínios. c) suporte / associações / erros. d) Agregação / interpretações / ruídos. e) Sequencial /instâncias / itemsets.
Responda

Helpful Social

Copyright © 2024 ELIBRARY.TIPS - All rights reserved.