Articles
Register
Sign In
Search
milenaguarda963
Ambicioso
0
Followers
26
Questões
8
Respostas
milenaguarda963
December 2023 | 2 Respostas
A regra é determinada por quão bem a parte e o todo da declaração são medidos. Esses valores são calculados com base no tamanho de cada conjunto de itens, especificamente a parte e a lâmina completa. Um valor de suporte de regra alto significa que muitas pessoas acham a regra interessante. As regras com alto suporte têm muitos exemplos no banco de dados. Isso ocorre porque eles incluem muitas regras com poucos exemplos.Com relação às medidas de interesse apresentadas, assinale a alternativa correta.a.Medidas de interesse.b.Compreensibilidade e grau de interesse.d.Lift e convicção.e.Suporte e confiança.
Responda
milenaguarda963
December 2023 | 2 Respostas
Ao contrário das regras de classificação, as regras de associação podem prever qualquer atributo em vez de apenas classe. Isso leva à capacidade de prever qualquer combinação de atributos junto com suas regras associadas. Eles não devem ser usados juntos e raramente são aplicados em conjunto com as regras de classificação. Diferentes regras de associação avaliam diferentes regularidades de banco de dados e, geralmente, correlacionam coisas diferentes de uma forma que se estimam relacionamentos entre objetos diferentes. A mineração de regras de associação pode ser realizada com diferentes algoritmos. Apriori, foi o primeiro algoritmo de mineração de regras de associação que foi criado. Outros métodos de mineração de dados usam variações de Apriori. Com relação ao processo geral de minerar regras de associação, avalie as afirmativas a seguir. I. Pré-processamento da base: preparar um banco de dados transacional para mineração de regras II. Análise das regras: análise de metodologia a ser utilizada para as regras de associação ocorrerem da melhor forma. III. Geração do conjunto de itens frequentes: é formada quando ocorre pelo menos um certo número de transações. IV. Mineração das regras: é utilizado um processo que envolve o uso apenas de itens de base frequentes em uma ordem específica. É correto o que se afirma em: a. I, II e III, apenas. b. I e III, apenas. c. I e II, apenas. d. I, apenas. e. I, III e IV, apenas.
Responda
milenaguarda963
December 2023 | 1 Respostas
Sobre a análise de regras de associação, indique a alternativa que contém somente exemplos de onde essas regras são frequentemente utilizadas. I. Realização de promoções. II. Campanhas de marketing. III. Identificação de categorias de produtos. IV. Vendas casadas. I, II e III, apenas. III e IV, apenas. I, II e IV, apenas. II e III, apenas. I e IV, apenas.
Responda
milenaguarda963
December 2023 | 1 Respostas
Sobre as características do algoritmo FP-Growth, escolha a alternativa que contém somente afirmações corretas a respeito do algoritmo. I. Cada nó na sub-árvore de itens frequentes (FP-Tree) possui três campos: nome_do_item, contagem e link para outro nó (ligação_do_nó). II. O FP-Growth usa uma estrutura de matriz para armazenar o conjunto de itens frequentes de forma comprimida. III. O conjunto de itens frequentes armazenado pela FP-Growth é, no pior caso, do mesmo tamanho da base transacional original. IV. O FP-Growth usa uma estrutura de árvore para armazenar o conjunto de itens frequentes de forma comprimida. I e III, apenas. I e IV, apenas. III e IV, apenas. I, III e IV, apenas. II e III, apenas.
Responda
milenaguarda963
November 2023 | 1 Respostas
Uma árvore de itens usada com frequência é chamada de “FP-Tree”. Ela tem um nulo como raiz, sendo que cada subárvore de itens tem uma tabela de cabeçalho de itens frequentes como filhos. Cada nó da árvore possui três campos: nome do item, contagem do número de transações representadas pela parte do caminho que passa por aquele nó e um link para o próximo nó ou nulo (a raiz). Cada entrada na tabela de cabeçalho usada com frequência contém um nome de nó e um link para o primeiro nó que compartilha esse nome. Além disso, cada entrada possui dois outros campos: um nome para o item e um link para o primeiro nó que compartilha esse nome. Avalie as afirmações a seguir sobre construção da FP-Tree e as correlacione adequadamente aos termos ou às ferramentas às quais se referem. 1. Determinação da lista de itens frequentes. 2. Construção da árvore. 3. Função InsertTree([p|P],Tree). I. A árvore possui um descendente D, então, incremente a contagem de D em 1. II. Dados os parâmetros de entrada relativos ao suporte mínimo, minsup, leia o banco de dados. III. Chamada simplesmente de Tree e o rotule como null. Assinale a alternativa que correlaciona adequadamente os dois grupos de informações. a. 1-II; 2-III; 3-I. b. 1-III; 2-I; 3-II. c. 1-III; 2-II; 3-I. d. 1-I; 2-III; 3-II. e. 1-I; 2-II; 3-III.
Responda
milenaguarda963
November 2023 | 1 Respostas
vObserve a representação binária da base transacional abaixo contendo cinco transações com itens comprados em um supermercado. Escolha a alternativa que indica corretamente o valor de Lift da regra {Pão} -> {Manteiga}. Lift = ~ 0,93 Lift = ~ 0,53Lift = ~ 0,77Lift = ~ 0,66Lift = ~ 1,2
Responda
milenaguarda963
November 2023 | 1 Respostas
A mineração de itens frequentes requer a mineração de um algoritmo eficiente que possa minerar todo o conjunto. No entanto, construir uma FP-Tree não é suficiente. Pesquisas adicionais são necessárias para criar um algoritmo eficiente que também possa minerar itens frequentes com eficiência. Esse processo envolve uma técnica de “avançar e dividir” chamada “FP-Crescimento”. Ele divide o problema em subproblemas menores para que um método de “dividir e conquistar”, chamado “FP-Growth”, possa ser aplicado. Com base no método de construção de uma FP-Tree compacta, assinale a alternativa que melhor descreve esse processo. a. As regras com confiança mínima de 30% ou mais devem ser selecionadas antes de qualquer outra regra. Isso ocorre porque todas as regras suportadas têm uma confiança superior a 30%, e o cálculo da confiança é necessário ao selecionar quais regras usar. b. No algoritmo Apriori, que gera repetidamente um conjunto de itens de ocorrência frequente, é necessário combinar os dois itens selecionados em três, com o objetivo de determinar seu suporte. c. Para o algoritmo Apriori e o algoritmo FP-Growth, um conjunto inicial de itens com frequência maior do que o suporte mínimo atribuído, minsup, deve ser selecionado. Isso pode ser feito usando o algoritmo FP-Growth ou o algoritmo Apriori. d. O algoritmo explora a FP-Tree das folhas até a raiz. Seja um nó na folha da FP-Tree. Em seguida, ele encontra os conjuntos de itens frequentes de o e continua até o-1. Após a exploração até a raiz, ele continua explorando as árvores até o-2, e assim por diante. e. Primeiro, combine dois itens do conjunto inicial em um único item. Em seguida, determine o suporte para cada par de itens e elimine quaisquer pares com menos de 30% de suporte. Em seguida, o algoritmo Apriori é usado para gerar o conjunto de itens frequentes.
Responda
milenaguarda963
November 2023 | 1 Respostas
Para agrupar objetos, é necessário definir a sua similaridade ou distância de outros grupos. Esses métodos usam dados sobre a distância entre grupos de objetos agrupados semelhantes e diferentes. Muitos algoritmos de agrupamento medem a proximidade dos objetos calculando as medidas de distância a partir das medidas de dissimilaridade. Antes de calcular a distância, um banco de dados deve identificar se contém dados numéricos, categóricos ou ambos. Com relação a alguns tipos de medidas de similaridade, avalie as afirmativas a seguir. I. Medidas para dados categóricos são empregadas em dados categóricos e costumam ser atribuídas por intervalos de 0 e 1 ou 0% a 100%. II. Medidas de similaridade para dados nominais são empregadas em dados completamente diferentes ou quando não existe alguma similaridade. III. Medidas de similaridade para dados ordinais são semelhantes ao atributo ordinal, sendo que a diferença é que o atributo ordinal é ordenado por algum critério. IV. Medidas de similaridade para dados nominais e ordinais são a união de semelhanças entre o atributo de dados ordinais e os dados nominais, sendo objetos diferentes, de formas ordenadas. É correto o que se afirma em: a. I e II, apenas. b. I e III, apenas. c. I, II e IV, apenas. d. I, apenas. e. I, II e III.
Responda
milenaguarda963
November 2023 | 2 Respostas
Para entender um banco de dados, é necessário analisar suas principais características. É por isso que a ___________________(Lacuna 1) é usada para descrever, simplificar e resumir as informações contidas em um banco de dados. Uma distinção entre ADD e mineração de dados é que o primeiro se concentra em descrever o que está _______________(Lacuna 2), enquanto o último analisa os dados e tenta tirar _____________(Lacuna 3) sobre algo fora deles. Preencha as lacunas escolhendo a alternativa CORRETA. a. Análise de dados descritiva (ADD), fora dos dados, conclusões. b. Knowledge Discovery in Databases (KDD), dentro dos dados, início. c. Knowledge Discovery in Databases (KDD), fora dos dados, conclusões. d. Análise de dados descritiva (ADD), dentro dos dados, conclusões. e. Knowledge Discovery in Databases (KDD), fora dos dados, início.
Responda
milenaguarda963
November 2023 | 2 Respostas
Quando se integram bases de dados diferentes, que podem ter valores ausentes ou ruídos, é comum encontrar dados que não seguem um padrão único. Por exemplo, um mesmo atributo pode ter variações na escrita ou na unidade de medida. Para resolver esses problemas, é necessário padronizar os dados. Em relação ao objetivo principal da padronização , avalie as afirmativas a seguir. Capitalização: costuma-se padronizar as fontes, geralmente para maiúsculas. Conversão de unidades: todas as informações precisam ser mudadas para ficarem com diferentes tipos. Caracteres especiais: conjunto de caracteres pode influenciar o desempenho de certas ferramentas de mineração de dados. Padronização de formatos: podemos usar formatos variados para certos atributos, como números de documentos e datas. Está correto o que se afirma em: a. I, III e IV, apenas. b. II e III apenas. c. I, II e III, apenas. d. III e IV apenas. e. I, apenas.
Responda
milenaguarda963
November 2023 | 1 Respostas
Pode-se considerar intuitivamente que quanto maior a quantidade de objetos e atributos, maior a quantidade de informações disponíveis para o algoritmo de mineração de dados. No entanto, um aumento no número de objetos e na dimensão do espaço (número de atributos na base) pode resultar em dados esparsos e medidas matemáticas instáveis na análise. Além disso, uma grande quantidade de objetos e atributos pode tornar o processamento dos algoritmos de mineração complexo, assim como os modelos gerados. No entanto, é importante destacar que os métodos de redução de dados devem manter a integridade dos dados originais. A mineração dos dados reduzidos deve ser mais eficiente, mas não menos eficaz. Em relação aos tipos de redução de dados, observe as afirmativas a seguir. Seleção de atributos (ou características): realiza-se uma técnica de redução de dimensionalidade em que atributos considerados irrelevantes, pouco relevantes ou redundantes são identificados e eliminados. Discretização: os valores de atributos são substituídos por intervalos ou níveis conceituais mais baixos, aumentando a quantidade final de atributos, deixando informações mais completas. Compressão de atributos: realiza-se uma técnica de redução de dimensionalidade por meio da aplicação de algoritmos de codificação ou transformação de atributos, em vez de selecionar atributos para remoção. Está correto o que se afirma em: a. I, II e III, apenas. b. I e II, apenas. c. I e III, apenas. d. I, apenas. e. II e III , apenas
Responda
milenaguarda963
November 2023 | 1 Respostas
A normalização é um processo de transformação de dados que tem como objetivo torná-los mais adequados para a aplicação de algoritmos de mineração, tais como redes neurais artificiais ou métodos baseados em distância. A normalização pode ser necessária por diversos motivos, como prevenir a saturação dos neurônios em redes neurais artificiais com múltiplas camadas e garantir que cada atributo de entrada tenha o mesmo intervalo de valores. Em relação aos quatro tipos de normalização, avalie as afirmativas a seguir. Normalização Max-Min: uma técnica de pré-processamento de dados que transforma os valores de um atributo em uma escala entre 0 e 1, usando o valor máximo e mínimo do atributo. Essa técnica é útil para padronizar os dados e evitar a influência de valores extremos ou discrepantes. Normalização pelo escore-z: um método estatístico que unifica os valores de uma variável em unidades de desvio padrão em relação à média. Esse método permite comparar variáveis iguais que possuem escalas ou unidades iguais. Normalização pelo escalonamento decimal: um método de transformar dados numéricos em valores entre 0 e 1, dividindo cada valor pelo maior valor absoluto da coluna. Esse método preserva a proporção e a ordem dos valores originais, mas pode ser sensível a outliers. Normalização pelo range interquartil: um método estatístico que visa reduzir a influência de valores extremos nos dados. Consiste em subtrair a mediana dos dados e dividir pelo intervalo interquartil, que é a diferença entre o terceiro e o primeiro quartil. Está correto o que se afirma em: a. II e III apenas. b. I, II e III, apenas. c. I, III e IV, apenas. d. I, apenas. e. III e IV apenas.
Responda
milenaguarda963
November 2023 | 1 Respostas
Business Intelligence (BI) se refere à etapa de buscar a informação, organizar, fazer análise, distribuição e acompanhamento de informações de suporte à gestão empresarial. É um conjunto de tecnologias e ferramentas que ajudam a transformar dados brutos em informações significativas e úteis para a análise de negócios. A tecnologia de BI pode suportar grandes volumes de dados não estruturados para auxiliar a localizar, produzir e até mesmo criar novas estratégias de negócios. Com base nesses aspectos de um Business Intelligence (BI), assinale a alternativa que melhor descreve as diferenças que existem entre BI e DS (Data Science). a. Um Data Scientist trabalha principalmente com dados estruturados, enquanto um profissional de BI trabalha principalmente com dados não estruturados. b. Um Data Scientist é responsável por criar modelos preditivos e prescritivos, enquanto um profissional de BI é responsável por gerar relatórios e dashboards. c. Um Data Scientist é responsável por coletar e organizar dados, enquanto um profissional de BI é responsável por analisar e interpretar dados. d. BI tem como objetivo as tomadas de decisões para o futuro e atuais, já o DS tem como objetivo a tomada de decisões para o futuro e atuais. e. Um Data Scientist utiliza principalmente ferramentas de análise estatística e modelagem, ja o BI utiliza principalmente ferramentas de visualização de dados.
Responda
milenaguarda963
November 2023 | 1 Respostas
A distribuição dos dados apresenta uma imagem clara de sua natureza e é usada para construir gráficos importantes, como gráficos de pizza, histogramas e gráficos de barras por meio do uso de distribuições de frequência. Com base nas informações referentes às definições dos algoritmos de construção de uma distribuição de frequência, identifique se são verdadeiras (V) ou falsas (F) as afirmativas a seguir. ( ) Classes: são intervalos do qual irá dividir os valores dos atributos. ( ) Fronteiras de classes: é a informação utilizada para diferenciar as classes. ( ) Pontos médios de classes: pontos intermediários que separam cada classe. ( ) Tamanhos de classes: as dimensões de quantidades de informações na classe. Assinale a alternativa que apresenta a sequência correta. a. V - F - V - F. b. V - V - F - F. c. V - V - V - F. d. V - F - F - F. e. F - F - V - V.
Responda
milenaguarda963
November 2023 | 1 Respostas
bre a dimensionalidade de atributos usados na análise descritiva de dados, qual das alternativas abaixo está correta? As análises descritivas tendem a ser bivariadas. As análises descritivas devem ser sempre univariadas. As análises descritivas devem sempre mesclar todos os atributos em um só. As análises descritivas são sempre multivariadas, contendo ao menos três atributos. De maneira geral, as análises descritivas são univariadas ou bivariadas
Responda
milenaguarda963
November 2023 | 1 Respostas
A visualização de dados é a demonstração de dados de forma mais completa em forma ___________(Lacuna 1) ou pictórica (representações visuais), que tem como principal papel entender a natureza das distribuições de dados, _________________(Lacuna 2) de forma mais fácil e rápida e autorizando o compartilhamento desse conhecimento de forma mais parecida no meio de distintas entidades e pessoas. Os técnicos de visualização auxiliam a descobrir ___________(Lacuna 3) que não são evidentes simplesmente observando os dados. Preencha as lacunas escolhendo a alternativa CORRETA. a. Sintética, apresentando, insights. b. Gráfica, apresentando, insights. c. Sintética, extraindo conhecimento, métodos. d. Gráfica, extraindo conhecimento, insights. e. Gráfica, apresentando, métodos.
Responda
milenaguarda963
September 2023 | 1 Respostas
Para avaliar um modelo de regressão, os resíduos são bem úteis, por indicarem a divergência do conjunto de dados a um modelo. É comum, nesse procedimento, recorrer ao seu gráfico (gráfico de resíduos), por permitir avaliar visualmente o modelo de regressão de acordo com o conjunto de dados utilizados. A respeito do processo de avaliação do modelo de regressão múltipla, assinale a alternativa correta. a. Uma maior simplicidade no cálculo dos desvios padrão dos valores esperados para a regressão múltipla é percebida comparada com o cálculo dos desvios padrões da regressão linear simples. b. Os padrões t e F devem ser aplicados quando um gráfico de probabilidade normal se aproximar da linearidade. c. A divisão dos resíduos pelos seus respectivos desvios padrões estimados resultam nos chamados resíduos padronizados. d. Busca-se um gráfico de dispersão de resíduos padronizado construído a partir de cada preditor por y em que se visualisa um padrão discernível. e. A linearidade do gráfico dos resíduos padronizados indica que o desvio aleatório e tenha distribuição de probabilidade uniforme.
Responda
milenaguarda963
September 2023 | 2 Respostas
Em um estudo sobre os efeitos da y = concentração de álcool no sangue (mg/L) após a x = transpiração (ml/h) em pessoas jovens a partir de uma amostra de 10 pessoas, os dados mais relevantes do gráfico de dispersão elaborado foram:Com base nessas informações, assinale a alternativa que contém o coeficiente de determinação.a.432,84.b.1,8990.c.0,8990.d.0,5265.e.0,4734.
Responda
milenaguarda963
August 2023 | 1 Respostas
Matemática, a Computação e a Estatística são conteúdos próprios, ou áreas do conhecimento, que alicerçam a Ciência de Dados em suas diversas abordagens e aplicações, desde conceituações a métodos e bibliotecas associadas. Nesse contexto, assinale a alternativa que apresenta um aparato da linguagem Python voltado para matemáticos, cientistas e engenheiros, que permite a utilização de técnicas no âmbito computacional, no campo científico. a. Biblioteca Scipy. b. Biblioteca Matplotlib. c. Biblioteca Seaborn. d. Biblioteca Scikit-Learn. e. Biblioteca Pandas.
Responda
milenaguarda963
August 2023 | 2 Respostas
É sabido que a gestão estratégica das empresas não permite o achismo no contexto da tomada de decisão, já que tal processo é muito complexo. Além disso, hoje existe um __________________ cada vez mais denso de ___________________ que ajudam os gestores decisores no processo de tomada de decisão, já que permite uma tomada de decisão mais assertiva e confiável. Nesse contexto, surge o ___________________ que se traduz como uma técnica utilizada para impulsionar ________________________ em todos os níveis empresariais, sendo encarado como um tipo de _____________________ em sites ______________________________. Preencha as lacunas escolhendo a alternativa correta. a. O volume é o menor nível, informações, Seaborn, negócios, garimpo de dados, peculiares. b. O volume é o maior nível, informações, Web Scraping, planos, garimpo de dados, peculiares. c. O volume é o menor nível, informações, Web Scraping, negócios, garimpo de dados, peculiares. d. O volume é o menor nível, informações, Numpy, negócios, garimpo de dados, peculiares. e. O volume é o maior nível, informações, Web Scraping, negócios, garimpo de dados, peculiares.
Responda
milenaguarda963
August 2023 | 1 Respostas
Faça a correlação 1 – Stats Models. 2 – Bokeh. 3 – Scrapy. I – Caracteriza-se como sendo uma biblioteca do Python com visão interativa voltada para navegadores do mundo moderno vinculada a apresentações, tendo como intuito principal gerar uma obra apurada e sucinta no ambiente gráfico. II – É uma espécie de framework de acompanhamento web, concedendo a navegação no site para páginas que apresentam as informações devidamente procuradas e requisitadas. III - Em linhas gerais, trata-se de uma biblioteca que oferece uma complementação para Scipy para mensurações estatísticas, sejam descritivas sejam inferenciais.
Responda
milenaguarda963
August 2023 | 2 Respostas
Ao pensarmos nas relações entre coordenadas cartesianas e cilíndricas, sabemos que podemos relacionar o eixo y entre as diversas coordenadas (x, y, z). Além disso, existe uma correlação matemática entre esses dois tipos de coordenadas. Encontre a equação em coordenadas polares para a curva onde a equação em coordenadas cartesianas é apresentada por:[tex]x^3 +y^3 -6xy = 0[/tex]
Responda
milenaguarda963
July 2023 | 2 Respostas
Os Bancos de Dados (BD) estão presentes no cotidiano das pessoas de maneira completamente onipresente. Toda a operação realizada, na atualidade, passa por um BD para que possa ser concluída de maneira positiva ou negativa. Evidentemente, ao se buscar uma definição mais genérica sobre BD, a primeira que se pode lembrar/pensar é a de que bancos de dados são coleções de dados. Entretanto, a cada dia essa definição é enriquecida de significado, resultando em definições cada vez mais completas. Considerando o contexto dado, avalie as seguintes asserções e a relação proposta entre elas. Um banco de dados representa algum aspecto do mundo real, às vezes chamado de “minimundo” ou de “universo de discurso”. As mudanças no minimundo são refletidas no banco de dados. PORQUE Um banco de dados é uma coleção logicamente coerente de dados com algum significado inerente. Uma variedade aleatória de dados não pode ser corretamente chamada de banco de dados. A respeito dessas asserções, assinale a alternativa correta. a. A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. b. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I. c. As asserções I e II são proposições falsas. d. As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I. e. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
Responda
milenaguarda963
July 2023 | 2 Respostas
Um plano de negócios é um documento que define em detalhes os objetivos de uma empresa e a maneira como ela planeja atingir as próprias metas. Portanto, um plano de negócios estabelece um roteiro escrito para a empresa em consonância com os pontos de vista do marketing, do financeiro e do operacional. Tanto as startups quanto as empresas estabelecidas usam planos de negócios. Sobre o uso do plano de negócios no Brasil, assinale a alternativa correta. a. Foi o setor de softwares que deu início à popularização do plano de negócios, em 1990. b. Foi o setor agropecuário que deu início à popularização do plano de negócios, em 1980. c. Foi o setor de automóveis que deu início à popularização do plano de negócios, em 1960. d. Foi o setor de alimentos que deu início à popularização do plano de negócios, em 1990. e. Foi o setor de games que deu início à popularização do plano de negócios, em 1990.
Responda
1
2
»
Helpful Links
Sobre nós
Política de Privacidade
Termos e Condições
direito autoral
Contate-Nos
Helpful Social
Get monthly updates
Submit
Copyright © 2024 ELIBRARY.TIPS - All rights reserved.