Articles
Register
Sign In
Search
KetliChaves
Ambicioso
0
Followers
27
Questões
65
Respostas
KetliChaves
July 2023 | 1 Respostas
Sobre criação de bancos de dados em ambiente R, avalie as afirmações a seguir e assinale (V) para verdadeira e (F) para falsa. ( ) Um objeto do tipo data frame é mais genérico que um objeto do tipo matriz. ( ) O comando para selecionar as duas primeiras colunas de conjuntos de dados denominado “dados” é dados[1:3]. ( ) O comando R para selecionar uma variável de um banco de dados é igual a “nome_variável$dados”. ( ) Para juntar vetores em colunas, utiliza-se a função cbind( ) em linguagem R. ( ) O comando aggregate( ) resume variáveis quantitativas segundo algumas variáveis categórica. Assinale a alternativa que contenha a sequência correta: Alternativas: a) F – V – V – F – F. b) F – V – F – V – F. c) V – F – F – V – V. d) V – V – V – V – V. e) F – F – F – F – F. Código da questão: 47615
Responda
KetliChaves
July 2023 | 1 Respostas
O RStudio apresenta uma série de funcionalidades que facilitam a utilização da linguagem R em seu ambiente. Considerando esta informação, avalie as afirmativas a seguir. I. Ao digitar uma linha de comando no editor de códigos do RStudio só é possível executar tal comando apertando a tecla enter. II. A utilização de um pacote do R é realizada quando se deseja fazer uso dos scripts nele existente. III. Só é possível instalar pacotes no RStudio se estiver com o computador conectado à internet. IV. A utilização de um pacote específico do R só pode ser realizada se ele for carregado na sessão de trabalho. V. Os argumentos de uma função do R não podem ser omitidos quando uma função específica for utilizada. Assinale a alternativa que contém as afirmativas verdadeiras. Alternativas: a) II, III e IV. b) I, II e IV. c) III e V. d) I, IV e V. e) III, IV e V. Código da questão: 47599
Responda
KetliChaves
July 2023 | 1 Respostas
O programa R é um software para análise estatística de dados. É um programa que está em crescimento quanto ao número de usuários, movimento motivado por uma série de fatores que influenciam na decisão de utilizá-lo. A respeito do programa R, avalie as afirmativas a seguir. I. O R é um programa gratuito e de código aberto (open source). II. A linguagem R foi desenvolvida por John Chambers e colaboradores. III. A linguagem R é baseada em linhas de comando e é semelhante à linguagem S. IV. Os argumentos das funções da linguagem R devem ser escritos sempre dentro de parênteses. Assinale a alternativa que contenha as afirmativas CORRETAS. Alternativas: a) I, II e III. b) Apenas I. c) I, II, III e IV. d) Apenas IV. e) I e II. Código da questão: 47590
Responda
KetliChaves
July 2023 | 1 Respostas
Os modelos preditivos podem ser implementados em linguagem R de diversas formas. Sobre a aplicação de modelos preditivos para classificação em linguagem R, avalie as afirmativas a seguir. I. Para criar um modelo de classificação no R, o banco de dados é dividido em duas partes iguais. II. A função factor( ) converte uma variável para quantitativa. III. A função summary( ) exibe um resumo descritivo das variáveis de um conjunto de dados. IV. A função sample(ncol(dados), 0.7*nrow(dados)) seleciona parte das linhas de um conjunto de dados. V. A função table( ) cria uma tabela de resultados de variáveis. Assinale a alternativa que contém as afirmativas CORRETAS. Alternativas: a) I, II e III, apenas. b) I, II, III, IV e V. c) III, IV e V, apenas. d) III e V, apenas. e) I, II e IV, apenas. Código da questão: 47619
Responda
KetliChaves
July 2023 | 1 Respostas
A linguagem R, quando utilizada para cálculos mais complexos, necessita fazer uso do conceito de objeto ou variável para a correta manipulação de dados. Com base no texto, avalie as afirmativas sobre e assinale (V), se verdadeiras, e (F), se falsas. ( ) Objeto ou variável é uma estrutura pré-definida que recebe um valor ou resultado de um comando. ( ) A criação de um objeto só pode ser feita através do uso do símbolo de atribuição “< -“. ( ) O nome de um objeto só pode ser iniciado com letra, maiúscula ou minúscula. ( ) Ao digitar o comando 15 - > y.A está sendo criado o objeto com nome 15 que recebe o conteúdo y.A . Assinale a alternativa que contenha a sequência CORRETA: Alternativas: a) F – F – F – F. b) F – V – F – V. c) F – F – V – V. d) V – V – F – F. e) V – F – V – F. Código da questão: 47600
Responda
KetliChaves
July 2023 | 1 Respostas
A estatística, assim como as outras ciências, foi construída ao longo dos tempos. Ao longo desta construção, uma série de acontecimentos marcou o processo de construção da estatística. Sobre os acontecimentos registrados na história da estatística, avalie as afirmativas a seguir. I. A primeira vez que o termo estatística foi utilizado aconteceu por volta do século XVII. II. A história atribui ao austríaco Gottfried Achemmel a criação do termo estatística. III. A palavra estatística é originária da palavra latina status, que era um termo relacionado ao Estado. IV. A criação da palavra estatística é atribuída a um personagem da história de origem alemã. V. O primeiro levantamento estatístico que se tem registrado na história foi realizado por Heródoto. Assinale a alternativa que contém as alternativas verdadeiras. Alternativas: a) III e IV. b) I, II e IV. c) I, II e III. d) III, IV e V. e) II e III. Código da questão: 47589
Responda
KetliChaves
July 2023 | 1 Respostas
Existem diversas maneiras de elaboração de um banco de dados em linguagem R. Sobre esta característica, avalie as afirmativas a seguir. I. As estruturas de arranjos de dados em linguagem R são classificadas como escalares, vetores, matrizes, arrays, data frames e listas. II. Um banco de dados escalar em linguagem R tem dimensão de uma linha e várias colunas. III. Um banco de dados do tipo data frame pode possuir diversos tipos de variáveis. IV. Em linguagem R, as variáveis categóricas são classificadas como factor. V. Em linguagem R, denomina-se objeto qualquer elemento que possa ser atribuído a uma variável. São verdadeiras: Alternativas: a) I, II, IV e V, apenas. b) I, II e IV, apenas. c) IV e V, apenas. d) III e V, apenas. e) I, III, IV e V, apenas. Código da questão: 47614
Responda
KetliChaves
July 2023 | 1 Respostas
Leia e associe as duas colunas: I. Preparação dos dados para modelagem II. Treinamento e avaliação do modelo. III. Otimização do modelo escolhido. A. Busca aleatória pelos melhores hiperparâmetros de um modelo específico. B. Aplicação de um ou mais algoritmo de machine learning. C. Utiliza técnicas de engenharia de atributos para construir um conjunto de daos pronto para modelagem. Assinale a alternativa que traz a associação correta entre as duas colunas: Alternativas: I – C; II – A; III – B. I – C; II – B; III – A. I – A; II – C; III – B. I – B; II – A; III – C. I – B; II – C; III – A. Código da questão: 61718
Responda
KetliChaves
July 2023 | 1 Respostas
A respeito da avaliação de modelos preditivos, é correto afirmar que: Alternativas: a) Os dados históricos devem ser divididos em subconjuntos distintos para fins experimentais. b) Uma mesma medida de desempenho pode ser aplicada em problemas de regressão e classificação. c) A avaliação é realizada sobre os dados de treinamento durante a otimização do modelo. d) A estimação ou classificação sobre novos dados é realizada antes da etapa de treinamento. e) A avaliação é realizada sobre os dados de treinamento em problemas de regressão. Código da questão: 61706
Responda
KetliChaves
July 2023 | 1 Respostas
Otimizar um modelo é uma etapa importante em projetos de ciência de dados. A respeito da otimização de modelos preditivos, é correto afirmar que: Alternativas: a) A base da classificação de dados é a otimização de modelos preditivos em um processo centrado na aprendizagem de dados. b) O desempenho de um modelo de classificação depende da otimização de hiperparâmetros realizada em conjunto com a regularização. c) O processo de otimização se caracteriza pela busca de parâmetros e hiperparâmetros ótimos em um conjunto pré-definido de modelos. d) O preditor de base é a referência do processo de otimização algorítmica, sendo responsável por predizer o desempenho dos modelos lineares. e) A otimização corresponde ao processo de melhora no desempenho preditivo, realizado antes da implantação do modelo em produção. Código da questão: 61713
Responda
KetliChaves
July 2023 | 1 Respostas
A ___________ é uma estratégia alternativa à matriz de confusão para a avaliação de problemas preditivos. Nessa estratégia, devemos construir um ___________ e nele plotar o desempenho do modelo observando os resultados ___________ e ___________, respectivamente aos eixos X e Y. Assinale a alternativa que completa adequadamente as lacunas: Alternativas: a) Análise ROC; gráfico bidimensional; da taxa de falsos positivos; da taxa de verdadeiros positivos. b) Estratégia ROC; gráfico bidimensional; da taxa positiva; da taxa negativa. c) Curva ROC; gráfico; de falsos positivos; de verdadeiros positivos. d) Análise ROC; gráfico; da taxa de verdadeiros positivos; da taxa de falsos positivos. e) Curva ROC; gráfico bidimensional; de verdadeiros positivos; de falsos positivos. Código da questão: 61707
Responda
KetliChaves
July 2023 | 1 Respostas
Sobre overfitting, underfitting e as técnicas de regularização, podemos afirmar que: I. Overfitting corresponde ao comportamento de modelos preditivos que não generalizam bem além dos dados de treinamento. II. Underfitting é uma característica dos modelos de classificação que favorece o desempenho preditivo do estimador. III. Tanto overfitting quanto underfitting prejudicam a generalização dos modelos preditivos. IV. Técnicas de regularização podem ser utilizadas para evitar overfitting. São verdadeiras: Alternativas: a) II e IV, apenas. b) II, III e IV, apenas. c) I e II, apenas. d) I, apenas. e) I, III e IV, apenas. Código da questão: 61712
Responda
KetliChaves
July 2023 | 1 Respostas
Leia e associe as duas colunas: I. Classificação II. Agrupamento III. Mineração de itens frequentes A. Reunir clientes em grupos por similaridade B. Discriminar clientes entre bons e mas pagadores. C. Encontrar um perfil de cliente por associação entre os produtos comprados por cada um. Assinale a alternativa que traz a associação correta entre as duas colunas: Alternativas: a) I – B; II – C; III – A. b) I – B; II – A; III – C. c) I – A; II – C; III – B. d) I – A; II – B; III – C. e) I – C; II – B; III – A. Código da questão: 61697
Responda
KetliChaves
July 2023 | 1 Respostas
A composição dos atributos é uma peça fundamental na modelagem preditiva. Em geral, eles descrevem as características do problema e indicam um possível caminho ao analista para encontrar a solução. Diante disso, responda: qual é o papel dos atributos na análise e modelagem preditiva? Alternativas: a) O propósito da seleção de atributos na modelagem preditiva é otimizar o desempenho do estimador, especialmente dos classificadores. b) A análise e modelagem preditiva dependem menos dos atributos do que dos algoritmos empregados na solução. c) Um atributo deve ser suficientemente explicativo em qualquer contexto de predição. d) Uma desvantagem da seleção de atributos é a necessidade de seleção manual das características que formatam o problema. e) Os atributos devem ser selecionados de acordo com critérios que respondam ao negócio a fim de reduzir as incertezas sobre o problema. Código da questão: 61708
Responda
KetliChaves
July 2023 | 1 Respostas
A ciência de dados pode ser formulada a partir de um processo que enxergue o desenvolvimento de projetos analíticos como uma série de etapas, que vão da __________ até a _________ do que foi construído. Entre essas etapas, o cientista de dados ou especialista em Analytics deverá aplicar estratégias para obter e __________, preparar os dados obtidos para modelagem, executar o treinamento e a avaliação dos modelos e, finalmente, _________ o melhor modelo da etapa anterior. Assinale a alternativa que completa adequadamente as lacunas. Alternativas: a) Análise do problema de negócio; distribuição; visualizar dados; otimizar. b) Análise de dados; implantação; pré-processar dados; implantar. c) Análise de dados; distribuição; visualizar dados; otimizar. d) Análise do problema de negócio; pré-processar; visualizar dados; otimizar. e) Análise do problema de negócio; implantação; visualizar dados; implantar. Código da questão: 61721
Responda
KetliChaves
July 2023 | 1 Respostas
A tarefa analítica que melhor descreve o propósito de discriminar um indivíduo entre conjuntos preexistentes é: Alternativas: a) A regressão. b) A mineração de itens frequentes. c) A redução de dados. d) O agrupamento. e) A classificação. Código da questão: 61700
Responda
KetliChaves
July 2023 | 1 Respostas
Sobre as diferentes abordagens para seleção de atributos, podemos afirmar que: I. Na abordagem filtro, a seleção de atributos acontece durante a aprendizagem. II. Na abordagem embutida, a seleção de atributos acontece antes da aprendizagem. III. Na abordagem filtro, os atributos menos importantes são filtrados conforme um critério. IV. Na abordagem wrapper, um critério do algoritmo é utilizado para realizar a seleção de atributos. São verdadeiras: Alternativas: a) III, apenas b) I, II e IV, apenas. c) II e IV, apenas. d) I e III, apenas. e) II, apenas. Código da questão: 61698
Responda
KetliChaves
July 2023 | 1 Respostas
1) Medidas de tendência central descrevem a posição de um elemento dentro do conjunto de dados, ou seja, são medidas que fornecem uma ideia de todo os elementos, como as de tendência central: média, mediana e moda. A média (x ̅) de um conjunto de dados é encontrada por meio da soma de todos os números no conjunto de dados e depois dividindo pelo número de valores no conjunto. Com base nesse conceito, determine a média da distribuição a seguir: [6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2] Alternativas: a) 14.5. b) 12. c) 11.40. d)13. e) 10.39.
Responda
KetliChaves
July 2023 | 1 Respostas
Uma variável é uma característica de uma unidade observada que pode assumir mais de um conjunto de valores, tipos e mensurações. Logo, defina o tipo de mensuração que tem as variáveis: sexo, cor dos olhos e cor da pele. Alternativas: a) Contínua. b) Razão. c) Ordinal. d) Nominal. e) Intervalar
Responda
KetliChaves
July 2023 | 1 Respostas
A distribuição de uma variável é definida como a quantidade de vezes que cada resultado possível pode ocorrer dentre várias tentativas. Com base nesse conceito, vamos supor que você trabalha em uma fábrica que produz geladeiras e precisa estimar o tempo de funcionamento esperado das geladeiras produzidas. Descreva qual distribuição de probabilidade que podemos usar para calcular esse tempo? Alternativas: a) Distribuição Poisson. b) Distribuição binomial. c) Distribuição normal. d) Distribuição uniforme. e) Distribuição exponencial.
Responda
KetliChaves
July 2023 | 1 Respostas
A limpeza dos dados é um processo muito importante que antecede sua exploração, com base nesse processo, podemos extrair inconsistências e valores faltosos. A limpeza contém vários métodos para tratar as informações. Com base nesse texto, identifique o comando para remover a coluna B de um conjunto de dados Alternativas: a) data.fillna(data.mean(0)). b) data.drop('data', inplace=True, axis=B). c) data.drop('B', inplace=True, axis=0). d) data.drop('B', inplace=True, axis=1). e) data.fillna(data.mean(B)).
Responda
KetliChaves
July 2023 | 1 Respostas
Um conjunto de dados com valores inconsistentes pode não fornecer insumos suficientes para gerar uma boa análise. Informações consistentes, sem duplicação, atualizadas e formatadas são fundamentais para uma boa análise. A precisão é essencial para uma análise com alta qualidade. Dados com problemas precisam ser identificados e tratados. Em relação à qualidade dos dados, marque V para a opção verdadeira e F para a falsa. ( ) O pré-processamento de dados é uma técnica de exploração para transformar dados brutos coletados em informações mais limpas. ( ) No pré-processamento, os dados não são transformados ou codificados, a técnica precisa do auxílio de algoritmos de machine learning para isso. ( ) A normalização reorganiza os dados de maneira que os valores se tornem úteis apenas para serem processados por algoritmos. ( ) A normalização formata os dados e os converte de forma que permite processamento e análise adicionais. Assinale a alternativa que contenha a sequência correta: Alternativas: a) F – F – V – V. b) F – F – F – F. c) V – F – V – V. d) V – F – F – V. e) F – F – V – F.
Responda
KetliChaves
July 2023 | 1 Respostas
A análise de dados fornece suporte para extrair informações e realizar inferências que tragam escopo e suporte para a tomada de decisão de um negócio. À medida que o mercado se torna mais impulsionado pela tecnologia e rapidez nas informações, a análise de dados tem um papel cada vez mais importante nos negócios. Acerca desse tema, analise as afirmativas a seguir e classifique-as em verdadeiras (V) ou falsas (F): ( ) Existem somente técnicas de visualização de dados. ( ) Um parâmetro faz uma descrição sobre as características da população. ( ) A análise de dados pode ser aplicada somente no setor gerencial de uma empresa. ( ) Gráficos facilitam a comunicação dos resultados. Assinale a alternativa que contenha a sequência correta: Alternativas: a) V – F – F – F. b) V – V – V – F. c) V – V – F – V. d) F – V – F – V. e) F – F – F – V.
Responda
KetliChaves
July 2023 | 1 Respostas
Em um banco de dados, muitas vezes, encontramos dados nulos. Esses valores precisam ser removidos do DataFrame antes da exploração de dados. O Python fornece vários métodos para limpeza e tratamento. Portanto, ao analisar o conjunto de dados a seguir, notamos que existem alguns valores nulos. Figura 1 – Conjunto de dados Fonte: elaborada pela autora. Vamos supor que seja necessário substituir os valores nulos pelas médias dos valores. Qual opção a seguir indica o método para substituir os valores pela média? Alternativas: a) data.fillna(data.mean(A)). b) data.fillna(data.mean(0)). c) data.drop('data', inplace=True, axis=mediana). d) data.fillna(data.mean(A e C)). e) data.drop('data', inplace=True, axis=media).
Responda
1
2
»
Helpful Links
Sobre nós
Política de Privacidade
Termos e Condições
direito autoral
Contate-Nos
Helpful Social
Get monthly updates
Submit
Copyright © 2024 ELIBRARY.TIPS - All rights reserved.