As árvores e decisão são modelos aplicados tanto em problemas de classificação, como em problemas de regressão. Através das árvores é possível identificar os principais atributos que impactam no processo de decisão, bem como visualizar as regras definidas pelo modelo para classificar os exemplos ou para fazer previsões de valores, em caso de problemas de regressão. Essa visualização é possível através dos símbolos utilizados para compor uma árvore de decisão: os arcos ou ligações, os nós não folha e os nós folha.

Elaborado pelo professor, 2022.

Identifique a alternativa que descreve as respectivas representações dos arcos, dos nós não folha e dos nós folha.
Alternativas
Alternativa 1:
Um arco é uma representação das variáveis do modelo, um nó não folha são os valores dessas variáveis e um nó folha as decisões tomadas pelo modelo.

Alternativa 2:
Um arco representa as regras definidas pelo modelo, um nó não folha representa uma variável de entrada e um nó folha representa as possíveis classes do modelo.

Alternativa 3:
Um arco representa as transições entre as classes, um nó não folha representa as classes ou um valor estimado e um nó folha sinaliza o final de execução do modelo.

Alternativa 4:
Um arco representa uma variável de entrada ou saída, um nó não folha representa os valores das variáveis e um nó folha representa uma classes ou um valor estimado.

Alternativa 5:
Um arco vindo de um nó rotulado representa um valor possível (ou valores possíveis) de uma variável, um nó não folha representa uma variável de entrada e um nó folha representa uma classe ou um valor estimado.
Please enter comments
Please enter your name.
Please enter the correct email address.
You must agree before submitting.

Lista de comentários


More Questions From This User See All
Conforme Almeida, Tokumoto, Freitas (2021), a tecnologia Deep learning (DL) permite relacionar dados e encontrar padrões que os seres humanos têm dificuldade, ou não conseguem, pelo tempo necessário para processar e analisar esses dados. Além disso, estes mesmos autores salientam que um software baseado em ML aprende uma tarefa T por meio de uma experiência E, em relação a uma métrica de desempenho P, se o seu desempenho na tarefa T, quando medido pela métrica P, aumenta com a experiência E. Com isso, pode-se ter I) uma tarefa para determinar, com base em imagens de exames, se um tumor é maligno ou benigno; a medida de desempenho é o percentual de diagnósticos corretos; e a experiência de treinamento ocorrem através das imagens de tumores obtidas de exames médicos (raio X, ultrassom, tomografia, ressonância magnética, etc.). PORTANTO, II) Se o desempenho é adequado, a tarefa não pode ser realizada, pois o aprendizado não foi satisfatório. ALMEIDA, Iara Carnevale de; TOKUMOTO, Ronie Cesar; FREITAS, Janaína Aparecida de. ​Técnicas de Machine Learning (Aprendizagem de Máquina). Maringá - PR.: Unicesumar, 2021. A respeito dessas asserções, assinale a opção correta: Alternativas Alternativa 1: As asserções I e II são proposições falsas. Alternativa 2: A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. Alternativa 3: A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. Alternativa 4: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Alternativa 5: As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
Responda
Ao listar todos os possíveis aspectos que podem influenciar o desenvolvimento de uma doença, por exemplo, você pode notar que, cada um desses aspectos se trata de uma variável. Sim, são variáveis que, dependendo de cada pessoa, podem assumir valores diferentes. Esses valores podem ser binários (zeros e uns), apenas para diferenciar entre a presença ou ausência de certo aspecto, podem ser divididos em categorias (como faixas etárias), ou podem ser valores numéricos contínuos (como peso). Observe que o objetivo dessa pesquisa seria entender o desenvolvimento de tal doença em pessoas de maneira geral e, para isso, listamos possíveis aspectos que possam ter influência nesse processo. O que estamos fazendo é o ponto de partida para a criação de uma “equação” que poderia representar esse desenvolvimento (ou não) dessa doença. Considerando as informações do texto, analise as afirmações a seguir e a relação existente entre elas. I – Um modelo estatístico é dado por uma equação linear. PORQUE II – Ao somar todas as variáveis disponíveis, formamos uma equação linear. Alternativas Alternativa 1: As afirmações I e II são falsas. Alternativa 2: A afirmação I é verdadeira e a afirmação II é falsa. Alternativa 3: A afirmação I é falsa e a afirmação II é verdadeira. Alternativa 4: As afirmações I e II são verdadeiras e a afirmação II é uma justificativa correta para I. Alternativa 5: As afirmações I e II são verdadeiras, mas a afirmação II não é uma justificativa correta para I.
Responda
De acordo com Everitt e Howell (2005[2]), o modelo estatístico é composto por uma ou mais equações. Em cada equação, uma variável (ou um conjunto de variáveis) funciona como resposta a ser obtida – ela fica do lado esquerdo do sinal de igualdade. Tais variáveis são chamadas de variáveis dependentes. Nessa mesma equação, um diferente grupo de variáveis são utilizadas para explicar as variáveis dependentes e, portanto, são chamadas de variáveis explicativas (ou variáveis independentes). São as variáveis que ficam do lado direito do sinal de igualdade. Considere a seguinte pesquisa: Um construtor está interessado em descobrir o tempo que irá utilizar para levantar a fundação de uma obra civil. Para isso, pesquisou na cidade outras obras, identificando o tamanho em metros quadrados da obra, os matérias utilizados e a quantidade de funcionários trabalhando. Considerando essas informações, analise as afirmações a seguir e a relação existente entre elas: I – A variável resposta que esse construtor está interessado é o tempo gasto. PORQUE II – As variáveis explicativas que podem ser utilizadas são o tamanho da obra, os materiais utilizados e a quantidade de funcionários. Alternativas Alternativa 1: As afirmações I e II são falsas. Alternativa 2: A afirmação I é verdadeira e a afirmação II é falsa. Alternativa 3: A afirmação I é falsa e a afirmação II é verdadeira. Alternativa 4: As afirmações I e II são verdadeiras e a afirmação II é uma justificativa correta para I. Alternativa 5: As afirmações I e II são verdadeiras, mas a afirmação II não é uma justificativa correta para I.
Responda
A validação de um modelo estatístico é, possivelmente, o passo mais importante na sequência de criação de um modelo. É, também, um dos passos mais ignorados. A utilização de um modelo que não se ajusta corretamente aos dados pode fornecer respostas equivocadas à questão que está sob investigação. E isso pode ser fatal à sua pesquisa. Se coloque na posição de um gestor, cuja responsabilidade é tomar uma decisão com base nas informações apresentadas pela equipe responsável pela análise estatística. Se um modelo estatístico, que nós já vimos, se trata de uma função, estiver “fora do eixo” por poucos pontos, isso já pode resultar em diferenças grandes quando os valores aplicados nessa função forem grandes. Com esse objetivo, a busca por “diminuir os erros” é constante dentro da modelagem estatística. Com base nessas informações, analise as afirmações a seguir: I – Um resíduo é a diferença entre um valor estimado por um valor observado. II – Para verificar a qualidade do ajuste de um modelo, é necessário analisar a qualidade dos resíduos, verificando sua normalidade, homoscedasticidade e independência. III – O método dos mínimos quadrados para estimação dos parâmetros busca encontrar coeficientes cujos resíduos sejam os menores possíveis. IV – O gráfico Quantil-Quantil consegue comparar os resíduos do modelo com a distribuição normal de probabilidade. É correto o que se diz em: Alternativas Alternativa 1: I, apenas. Alternativa 2: II e III, apenas. Alternativa 3: I, II e IV, apenas. Alternativa 4: II, III e IV, apenas. Alternativa 5: I, II, III e IV.
Responda
A modelagem estatística é uma representação mais simplificada da realidade, através de um modelo desenvolvido com técnicas (baseadas em probabilidades), com o objetivo de descrever diferentes aspectos de interesse. Um modelo estatístico é formado por duas partes: uma variável de resposta (variável dependente), e variáveis de informação coletada (variáveis independentes), o que compõe uma ou mais equações. EVERITT, B., HOWELL, D. C. Encyclopedia of Statistics in Behavioral Science. Volume 4. John Wiley & sons, 2005. (adaptado) Considerando o texto anterior, considere a situação hipotética, em que você está realizando tarefas para ganhar sua mesada, e para cada tarefa que você realiza, você ganha 3 reais. Avalie as afirmações a seguir. I. A variável independente é a quantidade de tarefas feitas, pois essa é a variável sobre a qual você tem controle. II. A variável dependente é a quantidade de tarefas que você faz, pois você escolhe a quantidades de tarefas que quer fazer. III. A variável independente é dinheiro total recolhido pelas tarefas, pois não se tem um controle constante por mais tarefas que você realize. IV. A variável dependente é a quantia de dinheiro que você ganha, pois a quantia de dinheiro que você ganha depende de quantas tarefas você realiza. É correto o que se afirma em: Alternativas Alternativa 1: I e IV, apenas. Alternativa 2: II e III, apenas. Alternativa 3: III e IV, apenas. Alternativa 4: I, II e III, apenas. Alternativa 5: II, III e IV, apenas.
Responda

Helpful Social

Copyright © 2025 ELIBRARY.TIPS - All rights reserved.