PERGUNTA 3 1. Quando estamos utilizando diferentes conjuntos de dados de treinamento durante o processo de minimização da função custo na aprendizagem de máquina, quanto menor for o tamanho dos minibatches utilizados, mais ruidoso será o comportamento dessa função custo. Assim, devido às características desse comportamento, diferentes estratégias podem ser utilizadas.
Considerando essa informação, identifique se são Verdadeiras (V) ou Falsas (F) as afirmativas a seguir, que definem os pontos positivos das diferentes estratégias.
I. ( ) Gradient descent: é mais bem comportada e o gradiente normalmente atinge o mínimo da função j (w,b). II. ( ) Minibatch gradient descent: é possível observar a evolução do processo de minimização de j (w,b) já nos primeiros passos de iteração. III. ( ) Stochastic gradient descent: aumenta a velocidade do aprendizado se m é elevado.
Assinale a alternativa que apresenta a sequência correta.
Lista de comentários
Resposta: c. V – F – F
Explicação: Corrigido pelo AVA
Resposta: Letra C (Conferido pelo AVA)
V – F – F.