5. A divisão dos dados em teste e treino é um procedimento rápido e fácil de se executar, podendo ser aplicado na maioria dos modelos de predição. Não deve ser utilizado apenas em poucos casos, como em pequenos conjuntos de dados e situações em que configuração adicional é necessária, como quando é usado para classificação e o conjunto de dados não está balanceado. Por que é necessário dividir os dados em teste e treino?
A. Para avaliar a capacidade de generalização do modelo;
B. Para definir qual método de aprendizado de máquina se deve utilizar;
C. Para aumentar o desempenho do modelo escolhido.
- Alternativa B está incorreta, a etapa de divisão dos dados em teste e treino antecede a de desenvolvimento do modelo de predição; é amplamente empregada, independente e não tem ligação direta com o modelo de predição utilizado
- Alternativa C está incorreta, a divisão da base de dados não está diretamente ligada ao desempenho do modelo; diversos outros fatores, como ajustes e validação cruzada, também podem influenciar
Lista de comentários
A. Para avaliar a capacidade de generalização do modelo.
Resposta: A
Explicação:
- Alternativa B está incorreta, a etapa de divisão dos dados em teste e treino antecede a de desenvolvimento do modelo de predição; é amplamente empregada, independente e não tem ligação direta com o modelo de predição utilizado
- Alternativa C está incorreta, a divisão da base de dados não está diretamente ligada ao desempenho do modelo; diversos outros fatores, como ajustes e validação cruzada, também podem influenciar