Sempre represente graficamente seus dados. A tabela a seguir apresenta quatro conjuntos de dados preparados pelo
pesquisador Frank Stuart para ilustrar os perigos de cálculos sem antes elaborar um gráfico dos dados.
(a) sem fazer os gráficos de dispersão, ache a correlação e a reta de regressão de mínimos quadrados para todos os quatro conjuntos de dados. O que
você percebe? Use a reta de regressão para predizer y para x=10.
b) Faça um gráfico de dispersão para cada um dos conjuntos
de dados e adicione a reta de regressão a cada gráfico.
(c) Em qual dos quatro casos você gostaria de usar a reta de regressão
para descrever a dependência de y em função de x? Explique sua resposta em cada caso.
Conjunto A
x 10 8 13 9 11 14 6 4 12 7 5
y 8,04 6,95 7,58 8,81 8,33 9,96 7,24 4,26 10,84 4,82 5,68
Conjunto B
x 10 8 13 9 11 14 6 4 12 7 5
y 9,14 8,14 8,74 8,77 9,26 8,10 6,13 3,10 9,13 7,26 4,74
Conjunto C
x 10 8 13 9 11 14 6 4 12 7 5
y 7,46 8,77 12,74 7,11 7,81 8,84 6,08 5,39 8,15 6,42 5,73
Conjunto D
x 10 8 13 9 11 14 6 4 12 7 5
y 6,58 5,76 7,71 8,84 8,47 7,04 5,25 5,56 7,91 6,89 12,50
Lista de comentários
Resposta:
(a) Para o Conjunto A, o coeficiente de correlação é 0,897 e a equação da reta de regressão de mínimos quadrados é y = 0,632x + 1,461. Para o Conjunto B, o coeficiente de correlação é 0,901 e a equação para a reta de regressão de mínimos quadrados é y = 0,655x + 0,557. Para o Conjunto C, o coeficiente de correlação é 0,922 e a equação para a reta de regressão de mínimos quadrados é y = 0,804x + 0,383. Para o Conjunto D, o coeficiente de correlação é 0,902 e a equação para a reta de regressão de mínimos quadrados é y = 0,717x + 0,798.
Usando essas equações, podemos prever que y = 8,202 para x = 10 no Conjunto A, y = 8,55 para x = 10 no Conjunto B, y = 8,44 para x = 10 no Conjunto C e y = 7,87 para x = 10 no Conjunto D.
(b) Não consigo criar um gráfico para você, mas você pode criar um gráfico de dispersão para cada conjunto de dados e adicionar a linha de regressão de mínimos quadrados a cada gráfico plotando os valores de y previstos para cada valor de x no gráfico e conectando os pontos com uma linha.
(c) No Conjunto A, a linha de regressão de mínimos quadrados parece ser um bom ajuste para os dados porque há uma forte correlação positiva e os pontos no gráfico estão próximos da linha. No entanto, no Conjunto B, a linha de regressão de mínimos quadrados não é um bom ajuste para os dados porque há muitos pontos que estão longe da linha. No Conjunto C, a linha de regressão de mínimos quadrados é um bom ajuste para os dados, mas há alguma variabilidade nos pontos que não é capturada pela linha. No Conjunto D, a linha de regressão de mínimos quadrados não é um bom ajuste para os dados porque há muita variabilidade nos pontos e a linha parece não seguir o padrão dos dados.