Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

1
LISTA 14: ANÁLISE DE REGRESSÃO LINEAR SIMPLES
INTRODUÇÃO
Por meio da análise de regressão, um pesquisador poderá compreender como é possível avaliar e mensurar a influência de variáveis explicativas sobre uma única variável dependente que representará um fenômeno sobre o qual há interesse de estudo.
REGRESSÃO LINEAR
A regressão linear tem como objetivo estudar a relação entre duas ou mais variáveis explicativas, que se apresentam na forma linear, e uma variável dependente. 
REGRESSÃO LINEAR SIMPLES
A regressão linear simples refere-se à existência de apenas uma variável explicativa para uma variável dependente, qual seja, aquela que representa o fenômeno que você deseja saber. Essas relações, geralmente, não são perfeitas, o que justifica a inclusão do termo erro na expressão matemática (u). 
CONSTRUÇÃO DO MODELO: FUNÇÃO MATEMÁTICA
A análise de regressão procura estabelecer não só a dependência, como também a forma específica (função matemática) que liga as variáveis. Em outras palavras, como uma variável explica o comportamento de outra variável.
A equação genérica é:
Y = + X + 
onde:
 e = são coeficientes não observáveis, ou seja, são parâmetros teóricos, válidos para a população. São conhecidos como os “verdadeiros” parâmetros.
Y = gastos com alimentação (variável dependente)
X = renda total mensal (variável explicativa ou independente)
 = erro aleatório
Y depende de X e, obviamente, não vale a relação inversa, qual seja, X não pode depender de Y.
Como trabalhamos com amostras estaremos, sempre, calculando estimadores dos parâmetros e , ou seja:
Y = a + bx
onde a e b são estimadores dos parâmetros populacionais e , respectivamente.
Como estimar os parâmetros a e b?
Deve-se estimar uma equação de regressão que apresenta as menores distâncias em relação aos pontos do diagrama, ou seja, aquela que minimiza a soma dos quadrados dos desvios (desvio é a distância com um sinal algébrico “+” ou “-“). Esse método é conhecido como o Método dos Mínimos Quadrados.
PODER EXPLICATIVO DO MODELO
A capacidade explicativa do modelo é analisada pelo R² da regressão (R quadrado). Esta medida mostra o quanto o comportamento da variável X explica a variação de Y e não justifica uma relação de causalidade da variável Y pelo vetor da variável X.
O R² pode variar de 0 a 1 ou de 0 a 100%, porém é praticamente impossível a obtenção de um R² igual a 1, uma vez que dificilmente todos os pontos cairão em cima de uma reta. 
Se o R² for 1, não haverá resíduos para cada uma das observações da amostra em estudo. 
Se o R² for próximo de 0, as variáveis explicativas não foram adequadas para explicar o comportamento de Y.
ANÁLISE DA SIGNIFICÂNCIA DO MODELO
O teste ANOVA propicia condições à verificação da significância do modelo. As hipóteses são:
H0: β = 0
Ha: β ≠ 0
Este teste propicia uma verificação inicial sobre a existência do modelo. 
Se o β=0, o comportamento de alteração da variável independente explicativa não influencia em absolutamente nada o comportamento da variável dependente. 
Se o β≠0, o comportamento de alteração da variável independente explicativa influencia o comportamento da variável dependente. 
ANÁLISE DA SIGNIFICÂNCIA DOS PARÂMETROS
Com a definição de existência do modelo, precisamos partir para a análise dos parâmetros da equação de regressão.
H0: β = 0
Ha: β ≠ 0
Se o β=0, o comportamento de alteração da variável explicativa não influencia em absolutamente nada o comportamento da variável dependente. Se Ho for rejeitada, a variável explicativa influencia a variável dependente, portanto, deve permanecer no modelo.
Agora, podemos verificar a significância de α (a constante). As hipóteses são:
H0: α = 0
Ha: α ≠ 0
Se o α =0 a variável dependente não apresenta nenhum valor fixo mínimo. Se α ≠ 0 a variável dependente apresenta algum valor que independe de qualquer outra variável. O intercepto deve permanecer no modelo. 
EXERCÍCIO
Segundo Engel, quanto maior a renda das famílias, menor é a proporção dos gastos destinados ao consumo de alimentos (Lei de Engel). Será que a Lei de Engel é válida nos dias atuais, visto que essa teoria foi escrita no século XIX? Para avaliarmos se a Lei é válida ou não, foram coletados dados sobre a renda mensal (R$) e os gastos com alimentação (R$) de 99 famílias. Com essas informações elabore um modelo matemático que explique a relação entre as duas variáveis e conclua sobre a aplicabilidade da Lei de Engel. Para essa análise utilize o nível de confiança de 95% e os dados que estão disponíveis no arquivo do excel “Lista 14: base de dados”.
a) Qual o objetivo desse estudo?
Pretende-se verificar se a Lei de Engel é válida para os dias atuais. Segundo Engel, quanto maior a renda das famílias, menor é a proporção dos gastos destinados ao consumo de alimentos. 
b) Emita o gráfico de dispersão e analise a nuvem de pontos. Descreva a relação entre as duas variáveis. Para finalizar, indique se a correlação entre as variáveis é positiva ou negativa.
Gráficos → Diálogos anteriores → Dispersão/ponto
Escolha a opção “Dispersão simples” e clique em “Definir”.
Coloque a variável independente no eixo X e a variável dependente no eixo Y. Clique em “Ok”. 
Para analisar a correlação não é necessário identificar qual é a variável independente e a variável dependente. Entretanto, para que você se acostume a fazer de forma correta, coloque sempre a variável independente no eixo X (eixo horizontal) e a variável dependente no eixo Y (eixo vertical). 
O SPSS liberará o seguinte gráfico.
À medida que a renda (em R$) aumenta, os gastos (em R$) com alimentação também aumentam, mas em proporção menor que a da renda. Desta forma, a correlação entre as variáveis é positiva.
c) Escreva a equação de regressão genérica utilizando os nomes das variáveis que você está estudando. 
Gastos com alimentação = α + β renda mensal familiar
d) Emita os relatórios “Sumarização do modelo”, “ANOVA” e “Coeficientes”. Cole as imagens abaixo. 
	
Analisar → Regressão → Linear
Preencha conforme quadro abaixo e clique em “Ok”.
O SPSS liberará os relatórios. 
e) Analise se o modelo de regressão é significativo e conclua.
Você pode escrever as hipóteses de duas formas.
Ho: o modelo de regressão não é significativo
Ha: o modelo de regressão é significativo
ou
Ho: β = 0
Ha: β ≠ 0
	Modelo
	Formulação matemática
	Rejeita Ho?
	Conclusão
	Regressão
	0,000sobre o que se desejava estudar. Justifique sua resposta. 
O objetivo era verificar se a Lei de Engel é válida para os dias atuais. Pela análise de dados, a conclusão é de que é válida, porque o coeficiente angular é positivo e menor que um (0,18). Isso significa dizer quanto maior a renda das famílias, menor a proporção dos gastos destinados ao consumo de alimentos (18%). O coeficiente angular dessa variável independente é estatisticamente significativo a um nível de confiança de 95%.
l) A equação de regressão é utilizada para fazer previsões. Você pode utilizar qualquer valor para a renda mensal familiar? Se não, qual o intervalo que você pode utilizar para fazer as previsões? Justifique.
Para fazer as previsões, a renda mensal familiar deve estar entre R$5.000,00 e R$55.000,00 visto que a amostra possui famílias nessa faixa de renda. 
m) Jorge Maicol possuía uma renda mensal de R$10.000,00 e, com o novo emprego, ganhará R$50.000,00. Estime qual será o gasto com alimentação com a renda de R$50.000,00 e com a renda de R$10.000,00. Calcule a variação percentual da renda e dos gastos com alimentação. Compare os resultados e conclua.
Gastos com alimentação = 2.101,77 + 0,18 * renda mensal familiar
Gastos com alimentação = 2.101,77 + 0,18 * 50.000,00 = R$11.101,77
Gastos com alimentação = 2.101,77 + 0,18 * 10.000,00 = R$3.901,77
O aumento da renda em 400% gera um aumento de 184,5% nos gastos com alimentação. Isso significa dizer que houve um aumento menos que proporcional dos gastos com alimentação quando ocorreu um aumento na renda mensal familiar. 
image3.png
image4.png
image5.png
image6.png
image7.png
image8.png
image9.png
image10.png
image11.png
image1.png
image2.png