10 Haziran 2014 Salı

BASİT VE ÇOKLU LİNER REGRESYON

Alıştırma: 
(Murat Ozer - YouTube) tan yararlandık.
Bir araştırmada cinsiyet ve yaşın hayat beklentisi üzerindeki etkileri öngörülmek istenmektedir (http://www.youtube.com/watch?v=fpbVaoYrXXI).


Değişkenler için korelasyon analizi;
Yaş ve cinsiyet arasında anlamlı negatif yönde zayıf güçte bir ilişki vardır(r=-0,016, p<0,001).

Regresyon analizi için koşullarımız karşılanmış oldu.

 İki öngören bir öngörülen değişkenimiz var:
Statistics'e tıkladığımızda----> Collinearity diagnostics işaretlenir.



Outputda ilk tablo betimsel istatistik tablosu;



 ama bizi esas ilgilendiren correlations tablosu;

Variables Entered/Removed tablosu yorum açısından önemsiz. Bize hangi değişkenler arasındaki ilişkileri nasıl incelediğimizi hatırlatır.

Daha öncekorelasyon tablosunda yaptığımız anlamlılık testi kontrol edilmiş oldu. Demekki bu testi regresyon testi ile birlikte uygulayabilirdik.
Şimdi regresyon testimize bakalım;
Model Summary tablosu bize öngören(açıklayıcı, yordayıcı da denilen) değişkenimizin, değişimin yüzde kaçını açıkladığını gösteren R Square değerini verir. Yani yaş ve cinsiyet değişkenlerine bağlı olarak hayat beklentileri değişkeni yüzde 4,3  (0,043x100)  oranında değişir. Öngörü yüzdesinin anlamlı olup olmadığını gösteren F testinin phesap değeridir. Basit regresyon için ANOVA tablosunu yorumlamamıza gerek yoktur fakat çoklu regresyon için anavo tablosu modelin anlamlı olup olmadığını gösterir. Coefficients tablosu yani regresyon katsayıları tablosudur. Bu tabloda öngören değişkenimizin modele katkısı anlamlı mı sorusunun cevabını buluruz. Bakmamız gereken yer t değerleridir. Yaş için 34,712 ve cinsiyet için -9,152.  B sütundaki ilk değer (constant) 7,882 regresyon denklemimizdeki sabittir. Altttaki iki değer yaş ve cinsiyet için denklemdeki b değerleridir.

Hiç yorum yok:

Yorum Gönder