25 Haziran 2014 Çarşamba

Ki kare, χ2

Karl Pearson tarafından 1900 yılında sunulan bu test gözlemlenmiş bir olayın tesadüfî verilerinin, belirli bir olasılık yasasını izleyip izlemediğini sorgular. Bir başka deyişli, Ebu Abdullah Muhammed bin Musa el Harezmi ya da Alexandri okulunun niceliklerin oldukları gibi simgelerle kategorik olarak hesaplanmasından hareketle gözlemlenmiş verilerin teorik olarak beklenilen veriler arasındaki mesafeyi hesaplar.

Anlaşılan matematikten sosyal bilimlerde de kurtuluş yok!


Ki Kare testi genellikle parametrik olmayan testlerden sayılsa da oranlı  (ratio) değişkenlere ya da verilere de uygulanabileceğinden parametrik bir test olarak da değerlendirilebilir.

Birbirine benzer iki Ki Kare testi vardır. Çoğunlukla türkçede uyum iyiliği olarak adlandırılan ama niçin böyle adlandırıldığını bir türlü anlamadığım (uyumun iyiliği kötülüğü mü olur matematikte) uygunluk (adequation) testi ve homojenlik, bağımsızlık Ki kare testi.


Sosyal bilimlerde daha ziyade kullanılan  Homojenlik Bağımsızlık Ki kare testidir. (Her ne kadar Arkeo-Antropologlar kemik ağırlıklarından hareketle kalıntılarındaki birey sayılarını hesaplamalarında adequasyon testini kullanabilseler dahi).Bu teste sözkonusu olan, sınırlı sayıda değerler alabilen kategorik, nomınal verilerin a priori olarak belirleniş bir olasılık yasasına uygunluğudur.Bir başka deyişle, bağımlı değişkenin değişik kategorilerdeki frekanslarının dağılımının bağımsız değişkenin kategorilerine göre değişip değişmediğidir.

Bir örnekle mevzuyu biraz daha iyi kavrayalım. Bir araştırmacı 2 kategorili bir bağımsız değişkene göre yine 2 kategorili bir bağımlı değişkeni incelemiştir. Elde ettiği veriler şöyledir;



yani  225 Aa ve 233 Ab den oluşan bağımsız değişkenin ;Aa'nın Bv için gözlemlenmiş vaka sayısı 126 ve bunun yüzdelik oranı 56'dır. Diğer şıklar için benzerdir. Bu durumda Ho 'muz Bv ve By'in Aa ve Ab için yüzde dağılımları arasında fark yoktur, olacaktır.Ki kare testlerinde kabul edilen hata oranı genellikle alışkanlık olduğu üzere %5'tir. Yani alfa değeri 0,05 olarak kabul görür.Bu hata payı olasılık teorisine içkindir. Ama bu araştırmacı testini daha güçlü kılmak için hata payını alfasını 0,001 olarak belirlemiş olsun. Araştırmacı bu testin bir ki kare tablosuna göre belirlenen serbestlik derecesini şöyle hesaplayacaktır; df= (2-1)*(2-1)=1, yani bağımlı değişkenin kategori sayısının bir eksiği ile bağımsız değişkenin kategori sayısının bir eksiğinin çarpımını alıp Ki kare tablo değerine bakacaktır.Baktı diyelim, χ2tablo(α=0.001; df=1)=10.827 gördü. Şimdi gözlediği frekansların χ2 olasılık teoremine göre beklenen frekanslarını hesaplamak zorundadır. Bunun için şu yolu izleyecektir. 
(Aa;Bv)'nin gözlenen frekans sayısı 126'dir fb ile göstereceğimiz beklenen frekansı hesaplamak için; 
(225*197)/428=96.8
(Aa;By) için fg yani özlenen frakans 99'dur fb hesaplamak için, (225*261)/458=128.2.
(Ab;Bv) için ve (Ab;By) için  aynı işlemi yaparak araştırmacımız her bir dört durum için fb'leri bulmuş oldu. Şimdi  χ2 hesabını yapabilir.

χ2tablo=10.827 <  χ2hesap=30.388. Bu durumda araştırmacı Ho rededer.  χ2hesap  χ2tablo ise  Ho  rededilir.Yani Bv ve By'in Aa ve Ab için yüzde dağılımları arasında fark vardır.Bv ve By'nın frekans dağılımları Aa ve Ab kategorilerine göre değişmektedir.

Şener Büyüköztürk ve arkadaşalrının sosyal bilimler için istatistik pegem yayınlarından aldığımız bir örneğe bakalım.
''Aşagıda bir grup hastanın hastalık türleri ile tedavi sürelerine ilişkin veriler bulunmaktadır. Hastalığın türü ile tedavi süreleri arasında manidar bir ilişki var mıdır?''
hastalık türü tedavi süresi
6 ay-1 yıl 1 yıldan fazla
depresyon 25 10
anksiyete 5 40
bağımsız değişkenimiz hastalık türü ve bağımlı değişkenimiz tedavi süresi
    6ay-1yıl   1+    toplam
depresyon N 25 10 30
anksiyete N 5 40 45
d+a N 30   50   80
fb(d 6ay-1yıl)=


Şimdi spss'te ki kare uygulamasını değil ama çıktıların yorumlanmasına bakalım.Bağımsız değişken cinsiyet yanı S1, 2 kategorili ( kız, oğlan) olarak belirlenmiş bağımlı değişkenin S4 iki kategorisi var başarılı ve başarısız.
Örnek: http://www.youtube.com/watch?v=-i1KhONchL4 den alınmıştır

Öncelikle son tabloya bakıp Ho yu rededip etmediğimize bakalım. alfa değerimiz (Pearson chı-Square Asymp.Sig değeri) 0,008 alfa tablo değerimiz 0,05'ten küçük olduğundan Ho kabul. Kızların başarılı olma oranı %67,2 erkeklerinkinden %32,8 daha yüksektir.


Mevzuyu biraz daha derinleştirmek için http://www.youtube.com/watch?v=jXi93c_Zz9s de öneririz

Hiç yorum yok:

Yorum Gönder