16 Haziran 2014 Pazartesi

Tek Örneklem Yöntemleri: Kolmogorov-Smirnov testi

Daha sonra K-S diye anacağımız Kolmogorov-Smirnov testi, örneklem değerlerinin bilinen teorik bir dağılıma uyğunluğunu araştıran  testlerden biridir. K-S, teorik kümülatif frekans dağılımlarını gözlenen kümülatif frekans dağılımları ile karşılaştırır. Bu test ile, iki dağılımın en farklı olduğu noktadaki farklılığın anlamlı olup olmadığı araştırılır.Bir başka deyişle frekansların hangi düzeyde benzeştiği araştırılır. Eğer bu en büyük fark anlamlı değilse dağılımların aynı olduğu iddia edilir. K-S testi ilgili populasyonun (örneklemin) karakteristiklerini kavramaya yarar. Bu çerçevede bu özelliklere ilişkin K-S testinde iki hipotez öne süreriz.


Genel olarak bu işleyiş istatistik tekniklerinde belirli bir yasaya uygun parametrik hipotezlerle ve öyle olmayan (non-parametrik) hipotezlerle test edilir. Bilimsel araştırmaların temelindeki bu işleyiş (yani çözümlenebilir sorular  ortaya çıkarmak ve bu soruları test edilebilir hipotezlerle sınamak) bir çok teste olduğu gibi K-S testinde birbirlerini karşılıklı olarak dıştalayan iki hipotezle karşılanır: sıfır hipotezi Ho  ve onun karşıtı H1. Bu hipotezlerin oluşturulması rasgele değildir.  Ho inandığımız, kabulu durumunda bize hesap imkanları verecek bir hipotezdir.

Diyelim ki farklı kültürleri temsil eden değişik ülkelerdeki lise düzeyi öğrencilerinin cinsiyetleri ile zorbalık eğilimlerini eğilimlerini araştırıyoruz. Bu ifadeler bilimsel olmayan ifadelerdir her bir terimimizi,  operasyonel yani işleme koyabilecek bir şekilde tarif etmemiz gereklidir. Bunları yaptık ve ölçümler sonucunda veriler elde ettik. İşte bu verileri istatistik yöntemlerle analiz edebilmemiz için ve araştırma sonucunda iddialar öne sürebilmek için esas sorunumuz ölçümleri elde ettiğimiz populasyonun yani denek grubunun verilerinin normal dağılıp dağılmadığıdır. Bir başka deyişle lise öğrencilerini temsil edip edemediğidir.

Hipotez testleri, elde edilmiş verilere dayanarak, önceden belirlenmiş bir hata payı ile istatistik bir hipotezin kabulunun ve reddinin kurallarıdır.

Yukardaki önermelerden yola çıkarak Ho'yu non parametrik K-S için şöyle ifade edebiliriz;
Ho: Beklenen ve gözlenen kümülatif frekans oranları arasındaki fark sıfıra eşittir, bu demektir ki. gözlemlenmiş veriler geçerli bir model kabul edilen teorik bir olasılık yasasına uygundur.

Bir başka deyişle,bir X değişkeni için F dağılımı fonksiyonunu, sürekli teorik bir Fo  dağılımı fonksiyonuyla test etmek istiyoruz:
Ho: F=Fo.  
 H 1 : F ≠ Fo. olur.

Kritik bölge ve red bölgesini ve bu fonksiyonların ifadelerini bir yana bıraktık. Şimdi bir örnekle bir adım daha atalım. Diyelim ki 8 atın koştuğu 144 yarışı gözlemledik, atların tesadüfen seçilen ve koşuya başlayacakları içten dışa ve 1'den 8'e numaralanmış yarış yerlerinin yani boxlarının yarış sonuçlarını etkileyip etkilemediğini araştırıyoruz. Bir atın küçük rakamlarla ifade edilen iç parkurdan koştuğunda kazanma şansının yüksek olduğundan şüpheleniyoruz. Bu durumda;
Ho: Farklı parkurlardan koşan atların kazanma şansları eşittir.
Hı:  Farklı parkurlardan koşan atların kazanma şansları eşit değildir.

Dağılım fonksiyonunun en büyük farkı 4. boxta gözlemlenmiştir. Bu grup için  
D hesap = 19/144 = 0,132
K-S testinin n=144 için a = 0,05 anlamlılık düzeyinde tablo değeri:
 = 0,113, D hesap = 0,132 > D tablo =0,113 Þ , H 0 red ediyoruz.. Gözlemlenen fark anlamlıdır.

Hiç yorum yok:

Yorum Gönder