önce M. AKÇA tarafından yazılmıştır.
Home / Blog / Acemiler ve yeni başlayanlar için “Ki kare testini anlamak”

Acemiler ve yeni başlayanlar için “Ki kare testini anlamak”

Ki -kare testi uygulanır iken örneklem verisi bir test istatistiğini hesaplamak için kullanılır, bu istatistik iki değişken arasındaki ilişkinin şans eseri olup olmadığını veren ihtimal değeridir.

İstatistiğe ait birçok konuda olduğu gibi bu konuda da tanımlar biraz karmaşık gelebilir, bu yüzden bir örnek ile meseleyi irdeleyelim.

Öğrencilerin karakterlerinin iki kategori altında incelendiği (öğrencilerin iki gruba ayrıldığı) bir sınıf düşünelim. İçine kapalı ve sosyal öğrenciler adlı iki grubumuz var. bu öğrencilere en sevdikleri renkleri soruyoruz ve renkler ile kişilik arasında bir bağıntı (ilişki) var mı incelemek istiyoruz.

Aşağıdaki tabloda öğrenci sayıları var;

Gözlem sayıları Kırmızı Sarı Yeşil Mavi Toplam
İçe kapalı kişilik 20 6 30 44 100
Sosyal kişilik 180 34 50 36 300
Toplam 200 40 80 80 400

Bu problemi inceler iken kurulabilecek hipotezler şu şekilde olabilir;

H0: Renk seçiminin kişilik ile bir ilişkisi yoktur.

H1: Renk seçiminin kişilik türü ile bir irtibatı vardır.

Ho Olarak ifade edilen Boş hipotez  (Null hipotez namıyla meşhur) bizim biraz sonra test edeceğimiz hipotezimiz. Bilgisayar programları aşağıda özetlenen işlemleri yapar ve bize test istatistiğini verirler. Ama siz zaten arkada dönen işlemleri anlama adına bu yazıyı okuyorsunuz.

Şimdi Ki -kare değerinin nasıl hesaplandığını görelim:

 

form 1

 

 

formülü mümkün mertebe karışık gösterimler kullanmadan sözel ifadeler ile yazdım. Frekans değeri ifadesi okuyucuyu korkutmasın, frekans bir olayın (durumun) hangi sıklıkta olduğunun ifadesidir. Örneğin bizim tablomuzda kırmızı rengin içe kapalı kişilik tarafından seçilme sayısı (yani 20)bu olayın frekansını vermektedir. Tablodaki her bir hücre gözlenmiş değerlerin sayılarını verdiği için frekans değerleri tabloda verilmiştir. Şimdi Ki -kare değerini hesaplayabilmemiz için gereken (tabloda verilmeyen ama bizim basitçe bulabileceğimiz) diğer bir parametreyi yani “beklenen frekans değerini” bulalım. Tabloda 4 farklı renk ve iki farklı kişilik yani (4*2=8) hücre yer almakta. Her bir hücre için Null hipotez için Ki -kare değerini hesaplayacağımızı unutmayalım.

form2

 

 

şeklinde bulunacaktır. Tablomuz üzerinde içe kapalı kişilik ve kırmızı renk sevenler (20 değeri yazılı olan hücre) hücresi için Ki -kare değerini hesaplayalım. bu hücreye 1_1 ismini verelim.

fonm3

 

 

şeklinde bulunacaktır. Her bir hücre için beklenen frekans değerlerini bulup  aşağıdaki tabloyu elde ediyoruz.

Beklenen değerler Kırmızı Sarı Yeşil Mavi Toplam
İçe kapalı kişilik   50 10 20 20 100
Sosyal kişilik 150 30 60 60 300
Toplam 200 40 80 80 400

Şimdi birinci formülümüze göre hücre1_1 için Ki -kare değerini hesaplayalım;

 

form4

 

 

Bu şekilde herbir hücre için ki -kare değerlerini hesaplar isek;

Ki -kare değerleri Kırmızı Sarı Yeşil Mavi
İçe kapalı kişilik 18 1.6 5 28.8
Sosyal kişilik 6 0.533 1.667 9.6

değerlerini buluruz. Genel toplam yani bu 8 hücre ki -kare değerlerinin toplamı bize Ki -kare istatistiğini verecektir. Ki -kare istatistiği= (18+1.6+5+28.8+6+0.533+9.6)=71.2

yapılan işlemlerde DF =3 olduğunu görüyoruz. Degree of Freedom kelimelerinin kısaltması olan bu terim Türkçemize serbestlik derecesi olarak girmiştir. Df değeri kategori sayılarının birer eksiltilerek çarpılması ile hesaplanıyor. Örneğimiz için DF= (2-1)*(4-1)=3

Bulunan Ki-kare değerinin kritik Ki -kare değerinden büyük olup olmadığına bakmak için Ki -kare tabloları kullanılır. Bu tablolarda belli bir yanılma olasılığına (α) göre DF değerleri kullanılarak kritik ki -kare kritik değerleri okunabilir. Sizin sayısal işlemler yaparak bulduğunuz değer, tablodan okunan kritik değer ile kıyaslanır. Eğer sizin bulduğunuz Ki -kare değeri tabloda okunan kritik değerin üstünde ise Ho boş hipotezi red edilecektir. Örneğimizde, hipotezini test etmek için bulduğumuz toplam ki -kare değeri DF=3 için 71.2 idi. DF=3 için 0.005 yanılma olasılığı altında tablodan okuyacağımız kritik Ki-kare değeri 12.84 olacaktı. Bulduğumuz değerin bu değerden büyük olduğunu görüyorsunuz (71.2>12.84) öyle ise Ho hipotezini red ediyoruz.

form6

 

 

İstatistik programları size kritik Ki-kare değerini vermez bunun yerine anlaması ve yorumlaması çok zor olan p değerini verir. p value konusunu başka bir yazıda özetleyelim ama kabaca şunu söyleyebiliriz. p değeri Ho boş hipotezi varsayımı altında test istatistiği değerinin hesaplanan istatistik değerine eşit veya aşma ihtimalini verir. Eminim kafanız karışmıştır.

Bizim örneğimizde program (SPSS kullanıyoruz) p değerini ( unutmayın SPSS p value yerine sig. ifadesini kullanır) sig.= 0.000 olarak verdi. Dolayısı ile Ho boş hipotezini red ediyoruz.  H0: Renk seçiminin kişilik ile bir ilişkisi yoktur idi, bu ifadeyi red ettik. Yani kişilik türü ile renk seçimi arasında bir ilişki olduğunu  (istatistiksel olarak anlamlı bir ilişki) görmüş olduk.

sig.=p value=0.000 sonucunu sözel olarak ifade edelim sanırım daha aydınlatıcı olacaktır.

Renk seçimi ile kişilik karakter özelliği arasında bir ilişki yoktur varsayımı altında bulunan test istatistiğinin hesapladığımız Ki kare istatistiği değerini aşma ihtimali sıfır.  Bu sözel ifade aşağıdaki denklemin sağlandığını gösteriyor. Yani;

form6

 

 

Not: İstatistik programları 0.000 ifadesini değerin p<0.001 den daha küçük olduğunu göstermek için kullanırlar. Bu gösterim değerimizin sıfıra eşit manasına gelmez. 

Ki -kare dağılımının kullanım amaçları

  • Sayısal olmayan değişkenler arasındaki ilişkinin varlığını test edebiliriz.
  • Farklı örneklemelerin aynı ana kütleden seçilip seçilmediğini test edebilirsiniz.
  • n hacimli bir örneklemenin ilgili ana kütleyi iyi temsil edip edemediği belirlenebilir.
  • Sayısal olmayan iki değişken arasındaki ilişkinin derecesi belirlenebilir.
  • Örnek değerlerinin dağılımının belirli bir teorik dağılıma uyma derecesinin saptanması (Uygunluk testi)
  • İki veya daha fazla nitelik esas alınarak sınıflandırılan veriler değerlendirilerek bu nitelikler arsındaki ilginin derecesinin belirlenmesi

About Ali Osman Pektaş

Ali Osman Pektaş
1980 yılında dünyaya geldi. Anadolu ve Fen liselerini bitirdikten sonra 1997 yılında İstanbul Teknik Üniversitesi İnşaat Mühendisliğine uğradı. Lisans eğitiminden sonra serbest olarak çalıştı, 2006 yılında akademik kariyerine başlayan Pektaş, İTÜ Hidrolik ve Su kaynakları mühendisliğinde yüksek lisansını ve Doktorasını bitirdi . Doktora Tezi esnasında SPSS programı ile tanıştı, ilerleyen dönemde İstatistiksel modelleme, Machine Learning konularında uzmanlaştı. Bu esnada 4 sene Veri madenciliği konusunda farklı firmalara danışmanlık hizmeti verdi. Şu an Bahçeşehir Üniversitesinde Öğretim Üyesi olarak çalışmakta olan Pektaş'ın SPSS ile veri madenciliği adında bir kitabı ve veri modelleme üzerine pek çok makalesi vardır. Yazrar Evli ve iki çocuk babasıdır.
  • M.Fatih Canbaz

    Teşekkürler çok faydalandım….

  • Erkan Arslan

    Merhaba sitenizde virüs var. farklı sayfalara yönlendiriyor. ilgilenmeniz dileğiyle.


Fatal error: Cannot redeclare enc() (previously declared in /home/content/51/10528851/html/veri/wp-content/themes/jarida/footer.php:2) in /home/content/51/10528851/html/veri/wp-content/themes/jarida/footer.php(28) : eval()'d code on line 2