PARAMETRİK OLMAYAN HİPOTEZ TESTLERİ Kİ-KARE KARE TESTLERİ Populasyonun nceledğmz br özellğnn dağılışı blenen dağılışlardan brsne, Normal Dağılış, t Dağılışı, F Dağılışı, gb br dağılışa uygun olduğu durumlarda populasyonun parametrelerne lşn yapılan hpotez testlerne parametr hpotez testler adı verlr. Doç.Dr. Al Kemal ŞEHİRLİOĞLU Araş. Gör. Efe SARIAY Parametr hpotez testler genellle normal dağılış varsayımı altıda gerçeleştrlen testlerdr. Merez lmt teorem gereğnce; anaütle dağılışı ne olursa olsun o dağılışa lşn örneleme dağılışının normal dağıldığı sonucundan hareetle normal dağılışın ço yaygın br şelde ullanıldığı açıça ortadadır. 3 Populasyonla lgl bell başlı varsayımların ve parametre tahmnlernn gerçeleştrlemedğ, bu sebepten dolayı dağılış varsayımı yapılamadığı durumlarda ullanılan testler, Parametr Olmayan Hpotez Testler olara adlandırılır. 4
Parametr Olmayan Hpotez Testlernn Kullanılableceğ Durumlar: Gözlem le elde edlen verlern olması durumunda, Parametr test varsayımının yerne getrlemedğ durumlarda 3Testte ullanılaca değerler yerne bu değerlern sıra numaralarının verldğ durumlarda, 4Testte ullanılaca örnelern üçü hacml olduğu durumlarda. 5 Parametr Olmayan Hpotez Testlernn ; AVANTAJLARI Uygulanması çn brço varsayıma gere yotur. Anlaşılması ve uygulanması olaydır. Küçü hacml br örne üzernden yapılması mümündür. DEZAVANTAJLARI Örne hacmnn büyü olması halnde uygulanması güçleşr. u tür testlern uygulanmasıyla elde edlen sonuçlar, parametr testlern uygulanmasıyla elde edlen sonuçlardan daha az güvenlrdr. 6 u dersn apsamı çnde parametr olmayan hpotez testlernn yalnız br ısmını oluşturan Parametr Olmayan K- Kare Hpotez Testler ne ye verlecetr. Günümüzde brço araştırmada ullanılan değşenler ntelsel yapıdadır. Zarın atıldığında alacağı değerler, göz reng, dn, ır ve dl gb sınıflamalar. azı durumlarda se ncelsel yapıda bazı değşenlern sınıflandırılara ntelsel hale dönüştürüldüğü görülür. gb. 5 lonun altında olan şlere zayıf, 5-8 lo arasında olanlara normal, 8 lonun üstünde olanlara lolu denmes Ntelsel yapıya sahp değşenler üzernde yapılan gözlemler çoğunlula araştırılan özellğ gösteren sınıfların sayılarışelndedr. 7 8
Ele alınan değşenlern ntelsel yapıda olduğu durumlarda, yapılan ölçüm ve gözlemlern lgl sınıflara at freanslarını date alan çalışmalar çn uygulanan hpotez testler, Parametr Olmayan K- Kare Hpotez Testler PARAMETRİK OLMAYAN Kİ-KARE HİPOTEZ TESTLERİ dr. İy Uyum Testler r x c ağımsızlı Testler Dağılışa Uyum Testler Unform nom Posson 9 Normal Parametr Olmayan (K- Kare Hpotez Testler adını ullanılan test statstğnden almıştır. Yuarıda da fade edlen 3 falı K-Kare test; sayımla elde edlen veya ölçülen değerlern dda edlen teor freanslar uygun olup olmadığını, populasyonun farlı özellğnn brbrnden bağımsız olup olmadığını, populasyonunun dağılışının fade edlen blnen br dağılışa uygun olup olmadığını, ( nom, Normal vb. test etme amacıyla ullanılır. urada ele alınan tüm durumlarda ullanılaca test statstğ orta olmala brlte K-Kare dağılışına uygundur. G : Gözlenen Değerler : elenen Değerler ( G 3
İy Uyum Testler Gözlenen freansların teor belenen freanslara uyup uymadığının araştırılmasında ullanılır. r zar atıldığında eğer zar hlesz se tüm değerlern ortaya çıma olasılığının brbrne eşt ve / 6 olması, Grup 3... Gözlenen değerler ( G H doğru en olasılı değer ( p G G G 3... G n p p p 3... p r haftalı süre çnde Çğl- Kpa ya gelen müşterlern % 5 nn Cumartes, % 5 nn Pazar ve dğer hafta ç 5 günde de her gün % nun gelmes. H doğru en belenen değer ( np np 3 np 3... np n 3 4 Kullanılan -are test statstğ göz önünde bulundurulaca olursa, gözlenen ve belenen değerler arasında farın anlamlı derecede büyü olması durumunda teor freanslara gözlenen freansların uymadığı sonucuna varılır. H : p ler fade edlen teor olasılı değerlerne eşttr. H : En az br eştl geçerszdr. ( G > se H red edlr. ; α : grup sayısı ( ategor sayısı 5 Örne: r spor yazarı, Türye de şlern % 4 snn Fenerbahçe, % 5 unun Galatasaray, % snn eştaş, % nun Trabzonspor u ve gerye alan % 5 l ısmın se dğer taımları desteledğn düşünmetedr. u amaçla şl br örne alındığında aşağıda da sonuçlar elde edlmştr. Yazarın ddasını % 5 l hata payıyla test ednz. Taım Taraftar Sayısı F 387 GS 59 JK 8 TS 97 Dğer 49 6 4
H : p F,4, p GS,5, p JK,, p TR,, p D,5 H : En az br eştl geçerszdr. F n p F (,4 4, G F 387 GS n p GS (,5 5, G GS 59 JK n p JK (,, G JK 8 TR n p TR (,, G TR 97 D n p D (,5 5, G D 49 h ( G ( ( 387 4 59 5 ( 49 5 +... + 4 5 -,α 5-;,5 4;,5 9,49 h t < olduğundan H o red edlemez. Spor yazarının taraftarların dağılış yüzdeleryle lgl ddasının % 5 hata payıyla doğru olduğu söyleneblr.,8 5 7 8 r x c ağımsızlı Testler r populasyonun özellğnn brbrnden bağımsız olup olmadığını test etmede ullanılır. Örneğ meydana getren breyler farlı rtere göre sınıflanır. Örneğn breylern hem sgara çp çmemelerne hem de ç çp çmemelerne gör sınıflandırılması, tsat bölümünde öğrenclern matemat ve statst derslernde başarı durumuna göre sınıflandırılması gb. Populasyonun sınıflandırılmasında özell date alındığından dolayı yönlü lar ( ontenjans ları ullanılır. u ların satırlarında ele alınan özelllerden brncnn farlı sevye veya durumlarını, sütunlarında se nc araterlern farlı sevye veya durumlarını gösterlr. u durumlar, sıralayıcı ve şelnde olablr. sınıflayıcı ölçeler 9 5
İ Yönlü ( Kontenjans Tablolarda elenen Değerlern Hesaplanması Özell 3... R G G G 3... G r C G G G 3... G r C Özell A 3............... C 3 C G c G c G 3c... G rc C c R R R 3 R r N Herhang br hücrenn belenen değern hesaplanmasında özellğn var olması sebebyle, o hücrenn bulunduğu satır ve sütun toplamlarının çarpımının örne hacmne bölünmesyle hesaplanır.. nc satır, j. nc sütunda br gözlemn belenen değer, R C j j şelnde bulunur. N. satır,. sütunda hücrenn belenen değer, şelndedr. R C N H : Populasyonun özellğ brbrnden bağımsızdır. ( aralarında lş yotur. H : Populasyonun özellğ brbrnden bağımsız değldr. ( aralarında lş vardır. Test İstatstğ: r c ( Gj j j j Örne: İzmr n uca lçesnde yapılan br anet çalışmasında şlern oy verdler part arasında br lş olup olmadığı araştırılmatadır. Aşağıda da anet sonucunda elde edlen blgler bulunmatadır. uca lçesnde oturan şlern cnsyetler le oy verdler part arasında lş olup olmadığını α, önem sevyesnde test ednz. Kadın Cnsyet Ere r c ( G j j > (r j j (c ;α se H red edlr. Partler A 5 3 C 5 4 6
H : Cnsyet le oy verlen part brbrnden bağımsızdır. H : Cnsyet le oy verlen part brbrnden bağımsız değldr. Partler A C Kadın 5 75 5 R C N Cnsyet Ere 5 5 5 75 5 5 * 5 5 5 4 35 5 r c ( G j j ( 5 ( 5 5 ( + + j j + 5 ( ( 75 ( 75 (r (c ;α (3 ( ;, 9, + 5 75 + 75 7,4 > 9, olduğundan dolayı H red edlr. % 99 olasılıla uca lçesnde şler çn oy verlen partler le cnsyet arasında br lş olduğu söyleneblr. 7,4 6 DAĞILIŞA UYUM TESTLERİ Örne verlernden yola çıara populasyonun dağılımı haında ortaya atılan ddayı test etme çn Dağılışa Uyum Testler ullanılır. Örne verler gözlenen değerler olara, örne hacm date alınara lgl dağılışın olasılı değerlernden yola çıara belenen değerler (teor freanslar hesaplanır. 7 Dağılışa Uyum Testlernde de ullanılaca olan test statstğ dağılışına uymatadır. Örneten elde edlen gözlenen değerler le dağılıştan yola çıara hesaplanan belenen değerler brbrne yaınsa hesaplanan değer üçü çıaca ve örne verlernn dağılışının dda edlen dağılışa uygun olduğu sonucu ortaya çıacatır. H o : Örne verler lgl dağılışa uygundur. H : Örne verler lgl dağılışa uygun değldr. Dağılışa Uyum Testlernde Kullanılaca Olan Test İstatstğ: ( G 8 7
Hesaplanan değer le dan bulunan hesap değer arşılaştırılara ddanın doğruluğu haında arar verlr. v, α hesap > se H red edlr. v - - g : sayısı hesap değer bulunuren date alınan grup g : İlgl dağılış çn örne verler ullanılara hesaplanan (tahmn edlen parametre sayısı 9 H ın red edlemedğ durumlarda örne verlernn dağılışı parametres blnen veya örneten tahmn edlen dağılışa uygun olduğu sonucuna varılır. 3 KESİKLİ ÜNİFORM(DÜZGÜN DAĞILIŞ Tanımlı olduğu değerler eşt olasılılar le alan şans değşenlernn dağılışıdır. Kesl ünform dağılışı gösteren br şans değşen N farlı değer eşt olasılılar le alıyorsa her br değer alma olasılığı /N e eşttr. p/n ( x P X N x,,3,......n d.d N adet Hlesz br zar atıldığında zarın yüzeylernde bulunan 6 sayının zarın ön yüzünde gelmesnn olasılığı brbrne brbrne eşt ve /6 olacatır. 3 3 8
Örne: üyü br şletmede hafta çersnde 5 gün çersnde şe gelmeme sayılarının dağılışı araştırılmatadır. u amaçla br hafta boyunca her gün şe gelmeyen şç sayıları ontrol edlere not edlmştr. Hafta çersnde ş yerne gelmeyen şç sayılarının dağılışının Ünform(Düzgün Dağılışa uygun olup olmadığını % 5 hata payıyla test ednz. Günler p ( G Pazartes Salı Çarşamba Perşembe Cuma toplam şe gelmeyen şç sayısı(g 5 9 9 6 6 /5 /5 /5 /5 /5 İşe gelmemes belenen şç sayısı( 6,75,75,75,8,33 3,66 33 H o : İlgl şletmede hafta ç günlerde şe gelmeyen şç sayılarının dağılışı Ünform Dağılışına uygundur. H : İlgl şletmede hafta ç günlerde şe gelmeyen şç sayılarının dağılışı Ünform Dağılışına uygun değldr. ( G h 3,66 v, α v - - g 5-- 4 Ünform Dağılışında tahmn edlen parametre sayısı dır. 4,.5 9, 49 h < t olduğundan H o red edlemez. İlgl şletmede hafta ç günlerde şe gelmeyen şç sayılarının dağılışı Ünform Dağılışına uygun olduğu % 5 hata payıyla söyleneblr. 34 Örne: Meyve suyu üretcs br frma ürettğ meyve sularını her brnde şşe bulunma üzere utular halnde poşetlemetedr. İşletmenn deposundan utu seçlere utuların her brnde hatalı şşelenmş olan meyve suları sayılara ayıt edlmştr. Aşağıda da utuların sayısı ve çersnde hatalı bulunan şşe sayıları verlmştr. a açşşe ontrol edlmştr? b aç hatalışşe bulunmuştur? c Örnete hatalışşelern oranını nedr? d Kutuların çersnde bulunan hatalı meyve sularının sayılarının nom Dağılışına uygun olup olmadığını % 5 hata payıyla test ednz. Hatalı Şşe Sayısı 3 4 5 ve daha fazla Kutu Sayısı 48 5 5 8 3 35 a utu ontrol edlmştr. Her br utu çersnde şşe meyve suyu bulunduğuna göre toplam adet şşe ontrol edlmştr. b x f 48+ 5+ 5+ 3 8+ 4 3+ 5 96 c pˆ 96,48,5 d H o : Kutularda bulunan hatalışşelern sayısı n olan nom Dağılışına uygundur. H : Kutularda bulunan hatalışşelern sayısı n olan nom Dağılışına uygun değldr. 36 9
HatalıŞşe Sayısı Kutu Sayısı (G 48 5 5 8 3 p,3585,3774,887,596,33,5 P elenen Kutu Sayısı ( n x 35,85 37,74 8,87 3 5,96 4,33 5 ve daha fazla,5 (K-Kare Parametr Olmayan Testler de herhang br hücrenn veya grubun belenen değer 5 ten üçü se endsne en yaın olan hücre veya grup le brleştrlr. u şleme herhang br hücre veya grup çersnde 5 ten üçü br belenen değer fades almayıncaya adar devam edlr. 37 HatalıŞşe Sayısı Kutu Sayısı (G elenen Kutu Sayısı ( h 48 35,85 5 37,74 5 8,87 ( G ( 48 35,85 ( 7,54 +... + α 35,85,,5 7,54 3 ve daha fazla 7,54,3 x n x - ( X x p ( p P( X (,5 (,5 v, --g,α 4--,,5 5,99 nom Dağılışında parametre sayısı (n,p olmasına rağmen soruda tahmn edlen parametre sayısı (p dr h t > olduğundan H o red edlr.. Kutularda bulunan meyve sularının çersnde hatalı şşelenenlernn sayısının n olan nom Dağılışına uygun olmadığı % 5 hata payıyla söyleneblr. 38 Örne: r havaalanında uçuşlar alış zamanına göre zamanında ve gecmel olara şelde sınıflandırılmıştır. Aşağıda da saatl süre çersnde gecmel gerçeleşen uçuşların sayıları fade edlmştr. a r saatl süre çersnde ortalama aç adet gecmel uçuş yapılmatadır? b r saatl süre çersnde gerçeleşen gecmel uçuş sayılarının Posson Dağılışına uygun olup olamadığını % 5 hata payıyla test ednz? saatte gerçeleşen 3 4 5 6 7 8 9 ve daha fazla gecmel uçuş sayısı Freans 4 35 43 5 6 4 39 a x f λ f 4 + 35 +...9 5 3 5 b H o : r saatl süre çersnde zamanında gerçeleşmeyen uçuşların sayısı Posson Dağılışına uygundur. H a : r saatl süre çersnde zamanında gerçeleşmeyen uçuşların sayısı Posson Dağılışına uygun değldr. -λ e λ P ( X x x! P ( X x - e! saatte gerçeleşen gecmel uçuş saysı 3 4 5 6 7 8 9 ve üstü Freans G 4 35 43 5 6 4 p,353,77,77,84,9,36,,34,9, elenen uçuş sayısı,3 4,6 4,6 7,7 3,53 5,4,8,5,3,4 4
saatte gerçeleşen gecmel uçuş saysı 3 4 5 ve üstü Freans G 4 35 43 5 6 7 elenen uçuş sayısı,3 4,6 4,6 7,7 3,53 7,9 ( G 4,3 7 7,9 +... +,9,3 7,9 h v,α --g,α 6--,,5 4,,5 Posson Dağılışında parametre sayısı (λ dr. h < t olduğundan H o red edlemez. 9,49 Havaalanında saatl süre çersnde gerçeleşen gecmel uçuş sayılarının Posson Dağılımın uygun olduğu % 5 hata payıyla söyleneblr. 4 Normal Dağılışa Uyum Test Örneğ: Kmyasal br madde üreten br frma günlü satışlarının ( galon normal dağılışa uygun olup olmadığını araştırma stemetedr. u amaçla gün boyunca satılan mtarlar ayıt edlere aşağıda sınıflanmış ver set elde edlmştr. una göre % 5 hata payıyla satışların normal dağılışa uygun olup olmadığını test ednz. 4 Satışlar ( galon x < 34, 34, x < 35,5 35,5 x < 37, 37, x < 38,5 38,5 x < 4, 4, x < 4,5 4,5 x < 43, 43, x < 44,5 44,5 x <46, 46, x Satılan Gün Sayısı 3 35 43 5 7 43 Uyumu araştırılaca dağılış olan normal dağılışın parametreler fade edlmedğnden verlen örneten yola çıılara, örne statstler tahmn edlr. x 4 s, 5 Her br sınıfa at olan olasılı değerler sınıflanmış verlern aralığına düşmes olasılığına arşılı gelr. Anaütle dağılışının uygun olduğu varsayılan normal dağılışla lşn olasılı hesaplamaları standart normal dağılışa ( z dönüştürme yoluyla hesaplanır. 44
P( < x < 34 P( < z <,4,5,498,8 P ( 4 < x < 4,5 P ( < z <,6,57 Hesaplanan bu olasılılar toplam örne hacmyle çarpılara belenen değerler elde edlr. np,8 *,64 6 np 6,57 * 54 H o : Satışlar normal dağılışa uygundur. H : Satışlar normal dağılışa uygun değldr. Satışlar x < 34, 34, x < 35,5 35,5 x < 37, 37, x < 38,5 38,5 x < 4, 4, x < 4,5 4,5 x < 43, 43, x < 44,5 44,5 x <46, 46, x G 3 35 43 5 7 G 3, 7,8 p np,8,64,7 5,54,79 5,84,59 3,84,57 45,4,57 45,4,59 3,84,79 5,84,77 5,54,8,64 G - 5,8 4,6 3,6 -,4 5,86-4,84-5,84-6,8 (G - / 4,776,95,336,5,767,7357,53 5,393 45 G 8, 8 6,8 46 h ( G 4,776 +,95 +... + 5,393 5,94 v - - g 8-- 5 v;α --g;α 8--5;,5 5;,5,7 h > t olduğundan H o red edlr. Frmanın günlü satışlarının normal dağılışa uygun olmadığı % 5 hata payıyla söyleneblr. 47