PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER Prof. Dr. Ali ŞEN Ki- kare Bağımsızlık Testi Daha öceki bölümlerde ölçümler arasıdaki ilişkileri asıl iceleeceğii gördük. Acak sıklıkla ilgileile veriler ölçüm yerie satır ve sütu kategorileride yer ala gözlem adeti şeklidedir. Ve araştırmacılarkategorileri birbirleri ile bağımlı veya bağımsız olup olmadıklarıı alamaya çalışırlar.
Ki- kare Bağımsızlık Testi 3 Ki- kare Bağımsızlık Testi Testi gerçekleştirilmesi içi kotejas tablosu deile tablou kurulmuş olması gerekir. Bu tablo, icelee iki değişkei şıklarıa düşe gözlee frekasları yazıldığı, yatay ve düşey batlarda oluşa bir bölümüş tablodur. Bu tabloya her hücreye düşmesi beklee gözlem adetleri yerleştirilir ve gözlee ile beklee değerleri birbirleride uzaklaşmaları dikkate alıarak test gerçekleştirilir. 4
Ki- kare Bağımsızlık Testi RxC Tabloları ile Bağımsızlık Testi Baya televizyo izleyicilerii öğreim düzeyleri ve TV programlarıda tercih ettikleri türler sorgulaarak, bu iki değişke arasıda bir bağlatı buluupbulumadığı yai iki değişkei birbiride bağımsız olup-olmadığı ortaya komaya çalışılacaktır. 5 Ki- kare Bağımsızlık Testi Bu amaçla Öğreim Düzeyi 300 izleyiciyi Tercih edile TV programı Türü İlk Orta Yüksek kapsaya bir Dizi Film 50 0 0 80 öreklem Eğlece 0 3 8 60 üzerideki gözlemler yadaki Saat ve Kültür 4 60 85 Magazi 6 37 3 75 soucu vermiştir. Toplam 90 00 0 300 Toplam 6 3
Ki- kare Bağımsızlık Testi Eğer baya izleyicileri tercih ettikleri TV programı türü oları öğreim düzeyleri ile ilişkili değilse, her gözde beklee frekasları, paratez içidekiler gibi bir dağılım gerçekleşmesi gerekirdi. 7 Ki- kare Bağımsızlık Testi Gerçektede toplam 300 bireyde dizi film tercih edeler 80 kişi olup öğreim düzeyie bakılmaksızı, bu deemede yer ala her bayaı dizi filmi tercih etmesi olasılığı 80/300 dür. Bu bayalar ilk öğreimli olsalar, bu ora (80/300) olarak gözleecektir. 8 4
Ki- kare Bağımsızlık Testi Oysa ilk öğreimli 90 baya var ve buları 80/300 ü 90(80/300)=4 kişi eder, bua karşılık ilk öğreimli 50 bayaı bu programı izlediği gözlemiş, 4 kişilik bekletiye karşılık 50 kişilik bir gerçekleşme var. 9 Ki- kare Bağımsızlık Testi P(Dizi/İlkokul)=P(Dizi) olursa iki olay bağımsızdır. İcelee iki kategogirii bağımsız olabilmesi içi tüm satır sütu kombiasyolarıı bu şartı sağlaması gerekir P(Dizi)= Toplam dizi izleyicisi Geel Toplam P(Dizi/İlkokul)= Dizi, İlkokul hücresideki sayı İlkokul sütuu toplamı Bağımsızlık içi P(Dizi/İlkokul)=P(Dizi) olmalı öyle ise 0 5
Ki- kare Bağımsızlık Testi Dizi, İlkokul hücresideki sayı Toplam dizi izleyicisi İlkokul sütuu toplamı Geel Toplam Dizi, İlkokul hücresideki sayı = Toplam dizi izleyicisi x İlkokul sütuu toplamı Geel Toplam (80) x (90) = = 4 00 Ki- kare Bağımsızlık Testi Ayı tekikle, her göz içi birer beklee frekas hesaplaarak gözlerde paratez içeriside gösterilmiştir. Tercih edile TV programı Türü Dizi Film Eğlece İlk 50(4) 0(8) Öğreim Düzeyi Orta Yüksek 0(6.7) 0(9.3) 3(0.0) 8(.0) 80 60 Toplam Saat ve Kültür 4(5.5) (8.3) 60(3.) 85 Magazi 6(.5) 37(5.0) 3(7.5) 75 Toplam 90 00 0 300 6
Ki- kare Bağımsızlık Testi H 0 : Gözlerdeki gözlee ve beklee frekaslar arasıdaki farklar, çok küçük farklardır, tesadüfe bağlı olarak ortaya çıkmışlardır, öğreim düzeyi ile TV programı birbiride bağımsız değişkelerdir. Bu iki değişke arasıda ilişki yoktur. 3 Ki- kare Bağımsızlık Testi H : Gözlerdeki gözlee ile beklee frekaslar arasıdaki farklar tesadüfe bağlı olmayacak kadar büyüktür, öğreim düzeyi ile TV programı arasıda bir ilişki vardır. 4 7
Ki- kare Bağımsızlık Testi İstatistiksel Test: Gözlee ve beklee frekaslara dayaa ve iki değişkei arasıdaki ilişkii varlığıı araştıra bir test ola testi olmalıdır. χ 5 Ki- kare Bağımsızlık Testi Alamlılık Düzeyi: α = 0.05 İşlem ve Karar: ve =300 olsu. Gözlee ve beklee frekasları farklarıa dayalı olarak her göz içi hesaplaa χ değerleri toplaarak, test istatistiğii oluşturacak buluacaktır. χ h 6 8
Ki- kare Bağımsızlık Testi χ k ( Gi Bi ) h = i= Bi χ h = (50 4) 4 (0 8) + 8 (3 7.5) +... + 7.5 = 9.8 Serbestlik derecesi v=(r-)(c-)= (3-)(4-)= 6 dır. χ 0 =.59.05;6 7 Ki- kare Bağımsızlık Testi χ h = 9.8 > χ 0.05;6 =.59 Nedeiyle Ho hipotezi reddedilecektir, H kabul edilecektir. Souç olarak, baya izleyicileri öğreim düzeyleri ile oları izlemeyi tercih ettikleri TV programı türü arasıda istatistik bakımıda alamlı, öemli bir bağlatı vardır. 8 9
PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER Prof. Dr. Ali ŞEN 9 Birçok durumda seride bulua birimleri rasgele olarak seçilip seçilmediğii bilmek isteriz. Öreği istatistiki aalizlerde verile kararları dayadığı temel varsayım alıacak kararları rasgele öreklere bağlı olmasıdır. 0 0
Rasgelelik yaklaşımıı olup olmadığı durumlara örek vermek gerekirse: Bazı kalite kotrol prosedürleride kotrol grafikleri üretim süreçlerii çıktıları arasıda stadartlara uymayaları oraıı belirleyip kotrol altıa almada kullaılır. Üretile mamüllerde belirli aralıklarla örekler alıır ve bu örekler itibariyle stadartlara uymaya mamül oraı belirleir. Araştırmacı, belirli bir örekteki stadartlara uymaya mamül oraıı, tüm prosesdeki stadartlara uymaya mamül oraı ile karşılaştırılır.
Burada araştırmacı, aldığı öreği rasgele bir örek olup olmadığıı bilmek ister. Rasgeleleğii olmaması üretim sürecii kotrolde olmadığıı gösterir. 3 Tek Örek Dizi Sayılar -RuTesti İkici olarak, regresyo aalizide, bağımlı değer ile bu değere karşılık gele tahmii değer arasıdaki fark artık olarak adladırılır. Artıklar hem pozitif hem de egatif olabilir. Örek verileri tesadüflüğüü alamak içi pozitif ve egatif artık değerleri sayısıı test ederiz. 4
Rasgeleliği araştıra prosedürler üzeride durula verilerdeki dizileri sayılarıa ve doğasıa dayaır. Dizi ard arda birbirii takip ede bezer olay, birim veya sembollerdir. Bir seride çok sayıda veya çok az sayıda dizi varsa, söz kousu serii rasgeleliğide şüpheleir. 5 Öreği 0 kişilik bir örek psikolojik deemeye alıacaktır. Eğer üzeride deeme yapılacak kişiler cisiyetlerie göre: E K E K E K E K E K şeklide teste tabi tutulursa, bu öreği rasgeleliğide şüpheleiriz. 6 3
Bu durumda çok sayıda dizii (0 dizi) olması yüzüde öreğe birim seçerke sistematik bir prosedürü takip edildiğii söyleyebiliriz. Eğer deemeye çağrılacak kişileri sırası: E E E E E K K K K K şeklide olsaydı, bu durumda sadece iki dizii ayrı olması yüzüde rasgelelikte şüpheleecektir. 7 Varsayımlar: Aalizde kullaılacak veriler, vuku bulma sıralarıa göre kaydedilmiş, başlıca iki kategori tipi içeriside toplaabilecek bir seride oluşmaktadır. Toplam örek sayısı ise, birici tip örek sayısı, birici tip örek sayısı olsu. 8 4
Hipotezler: A. (Çift yölü) H0: İki örek tipii vuku bulması durumu tesadüfi bir süreci soucudur. H: Vuku bulma durumu tesadüfi değildir. 9 B. (Tek Yölü) H0: İki örek tipii vuku bulması durumu tesadüfi bir süreci soucudur. H: Şasta ileri geldiğii kabul edemeyeceğimiz kadar az dizii olması sebebiyle vuku bulma durumu rasgele değildir. 30 5
6 3 C. (Tek Yölü) H0: İki örek tipii vuku bulması durumu tesadüfi bir süreci soucudur. H: Şasta ileri geldiğii kabul edemeyeceğimiz kadar çok dizii olması sebebiyle vuku bulma durumu rasgele değildir. 3 Test istatistiği: Test istatistiği r, toplam dizi sayısıdır. r adet dizi gözlemlemei olasılığı + = ) ( k k r f + + = ) ( k k k k r f r çift ike r tek ike
Karar Modeli: A. Sıfır hipotezi yö belirtmediği içi çift yölü hipotez testi yapılabilir. Böylece test istatistiği içi alt ve üst kritik değerlerii belirlememiz gerekir. 33 r değeri, alt kritik değere eşit veya küçük ise veya üst kritik değere eşit veya büyük ise rastgeleleği olduğuu iddia ede sıfır hipotezi reddedilir. E fazla 0 ye kadar ola ve değerleri itibari ile tablo kritik ' değerleri ( u ve u α / ) verir verir. α / 34 7
B. ve değerleri itibari ile ilk Tabloya bakıız r değeri tablodaki test istatistiğide küçük veya eşit ise α öem seviyeside Ho hipotezii redderiz. 35 Tek Örek Dizi Sayılar Testi C. ve değerleri itibari ile tabloya bakıız. r değeri tablodaki test istatistiğide büyük veya eşit ise α öem seviyeside Ho hipotezii redderiz. 36 8
Örek: Bir kasaba yolu üzeride dikile karağaçları yol boyuca hasta ve sağlıklı olmalarıa göre dizilişi şu şekildedir. HHHHDDDHHHHHHHDDHHDDDD Bua göre dizilişi rastgele olup olmadığıı araştırı (0,05 öem seviyeside) 37 HHHHDDDHHHHHHHDDHHDDDD H 0 : Diziliş rastgeledir H : Diziliş rastgele değildir = 3 ve = 9 Tabloda üst kritik değer ' u α / = 6 okuur r ru sayısı 6 olduğuda H 0 hipotezi reddedilir u α / = 7 ve alt kritik değer 38 9
Büyük Örek Yaklaşımı: ve değerleride birisi 0 yi geçtiğide hipotezlerimizi test etmede ormal dağılım yakısaması yapılabilir Büyük örekler içi z değeri Ho hipotezi doğru ike stadart ormal dağılıma yaklaşır. r {[( ) /( + ) + ] } z = ( ) ( + ) ( + ) 39 Büyük Örek Yaklaşımı: Bir rock koseride bilet almak içi sıraya dizile erkek E ve kadıları K dizilişi aşağıdaki gibidir EKEKEEEKEKEEEKKEEEEKKEKEEEKEEEKKKEKEEE KEKEEEEKKE Bua göre 0,05 öem seviyeside dizilişi rastgeleliğii araştırı 40 0
EKEKEEEKEKEEEKKEEEEKKEKEEEKEEEKK KEKEEEKEKEEEEKKE H 0 = Diziliş rastgeledir H = Diziliş rastgele değildir. 4.30.8 μ = + = 3,5 3, 30 + 8 σ.30.8(.30.8 30 8) = = (30 + 8) (30 + 8 ) z = z = u μ σ 7 3,5 =,09 3, İke z<,96 ve z>,96 ise H 0 reddedilecektir H 0 reddedilemez 4