BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ



Benzer belgeler
BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

İstatistik ve Olasılık

Parametrik Olmayan Testler. İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi

İSTATİSTİK II. Hipotez Testleri 1

İstatistik ve Olasılık

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

OLASILIK ve İSTATİSTİK Hipotez Testleri

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları III (3 Mayıs 2012)

BİYOİSTATİSTİK. Uygulama 4. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

İSTATİSTİKSEL TAHMİNLEME. Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir.

SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER. Abdullah Can

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş

BİYOİSTATİSTİK PARAMETRİK TESTLER

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

HİPOTEZ TESTLERİ. Yrd. Doç. Dr. Emre ATILGAN

İSTATİSTİK 2. Hipotez Testi 21/03/2012 AYŞE S. ÇAĞLI.

BÖLÜM 13 HİPOTEZ TESTİ

Ortalamaların karşılaştırılması

1 Hipotez konusuna öncelikle yokluk hipoteziyle başlanılan yaklaşımda, araştırma hipotezleri ALTERNATİF HİPOTEZLER olarak adlandırılmaktadır.

Mühendislikte İstatistiksel Yöntemler

NORMAL DAĞILIM VE ÖNEMLİLİK TESTLERİ İLE İLGİLİ PROBLEMLER

Farklı iki ilaç(a,b) kullanan iki grupta kan pıhtılaşma zamanları farklı mıdır?

Hipotez. Hipotez Testleri. Y. Doç. Dr. İbrahim Turan Nisan 2011

Statistical Package for the Social Sciences


3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

T TESTİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ. Yrd. Doç. Dr. C. Deha DOĞAN

PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER 8

İstatistik ve Olasılık

10. Bir ana kütle oranının tahmininde α = 0,05 ise kullanılan Z değeri nedir? A) 1,64 B) 1,84 C) 1,96 D) 2,28 E) 3,08

İkiden Çok Grup Karşılaştırmaları

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

HİPOTEZ TESTLERİ HİPOTEZ NEDİR?

İstatistik. Temel Kavramlar Dr. Seher Yalçın 1

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

Nokta ve Aralık Tahmini Merkezi Limit Teoremi Örneklem Dağılımı Hipotez Testlerine Giriş

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

İstatistik ve Olasılık

Tek Yönlü Varyans Analizi (ANOVA) Kruskal Wallis H Testi

Hipotez Testleri. Mühendislikte İstatistik Yöntemler

BÖLÜM 12 STUDENT T DAĞILIMI

İstatistik ve Olasılık

Kestirim (Tahmin) Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir.

BİYOİSTATİSTİK Uygulama 4 Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Hazırlayan. Ramazan ANĞAY Kİ-KARE TEST İSTATİSTİĞİ

Mühendislikte İstatistiksel Yöntemler

BÖLÜM 10 ÖRNEKLEME YÖNTEMLERİ

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

Bir Normal Dağılım Ortalaması İçin Testler

UYGUN HİPOTEZ TESTİNİN SEÇİMİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır.

Merkezi Eğilim ve Dağılım Ölçüleri

Hipotezlerin test edilip onaylanması için çeşitli istatistiksel testler kullanılmaktadır. Fakat...

BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

KRUSKAL WALLIS VARYANS ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

1. FARKLILIKLARIN TESPİTİNE YÖNELİK HİPOTEZ TESTLERİ

PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER

Olasılık ve Normal Dağılım

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

İstatistik ve Olasılık

Popülasyon Ortalamasının Tahmin Edilmesi

Student t Testi. Doç. Dr. Ertuğrul ÇOLAK. Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

İstatistik ve Olasılık

İSTATİSTİK HAFTA. ÖRNEKLEME METOTLARI ve ÖRNEKLEM BÜYÜKLÜĞÜNÜN TESPİTİ

Varyans Analizi (ANOVA) Kruskal-Wallis H Testi. Doç. Dr. Ertuğrul ÇOLAK. Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

İçindekiler. Ön Söz... xiii

Temel Bilgi Teknolojisi Kullanımı

MATE 211 BİYOİSTATİSTİK İKİ FARKIN ÖNEMLİLİK TESTİ VE İKİ EŞ ARASINDAKİ FARKIN ÖNEMLİLİK TEST SORULARI

BİR ÖRNEKLEM İÇİN T TESTİ İLİŞKİSİZ ÖRNEKLEMLER İÇİN T-TESTİ

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

İstatistiksel Yorumlama

Temel ve Uygulamalı Araştırmalar için Araştırma Süreci

Hipotez Testi ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. Ders 4 Minitab da İstatiksel Çıkarım-I. Hipotez Testi. Hipotez Testi

Yrd. Doç. Dr. Neşet Demirci, Balıkesir Üniversitesi NEF Fizik Eğitimi. Parametrik Olmayan Testler. Ki-kare (Chi-Square) Testi

PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz.

DERS BİLGİLERİ Ders Kodu Yarıyıl T+U Saat Kredi AKTS Deneysel Tasarım EKO60 Bahar Ön Koşul Dersin Dili. Zorunlu

MATE211 BİYOİSTATİSTİK

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

K BAĞIMSIZ ÖRNEKLEM HİPOTEZ TESTLERİ

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

SÜREKLĠ OLASILIK DAĞILIMLARI

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

PARAMETRİK ve PARAMETRİK OLMAYAN (NON PARAMETRİK) ANALİZ YÖNTEMLERİ.

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

Transkript:

SAKARYA ÜNİVERSİTESİ BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ Hafta 9 Yrd. Doç. Dr. Halil İbrahim CEBECİ Bu ders içeriğinin basım, yayım ve satış hakları Sakarya Üniversitesi ne aittir. "Uzaktan Öğretim" tekniğine uygun olarak hazırlanan bu ders içeriğinin bütün hakları saklıdır. İlgili kuruluştan izin almadan ders içeriğinin tümü ya da bölümleri mekanik, elektronik, fotokopi, manyetik kayıt veya başka şekillerde çoğaltılamaz, basılamaz ve dağıtılamaz. Her hakkı saklıdır 2013 Sakarya Üniversitesi 0

BÖLÜM 5 ÇIKARIMSAL İSTATİSTİK BÖLÜMÜN AMACI Bu bölümün amacı en önemli istatistiksel dağılım olan normal dağılım ile ilgili temel bilgileri öğrenmek, normal olasılıkların hesaplanıp yorumlanmasını kavrayabilmektir. 5.1. Hipotez Testleri Hipotez kelime manası ile bir durum hakkında yapılan önermedir. İstatistiksel hipotez ise daha teknik bir tanımla bir ana kütle hakkında örnekleme istatistikleri yardımıyla yapılan önermelerdir. Aşağıda istatistiksel hipotezler için örnekler sunulmuştur. Günlük ortalama 1220 kg üretim yapan bir kimya fabrikasında, kullanılan yeni karıştırma aracı sayesinde ortalama üretim miktarı artmıştır. Bir firma tarafından üretilen aile boyu cipslerin ortalama ağırlığı 100 gramdır. Serdivan ilçesinde oturanların %40 ı giyim alışverişlerini AVM den gerçekleştirmektedir. İstatistiksel hipotezlerin doğruluğunun olasılık kuralları ile araştırılması gerekmektedir. Bu araştırma süreci ise hipotez testleri olarak adlandırılmaktadır. Hipotezler aslında istatistiklerden parametreler hakkında çıkarsama süreci, yani tahminleme süreci ile alakalı olduğunda mutlaka bir hata payı içerirler. Bu bağlamda örneklemden elde edilen istatistiklerinin belli bir hata payı ile doğrulanması sürecini İstatistiksel Hipotez Testleri olarak adlandırırsak daha doğru bir tanım yapmış oluruz. Hipotez testleri, ortaya atılan hipotezin yanlışlanamaması şeklinde çalışan bir süreçtir. Yani bir ana kütle ile ilgili temel bilgimiz olsun. Eğer bu bilgisinin aksi ispatlanamamışsa o zaman biz bilgisini kabul ederiz. Buradaki istatistiksel hipoteze, bu bilginin yanlış olmadığının ispatı süreci ise hipotez testleri tanımlarına karşılık gelmektedir. Bütün istatistik hipotez testlerinde ana kütle ilgili yapılan önermeyi içeren bir hipotezle birlikte, bu durumun tersini öngören bir hipotez bulunur. Ana kütle ilgili önerme, ana kütle ile ilgili bilgimiz olan nın doğruluğunu öngörür ve veya sıfır hipotezi olarak adlandırılır. Bu bilginin doğru olmadığı durumda kabul ettiğimiz bilgi ise veya alternatif hipotez olarak adlandırılır. Hipotez testlerinde bütün işlemler hipotezinin kabulü veya reddine karar vermek adına gerçekleştirilir. Sıfır hipotezleri eşitlik hipotezleridir. Yani aranılan gerçeğin ana kütledeki gerçek ile örtüştüğü öngörüsünü savunur. Çekilen bir örnekteki ortalama değerinin ana kütle ortalamasına eşitliği araştırılıyorsa bu durumda ve hipotezi aşağıdaki gibi kurulmalıdır. : : 1

Kurulan hipotezlerden de anlaşılacağı üzere, hipotezi ile ulaşılacak sonuç, örneklem ortalamasının ana kütle ortalamasından farklı olmasıdır. Bu durumda örneklem ortalamasının ana kütle ortalamasından aşağıda veya yukarıda olması bir mana ifade etmez. Bu tip hipotez testlerine çift yönlü hipotez testleri denmektedir. Şekilden de anlaşılacağı üzere hipotezinin red edileceği ( öngörüsünün kabul edileceği) iki bölge vardır. hipotezinin olarak ifade edildiği bütün hipotez testlerinde durum bu şekildedir. Bazı durumlarda örneklem ortalamasının eşit olmaması değil de, yukarıda veya aşağıda olması durumları incelenebilir. Bu şekilde belli bir yönün öngörüldüğü testlere tek yönlü hipotez testleri denir. 0 : 1 : 0 : 1 : ÖRNEK Sakarya Üniversitesinde İşletme Fakültesinde okuyan öğrencilerin istatistik dersinden alınan notların ortalamasının 45,2 olduğu bilinmektedir. Aşağıdaki durumlar için araştırma hipotezlerini kurunuz. a. Yeni kullanılan bir kitapla birlikte öğrencilerin istatistik dersindeki başarı düzeyi yükselmiştir. b. Uygulamalı öğrenme yöntemine geçilmesi ile birlikte öğrencilerin istatistik notlarının değiştiği düşünülmektedir. 2

ÇÖZÜM İlk durumda öğrencilerin ortalamalarının yükseldiği önermesi gerçekleştirilmektedir. Bu önermeye göre tek yönlü bir değişim vardır. Notların düşmesi araştırılmamaktadır. Bu durumda tek yönlü hipotez testine uygun olarak sıfır hipotezi ve alternatif hipotez kurulmalıdır. : : İkinci durumda ise yeni öğretim yönteminin notları değiştirdiği düşünülmekle birlikte, etkisinin hangi yönde olduğu tam olarak öngörülememiştir. Bu durumda her iki yönde de bir değişimin olması araştırmacının önermesinde yer almalıdır. : : Yukarıda hipotez testlerinin şekilsel olarak ifadeleri incelendiğinde, sıfır hipotezinin red alanlarının simgesi ile gösterildiği anlaşılmaktadır. değerleri istatistiksel hipotez testlerinde anlamlılık düzeyi olarak adlandırılır. Tek yönlü hipotez testlerinde anlamlılık düzeyleri değerleri tek bir alanda betimlenirken, çift yönlü hipotez testlerinde iki farklı red alanı olduğunda her bir alan toplam anlamlılık düzeyinin yarısı olan 2 ile ifade edilir. Anlamlılık düzeyi tanımlanması sırasında sıklıkla kullanılan red bölgesi terimi Örneklem istatistiğinin ana kütle parametresi ile örtüşmediği bölge olarak adlandırılır. Unutulmamalıdır ki bu bölge hipotezinin reddine ait bölgedir yani aslında hipotezinin kabul bölgesidir. Red bölgesinin (veya bölgelerinin toplam alanı) anlamlılık düzeyi değerine eşittir. Hipotez testlerinde anlamlılık düzeyleri araştırmacının amaçları doğrultusunda, çalışma alanı ve araştırmacının tecrübeleri ışığında belirlenir. İstatistik testlerde genelde anlamlılık düzeyi, çalışma alanlarına bağlı olarak farklılık göstermesine rağmen, 0,05 olarak alınır. DİKKAT Anlamlılık düzeyleri genelde aşağıdaki gibi tercih edilir. Sağlık Bilimlerinde 0,01 Eğitim Bilimlerinde 0,05 Sosyal Bilimlerde 0,10 Anlamlılık düzeyini bir örnekle pekiştirelim. İstatistiksel hipotez testlerinde aslında aranılan gerçeklik, alternatif hipotezde yatar. Aşağıdaki hipotezleri inceleyelim. : ç ğ ş ş. : ç ğ ş. 3

Sağlık sektöründeki bir araştırmacı iseniz, aslında sizin aradığınız bilgi bu ilacın etkisinin olmasıdır. Bu durumda etkinin olduğunu, yani kalp hastalıklarının sayısını kesinlikler değiştirdiğini belirlemeniz gerekmektedir. 500 er kişilik iki deney grubu seçtiniz. Bir gruba ilaç verip, diğer gruba hiçbir şey vermeden sadece gözlem yaptınız. İlk yapılan muayenelerde 1000 deneğin hemen hemen aynı kalp sağlıkları olduğuna karar vermiştiniz. Deney sonucunda 5 yılsonunda ilaç alan grupta 47 kalp hastalığı, ilaç almayan grupta ise 53 kalp hastalığı olduğunu fark ettiniz. Bu durumda acaba ilaç hakikaten etkili mi? Bu sorunun cevabı anlamlılık düzeyi bilgisinde yatıyor. Eğer 0,10 alırsanız, sıfır hipotezi red bölgesi büyüyecek, diğer açıdan baktığımızda alternatif hipotez kabul bölgesi artacak. Bu durumda büyük ihtimalle 47 kalp hastalığı değeri 53 kalp hastalığından farklı çıkacaktır. Peki bu sonuç ne kadar güvenilir? Güvenilirliğinin çok yüksek olduğunu söylemek doğru olmaz. En basit ifade ile 1 %90 güvenilir diyebiliriz. Ama söz konusu sağlık ise bu rakam tatmin edici olmaktan çok uzaktadır. Sağlık sektöründe farklılık yaratıldığı net bir şekilde, olabildiğinde güvenilir olarak ifade edilmelidir. Bu durumda güvenilirliği arttırmak gerekir. 1 %99 değerine yükseltmek, 0,01 değerine düşürmek manasına gelir, bu durumda alternatif hipotezin kabul edilmesi ihtimali gitgide zayıflayacaktır. Eğer siz bu ilacın etkisinden kesin emin iseniz, bu durumda yüksek güvenirlik düzeylerinde de farklılık çıkmasını beklersiniz. %99 güvenilirlik düzeyinde acaba 47 kalp hastalığı, ilaç alınmayan durumdaki 53 kalp hastalığından farklı çıkmayacak ve iddianızı ispatlayamayacaksınız. DİKKAT Örneklem ortalamasından çok eminseniz o zaman anlamlılık düzeyi aşağı çekilerek testin güvenirliği arttırılabilir. İstatistiksel hipotez testleri sonucunda iki farklı hata türü ile karşılaşabiliriz. Sıfır hipotezi gerçekte doğru iken bu hipotezin test sonucunda red edilmesi durumu Birinci Tip Hata olarak adlandırılır. Diğer bir hata türü ise sıfır hipotezi ile ortaya atılan önermenin aslında yanlış olmasına rağmen test sonucunda kabul edilmesidir. Bu hata türüne ise İkinci Tip Hata denir. Sıfır hipotezi doğru iken kabul edilmesi veya yanlış iken red edilmesi durumlarında istatistiksel hipotez testlerinde hata olmadığı sonucuna ulaşılır. Sıfır hipotezinin doğru iken kabul edilmesi, kabul bölgesi yani 1 değerine eşittir. Bu durum testin güvenilirliği olarak adlandırılır. Eğer Sıfır hipotezi yanlış iken red edilmiş ise bu duruma Testin Gücü denir ve 1 ifadesi ile gösterilir. Hipotez testleri konusu anlatılırken sıklıkla incelenen mahkeme örneğini inceleyelim. Her birey aksi ispatlanana kadar masumdur ifadesi ile adalet sisteminde değerlendirilen Masumiyet Karinesi durumunu hipotez testleri yardımıyla ifade edelim. Herkesin masum olduğu görüşü ana kütle ilgili temel bilgimizdir. Bu yüzden sıfır hipotezini masumiyet karinesini sağlamak adına kurmalıyız. Alternatif hipotez ise bu duruma eşit olmayan, yani masumiyetin olmadığı durumu betimlemelidir. Bu koşullar altında istatistiksel hipotezler aşağıdaki gibi kurulmalıdır. 4

: ç ş : ç ş ç ş ç Hata durumlarını, testin güvenilirliğini ve gücünü aşağıdaki tablodan inceleyelim. Yukarıdaki örnekten de anlaşılacağı üzere masum olan bir insanı suçlu ilan etmek birinci tip hataya, suçu olan bir insanı masum ilan etmek ise ikinci tip hataya örnektir. Bu mahkemenin masum olan insanı, masum ilan etmesi güvenilirliğini, diğer taraftan suçlu bir insanın suçlu ilan edilmesi ise gücünü gösterir. Bu istatistikler arasındaki ilişkileri de iyice anlamak gereklidir. Eğer örneklem istatistikleri ile ana kütle parametreleri arasındaki fark artarsa, birinci tip hata yapma olasılığı azalıp, ikinci tip hata yapma olasılığı artar. Çünkü ortalamadan uzaklaştıkça anlamlılık düzeyi değeri düşer, bu değer düşerken değeri yükselir. değeri ana kütle standart sapmasının büyük olduğu durumlarda da benzer şekilde düşmektedir. Örneklem hacmi arttığında, hataların oranı düşeceğinden, bir diğer deyişle ana kütle ortalamasına daha fazla yaklaşılacağından parametresi düşecektir. 5.1.1. Hipotez Testi Süreci İstatistiksel hipotez testleri öncelikle hipotezlerin belirlenmesi ile başlanır. Buradaki önemli nokta hipotez testlerinin yönüdür. Çünkü çift yönlü veya tek yönlü bir hipotez testi olması analiz hesaplamalarını değiştirecektir. Hipotezler belirlendikten sonra araştırmacı daha önceki deneyimlerinde, çalışma alanı ile ilgili genel kabul görmüş bilgilerden faydalanarak anlamlılık düzeyini belirlemelidir. Anlamlılık düzeyi sonucunda farklılıkların ne kadar kesin olması isteniyorsa, testin güvenilirliğinin yükseltilmesi gerektiğini unutulmamalıdır. Daha sonra hipotezlerin test edilmesi için gerekli istatistiksel testler belirlenmelidir. Bu testler veri türüne (Sayısal veya Kategorik), Veri dağılımına (Parametrik veya Parametrik olmayan), Analiz yapılacak örneklem sayısına (Tek, çift veya ikiden çok) ve Verilerin bağımsızlık durumlarına göre (eşleştirilmiş veya eşleştirilmemiş) seçilir. Her farklı kombinasyon farklı bir test yapma gereksinimini doğurur. Daha sonra örneklem sayısına ve anlamlılık düzeyleri değerlendirilerek kritik test değerleri tablolardan okunur. Test türü belirlendikten sonra, o test için karşılaştırmalarda kullanılacak test istatistikleri hesaplanır. Bu istatistikler örneklem verilerinde bulunur. 5

Son olarak ise tablodan gelen kritik test istatistiği değeri ile örneklem için hesaplanmış olan test istatistiği karşılaştırılarak hipotezler ile ilgili kararlar verilir ve bu kararlar analize sonuçları ile birlikte yorumlanır. DİKKAT Hipotez testi gerçekleştirme adımları aşağıdaki gibi özetlenebilir. 1. Hipotezlerin belirlenmesi 2. Anlamlılık düzeyinin belirlenmesi 3. Test istatistiği seçilerek tablodan değerinin okunması 4. Örneklem verilerinden test istatistiğinin hesaplanması 5. Bu iki değerin karşılaştırılarak yorumlanması Yukarıda anlatılan yöntemde test istatistikleri karşılaştırılarak karar oluşturulur. Fakat istatistik alanında kullanılan bütün analiz programların karar verme süreci kabul olasılıkları ile anlamlılık düzeyinin karşılaştırılması şeklinde hesaplanır. Bu iki durum sonucunda elde edilen karar tamamen aynı olmakla birlikte, olasılık değerleri daha farklı yorumlar yapmamızı sağlayabilir. Eğer anlamlılık düzeyi üzerinden bir karşılaştırma yapılacaksa, manuel hesaplamalarda test istatistiğinin tablodan okunmasına gerek yoktur. Sadece örneklemden test istatistiği hesaplanıp, tablodan bu değere karşılık gelen kabul olasılığı değeri belirlenip, anlamlılık düzeyinin altında veya üstünde olması durumuna göre karar oluşturulur. Fakat pratikte bu test verilerini çok büyük veri setlerinde manuel olarak analiz etmek çok ta mümkün değildir. Bu nedenle bu işlemleri bizim için yapan, yöntemden ziyade sonuçlara bizi yönlendiren paket programlar kullanılır. Biz dersimiz içerisinde hemen hemen her bilgisayarda yer alan MS EXCEL 2010 programının Veri Çözümleme aracını bu amaçla kullanacağız. Bu araç çoğu analizde bize yorumlanabilecek sonuç tablolarını sunarken, bazı analizlerde yetersiz kalabilmektedir. Bu durumlarda piyasada bulunan (çoğu ücretli) birçok programdan analiz çıktıları vasıtasıyla EXCEL ile yapılamayan analizler ile ilgili bilgiler ve yorumlar sunulacaktır. Bir paket program vasıtasıyla veri analizini yapmak aşağıdaki süreçleri gerektirir. 1. Hipotezlerin belirlenmesi 2. Kullanılacak analiz yönteminin belirlenmesi 3. Anlamlılık düzeyi ve gerekli diğer parametrelerin programa girilmesi 4. Analiz sonuç tablosu okunarak bulunan kabul olasılığı değeri ile anlamlılık düzeyi karşılaştırılarak yorum yapılması 6

5.2. Tek Örneklem Testleri Tek bir örneklemin ana kütle ortalaması ile arasındaki farklılıkların istatistiksel olarak anlamlı olup olmadıklarının incelendiği analiz süreçleridir. Verilerin parametrik olup, olmamasına göre farklı testler yapılır. Parametrik Veri Tek Örneklem T Testi Tek Örneklem Bağımsız Veri Parametrik Olmayan Veri Wilcoxon İşaretli Sıralar testi Parametrik Veri Bağımsız Örneklem T Testi Bağımsız Veri Parametrik Olmayan Veri Mann Whitney U Testi Çift Örneklem Karşılaştırmalı Veri Analizi Eşleştirilmiş Veri Parametrik Veri Parametrik Olmayan Veri Eşleştirilmiş Örneklem T Testi Wilcoxon Eşleştirilmiş Çiftler Testi Tek Faktör (ANOVA) Parametrik Veri Varyans Analizi Çift Faktör Bağımsız Veri İkiden Fazla Örneklem Parametrik Olmayan Veri Parametrik Veri Kruskal Wallis Testi Rastgele Blok Dizaynı Çok Faktör (MANOVA) Bağımlı Veri Parametrik Olmayan Veri Friedman Testi DİKKAT Bu ders içerisinde bundan sonra; analiz tekniklerinin ne şekilde çalıştıkları, yazılım vasıtasıyla nasıl analizler yapılacağı, analiz sonuçlarının nasıl değerlendirileceği ile ilgilenilecektir. Ayrıca test istatistiği formülleri sunulmayacaktır. 5.2.1. Tek Örneklem T testi Eğer elimizde normal dağıldığını düşündüğümüz (Parametrik) bir ana kütleden çekilen bir veri var ise, bu verinin belirtilen ana kütleden çekildiğinin ispatını yapmak istiyorsak, bu durumda ana kütle ortalaması ile veri setindeki her bir değerin karşılaştırıldığı Tek örneklem t testi nden faydalanabiliriz. 7

ÖRNEK Bir araştırmacı Sakarya Üniversitesindeki öğrencilerin boy ortalamasının 175 cm olduğunu düşünmektedir. Bu amaçla üniversite kantininde rastgele seçtiği 15 kişilik iki örneklem grubunun Sakarya Üniversitesi öğrencisi olup olmadıklarını (175 cmlik ana kütleden çekilip çekilmediklerini) değerlendirmek istemektedir. Aşağıdaki verileri dikkate alarak, gerekli hipotezleri kurup, uygun testi EXCEL yardımıyla gerçekleştirip, sonuçları yorumlayınız. ÖRNEKLEM 1 175 169 175 177 180 168 183 178 175 193 179 186 180 171 196 ÖRNEKLEM 2 197 187 193 187 172 183 167 190 191 192 170 164 188 178 175 ÇÖZÜM Hipotez testlerine başlamadan önce sıfır ve alternatif hipotezler belirlenmelidir. : Ç ö ü ş : Ç ö ü Daha sonra veri analizi için kullanılacak istatistiksel test seçilmelidir. Soruda her iki grup ile ana kütle ortalamasının karşılaştırılması gerekmektedir. İki grubun ortalamalarının birbiri ile karşılaştırılması söz konusu değildir. Bu durumda ayrı ayır iki farklı tek örneklem t testi uygulanması gerekmektedir. Üçüncü olarak anlamlılık düzeyi ve aranılan parametre belirlenmelidir. Bu soru için biz anlamlılık düzeyini 0,05 ve ortalama parametresini ise 175 olarak belirlenmiştir. Son olarak Excel yardımıyla analizler gerçekleştirilecektir. EXCEL Tek örneklem t testini Excel yardımıyla direkt olarak gerçekleştirmek mümkün değildir. Excel içerisinde iki farklı grubun karşılaştırıldığı t testleri yapılabilmektedir. Fakat veri üzerinde yapılabilecek ufak bir ayarlama ile tek örneklem testinin yapılması gerçekleştirilebilir. Tek örneklem t testi için öncelikle veriler sütunlara alt alta yazılmalıdır. Bu sırada açıklayıcı olmak adına ilk satırda veri etiketleri kullanılmalıdır. Daha sonra boş bir sütuna Ortalama etiketi ilk satıra girilerek, karşılaştırma için kullanılacak ana kütle ortalaması (bizim sorumuzda 175) her bir satıra tekrarlı olarak girilmelidir. Bu şekilde Excel de hazırlanan veri setleri aşağıdadır. 8

Veri seti yukarıdaki gibi girildikten sonra her bir grup için ayrı ayrı testleri yapmak gerekmektedir. Testleri yapmak için Veri Çözümleme aracı açılır. Açılan listeden t test: ortalamalar için iki örnek seçilir. Gelen ekranda Değişken 1 Aralığı alanına test için girdiğimiz boy değerleri seçilir. Değişken 2 Aralığı kısmına ise Ortalama adı ile oluşturduğumuz yeni sütundaki veriler girilir. Eğer veri seçimlerinde açıklama satırları seçildi ise (Bu soruda seçilmiştir), o zaman Etiketler kutucuğu seçilmelidir. Son olarak Alfa kutucuğuna anlamlılık düzeyi değeri girilmelidir. Bu işlemler bittikten sonra analiz sonuçlarını istediğimiz alan Çıkış Aralığı kısmından seçilmelidir. Yukarıdaki ekranda Tamam tuşuna basıldığında aşağıdaki sonuç ekranı verilecektir. 9

Sonuç ekranında (1) numara ile gösterilen alan Örneklem 1 değerleri için hesaplanmış olan t test değeridir. (3) numaralı değer ise iki yönlü hipotez testi olduğundan anlamlılık düzeyinin (0,05) ve serbestlik derecesi 14 (serbestlik derecesi n 1 değerine eşittir) olduğu durumdaki t istatistiğinin tablo değeridir. (2) numaralı kısım ise kabul olasılığını ( ) verir. Bu değer anlamlılık düzeyinin üstünde olduğundan (0,318 > 0,05) hipotezi red edilmeyecek, yani başka bir deyişle kabul edilecektir. Bu durumda yapılacak yorum Örneklem 1 öğrencilerinin ortalama boyları 176,933 (sonuç tablosunda en üstte) ana kütle ortalaması olan 175 değerinden istatistiksel açıdan farklı değildir. Başka bir deyişle örneklem ortalaması ile ana kütle ortalaması arasındaki fark istatistiksel açıdan anlamlı değildir. (Büyük ihtimalle örneklem denekleri Sakarya Üniversitesi öğrencisidir) İkinci örneklem için benzer adımlar tekrarlandığında aşağıdaki sonuç tablosu elde edilir. T testi kritik değeri(3) hesaplanan değerden(1) daha küçüktür. Ayrıca kabul olasılığı (2) anlamlılık düzeyinden ( 0,05) daha azdır. Bu durumda Sıfır hipotezi ( ) red edilecek ve alternatif hipotez ( ) kabul edilecektir. Yani Örneklem ortalaması 182,267 ile ana kütle ortalaması 175 arasındaki fark istatistiksel açıdan anlamlıdır. Bir başka deyişle bu örneklem ortalaması 175 olan bir ana kütleden çekilmemiştir. (Misafir bir voleybol takımı olabilir.) 5.2.2. Wilcoxon İşaretli Sıralar Testi Eğer verilerimiz parametrik değilse, yani normal dağılıma uymuyorsa, o zaman Wilcoxon İşaretli Sıralar testi analizi hipotezleri test etmek adına kullanılmalıdır. Klasik t testi yaklaşımlarında örneklem ortalaması esastır. Yani karşılaştırmalar alınan örneklemin ortalaması ile ana kütle ortalamasının karşılaştırılması şeklinde gerçekleştirilir. Fakat Wilcoxon İşaretli Sıralar testinde kontrol edilen parametre medyandır. 10

ÖRNEK Bir yükseköğretim kurumu sayısal derslerde kullanılması amacı ile bir analiz programı geliştirmiştir. Bu analiz programı ile öğrencilerin derslerde daha başarılı olacağı düşünülmektedir. Kurum son beş yıl içerisinde mezun olan öğrencilerinin KPSS Genel Yetenek sınavının sayısal kısmında elde edilen puanları analiz etmiş ve 21,7 matematik neti medyan değeri belirlemiştir. Rastgele seçilen 30 mezun öğrencinin KPSS Genel Yetenek Testi netleri aşağıda verilmiştir. Alınan notların normal dağılmadığı biliniyorsa acaba bu yöntem başarıya ulaşmış mıdır? ÇÖZÜM Öncelikle verilen normal dağılmadığı, yani parametrik olmadığı dikkate alınarak, tek örneklem t testi yaklaşımı ile sorunun çözülemeyeceğini anlamamız gerekmektedir. Bu sorunda Wilcoxon İşaretli Sıralar testi kullanılmalıdır. Bu testin Excel programı ile basit bir çözümü yoktur. Ayrıntılı olarak karmaşık çözüm yöntemlerinden bahsetmek yerine bu soruda sonuçların yorumlanması ile ilgilenilecektir. İlk aşama olarak Hipotezlerin belirlenmesi gerekmektedir. Sıfır hipotezi eşitlik şeklinde yazılacaktır. Fakat eşitlik ortalama değil medyanların eşitliği şeklinde olmalıdır. Alternatif hipotez ise yerine şeklinde olmalıdır. : ğ ş ş. : 21,7 : ğ ş ş. : 21,7 Veriler düzenlendikten sonra elle hesaplayarak veya piyasadaki paket programların herhangi biri ile aşağıdakine benzer sonuçlar elde edilir. Parametreler Değerler Ana Kütle Medyan 21,70 Hesaplanan Medyan 26,00 Test Değeri 2,400 Kabul Olasılığı ( ) 0,016 Tek örneklem t testi ile benzer şekilde yorumlar yapılmalıdır. Burada sıfır hipotezinin kabul olasılığı 0,016 değeri anlamlılık düzeyi ( 0,05) değerinden düşük olduğunda alternatif hipotez kabul edilecektir. Yani örnekleme ait medyan değeri ana kütle medyan değerinden farklıdır. Bu şekilde 26,00 değeri ile yeni uygulanan yöntemin, sayısal derslerde başarılı olduğu sonucuna ulaşabiliriz. 11

ÖZET İstatistiksel hipotezler ana kütle parametreleri hakkında örneklem yardımıyla yapılan önermelerdir. Bu önermelerin belli bir hata payı ile doğrulanması süreçleri ise istatistiksel hipotez testleri olarak adlandırılır. Hipotez testleri veri analizi sürecini ilk ve en önemli aşamasını oluşturur. Verilerin türleri, bağımsızlık durumu, çekilen örneklem sayısı ve veri dağılımın normal dağılıma uyup uymaması analiz yöntemini seçmeden önce belirlenmesi gereken karakteristiklerdir. Eğer normal dağılıma uyan tek bir örneklem olan verimizin ana kütle parametresi ile karşılaştırılması gerekiyorsa o zaman tek örneklem t testi kullanılmalıdır. Bu testle örneklem ve ana kütle ortalamalarının ne kadar benzeştiği test edilir. Veriler normal dağılmıyorsa, tek örneklem testi olarak Wilcoxon İşaretli Sıralar testi kullanılabilir. Bu testte ana kütle medyanı ile örneklem medyanı karşılaştırılır. SON NOT İstatistiksel Testler, hipotezleri ispatlamak ya da yanlışlamak için tasarlanmazlar; Bunlardan amaç bir fikrin/iddianın gerçekleşme olasılığının ne kadar düşük/yüksek olduğunu göstermektir. Yanlışlamaya çalıştığımız hipotez sıfır hipotezdir (H_0), yani fark yoktur hipotezidir. H_1 hipotezi genelde yapılan iddiayı ifade eder. Örnekten elde edilen bilgiler örnek değişkenliği nedeniyle az veya çok yığına ait değerlerden farklı olabilir. Dolayısıyla sıfır hipotezi hakkında yığından seçilen bir örnek gruba dayanarak vereceğimiz karar doğru olabileceği gibi bazı hatalarda yapılabilir. Her analiz süreci veri türü, bağımsızlığı, dağılımı ve örneklem sayısı ile alakalıdır. Analizlere başlamadan bu değerleri doğruca belirlemek şarttır. Hipotezler belirlenirken alternatif hipotez çok doğru kurgulanmalıdır. Tek yönlü bir durum için, iki yönlü alternatif hipotez yazılması yanlış yorum yapma sonucunu doğurabilir. Eğer parametrik olmayan testler kullanılması zorunluluğu varsa, tek örneklem için Wilcoxon İşaretli Sıralar testi kullanmak uygun olmakla birlikte Run testi, Kolmogorov Smirnov tek örneklem testi, Binom testi, Ki Kare testleri de kullanılabilir. Anlatılan analizlerin sadece sayısal (sayılabilir, aralık) verilerinde yapıldığına dikkat ediniz. 12

ÇALIŞMA SORULARI S1 Aşağıdaki durumlar için uygun sıfır ve alternatif hipotezleri oluşturunuz? a. Bir araştırmacı Sakarya da bulunan futbol izleyicilerinin en fazla 100.000 kişisinin Sakarya Spor ile birlikte Fenerbahçe yi de tuttuğunu düşünmektedir. b. Bir firma yeni yaptığı promosyon ile satışlarının arttığını beklemektedir. c. Basketbol takımına katılan yeni iki oyuncu ile birlikte, takımın boy ortalamasının değiştiği düşünülmektedir. S2 Bir mağazadaki ortalama harcama tutarı alışveriş başına 47,5 TL iken, medyan 46,33 TL dir. Mağazadan alış veriş yapan ilk 10 erkek ve 10 bayan ile ilgili harcama tutarları aşağıdaki gibidir. Erkek Müşteri No Bayan Müşteri No Harcama Tutarı 1 40 1 66 2 55 2 59 3 53 3 49 4 67 4 53 5 33 5 55 6 27 6 69 7 27 7 40 8 31 8 39 9 36 9 69 10 33 10 57 Harcama Tutarı a. Yukarıdaki örneklem verilerinin normal dağıldığı varsayılıyorsa acaba müşterilerin harcama tutarları mağaza ortalamasından farklı mıdır? b. Veriler normal dağılmıyorsa a şıkkını tekrar analiz ediniz? (Her iki şıkkı da Erkek, Bayan ve toplam müşteri olarak ( örnek sayıları 10, 10 ve 20 olarak) anali ediniz.) KAYNAKLAR 1. Keller, Gerald; Statistics for Management and Economics, 9e, 2012 2. McClave, J.T, Benson, P.G, Sincich, T.; Statistics for Business and Economics, 11e, 2011 3. Sharpe N.R., De Veaux R.D., Velleman P.F.; Business Statistics 2e, 2012 13