BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ



Benzer belgeler
BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

χ 2 Testi Mühendislikte İstatistik Yöntemler Bağımsızlık Testi Homojenlik Testi Uygunluk Testi

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

Ki- Kare Testi ANADOLU ÜNİVERSİTESİ. ENM 317 MÜHENDİSLİK İSTATİSTİĞİ İYİ UYUM TESTİ Prof.Dr. Nihal ERGİNEL

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

İSTATİSTİK 2. Hipotez Testi 21/03/2012 AYŞE S. ÇAĞLI.

Yrd. Doç. Dr. Neşet Demirci, Balıkesir Üniversitesi NEF Fizik Eğitimi. Parametrik Olmayan Testler. Ki-kare (Chi-Square) Testi

Mann-Whitney U ve Wilcoxon T Testleri

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

Olasılık ve İstatistiğe Giriş-I (STAT 201) Ders Detayları

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

DOKUZ EYLÜL ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ DEKANLIĞI DERS/MODÜL/BLOK TANITIM FORMU. Dersin Orjinal Adı: STATISTICS. Dersin Kodu: STA 1302

BÖLÜM 14 BİLGİSAYAR UYGULAMALARI - 3 (ORTALAMALARIN KARŞILAŞTIRILMASI)

İSTATİSTİK STATISTICS (2+0) Yrd.Doç.Dr. Nil TOPLAN SAÜ.MÜH. FAK. METALURJİ VE MALZEME MÜH. BÖLÜMÜ ÖĞRETİM ÜYESİ ÖĞRETİM YILI

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

Hazırlayan. Ramazan ANĞAY Kİ-KARE TEST İSTATİSTİĞİ

PARAMETRİK ve PARAMETRİK OLMAYAN (NON PARAMETRİK) ANALİZ YÖNTEMLERİ.

İstatistik ve Olasılık


OLASILIK ve KURAMSAL DAĞILIMLAR

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

Sıklık Tablosu Oluşturma. BBY606 Araştırma Yöntemleri Güleda Doğan

Mühendislikte İstatistiksel Yöntemler

İçindekiler. Ön Söz... xiii

1. FARKLILIKLARIN TESPİTİNE YÖNELİK HİPOTEZ TESTLERİ

İstatistik ve Olasılık

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

UYGUN HİPOTEZ TESTİNİN SEÇİMİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Üretim Süreci: Girdi İşlem Ürün (Sonuç) Araştırma Süreci: Hangi alanda olursa olsun araştırma bir BİLGİ ye ulaşma sürecidir.

Verilerin Düzenlenmesi

Frekans. Hemoglobin Düzeyi

BİYOİSTATİSTİK. Ödev Çözümleri. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Biyoistatistik. Uygulama 1

ANADOLU ÜNİVERSİTESİ. ENM 317 MÜHENDİSLİK İSTATİSTİĞİ İYİ UYUM TESTİ Prof.Dr. Nihal ERGİNEL

BİYOİSTATİSTİK. Uygulama 4. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

İstatistik ve Olasılık

OLASILIK ve İSTATİSTİK Hipotez Testleri

IİSTATIİSTIİK. Mustafa Sezer PEHLI VAN

Tablo (2): Atıştırma Sayısı ve Günlük Sınav Sayısı Atıştırma Sınav Sayısı (X)

PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER

30 GÜNDE EĞİTİM BİLİMLERİ

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş

İstatistik ve Olasılık

Tek Yönlü Varyans Analizi (ANOVA) Kruskal Wallis H Testi

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

İstatistik ve Olasılık

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

İÇİNDEKİLER ÖN SÖZ...

SÜREKLİ ŞANS DEĞİŞKENLERİ. Üstel Dağılım Normal Dağılım

istatistik El 10 1_ ve 2_ sorular a Ş3 gldakl bilgilere göre Al 4 Bl 6 cı 7 Dl 8 Al 5 B) 12 CL 27 D) 28 E) 35 2Q 10 BS 4200-A

Adım Adım SPSS. 1- Data Girişi ve Düzenlemesi 2- Hızlı Menü. Y. Doç. Dr. İbrahim Turan Nisan 2011

çözümlemesi; beklenen değer ile gözlenen değer arasındaki farkın araştırılması için kullanılır.(aralarındaki fark anlamlı mı?)

İstatistik ve Olasılığa giriş -I (STAT 201T) Ders Detayları

İkiden Çok Grup Karşılaştırmaları

İstatistik ve Olasılık

İstatistik Yöntemleri ve Hipotez Testleri

TAŞINMAZ DEĞERLEMEDE İSTATİSTİKSEL ANALİZ

K BAĞIMSIZ ÖRNEKLEM HİPOTEZ TESTLERİ

Non-Parametrik İstatistiksel Yöntemler

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

ENM 316 BENZETİM ÖDEV SETİ

Farklı iki ilaç(a,b) kullanan iki grupta kan pıhtılaşma zamanları farklı mıdır?

TÜRKİYE DENGELEME GÜÇ PİYASASI TALİMAT MİKTARLARI ÜZERİNE İSTATİSTİKSEL BİR ÇALIŞMA 1. Gökhan Ceyhan Yazılım ARGE Uzmanı, EPİAŞ

İstatistik ve Olasılık

Mühendislikte İstatistik Yöntemler

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

HİPOTEZ TESTLERİ. Yrd. Doç. Dr. Emre ATILGAN

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Student t Testi. Doç. Dr. Ertuğrul ÇOLAK. Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

TANIMLAYICI İSTATİSTİKLER

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Merkezi Eğilim ve Dağılım Ölçüleri

KATEGORİSEL VERİ ANALİZİ (χ 2 testi)

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

İstatistik ve Olasılık

BİYOİSTATİSTİK Uygulama 4 Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

CEVAPLAR. n = n 1 + n 2 + n 3 + n 4 + n 5 + n 6 + n 7 = = 11 dir.

Deneysel Araştırmalarda Uygun Örneklem Büyüklüğü Ve İstatistiksel Güç Analizi. Doç Dr. Nurhan DOĞAN AKÜ Tıp Fak. Biyoistatistik ve Tıbbi Bilişim AD

İSTATİSTİK EXCEL UYGULAMA

Poisson Dağılımı Özellikleri ve Olasılıkların Hesaplanması

İstatistik 1. Bölüm 5 Olasılık Teorisi ve Kesikli Olasılık Dağılımları. Ankara Üniversitesi SBF, GYY

Parametrik Olmayan İstatistik. Prof. Dr. Cenk ÖZLER

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları III (3 Mayıs 2012)

ULUDAĞ ÜNİVERSİTESİ İİBF FAKÜLTESİ ÖĞRENCİLERİNİN BİLİŞİM TEKNOLOJİLERİ KULLANIM ARAŞTIRMASI. Danışman: Prof. Dr. Ayşe OĞUZLAR.

Kategorik Veri Analizi

İstatistiksel Karar Verme

Yönetimde Karar Verme Teknikleri

Transkript:

SAKARYA ÜNİVERSİTESİ BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ Hafta 13 Yrd. Doç. Dr. Halil İbrahim CEBECİ Bu ders içeriğinin basım, yayım ve satış hakları Sakarya Üniversitesi ne aittir. "Uzaktan Öğretim" tekniğine uygun olarak hazırlanan bu ders içeriğinin bütün hakları saklıdır. İlgili kuruluştan izin almadan ders içeriğinin tümü ya da bölümleri mekanik, elektronik, fotokopi, manyetik kayıt veya başka şekillerde çoğaltılamaz, basılamaz ve dağıtılamaz. Her hakkı saklıdır 2013 Sakarya Üniversitesi 0

BÖLÜMÜN AMACI BÖLÜM 7 NİTEL VERİ ANALİZİ (Kİ KARE TESTLERİ) Bu bölümün amacı nitel veri ile analiz yapılabilmesini sağlayan en önemli analizlerden Ki Kare analizini öğretilmesi ve sonuçların öğrenciler tarafından yorumlanmasının sağlanmasıdır. Şimdiye kadar anlatına bütün testler nümerik (sayılabilir, nicel, kantitatif) veriler üzerinde yapılmıştır. Fakat nitel (kategorik, kalitatif) verilerin de analiz edilmesi ihtiyacı söz konusudur. Bu durumda kullanılan en önemli analiz olan Ki Kare analizi, hem nicel hem de nitel verilerle çalışabildiğinden ayrıca önem arz etmektedir. Ki Kare Analizi Bağımsızlık Testleri Homojenlik Testleri Uyumluluk Testleri 7.1. Ki Kare Bağımsızlık Testleri Ki Kare bağımsızlık testleri iki farklı nitel değişkenin arasındaki farklılığın istatistiksel açıdan anlamlı olup olmadığının incelendiği hipotez testleridir. Bu hipotez testleri verilerin kontenjans tablosu şeklinde gösterilmesi ile başlar, daha sonra eşitlik ve farklılık (sıfır ve alternatif) hipotezleri kurulur ve test istatistiği hesaplanıp, kabul olasılığı incelenir. Aşağıdaki örnekle bu durumu daha iyi anlayabiliriz. 1

ÖRNEK Bir mağaza gün içerisinde alış veriş gerçekleştiren kadın ve erkek müşterilerin harcama düzeylerinin farklı olduklarını düşünmektedir. Bu bağlamda aşağıdaki kontenjans tablosunu hazırlamıştır. Erkek Bayan Düşük 11 6 Orta 18 13 Yüksek 10 21 Yukarıdaki tabloyu dikkate alarak müşteri cinsiyeti ile harcama düzeyler arasındaki ilişkiyi sorgulayınız. EXCEL Ki Kare değerini Excel yardımıyla hesaplayabilmek için gözlenen frekans değerlerinden beklenen frekans değerleri hesaplanmalıdır. Erkek Bayan Düşük 11 6 Orta 18 13 Yüksek 10 21 Yukarıdaki gözlenen frekanslar beklenen frekanslara çevrilmesi için öncelikle satır ve sütun toplamları hesaplanmalıdır. Erkek Bayan Düşük 11 6 17 Orta 18 13 31 Yüksek 10 21 31 39 40 Örneğin 79 kişinin (17+31+31) 17 tanesi düşük harcama yaptı ise, bu durumda %21,52 (17/79) oranında düşük harcamalı müşteri olmalıdır. Eğer kadın veya erkek durumunun eşitliğinin araştırıldığı hipotez dikkate alınırsa, erkek müşterilerin (39 kişinin) %21,52 si de (8,39) düşük harcama yapmalıdır. Bu durum gerçekleşirse kadın ve erkeklerin farklı harcamalar yaptığı söylenemez. Benzer şekilde beklenen frekanslar aşağıdaki gibi hesaplanır. Erkek Bayan Düşük 8,392405 8,607595 Orta 15,3038 15,6962 Yüksek 15,3038 15,6962 Yukarıdaki iki tablo hesaplandıktan sonra aşağıdaki formülle Ki Kare kabul olasılığı hesaplanır. =KİKARE.TEST(B3:C5;B9:C11) 2

Formülde yer alan B3:C5 kısmı gözlenen frekansları, B9:C11 kısmı ise beklenen frekansları vermektedir. Formül sonucunda kabul olasılığı 0,04576 çıkmıştır. Yani iki veri seti (Kadın ve Erkek) farklı sonuç üretmiştir. Bu durumda iki grup harcama düzeyi açısından farklılık göstermektedir. Yani cinsiyet ve harcama düzeyi birbiri ile ilişkilidir. Eğer aynı sonuçları üretip sıfır hipotezi kabul edilse idi, ilişkinin varlığından bahsedemezdik. Ki Kare bağımsızlık testleri iki farklı örneğin aynı gruptan gelip gelmediği ile ilgilidir. Eğer aynı ana gruptan geldi ise farklılık çıkmaz. Bu şekilde gruplama ölçütünün incelenen değişken düzeyinde farklılık göstermediği kabul edilir. 7.2. Ki Kare Homojenlik Testleri Homojenlik testleri bağımsızlık testinin farlı bir bakış açısı ile değerlendirilmesidir. Bağımsızlık testlerinde iki farlı bölümlemenin aynı olup olmadığına, yani bölümlerin bağımsızlığına odaklanır. (Kadın Erkek ayrımı istatistiksel açıdan uygun mu) Homojenlik testi ise direkt olarak farklı zamanlarda çekilen iki örneğin aynı ana kütleye ait olup olmadıklarının sorgulanmasıdır. (Örneklem 1 ile Örneklem 2 Kadın ve Erkek oranları dikkate alındığında aynı ana kütleden çekilmiş olabilir mi) ÖRNEK Bir alış veriş merkezi hafta içi gelen ziyaretçilerin akıllı telefon sayıları ile hafta sonu gelen ziyaretçilerin akıllı telefon sayılarını inceleyerek, farklı profil gösterip göstermediklerini incelemek istemektedir. Bu farklılığı istatistiksel açıdan aşağıda verilen frekansları dikkate alarak sorgulayınız. Örneklem1 Örneklem2 Android 101 88 Iphone 257 176 Windows M 142 103 EXCEL Gözlenen frekanslardan beklenen frekanslar aşağıdaki gibi hesaplanmıştır. Örneklem1 Örneklem2 Android 108,9965398 80,00346021 Iphone 249,7116494 183,2883506 Windows M 141,2918108 103,7081892 Yukarıdaki tablo hesaplandıktan sonra aşağıdaki formülle Ki Kare kabul olasılığı hesaplanır. =KİKARE.TEST(B3:C5;B9:C11) Formülde yer alan B3:C5 kısmı gözlenen frekansları, B9:C11 kısmı ise beklenen frekansları 3

vermektedir. Formül sonucunda kabul olasılığı 0,38735 çıkmıştır. Yani bu iki örneklemin aynı ana kütleden geldiğini öngören sıfır hipotezi kabul edilmiştir. Yani hafta içi müşterisi ile hafta sonu müşterisi profilleri farklılık göstermemektedir. 7.3. Ki Kare Uyumluluk Testleri Uyumluluk testleri ise ana kütle dağılımı ile örneklem dağılımının benzeşmesinin istatistiksel açıdan uygunluğunun testi şeklindedir. Burada amaç ana kütle dağılımı ile örneklem dağılımının örtüştürülmesidir. Ana kütle dağılımı kesikli olarak verilebileceği gibi, herhangi bir dağılıma uygunluğu da özellikle belirtilebilir. (Normal dağılıma uygun gibi) Ki Kare uyumluluk testlerinin en önemli kullanım alanı veri setinin bir istatistiksel dağılıma uygunluğunun testidir. ÖRNEK Bir firma web sitesini ziyaret eden kişilerin ortalama 50 saniye, 10 saniye standart sapma ile ziyaretlerini gerçekleştirdiklerini düşünmektedir. Bu durumu ispatlamak adına rastgele bir saatte ziyaretçilerin sitede kalma sürelerini dikkate alarak aşağıdaki frekans tablosunu oluşturmuştur. Acaba firma sahipleri haklı mıdır? Süre Kişi (Saniye) (Adet) <30 2 30 40 17 40 50 59 50 60 67 60 70 27 >70 9 EXCEL Diğer Ki Kare testlerine benzer şekilde beklenen frekanslar hesaplanmalıdır. Ana kütle normal dağılıyorsa o zaman sınıf aralıklarını dikkate alarak, bu aralıklar arasında normal dağılma durumunda kaç kişi olması gerektiğini (beklenen frekansları) hesaplamalıyız. Ortalama 50, Standart sapma 10 iken, bir müşterinin 30 saniyeden az sitede kalma ihtimali aşağıdaki formülle hesaplanır. = NORM.DAĞ(30;50;10;DOĞRU) = 0,0228 4

40 saniyeden az kalma durumu da aşağıdaki formülle rahatça belirlenebilir. = NORM.DAĞ(40;50;10;DOĞRU) = 0,1587 30 ile 40 dakika arasında kalma ihtimali ise bu iki olasılığın farkıdır. = 0,1587 0,0228=0,1359 Benzer şekilde bütün olasılıklar aşağıdaki gibi hesaplanabilir. Süre Olasılık (Saniye) Değeri <30 0,0228 30 40 0,1359 40 50 0,3413 50 60 0,3413 60 70 0,1359 >70 0,0228 Bu olasılık değerlerinin beklenen frekanslara dönüştürülmesi ise sadece toplam kişi sayısı (189) ile çarpılması ile elde edilir. Süre Gözlenen Olasılık Beklenen (Saniye) Frekanslar Değeri Frekanslar <30 2 0,0228 4,1178 30 40 17 0,1359 24,5988 40 50 59 0,3413 61,7834 50 60 67 0,3413 61,7834 60 70 27 0,1359 24,5988 >70 9 0,0228 4,1178 Daha sonra ise aşağıdaki formülle Ki Kare kabul olasılığı hesaplanır. =KİKARE.TEST(B2:B7;E2:E7) = 0,0745 Kabul olasılığı değeri incelendiğinde veri setinin,,incelenen dağılım ile aynı şekilde dağıldığını öngören sıfır hipotezi kabul edilmiştir. Yani veriler normal dağılmıştır. 5

ÖZET Ki Kare testleri nitel verilerin analizinde kullanılan bir yöntemdir. Üç farklı durumda tercih edilirler. Verilerin incelen değişken açısından farklılıklarının olup, olmadığının incelendiği Bağımsızlık Testleri, incelenen iki farklı örneğin aynı ana kütleden gelip gelmediklerinin incelendiği Homojenlik Testleri ve bir veri setinin belli bir dağılıma uygunluğunun incelendiği Uygunluk Testleri nitel verilerin analizinde önemlidir. SON NOT Bağımsızlık testleri ile homojenlik testlerinin kullanım yerlerini karıştırmayın. Farklı kullanım farklı yorum sonucunu doğurur. (Her ne kadar aynı şekilde bulunuyor olsalar bile) Uygunluk testlerinde illa ki bilinen bir olasılık dağılımına uygunluğun araştırılması gerekmez. Eğer ana kütlenin dağılımını kesikli bir olasılık dağılımı ile yazabiliyorsak, bu dağılıma uygunluğu da test edebiliriz. ÇALIŞMA SORULARI KAYNAKLAR 1. Keller, Gerald; Statistics for Management and Economics, 9e, 2012 2. McClave, J.T, Benson, P.G, Sincich, T.; Statistics for Business and Economics, 11e, 2011 3. Sharpe N.R., De Veaux R.D., Velleman P.F.; Business Statistics 2e, 2012 6