İstatistik ve Olasılığa Giriş Derleyen Kamil Kutoğlu Kaynak: Robert J. Beaver Barbara M. Beaver William Mendenhall Slaytları hazırlayan: Barbara M. Beaver İstatistik ve Olasılığa Giriş Derleyen Kamil Kutoğlu Giriş Beynimizi İstatistiğe Hazırlayalım Some graphic screen captures from Seeing Statistics Some images 2001-(current year) www.arttoday.com İstatistik nedir? İstatistikçiler ne iş yapar? Player Games Minutes Points Rebounds FG% Bob 34 32.7 24 7.6.552 Andy 36 31.5 21 8.4.465 Larry 30 33.0 18 5.6.493 Michael 31 35.1 29 6.1.422 1
İstatistik Tekil anlamdaki tek bilginin karşılığı datum. İngilizce'de data kelimesi çoğul kelimedir İstatistik dataların toplanıp organize edildiği ve sonucun yorumlandığı bilim dalıdır. İstatistiğin bir çok kullanım amacı vardır bunlardan en önemlisi belirsizlik içeren olaylar karşısında en güzel karar alma metodunu öğretir. İstatistikçinin işi Sayıları veya verileri toplamak Verileri sistematik olarak düzenleme veya organize etmek. Verilerin i Analizini liiiyapmak sayısal verileri elde etmek için bilgileri seçmek Sayısal verileri kullanarak genel sonuçlar çıkartmak. İstatistiğin Kullanım Alanları İstatistik kendi alanında teorik bir bilim dalıdır. İstatistik başka alanlardaki araştırmacılar için bir araçtır. Değişik uygulamalarda sonuçlar çıkarmak için kullanılır. 2
POLİTİKA Eğer Mağusa belediye başkanlığı için oy verecek olsanız, kime oy verirdiniz? James Hahn 32% Magic Johnson 36% Bir başkası 11% Henüz fikrim yok 21% Seçim sonucunda kimin kazanacağını önceden tahmin etmek Kampanyaların nerelerde düzenlenmesini, reklamların nerelerde yapılması gerektiğini ve tabi $$ ların nerelere gideceğini ENDÜSTRİ Malları pazarlamak Bir lambanın ortalama yaşam ömrünü bulmak için Tabiî ki tüm lambaları test edemezsin. KAMUOYU YOKLAMASI TERORİZİMLE SAVAŞ Amerikandaki terörizmim savaşının Afganistan ve Irak dışında başka bir ülkeye de sıçrayacağını düşünüyormuşsunuz? YES 64% NO 34% Bileşik Devletlerin diğer ülkelerin barış antlaşması arabuluculuk surecinde, direkt olarak bir rol alması gerektiğine inanıyor musunuz? YES 62% NO 31% 3
Yaygın Problemlerler Teker teker sayılamayan çok miktarda olan ölçümlerin tanımlanması veya kestirilmesi. POPULATION (YIGIN): Üzerinde belli özellikler bakımından inceleme yapılacak olan küme. Örnek Lambalar(yığını teker teker saymak neredeyse imkansız) Seçim sonuçlarını tahmin etmek (yığın çok büyük; insanlar fikirlerini değişebilirler) Çözüm Daha küçük ölçüm kümeleri oluşturmak ve bunun bütün kümeyi temsil etmesini ummak. SAMPLE (Örnek):Yığından seçilen alt kümeye örnek denir. 4
Örnek ve Yığın Hangi küme üzerinde ölçüm yapacağımızı belirleme İstatistiksel birim: Experimental Units: Ölçümün yapılacağı nesne veya birim. Örnek (veya Yığın): İstatistiksel birimlerin oluşturduğu küme. Örnek Ampul Lamba İstatistiksel birim = lamba Kamuoyu araştırması İstatistiksel birim = insan Betimsel İstatistik Descriptive Statistics Bazen ancak nadiren tüm yığınla çalışma yaparız. Eğer öyleyse, sadece kullanmamız gereken Betimsel İstatistik (DESCRIPTIVE STATISTICS: TATISTICS:) Ölçüm kümesini özetlemek ve tanımlamak için kullanılan prosedür. 5
Çıkarımsal İstatistik Inferential Statistics Tüm yığın hakkında işlem yapamadığımızda kullanılan INFERENTIAL STATISTICS: Örnek kümesini üzerinden analiz yapmak ve sonuç çıkartmak için kullanılan prosedür. Çıkarımsal İstatistiğin Hedefleri Örnek küme üzerinde yapılan çalışmaların sonuçları üzerinden tüm küme hakkında bilgi edinme. İstatistikçilerin işi bunu yapmanın en iyi yolunu bulup çıkartmaktır. Fakat sonuçlarımız yanlış olabilir aşağıdaki internet kamuoyu araştırmasına bakalım En İyi burgeri kim yapar? Oy (votes) Yüzdelik McDonalds 123 Votes 13% Burger King 384 Votes 39% Wendy s 304 Votes 31% Tümü aynı kalitede burger yapar 72 Votes 7% Hiçbiri iyi burger yapmazs 98 Votes 10% We ll PAY CASH For Your Opinions! (as much as $50,000 ) Click Here and sign up FREE! Ölçümde güvenirlik önemlidir. 6
Inferential İstatistiğin adımları Yapılacak ölçümün hedeflerinin ve yığının belirlenmesi Yapılacak incelemenin tasarlanması ve ölkl örleklemenin oluşturulması l Verileri toplamak ve analiz etmek Seçilen örnek üzerinden sonuçlar çıkartmak Sonuçların iyi taraflarını ve güvenirliliğini belirlemek. There are three kinds of lies --Lies, damn lies, and statistics.(benjamin Disraeli) Üç çeşit yalan vardır.. Yalan Müthiş Yalanlar İstatistik İstatistiği kullanmak için yapmalısınız, sizi yanıltması için değil. Nielsen Media Research Düzenli şekilde 5000 Amerikan ailesinin TV alışkanlıklarını ölçer. people meters. 5000 ailede toplam 13 bin kişi yaşar. 5000 kişiden 86 milyon kişinin maça baktığı sonucuna nasıl ulaşıldı? Population: Nielsen Rating firması nın amacı 5000 kişiden tüm Amerikan TV izleyicisinin genel tercihlerine ulaşılıyor. Population Parameters: Tüm Amerikan TV izleyicisinden kaç kişinin Maça baktığının saptanması. 7
Raw Data: 5000 aileden gelen ilk data Raw Datadır. Evden kim hangi programa baktı kaç dakika baktı. Sample İstatistik: Kimin hangi programa baktıgına göre gelen raw dataların sınıflandırılması as elde yeni data grubudur. Arthur C. Nielsen 1923 yılında market research firmasını kurar. İki yıl öncede Nielsen firması Media Metrix firmasınıda satın aldı. İşsizlik Oranının Tespiti Kaç insanın çalıştığı ve kaç kişinin aktif şekilde iş aradığı yani işsiz olduğunun tespiti. USA Labor Departman 60000 aileyi içine alan anket yapar. Population: Tüm çalışabilir nüfus. Sample:Anketin uygulandığı 60000 aile. Raw Data: Anket sürecinde toplanan bütün bilgiler Sample Statistik: 60000 aileden kaç kişi iş arıyor. Bunların cinsiyeti, yaşadıgı bölge Population Parameters: Sample istatistik sonuçlarına bağlı olarak tüm çalışabilir nüfustan işsizlik oranı. Sampling=Örnekleme Populasyonun (Ana Kütlenin) gerçek değerini bulmanın tek yolu bütün ana kütle üyelerinin sayımı ile mümkün. (Census- Sayım) Maliyetin yüksekliği. ğ Sampling (Örnekleme) Populasyon (Ana Kütle) hakkında gerekli bilgiye ulaşmanın bir diğer yolu örnekleme Üniversitede erkeklerin boy ortalaması için a)üniversite Basketbol takımın b)istatistik sınıf öğrencileri 8
Niçin Örnek Kütle Kümesi Oluşturuluyor Ana kütlenin bütün bireylerinin sayımı bazen İmkansız Oluşu Pratik bir yöntem olmayışı (seçimler) Çok Pahalı oluşu (Nüfus sayımı) Yüzyılın Kola Savaşı Pepsi / Coca-Cola Cola wars Cola savaşı rekabet alanında iki şirketin gösterdigi büyük mücadelenin ilginç örnegidir.pazarlama alanındaki reklam yolu ile yapılan mücadele de film,televizyon yildizlari, muzik spor gibi bircok unlu kullanilmistir. Pepsi seçtigi 1000 tüketiciden gözlerini kapatıp hangi markanın daha net ve belirgin bir tadı oldugu araştırması yapılır. Bu araştırmaya katılan her bir tüketicinin cinsiyeti yaş ve şehir gibi bilgilerde toplanmıştır. Sorular a. Bu reklam mücadelesindeki populasyon (Ana Kütle) nedir b. Populasyona ait variable nedir. c. Örnek kütleyi tanımlayın d. Lezzet tercihlerinin sonuçlarını açıklayınız. 9