GM-220 MÜH. ÇALIŞ. İSTATİSTİKSEL YÖNTEMLER Bölüm 1 Temel Terimler ve Tanımlar Yrd. Doç. Dr. Safa KARAMAN 1 2 Anlamı? İSTATİSTİKLER İstatistik=sayıtım Statisticum collegium (devlet konseyi) Statista (devlet damı) Stato: devletin siyasal durumunu belirtmede kullanılır. Herhangi bir konu ile ilgili veriler 4 Tarihi Devlet kadar eski bir geçmişi var Çin, Mısır ve Roma da nüfus sayımları, arazi yazımları yapılmış. İlk nüfus sayımı Mısır da. Pramitlerin yapımı-işgücü tahmini Tarihi İlk çağda sayımları en ileri götüren topluluk Romalılar olmuştur. Her Roma lı kendi ve babasının adını, servetini, arazisini, sahip olduğu kölelerin sayısını bildirmek zorunda idi. Bu bağlamda bir ülkede istatistiğin ilerlemesi devlet gücünün bir göstergesidir. 5 6 1
Tarihi Tanım: İstatistik 17. yy ilk yarısında bazı Alman Üni. Devletlerin özellikleri adlı bir derste çeşitli ülkelerin tarihi, askeri ve idari örgütleri, nüfusu vb. hakkında bazen sayısal bilgilerde verilmeye başlanmış. Bir süre sonra bu konuya status (devlet) den gelme statistik denmeye başlandı. Sayısal verilerin toplanması, düzenlenmesi, özetlenmesi, sunumu ve analizi ile yorumlanması için gerekli yöntemlerin geliştirilip uygulanması ile uğraşan ve sonuçta verilerden gidilerek bulunan olasılık deyimleri ile objektif karar vermede önemli rol oynayan bir yöntemler bilimidir. Kısaca verilerin ifade biçimidir. 7 8 Bir eğitimci olarak niçin belli düzeyde istatistik bilmeliyiz? Günlük hayatta çevremizde olup bitenleri izleyebilmek, anlayabilmek ve yorumlayabilmek için Borsa düşünce dolara ne oluyor? Seçimleri kim kazanacak? Şampiyon kim olacak? Sınıftaki en başarılı öğrenci kim? İSTATİSTİK HEP DOĞRU MU SÖYLER? Üç tip yalan vardır: Yalan Kuyruklu yalan İstatistik Her şey istatistik ile kanıtlanamaz Sınavda ilk yüzde elliye kimler giriyor? Elde ettiğimiz verilerle ilişkiler kurar, sonuçlar çıkarmaya çalışırız! 05.03.2015 9 10 Kadıköy-Karaköy vapurla seyahat edenlerin sayısı İstanbuldaki evlenmelerin sayısı Arada bir ilişki çıkabilir ama bu abartılı bir iddia olacaktır.reddedilir. ÖRNEĞİN; Bir çölde ortalama sıcaklığın 30 ºC olduğunu öğrenen bir kişinin çöle bir gömlekle gitmesi Gece -10 ºC de donacak Gündüz 50-60 ºC de yanacaktır. Veri: Tanımlar Belirli bir amaç için yapılan çalışmalarda elde edilen sayısal bilgilerdir. Araştırılan konu ile ilgili nesne, birey veya olayları ölçmek, gözlemek ve saymakla elde edilen sayısal bilgilerdir. Ölçüm sonuçları, cinsiyet, araştırma çıktıları gibi çeşitli çalışmalardan elde edilmiş gözlemlerdir. 11 12 2
İSTATİSTİK BİLİMİ VERİLERDEKİ FARKLILIKLARIN AÇIKLANMASI İHTİYACINDAN DOĞMUŞTUR. BU KAPSAMDA; Farklılıkları tanımlama Farklılığı hesaba katarak araştırmayı planlama Veri analizi ile maksimum bilgiye ulaşma Analiz sonucu bulunan sonuçların güvenilirliğini sayısal olarak ifade etme olanağı sağlar. 13 Verilerin toplanması Tablo ve grafiklerle özetlenmesi Sonuçların yorumlanması Sonuçların güven derecelerinin açıklanması Özellikler arasındaki ilişkinin tespiti Geleceğe yönelik tahminler Ve deney, düzenleme ve gözlem ilkelerini kapsayan bir bilim dalıdır. 14 Giriş Her alanda olduğu gibi İSTATİSTİK biliminin de kendine has bir dili vardır. Konuşabilmek için bu dili öğrenmek gerekmektedir. Genel olarak araştırmalarda, büyük veri gruplarının içinden daha küçük veri grupları seçilerek büyük veri gruplarının hakkında bilgi edinmek amaçlanır. Örneğin; Pazar araştırmaları, Kamuoyu yoklamaları, TÜİK in yaptığı hanehalkı araştırmaları. 15 16 TANIMLAYICI İSTATİSTİKLER İSTATİSTİKSEL YÖNTEMLER YORUMLAYICI İSTATİSTİKLER İstatistiksel Yöntemler Tanımlayıcı İstatistikler Verilerin toplanması,tanımlanması ve temel analizler Yorumlayıcı İstatistikler Örnekten elde edilen istatistikler kullanılarak, bilinmeyen parametreler hakkında tahminde bulunma, karar verme. 17 18 3
İstatistik metotlar DENEY & GÖZLEM Üzerinde çalışılan konu ile ilgili verilerin deney veya gözlem yoluyla elde edilmesi, özetlenmesi, konuyu tanıtacak şekilde işlenmesi, diğer veriler ile ilişkilerinin belirlenmesi, veriler üzerinde etkili olduğu bilinen faktörlere göre analizi ile sonuçların yorumlanması ve genelleştirilmesi için yapılan işlemlerdir. Deney: Bir olayın oluşuna müdahele ederek veri eldesine denir. Buğday başağının boyu uzunluğu Karpuzların ağırlığı Gözlem: Bir olayın oluşuna müdahele etmeksizin veri eldesine denir. Sınıfın fizik dersindeki başarı durumu Bir maçta atılan gol sayısı 19 20 Anakütle (Populasyon) Hakkında belirli bir veya daha fazla özellik (DEĞİŞKEN) açısından araştırma yapılmak istenen tüm elemanların içinde bulunduğu kümedir. İstatistik açısından iki temel kavram tanımlanmalıdır: Araştırılacak topluluğun sınırları, Topluluk içindeki incelenecek değişken veya değişkenler. Örnek Anakütleden seçilen ve ilgilenilen değişken açısından anakütlenin özelliklerini yansıtma özelliğine sahip alt kümedir. Örneğin en önemli amacı; zaman ve maliyet kaybını minimuma düşürmek,(optimum örnek hacmi) 21 22 Ana Kütle Örnek Popülasyonlara Örnek Popülasyon Popülasyondan hesaplanan değerlere parametre denir. Örnek Örnekten hesaplanan değerlere istatistik denir. Bir ülkedeki tüm seçmenler. İstanbul da yaşayan tüm ailelerin geliri. Maltepe Üniversitesi ndeki tüm öğrencilerin GNO sı. İstanbul borsasındaki tüm hisselerin ortalama getirisi. 4
05.03.2015 ÖRNEKLEME YAPMAK RASTGELE ÖRNEKLEME SİSTEMATİK ÖRNEKLEME 25 ÖRNEKLEME ŞEKİLLERİ 5
Rastgele Örneklem Basit Rastgele Örneklem Popülasyonun üyelerinin seçilmesinin tamamen şansa bağlı olduğu, Popülasyonun her üyesinin seçilme şansının eşit olduğu, Örneğin n üyesinden her birinin seçilme şansının eşit olduğu bir seçme yöntemidir. Bu şekilde oluşturulan örneğe de rastgele örnek denir. Sistematik Örneklem Sistematik örneklem için Popülasyon üyeleri konuyla ilişkili olmayacak şekilde sıralanır; Örneğin popülasyona oranında (j=n/n olacak şekilde) Popülasyonun her j üyesinden biri seçilir; İlk nesneyi 1 den j ye kadar rastgele seçin. Oluşan örneğe sistematik örnek denir. Sistematik Örneklem (devam) Örnek: 96 Elemandan (N=96) oluşan bir popülasyondan 6 elemanlı (n=6) bir örnek alacağınızı varsayalım. j = N / n = 96/ 6 = 16 1 den 16 ya kadar olan sayılardan rastgele bir sayı seçin; bu sayı örneğin 10 olsun; bu sizin ilk örneğinizdir. Daha sonra her 10. elemanı seçin Örnek kümesi ={10., 26., 42., 58., 74., ve 90. elemanlar} OLAYLAR İstatistik de tüm diğer bilim dalları gibi olayları konu alır. Olayları tipik ve toplu olaylar olarak ikiye ayırarak incelemek mümkündür. 34 OLAYLAR Tipik Olaylar az sayıda faktör tarafından etkilenen olaylardır. Eğer bir olaylar kümesinde tek bir olay, tüm olaylar kümesini temsil edebiliyorsa, bu tür olaylara tipik olay denir. Örneğin, ideal koşullar altında ve uygun bir laboratuar ortamında iki hidrojen ve bir oksijen atomu bir araya getirilirse, su elde edilir. Bu deney aynı koşullar altında kaç kez tekrarlanırsa tekrarlansın, her deneyin sonucunda su elde edilecektir. İstatistik tipik olaylarla ilgilenmez. OLAYLAR Toplu olay, bir olaylar kümesinde tek bir örnek ya da deneyin diğer örnekleri ve deneyleri, bunun sonucu olarak da ait olduğu kümeyi temsil edemeyen olaylardır. Örneğin, firmaların yıllık ciroları, trafik kazaları, evlenmeler, boşanmalar, doğumlar, ölümler ve benzeri gibi her gün karşılaşılan olaylar, birer toplu olay niteliğindedir. 35 36 6
Tanımlar Sayım anakütlenin her biriminin sayılması Örnek anakütleden çekilen alt küme Örnekte olması gereken en önemli özellikler Örnek veri uygun bir yolla rassal olarak toplanmalıdır. Anakütleyi iyi bir şekilde temsil edebilmelidir. NOT:Eğer veri uygun yolla toplanmazsa, veri hiçbir istatistik yöntemle kurtarılamaz ve tamamen kullanışsız olur. 37 38 Parametre Anakütlenin sayısal olarak ölçülebilen herhangi bir özelliği o anakütlenin parametresi olarak tanımlanabilir. Bir anakütle birden fazla parametreye sahip olabilir. Parametre, ilgili anakütle için, değişmeyen sayısal bir sabittir. NOT: Parametreyi belirlemek için anakütledeki tüm elamanların incelenmesi gerekir. PARAMETREYE İLİŞKİN ÖRNEKLER: Bir tekstil fabrikasında bir haftada kullanılan ortalama boya miktarı, D.E.Ü. İ.İ.B.F de okuyan öğrencilerin sigara içme oranı, Amerikan Doları nın ($ ) Euro ( ) karşısında son 2 yıllık değişim yüzdesinin ortalaması. 39 40 Örnek İstatistiği Anakütlenin belirli bir parametresinin hesaplanmasının zorluğundan dolayı alınan örnek yardımıyla bulunan parametre tahminine örnek istatistiği (istatistik / tahminleyici) adı verilir. Örnek: İzmir de üniversitede okuyan öğrencilerin aylık harcamalarının ortalamasını tahmin etmek amacıyla 150 öğrencilik bir örnek alınarak aylık harcama miktarlarının ortalamasının bulunması. Anakütle-Örnek İlişkisi Örnek Örnek verilerinin analizi n x Örnek İstatistiği Anakütle N Anakütle parametresi µ Örnekten elde edilen örnek istatistiği x anakütle parametresi µ ye ne kadar yakın ise yapılan çalışma o kadar iyidir. Anakütle için yapılacak yorumlar o kadar tutarlı olacaktır. 41 42 7
Parametre-Örnek İstatistiği İlişkisi Anakütle Parametreleri ve Tahminleyicileri Anakütle Parametresi Örnek İstatistiği µ (Anakütle Ortalaması ) (Örnek Ortalaması ) x Tanımlar Nicel (kantitatif) veriler Sayımları ya da ölçümleri sayılarla ifade edilebilen verilerdir. σ 2 (Anakütle Varyansı ) s 2 (Örnek Varyansı) Örnek: Tüketilen su miktarı π (Anakütle Oranı ) p (Örnek Oranı ) 43 44 Tanımlar Nitel (kalitatif veya kategorik) veriler Gözlemden gözleme kalite ve çeşit yönünden farklılık gösteren değişkenlerdir. Sayısal olarak ifade edilemeyen karakteristiklere göre birbirinden farklı kategorilere ayrılmış verilerdir. Örnek: Araba renkleri İş grupları Nicel verilerle çalışma Nicel veriler kesikli ve sürekli değişkenler olarak birbirlerinden ayrışırlar. 45 46 Değişken Belirli bir özelliğin davranışının incelenmesi amacıyla yapılan deneyler, gerçekleştirilen gözlemler sonucunda elde edilen verilerin(sonuçların) temel niteliği bu sonuçların önceden kestirilememesi ve birbirinden farklı değerler alabiliyor olmasıdır. Bu nedenle istatistikte bu niteliklere sahip özelliklere (verilere) değişken adı verilir. Gözlemden gözleme değişik özellik veya durumdur. değerler alabilen nesne, değişkenlerin ortaya çıkış şekline ise ŞIK denir. Örnekler: Öğrencilerin kardeş sayısı Bankaların TL. bazında aylık mevduat faiz oranı Bir süpermarkete belirli bir sürede gelen müşteri sayısı Cinsiyet, ağırlık, yaş, boy. 47 Kesikli Değişken Tanımlı olduğu aralıkta sadece tam sayı değerleri alabilen değişkenlerdir. Her değeri alamazlar Örnekler: Ders başladıktan sonra ilk 5 dk. içinde derse geç kalan öğrenci sayısı, Yılda doğan çoçuk sayısı Banka şubesinde gün içerisinde vadeli hesap açtıran müşteri sayısı. 48 8
Sürekli Değişken Tanımlı olduğu aralıkta tüm değerleri (sonsuz sayıda) alabilen değişkenlerdir. Örnekler: Bir süpermarkete gelen iki müşteri arasındaki geçen süre, Yaz dönemi boyunca kaydedilen sıcaklık değerleri Yeni doğan bebeklerin ağırlığı. 49 Ölçüm yapılarak sürekli değişkenler, sayım yapılarak ise kesikli değişkenler belirlenir. 50 Kalitatif/Kategorik Değişken Bağımlı ve Bağımsız Değişken Ölçüm veya sayımla ifade edilemeyen değişkenlerdir. Kodlanarak sayısal hale dönüştürülebildikleri için Kesikli değişkenlerin özel bir türü olarak düşünülebilir. Örnekler: Cinsiyet, Saç yada göz rengi, Taraftarı olunan futbol takımı. Bağımsız değişken bir olayın nedenidir. Uyarıcı Bağımlı değişken ise uyarılan değişkendir. Sonuçtur. Örneğin; bir gıda maddesinin nem değerinin yükselmesi ile mikroorganizma yükünün artış göstermesi Nem: bağımsız değişken M.O sayısı: bağımlı değişken 51 52 Şans Değişkeni Tanımlı olduğu aralıktaki belirli değerleri alma olasılıkları belirli olasılık (matematiksel) fonksiyonları ile hesaplanabilen değişkenlerdir. Örnekler: Bir madeni para belirli sayıda havaya atıldığında üst yüzüne gelen yazı ya da tura sayısı Bir zarda 6 gelinceye kadar yapılan atış sayısı 53 Verilerin Önemli Karakteristikleri Merkez: Veri setinin orta noktasının nerede bulunduğunu gösterir. Değişkenlik: Verilerin kendi aralarında ne kadar değişiklik gösterdiğini ya da yayıldığını ifade eder. Dağılım: Verilerin yayılımının yapısı yada şeklini gösterir. (çan eğrisi, düzgün veya basık gibi) Sapanlar: Diğer veri noktalarından önemli derecede uzakta bulunan verilerdir. Zaman: Karakteristiği zamana bağlı olarak değişen veriler. 54 9
İlginç istatistikler Her birey başına eşit ölçüde toprak vermeye kalkarsak kişi başına en fazla 50 metre kare düşer. *Her bir insan ortalama olarak yılda 1140 telefon görüşmesi yapar; ortalama ömrünün 2 yılını telefon başında geçir *Dünyada en çok kullanan isim Muhammed. *Eğer çinliler önümüzden teksıra halinde geçmeye başlasaydı bu sıranın sonu hiç gelmezdi. Nedeni nüfus artışı yüzünden. *Ortalama insan yılda 1460 rüya görür. *Sallanan sandalyede sallanma rekoru 440 saattir. *Vücudumuzdaki kemiklerin 1/4 ü ayaklarımızdadır. *El tırnakları ayak tırnaklarından daha hızlı uzar. *İnsan günde en az 15 kez güler. *Cam kırılınca, kırıklar saate 4.827 km hızla saçılır. *Planetteki otomobil sayısı insan nüfusundan 3 kat daha hızlı artmaktadır. *Solak insan oranı %17' dir. *Sağ elini kullananlar sol elini kullananlardan 10 yıl daha fazla yaşar. *Bir kupa dolusu kahvenin içinde ortalama 1000 kimyasal vardır. *Makyaj yapmayı seven bir kadın hayatı boyunca en az 3 kg ruj tüketir. *Eşek tepmesiyle ölenlerin sayısı uçak kazasında ölenlerden fazladır.( yıllık) 55 MATEMATİK UYGULAMALARI Verilerin yuvarlanması Bilimsel gösterim Fonksiyonlar Dikdörtgensel koordinat Grafikler Denklemler Eşitsizlikler Logaritmalar 56 10