GM-220 MÜHENDİSLİK ÇALIŞMALARINDA İSTATİSTİKSEL YÖNTEMLER GM 220 MÜHENDİSLİK ÇALIŞMALARINDA İSTATİSTİKSEL YÖNTEMLER Ders Yılı ve Dönemi Sınıf /Grup Ders Dili Ders Yeri Öğretim Üyesi Öğretim Yöntemi İletişim :2015-2016 Bahar :Lisans/ Zorunlu :Türkçe :Gıda Müh.Derslikleri (G:203) :Yrd. Doç. Dr. Safa KARAMAN :Anlatım-Sunum :skaraman@erciyes.edu.tr 1 2 İçerik Ders Saatler I. Öğretim: Cuma 08 10 11 00 II. Öğretim: Cuma17 10 20 00 Kaynaklar: I. Schaum s outlines-statistics /M.R. Spiegel and L.J. Stephens, Nobel Press, 2000 II. Uygulamalı İstatistik, Prof. Dr. Özer Serper, Ezgi Yayınları, 2000. III. Kişisel ders notları Dersin amacı: Temel istatistik kavramları ve tekniklerinin öğrenilmesi, araştırma verilerinin düzenlenmesi ve analize hazırlanmasının kavranması ve sonrasında uygun yöntemlerle analiz edilebilmesi, analiz sonuçların yorumlanabilmesinin sağlanması 3 İstatistik nedir?» İstatistik biliminde temel kavramlar» Anakütle» Örneklem» Veri, değişken, parametre» Temel matematik uygulamaları» Verilerin düzenlenmesi ve sunumu» Verilerin değişim ve merkez ölçüleri» Dağılımlar» Normal, Binom, Poisson» Örnekleme yöntemleri» Hipotez testleri» Parametrik yöntemler» Non-parametrik yöntemler» Güven aralıkları» Ki-kare testleri» Varyans ve özellikleri» Tek faktör varyans analizi» Regresyon ve uygulamaları» Korelasyon ve uygulamaları» Paket programlar 4 Yöntem Derslere Katılım: Bu ders için devam zorunluluğu bulunmamaktadır. Derslerde alınacak olan yoklama resmi manada işleme konmayacaktır. Kısa sınav: Belirli zamanlarda kısa sınavlar yapılacaktır. Notlandırma: Ara sınav %40 Kısa sınav: %10 Final %50 5 Gereç Bu ders için bilimsel bir hesap makinesi bulundurma zorunluluğu vardır. 6 1
Bölüm 1 Temel Terimler ve Tanımlar İSTATİSTİKLER Herhangi bir konu ile ilgili veriler 7 8 Anlamı? İstatistik=sayıtım Statisticum collegium (devlet konseyi) Statista (devlet adamı) Stato: devletin siyasal durumunu belirtmede kullanılır. Tarihi Devlet kadar eski bir geçmişi var Çin, Mısır ve Roma da nüfus sayımları, arazi yazımları yapılmış. İlk nüfus sayımı Mısır da. Pramitlerin yapımı-işgücü tahmini 9 10 Tarihi İlk çağda sayımları en ileri götüren topluluk Romalılar olmuştur. Her Roma lı kendi ve babasının adını, servetini, arazisini, sahip olduğu kölelerin sayısını bildirmek zorunda idi. Bu bağlamda bir ülkede istatistiğin ilerlemesi devlet gücünün bir göstergesidir. Tarihi 17. yy ilk yarısında bazı Alman Üniversitelerinde Devletlerin Özellikleri adlı bir derste çeşitli ülkelerin tarihi, askeri ve idari örgütleri, nüfusu vb. hakkında bazen sayısal bilgiler de verilmeye başlanmış. Bir süre sonra bu konuya status (devlet) den gelme statistik denmeye başlandı. 11 12 2
İstatistik denince; İSTANBUL A SON BEŞ YIL OCAK AYI GELEN YABANCI SAYILARI 13 14 2000-2014 YILLARI İSTANBUL A GELEN YABANCI SAYILARI 2015-2016 YILLARI AYLIK GELEN ZİYARETÇİ GRAFİĞİ 15 16 MİLLİYETLERİNE GÖRE İSTANBUL A GELEN YABANCILAR MİLLİYETLERİNE GÖRE İSTANBUL A GELEN YABANCILAR 17 18 3
Tanım: İstatistik Sayısal verilerin toplanması, düzenlenmesi, özetlenmesi, sunumu ve analizi ile yorumlanması için gerekli yöntemlerin geliştirilip uygulanması ile uğraşan ve sonuçta verilerden gidilerek bulunan olasılık deyimleri ile objektif karar vermede önemli rol oynayan bir yöntemler bilimidir. Kısaca verilerin ifade biçimidir. İstatistiğin konusu; İstatistiğin temel konusu yığın olaylardır. İstatistik tipik olaylar ile ilgilenmez. 19 20 Yığın olay: ÖRNEKLER Bir olaylar kümesinde tek bir olayın diğerlerini bağlı olarak da ait olduğu kümeyi temsil edemediği olaylardır. Tipik olay: Tek bir olayın tüm olaylar kümesini temsil edebildiği olaylardır. H 2 O Glukoz+galaktoz 1 mol gaz 22,4 litre =6,02*10 23 atom Tek bir deney ilgili deneyler kümesini temsil eder Trafik kazaları Evlenmeler Doğumlar Ölümler Karlılık Ciro Tek bir deney ilgili deneyler kümesini temsil etmez 21 22 İstatistik; Yığın olayların gözlenerek incelenmesi ve analizinde kullanılan teknikler topluluğudur. İlgilenilen olayın kavranabilmesi ve sayısal olarak analiz edilebilmesi için, ilgili konunun özelliklerinin belirlenerek bunların sayılması ya da ölçülmesi gerekmektedir. Bir eğitimci olarak niçin belli düzeyde istatistik bilmeliyiz? Günlük hayatta çevremizde olup bitenleri izleyebilmek, anlayabilmek ve yorumlayabilmek için Borsa düşünce dolara ne oluyor? Seçimleri kim kazanacak? Şampiyon kim olacak? Sınıftaki en başarılı öğrenci kim? Sınavda ilk yüzde elliye kimler giriyor? Elde ettiğimiz verilerle ilişkiler kurar, sonuçlar çıkarmaya çalışırız! 23 24 4
İSTATİSTİK HEP DOĞRU MU SÖYLER? Üç tip yalan vardır: Yalan Kuyruklu yalan İstatistik Her şey istatistik ile kanıtlanamaz Kadıköy-Karaköy vapurla seyahat edenlerin sayısı İstanbuldaki evlenmelerin sayısı Arada bir ilişki çıkabilir ama bu abartılı bir iddia olacaktır.reddedilir. ÖRNEĞİN; Bir çölde ortalama sıcaklığın 30 ºC olduğunu öğrenen bir kişinin çöle bir gömlekle gitmesi Gece -10 ºC de donacak Gündüz 50-60 ºC de yanacaktır. 25 26 Veri: Tanımlar Belirli bir amaç için yapılan çalışmalarda elde edilen sayısal bilgilerdir. Araştırılan konu ile ilgili nesne, birey veya olayları ölçmek, gözlemek ve saymakla elde edilen sayısal bilgilerdir. Ölçüm sonuçları, cinsiyet, araştırma çıktıları gibi çeşitli çalışmalardan elde edilmiş gözlemlerdir. İSTATİSTİK BİLİMİ VERİLERDEKİ FARKLILIKLARIN AÇIKLANMASI İHTİYACINDAN DOĞMUŞTUR. BU KAPSAMDA; Farklılıkları tanımlama Farklılığı hesaba katarak araştırmayı planlama Veri analizi ile maksimum bilgiye ulaşma Analiz sonucu bulunan sonuçların güvenilirliğini sayısal olarak ifade etme olanağı sağlar. 27 28 Verilerin toplanması Tablo ve grafiklerle özetlenmesi Sonuçların yorumlanması Sonuçların güven derecelerinin açıklanması Özellikler arasındaki ilişkinin tespiti Geleceğe yönelik tahminler Ve deney, düzenleme ve gözlem ilkelerini kapsayan bir bilim dalıdır. 29 Her alanda olduğu gibi İSTATİSTİK biliminin de kendine has bir dili vardır. Konuşabilmek için bu dili öğrenmek gerekmektedir. 30 5
Kapsam Genel olarak araştırmalarda, büyük veri gruplarının içinden daha küçük veri grupları seçilerek büyük veri gruplarının hakkında bilgi edinmek amaçlanır. Örneğin; Pazar araştırmaları, Kamuoyu yoklamaları, TÜİK in yaptığı hanehalkı araştırmaları. TANIMLAYICI İSTATİSTİKLER İSTATİSTİKSEL YÖNTEMLER YORUMLAYICI İSTATİSTİKLER 31 32 İstatistiksel Yöntemler Tanımlayıcı İstatistikler Verilerin toplanması,tanımlanması ve temel analizler Yorumlayıcı İstatistikler Örnekten elde edilen istatistikler kullanılarak, bilinmeyen parametreler hakkında tahminde bulunma, karar verme. Anakütle (Populasyon) Hakkında belirli bir veya daha fazla özellik (DEĞİŞKEN) açısından araştırma yapılmak istenen tüm elemanların içinde bulunduğu kümedir. İstatistik açısından iki temel kavram tanımlanmalıdır: Araştırılacak topluluğun sınırları, Topluluk içindeki incelenecek değişken veya değişkenler. 33 34 İstatistik metotlar Üzerinde çalışılan konu ile ilgili verilerin deney veya gözlem yoluyla elde edilmesi, özetlenmesi, konuyu tanıtacak şekilde işlenmesi, diğer veriler ile ilişkilerinin belirlenmesi, veriler üzerinde etkili olduğu bilinen faktörlere göre analizi ile sonuçların yorumlanması ve genelleştirilmesi için yapılan işlemlerdir. DENEY & GÖZLEM Deney: Bir olayın oluşuna müdahele ederek veri eldesine denir. Buğday başağının boy uzunluğu Karpuzların ağırlığı Gözlem: Bir olayın oluşuna müdahele etmeksizin veri eldesine denir. Sınıfın fizik dersindeki başarı durumu Bir maçta atılan gol sayısı 35 36 6
BİRİM Yığın olay niteliğindeki her olaya birim denir. Tüm canlı ve cansız varlıklar birer istatistik birimidir. Bir olayın birim olabilmesi için ölçüme ya da sayıma uygun olması gerekir. Sayılamayan ya da ölçülemeyen olaylar birim olamazlar. Örneğin Araba, ev, bina, hayvan, kar oranı, ölüm boşanma, doğum----birimdir. Sevinç, korku, heyecan, rüya, renk vb. birim değildir. 37 38 Örnek Anakütleden seçilen ve ilgilenilen değişken açısından anakütlenin özelliklerini yansıtma özelliğine sahip alt kümedir. Ana Kütle Örnek Popülasyon Örnek Örneğin en önemli amacı; zaman ve maliyet kaybını minimuma düşürmek,(optimum örnek hacmi) Popülasyondan hesaplanan değerlere parametre denir. Örnekten hesaplanan değerlere istatistik denir. 39 40 Popülasyonlara Örnek Bir ülkedeki tüm seçmenler. İstanbul da yaşayan tüm ailelerin geliri. Maltepe Üniversitesi ndeki tüm öğrencilerin GNO sı. İstanbul borsasındaki tüm hisselerin ortalama getirisi. ÖRNEKLEME YAPMAK RASTGELE ÖRNEKLEME SİSTEMATİK ÖRNEKLEME 41 42 7
Rastgele Örneklem Basit Rastgele Örneklem Popülasyonun üyelerinin seçilmesinin tamamen şansa bağlı olduğu, Popülasyonun her üyesinin seçilme şansının eşit olduğu, Örneğin n üyesinden her birinin seçilme şansının eşit olduğu bir seçme yöntemidir. Bu şekilde oluşturulan örneğe de rastgele örnek denir. 43 Sistematik Örneklem Sistematik örneklem için Popülasyon üyeleri konuyla ilişkili olmayacak şekilde sıralanır; Örneğin popülasyona oranı (j=n/n olacak şekilde) Popülasyonun her j üyesinden biri seçilir; İlk nesneyi 1 den j ye kadar rastgele seçin. Oluşan örneğe sistematik örnek denir. 44 Sistematik Örneklem (devam) Örnek: 96 Elemandan (N=96) oluşan bir popülasyondan 6 elemanlı (n=6) bir örnek alacağınızı varsayalım. j = N / n = 96/ 6 = 16 1 den 16 ya kadar olan sayılardan rastgele bir sayı seçin; bu sayı örneğin 10 olsun; bu sizin ilk örneğinizdir. Daha sonra her 10. elemanı seçin Örnek kümesi ={10., 26., 42., 58., 74., ve 90. elemanlar} Sayım Örnek Tanımlar anakütlenin her biriminin sayılması anakütleden çekilen alt küme 45 46 Örnekte olması gereken en önemli özellikler Örnek veri uygun bir yolla rassal olarak toplanmalıdır. Anakütleyi iyi bir şekilde temsil edebilmelidir. NOT:Eğer veri uygun yolla toplanmazsa, veri hiçbir istatistik yöntemle kurtarılamaz ve tamamen kullanışsız olur. Parametre Anakütlenin sayısal olarak ölçülebilen herhangi bir özelliği o anakütlenin parametresi olarak tanımlanabilir. Bir anakütle birden fazla parametreye sahip olabilir. Parametre, ilgili anakütle için, değişmeyen sayısal bir sabittir. NOT: Parametreyi belirlemek için anakütledeki tüm elamanların incelenmesi gerekir. 47 48 8
PARAMETREYE İLİŞKİN ÖRNEKLER: Bir tekstil fabrikasında bir haftada kullanılan ortalama boya miktarı, D.E.Ü. İ.İ.B.F de okuyan öğrencilerin sigara içme oranı, Amerikan Doları nın ($ ) Euro ( ) karşısında son 2 yıllık değişim yüzdesinin ortalaması. Örnek İstatistiği Anakütlenin belirli bir parametresinin hesaplanmasının zorluğundan dolayı alınan örnek yardımıyla bulunan parametre tahminine örnek istatistiği (istatistik / tahminleyici) adı verilir. Örnek: İzmir de üniversitede okuyan öğrencilerin aylık harcamalarının ortalamasını tahmin etmek amacıyla 150 öğrencilik bir örnek alınarak aylık harcama miktarlarının ortalamasının bulunması. 49 50 Anakütle-Örnek İlişkisi Örnek Örnek verilerinin analizi n x Anakütle N Anakütle parametresi µ Örnekten elde edilen örnek istatistiği x anakütle parametresi µ ye ne kadar yakın ise yapılan çalışma o kadar iyidir. Anakütle için yapılacak yorumlar o kadar tutarlı olacaktır. Parametre-Örnek İstatistiği İlişkisi Anakütle Parametreleri ve Tahminleyicileri Anakütle Parametresi Örnek İstatistiği µ (Anakütle Ortalaması ) (Örnek Ortalaması ) σ 2 (Anakütle Varyansı ) x s 2 (Örnek Varyansı) Örnek İstatistiği 51 52 Tanımlar Nicel (kantitatif) veriler Sayımları ya da ölçümleri sayılarla ifade edilebilen verilerdir. Örnek: Tüketilen su miktarı Tanımlar Nitel (kalitatif veya kategorik) veriler Gözlemden gözleme kalite ve çeşit yönünden farklılık gösteren değişkenlerdir. Sayısal olarak ifade edilemeyen karakteristiklere göre birbirinden farklı kategorilere ayrılmış verilerdir. Örnek: Araba renkleri İş grupları 53 54 9
Nicel verilerle çalışma Nicel veriler kesikli ve sürekli değişkenler olarak birbirlerinden ayrışırlar. Değişken Belirli bir özelliğin davranışının incelenmesi amacıyla yapılan deneyler, gerçekleştirilen gözlemler sonucunda elde edilen verilerin(sonuçların) temel niteliği bu sonuçların önceden kestirilememesi ve birbirinden farklı değerler alabiliyor olmasıdır. Bu nedenle istatistikte bu niteliklere sahip özelliklere (verilere) değişken adı verilir. Gözlemden gözleme değişik özellik veya durumdur. değerler alabilen nesne, değişkenlerin ortaya çıkışşekline iseşik denir. Örnekler: Öğrencilerin kardeş sayısı Bankaların TL. bazında aylık mevduat faiz oranı Bir süpermarkete belirli bir sürede gelen müşteri sayısı Cinsiyet, ağırlık, yaş, boy. 55 56 Kesikli Değişken Tanımlı olduğu aralıkta sadece tam sayı değerleri alabilen değişkenlerdir. Her değeri alamazlar Örnekler: Ders başladıktan sonra ilk 5 dk. içinde derse geç kalan öğrenci sayısı, Yılda doğan çoçuk sayısı Banka şubesinde gün içerisinde vadeli hesap açtıran müşteri sayısı. 57 58 Sürekli Değişken Tanımlı olduğu aralıkta tüm değerleri (sonsuz sayıda) alabilen değişkenlerdir. Örnekler: Bir süpermarkete gelen iki müşteri arasındaki geçen süre, Yaz dönemi boyunca kaydedilen sıcaklık değerleri Yeni doğan bebeklerin ağırlığı. Ölçüm yapılarak sürekli değişkenler, sayım yapılarak ise kesikli değişkenler belirlenir. 59 60 10
Kalitatif/Kategorik Değişken Ölçüm veya sayımla ifade edilemeyen değişkenlerdir. Kodlanarak sayısal hale dönüştürülebildikleri için Kesikli değişkenlerin özel bir türü olarak düşünülebilir. Örnekler: Cinsiyet, Saç yada göz rengi, Taraftarı olunan futbol takımı. Bağımlı ve Bağımsız Değişken Bağımsız değişken bir olayın nedenidir. Uyarıcı Bağımlı değişken ise uyarılan değişkendir. Sonuçtur. Örneğin; bir gıda maddesinin nem değerinin yükselmesi ile mikroorganizma yükünün artış göstermesi Nem: bağımsız değişken M.O sayısı: bağımlı değişken 61 62 Şans Değişkeni Tanımlı olduğu aralıktaki belirli değerleri alma olasılıkları belirli olasılık (matematiksel) fonksiyonları ile hesaplanabilen değişkenlerdir. Verilerin Önemli Karakteristikleri Merkez: Veri setinin orta noktasının nerede bulunduğunu gösterir. Değişkenlik: Verilerin kendi aralarında ne kadar değişiklik gösterdiğini ya da yayıldığını ifade eder. Örnekler: Bir madeni para belirli sayıda havaya atıldığında üst yüzüne gelen yazı ya da tura sayısı Bir zarda 6 gelinceye kadar yapılan atış sayısı Dağılım: Verilerin yayılımının yapısı yada şeklini gösterir. (çan eğrisi, düzgün veya basık gibi) Sapanlar: Diğer veri noktalarından önemli derecede uzakta bulunan verilerdir. Zaman: Karakteristiği zamana bağlı olarak değişen veriler. 63 64 İlginç istatistikler Her birey başına eşit ölçüde toprak vermeye kalkarsak kişi başına en fazla 50 metre kare düşer. *Her bir insan ortalama olarak yılda 1140 telefon görüşmesi yapar; ortalama ömrünün 2 yılını telefon başında geçir *Dünyada en çok kullanan isim Muhammed. *Eğer çinliler önümüzden teksıra halinde geçmeye başlasaydı bu sıranın sonu hiç gelmezdi. Nedeni nüfus artışı yüzünden. *Ortalama insan yılda 1460 rüya görür. *Sallanan sandalyede sallanma rekoru 440 saattir. *Vücudumuzdaki kemiklerin 1/4 ü ayaklarımızdadır. *El tırnakları ayak tırnaklarından daha hızlı uzar. *İnsan günde en az 15 kez güler. *Cam kırılınca, kırıklar saate 4.827 km hızla saçılır. *Planetteki otomobil sayısı insan nüfusundan 3 kat daha hızlı artmaktadır. *Solak insan oranı %17' dir. *Sağ elini kullananlar sol elini kullananlardan 10 yıl daha fazla yaşar. *Bir kupa dolusu kahvenin içinde ortalama 1000 kimyasal vardır. *Makyaj yapmayı seven bir kadın hayatı boyunca en az 3 kg ruj tüketir. *Eşek tepmesiyle ölenlerin sayısı uçak kazasında ölenlerden fazladır.( yıllık) 65 11