İSTATİSTİK 8.Hafta Değişkenlik Ölçüleri Hedefler Bu üniteyi çalıştıktan sonra; Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek, Serilerin birbirlerine değişkenliklerini yorumlayabileceksiniz.
2 İSTATİSTİK Değişkenlik Ölçüleri İçindekiler DEĞİŞKELİK ÖLÇÜLERİ Varyans ve Standart Sapma Basit Serilerde Varyans ve Standart Sapma Frekans Serilerinde Varyans ve Standart Sapma Gruplandırılmış Serilerde Varyans ve Standart Sapma Değişim Katsayısı (Varyasyon Katsayısı) İstatistik börek gibidir ve ancak kimin tarafından yapıldığı bilinirse ve içindekilerden insan emin olabilirse o zaman tatmin edicidir. Lawrence Lovell
İSTATİSTİK Değişkenlik Ölçüleri 3 DEĞİŞKELİK ÖLÇÜLERİ Ek Bilgi Dağılım: Bir serideki birimlerin değer bakımından birbirlerinden ya da ortalamadan farklılıklarını ve nasıl değiştiklerini ifade eder. Serilerin incelenmesinde ve karşılaştırılmasında merkezi eğilim ölçüleri yeterli değildir. Dolayısıyla gözlem değerlerinin birbirinden ne kadar farklı olabileceğini gösteren ölçülere ihtiyaç duyulmaktadır. Bu ölçülere değişkenlik ölçüleri denir. Örneğin Şekil 8.1 de görüldüğü gibi ortalamaları aynı olan iki seri yapı bakımından farklılık gösterebilirler. X 1 = X 2 1.seri Şekil 8.1 Ortalamaları aynı fakat değişkenlikleri farlı olan iki serinin dağılımını gösteren grafik. 2.seri 1.serinin değişkenliği 2.serinin değişkenliği Bu ünitede değişkenlik ölçülerinin devamı olan varyans, standart sapma ve değişim katsayısını göreceğiz. Varyans ve Standart Sapma Gözlem değerlerinin aritmetik ortalamadan farklarının karelerinin aritmetik ortalamasına varyans ve varyansın pozitif kareköküne ise standart sapma denir. İstatistikte en sık kullanılan değişkenlik ölçüleridir. Anakütle ve örneklem için aşağıdaki gibi gösterilirler. Anakütle için varyans σ 2 Anakütle için standart sapma σ Örneklem için varyans s 2 Örneklem için standart sapma s Burada σ sembolü sigma şeklinde okunur.
4 İSTATİSTİK Değişkenlik Ölçüleri Basit Serilerde Varyans ve Standart Sapma Basit serilerde anakütle için varyans, σ 2 = i=1 (x i μ) 2 formülü ile hesaplanır. Varyansın pozitif karekökü olan standart sapma ise σ = i=1 (x i μ) 2 olarak elde edilir. Örneklem için varyans değeri ise s 2 = n i=1 (x i X) 2 biçiminde ve yine örneklem için varyansın pozitif karekökü olan standart sapma, formülleri ile hesaplanır. s = n i=1 (x i X) 2 Örnek 8.1. İstatistik sınava giren 8 öğrenci sınavdan 24, 28, 36, 40, 54, 62, 75, 81 puanlarını almıştır. Buna göre sonuçların varyans ve standart sapmasını bulunuz. Çözüm: Sınav sonuçlarının aritmetik ortalaması μ = 50 dir. Buradan varyans, σ 2 = 8 i=1 (x i 50) 2 8 olarak karşımıza çıkar. Standart sapma ise, = (24 50)2 + (28 50) 2 + + (81 50) 2 8 = 400,25 şeklinde elde edilir. σ = 8 i=1 (x i 50) 2 8 = 3202 = 20,006
İSTATİSTİK Değişkenlik Ölçüleri 5 Frekans Serilerinde Varyans ve Standart Sapma Frekans serilerinde anakütle için varyans, σ 2 = i=1 f i(x i μ) 2 şeklinde hesaplanır. Varyansın pozitif karekökü olan standart sapma ise σ = i=1 f i(x i μ) 2 olarak elde edilir. Buradan örneklem için varyans değeri ise s 2 = n i=1 f i(x i X) 2 biçiminde ve örneklem için varyansın pozitif karekökü olan standart sapma ise, ile hesaplanır. s = n i=1 f i(x i X) 2 Örnek 8.2. Bir fabrikada üretilen pillerden rasgele olarak seçilen 30 pilin ömrü ölçülerek alttaki tabloda verilmiştir. Pil Ömrü (saat) Pil Sayısı 10 5 11 5 12 8 13 10 14 1 15 1 Buna göre bu fabrikanın ürettiği pillerin varyans ve standart sapmasını bulunuz. Çözüm: Fabrikanın ürettiği tüm piller içerisinden 30 pil seçilerek örneklem oluşturulmuştur. Dolayısıyla s 2 ve s değerleri bize sorulmaktadır. Öncelikle X aritmetik ortalamasını,
6 İSTATİSTİK Değişkenlik Ölçüleri X = x if i n = 50 + 55 + 96 + 130 + 14 + 15 30 = 360 30 = 12 saat biçiminde elde edelim ve varyans ile standart sapmayı bulmak için gereken bilgileri aşağıdaki tabloda gösterelim. x i f i x i f i x i X (x i X) 2 f i (x i X) 2 10 5 50-2 4 20 11 5 55-1 1 5 12 8 96 0 0 0 13 10 130 1 1 10 14 1 14 2 4 4 15 1 15 3 9 9 Buradan varyans, s 2 = n i=1 f i(x i X ) 2 biçiminde, standart sapma ise, = 20 + 5 + 0 + 10 + 4 + 9 30 1 = 48 29 = 1,655 elde edilir. s = n i=1 f i(x i X ) 2 = 1,655 = 1,286 Gruplandırılmış Serilerde Varyans ve Standart Sapma Gruplandırılmış serilerde gözlem değerleri olan x i yerine yine sınıf aralıklarının orta noktaları olan a i değerleri kullanılacaktır. Anakütle için varyans, σ 2 = i=1 f i(a i μ) 2 şeklinde hesaplanır. Varyansın pozitif karekökü olan standart sapma ise σ = i=1 f i(a i μ) 2 olarak elde edilir. Buradan örneklem için varyans değeri ise
İSTATİSTİK Değişkenlik Ölçüleri 7 s 2 = n i=1 f i(a i X) 2 biçiminde ve örneklem için varyansın pozitif karekökü olan standart sapma ise, ile hesaplanacaktır. s = n i=1 f i(a i X) 2 Örnek 8.3. Bir doğum hastanesinde ocak ayında doğan tüm bebeklerin ağırlıkları hakkında yapılan bir araştırmada 40 bebeğin ağırlıkları gruplandırılmış seri olarak aşağıdaki tabloda verilmiştir. Bu hastanede ocak ayında doğan bebeklerin ortalama ağırlığı μ = 3350 gr olduğuna göre varyans ve standart sapmasını bulunuz. Ağırlık (gram) Bebek Sayısı 2000 2500 den az 4 2500 3000 den az 8 3000 3500 den az 12 3500 4000 den az 10 4000 4500 den az 4 4500 5000 den az 2 Çözüm: Tablodaki bilgileri kullanarak varyans ve standart sapmayı elde edelim. Ağırlık f i a i a i μ (a i X) 2 f i (a i X) 2 2000 2500 4 2250-100 10000 40000 2500 3000 8 2750 400 160000 1280000 3000 3500 12 3250 900 810000 9720000 3500 4000 10 3750 1400 1960000 19600000 4000 4500 4 4250 1900 3610000 14440000 4500 5000 2 4750 2300 5290000 10580000 σ 2 = f i(a i μ) 2 şeklinde elde edilir. = 4000 + 1280000 + + 10580000 40 σ = f i(a i μ) 2 40 = 1391500 = 1179,61 = 1391500
8 İSTATİSTİK Değişkenlik Ölçüleri Değişim Katsayısı (Varyasyon Katsayısı) Standart sapma bize gözlem değerlerinin ortalama etrafında nasıl dağıldığını gösterir. İki seriyi karşılaştırdığımızda ise bunlar farklı birimlerle (TL, kg, cm vb.) ölçülmüşler ise standart sapma karşılaştırma hakkında net bir bilgi vermez. Bunun için iki serinin standart sapmaları kendi ortalamalarının yüzdesi olarak ifade edilirse gözlem değerlerinin büyüklüklerinden ve birimlerden kaynaklanan farklılıklar ortadan kalkar. Uyguladığımız bu değişkenlik ölçüsüne değişim katsayısı veya varyasyon katsayısı adı verilir. İki seriye ilişkin değişim katsayılarını karşılaştırdığımızda hangisinin değişim katsayısı daha büyük ise o dağılımın daha fazla değişim gösterdiğini söyleyebiliriz. Değişim katsayısını D ile gösterirsek anakütle için, D = σ μ 100 örneklem için ise, D = s X 100 olarak ifade edilir. Sonuç yüzde olarak belirtileceğinden dolayı standart sapmanın ortalamaya oranı 100 ile çarpılır. Bulduğumuz bu oranın birimi olmadığından dolayı da seriler arasındaki birim farkı ortadan kalkar. Örnek 8.4. Aşağıdaki tabloda verilen iki serinin değişkenliğini değişkenlik katsayısı ile hesaplayınız. x i y i 3 2 4 8 5 10 6 12 7 13 Çözüm: Tablodaki iki serinin ortalamaları ve standart sapmaları, μ x = 5 μ y = 9 σ x 1,414 σ y 3,898
İSTATİSTİK Değişkenlik Ölçüleri 9 olarak bulunur. Buradan değişkenlikleri, D x = σ x μ x 100 %28 D y = σ y μ y 100 %43 şeklinde elde ederiz. Buradan y i serisinin değişkenliğinin daha az olduğu söylenebilir. ÇALIŞMA SORULARI 1) Gözlem değerlerinin aritmetik ortalamadan farklarının karelerinin aritmetik ortalamasına ne ad verilir? a) Medyan b) Mutlak sapma c) Standart sapma d) Frekans e) Varyans 2) Varyansın pozitif kareköküne ne ad verilir? a) Medyan b) Mutlak sapma c) Standart sapma d) Frekans e) Varyans
10 İSTATİSTİK Değişkenlik Ölçüleri 3) Aşağıdakilerden hangisi anakütle için ifade edilen varyans gösterimidir? a) s b) s 2 c) σ d) σ 2 e) σ 3 4) 1, 3, 5, 7, 9 sayı dizisinin varyansı kaçtır? a) 4 b) 6 c) 8 d) 10 e) 12 5) 1, 3, 5, 7, 9 sayı dizisinin standart sapması kaçtır? a) 1 b) 2 c) 2 d) 2 2 e) 4 6) Bir fabrikada üretilen televizyonlardan rasgele olarak seçilen 7 tanesinin ekranındaki hatalı piksel sayıları frekans serisi olarak verilmiştir. Buna göre üretilen televizyonların ekranındaki hatalı piksel varyansını bulunuz? a) 8/9 b) 10/9 c) 25/6 d) 32/3 e) 29/6 Hatalı Piksel Sayısı Adet 1 2 3 1 6 1 8 3
İSTATİSTİK Değişkenlik Ölçüleri 11 7) Bir fabrikada üretilen televizyonlardan rasgele olarak seçilen 7 tanesinin ekranındaki hatalı piksel sayıları frekans serisi olarak verilmiştir. Buna göre üretilen televizyonların ekranındaki hatalı piksellerin standart sapmasını bulunuz? a) 0,85 b) 2,96 c) 3,26 d) 4,16 e) 5,25 Hatalı Piksel Sayısı Adet 1 2 3 1 6 1 8 3 8) Bir işyerinde çalışan 10 kişinin haftalık mesaiye kalma saatleri 2 saatlik aralıklarla gruplandırılmış seri olarak verilmiştir. Buna göre bu iş yerinde çalışanların mesai saatlerinin varyansını bulunuz? a) 5 b) 7 c) 9 d) 11 e) 13 Mesai (saat) Kişi 0-2 2 2-4 3 4-6 4 6-8 0 8-10 1 9) İki serinin standart sapmaları kendi ortalamalarının yüzdesi olarak ifade edilirse gözlem değerlerinin büyüklüklerinden ve birimlerden kaynaklanan farklılıkların ortadan kalkmasını sağlayan değişkenlik ölçüsüne ne ad verilir? a) Değişim Katsayısı b) Mutlak sapma c) Standart sapma d) Frekans e) Varyans 10) 2, 5, 8 dizisinin değişim katsayısını bulunuz? (σ = 3,4) a) 64 b) 68 c) 72 d) 76 e) 80