Ders 8: Verileri Düzelemesi ve Aalizi Betimsel İstatistik Merkezsel Eğilim Ölçüleri Dağılım Ölçüleri Grafiksel Gösterimler Bir kitlei tamamıı, ya da kitlede alıa bir öreklemi özetlemekle (betimlemekle) ilgilee istatistik dalıa betimsel istatistik deir. Öreklemde elde edile verileri kullaarak kitlei tamamı hakkıda ögörüde bulumayı amaçlaya istatistik dalıa ise tümevarımsal amaçlı istatistik deir. 1
Kagetorik (özellik belirte) değişkeler: Nitel özellikleri belirte değişkelerdir. Örek: medei durum, meslek Sıralama değişkeleri: Büyüklükleri itibariyle sıralaabile, acak toplama-çıkarma gibi işlemleri alamsız olduğu değişkelerdir. Örek: Eğitim durumu, işaat sııfı (lüks, 1. sııf,...) Sayısal değişkeler: Sürekli ya da kesikli olarak belli bir aralıktaki sayısal değerleri ala değişkeler Bir kitleyi oluştura tüm bireyleri ölçülerek verilerii kaydedilmesie tamsayım deir. Bir kitlei sadece bazı elemalarıı seçilerek ölçülmesie örekleme, seçilmiş ola alt kümeye öreklem deir. Kitlei taımlayıcı sayısal ölçütlerie parametre, öreklemi taımlayıcı sayısal ölçütlerie öreklem istatistiği deir. Parametrei tesbiti içi tamsayım gerekir, öreklem kullaılarak parametreler tahmi edilebilir. Aritmetik Ortalama: Gözlemee değerleri toplamıı gözlem sayısıa bölümü ile elde edilir. x = x 1+x + +x E yaygı olarak kullaıla merkezi eğilim ölçütüdür, acak sapa (aşırı) değerlerde etkileir.
Büyüklüklerie göre sıralamış gözlemler grubuu merkezi değerie medya deir. M = x +1 tek ise x +x +1 çift ise Sapa (aşırı) değerlerde etkilemez. Veri kümeside e çok tekrarlaa değere mod (tepe değer) deir. Kategorik değişkeleri ortalama ve mod hesabı yapılamadığı içi kullaılır. Sürekli rastgele değişkeler iceleirke ayı değer birde fazla kez gözlemlemez, dolayısıyla gözlemler sııflara ayrılır. 5 parça pamuk lifi alımış ve su emicilikleri ölçülerek aşağıdaki değerler bulumuştur 18,8 19,87 18,44 0,47 18,01 19,17 1,67 18,60 1,74 0,67,98 1,76 19,06,61 0,1,0 1,1 18,15,0 1,18 0,77 19,3 18,0 18,15 19,59 a) Öreklemi ortalamasıı ve ortacasıı hesaplayıız b) Öreklemi 5 eşit aralığa bölüp moduu buluuz 3
5 x = 1 x 5 i 0,18 i=1 M = x 13 = 0,1 Aralık 18,00-19,00-0,00-1,00-,00-18,99 19,99 0,99 1,99,99 Gözlem Sayısı 7 5 4 5 5 Gözlemler 18,01 19,06 0,1 1,1,0 18,0 19,17 0,47 1,18, 18,15 19,3 0,67 1,67,61 18,15 19,59 0,77 1,74,98 18,44 19,87 1,76 18,6 18,8 Mod = (18,00; 18,99) G. O. = x 1 x x log G. O. = 1 log x 1 + log x + + log x H. O. = 1 x1 + 1 x + 1 x H. O. G. O. A. O. Ortalama değere uzaklığı karesii ortalamasıa varyas deir. Kitle içi: σ = x 1 μ + x μ + x N μ N Öreklem içi: s = x 1 x + x x + x x 1 4
Varyası kareköküe stadart sapma deir. σ = σ s = s Ölçüle değer ile ayı birimde olduğu içi tercih edilir. Stadart sapmaı ortalamaya bölümüe değişim katsayısı deir D. K. = σ x μ x 100% Stadart sapmaı birimi değişkei birimi ile ayıdır. Varyası birimi değişkei birimii karesidir. Birimleri ya da büyüklükleri farklı ola değişkeleri dağılımlarıı karşılaştırmak içi birimsiz ola değişim katsayısı kullaılır. Öreklemi eşit sayıda gözlemi bulua 4 sııfa böle çeyrek değerlerie Q 1, Q = M ve Q 3 deir. p r ile gösterile r ici yüzdelik, gözlemleri %r side büyük ola değerdir. 5
Çeyrekler arası değişim: d = Q 1 Q 3 Ortalama Mutlak Sapma: Aralık: OMS = i=1 x i μ r = x max x mi 5 parça pamuk lifi alımış ve su emicilikleri ölçülerek aşağıdaki değerler bulumuştur 18,8 19,87 18,44 0,47 18,01 19,17 1,67 18,60 1,74 0,67,98 1,76 19,06,61 0,1,0 1,1 18,15,0 1,18 0,77 19,3 18,0 18,15 19,59 Öreklemi varyasıı, stadart sapmasıı, değişim yüzdesii, aralığıı ve çeyrekler arası değişimii buluuz. i=1 s x i x =,48 1 s = s =,48 1,57 D. K = s = 1,57 %100 %7,8 x 0,18 r = x max x mi =,98 18,01 = 4,97 Q 1 = 18,8 Q 3 = 1,67 d = Q 3 Q 1 =,85 6
Birde fazla öğei isbi değerlerii göstermekte iyidir. Dikek ekse, yatay eksede yaklaşık %15 kısa olmalıdır. Tüm sütular ayı geişlikte olmalı, sütular arası geişlik sütu geişliğii yarısı kadar olmalı. Başlagıç mümküse sıfır değeride olmalı, aksi durumda açıkça gösterilmeli. Sütular matıklı bir sırada dizilmeli 011 Ocak ayıda trafiğe yei kaydola biek araçları üretiye göre ayrılması 5 000 0 000 15 000 10 000 5 000 0 Kayak: www.tuik.gov.tr Değerleri zama içide değişimii göstermeye uygudur 4 te fazla çizgii takibi zordur Başlagıç değeri sıfır olmaldır, değilse açıkça belirtilmelidir. 8 000 000 7 000 000 6 000 000 Trafiğe yei kaydola motorlu taşıtları yıllara göre değişimi 5 000 000 4 000 000 3 000 000 000 000 Automobile Tractor Motorcycle 1 000 000 0 Kayak: www.tuik.gov.tr Bir bütüü parçalarıı birbirlerie göre büyüklüklerii göstermede kullaılır 7 de fazla dilim kullaıldığıda alaşılması zor olur 3 boyutlu pastalarda ödeki dilimler olduklarıda büyük gözükürler Dilimleri isimleri yatay ve mümküse dilimi içie yazılmaldır Bir dilimi vurgulamak içi diğerleride ayrık gösterilebilir. 010 Türkiye de 010 kırmızı et üretimi Keçi Mada %3 %1 Koyu %17 Sığır %79 Kayak: www.tuik.gov.tr 7
Gözlem sıklıklarıı bitişik sütular halide gösterir Sııf sayısı de az olmalıdır 8 7 6 5 4 3 1 0 Histogram 8