ASTROİSTATİSTİK 6. KOU Hazırlaya: Doç. Dr. Tolgaha KILIÇOĞLU 6. FARKLI VERİ TÜRLERİDE ORTA DEĞER, YAYILIM, ÇARPIKLIK VE BASIKLIK Bir veri üzeride istatistisel bir çalışma yapare verii bir popülasyoa mı yosa bir öreleme mi ait olduğuu bilme öemlidir. İstatistitei formüller bu ii veri türü içi farlılılar sergiler. Öreği, bir bilgisayar şiretide çalışa 100 işii ortalama maaşları hesaplama istiyor. Eğer elimizde bu 100 işii e adar maaş aldığıa ilişi bir veri varsa bu bir popülasyo olur. Eğer sadece rastgele seçilmiş 10 işii maaşıı verisi mevcutsa bu veri bir örelem olur. Popülasyou aalizi soucuda ortalama maaş bir parametre ( μ ) olara et bir şeilde ortaya oyulur. Örelem üzeride ise bir istatisti yapılara ortalama maaş tahmi edilir ( x ). Çözülme istee bir soruya göre bir verii popülasyo veya örelem olma durumu da değişebilir. Öreği, bir restora sahibi şu aa adar restoraı ziyaret etmiş ola müşterilerii yaşları üzerie bir istatisti betimleme yapma istemetedir. Elide şu aa adar restoraı ziyaret ede heresi yaş bilgisi veri olara bulumatadır. Bu durumda bu yaş verisi bir popülasyo oluşturur. Aca, restora sahibi bu verileri ullaara buda sora gelece ola müşterileri haıda tahmide buluma istiyorsa bu veri artı bir örelem olara ele alımalıdır. Çüü bu iici searyoda popülasyo restoraı sadece geçmiştei değil gelecetei müşterilerii de apsamatadır. Astroomide belirli gö cisimleride toplaa verileri ço büyü bölümüü bir örelem oluşturduğuu rahatlıla söyleyebiliriz. Öreği, ötro yıldızları üzerie yapıla bir çalışmada evredei ötro yıldızlarıı tamamıı gözlememiz mümü değildir. Aca bir örelem gözleyere ötro yıldızlarıı tamamıa ilişi bir istatisti yapabiliriz. Ço adir de olsa bazı veriler popülasyo da oluşturabilir. Öreği Güeş Sistemi dei gezegeleri yoğulularıı ortalaması üzerie yapıla bir çalışmada sisteme üye 8 gezegei de yoğulu verisi mevcutsa bu veri bir popülasyodur. Bir başa öre ise, bir yıldız ümesie üye tüm yıldızları uzay hareetleri biliiyorsa ve bu hareetler ullaılara ümei uzaydai ortalama hareeti belirleiyorsa verii bir popülasyo olduğu söyleebilir. Aca, yie çoğu durumda bir ümei tüm üyelerii gözleme mümü olmamata ve belirli sayısa üyede bir örelem oluşturulara ümei uzaydai hareeti tahmi edilmetedir. Dolayısıyla elimizde gözlemsel bir veri olduğuda ou çoğu zama bir örelem olduğuu alımızda çıarmamamız gereir. Veriler daha öce de gördüğümüz gibi sııflamış ve sııflamamış olma üzere de iiye ayrılırlar. Sııfladırılmış veriler söz ousu oldularıda istatistisel ifadelere sadece freas ( f ) terimi eleir. İfadeleri vereceği değerleri popülasyo-örelem durumuda olduğu gibi farlılaşması söz ousu değildir.
Bu bölümde istatistite ullaıla ifadeleri verii popülasyo/örelem olması ve sııfladırılmış/sııfladırılmamış olması durumlarıda asıl değiştiği gösterilmetedir. Burada verile ifadeleri büyü bir bölümü öcei ouları terarı iteliğii taşır. 6.1 Sembollerdei Farlılılar Ortalama, varyas ve stadart sapma ifadeleri içi ullaıla semboller verii popülasyo veya örelem olmasıa göre değişir. Çizelge 6.1 de bu semboller gösterilmetedir. Çizelge 6.1 Popülasyo ve örelem içi ortalama, varyas ve stadart sapma sembolleri Popülasyo Örelem Ortalama μ x Varyas σ 2 s 2 Stadart Sapma σ s Elema sayısı Bu ifadelere e olara sııflamış verilerde sııf sayısıı sembolüyle, sııftai elema sayısıı f sembolüyle ve sııf göstergesii (sııfı alt sıırı ile üst sıırıı ortalamasıı) ise ^x ile göstereceğiz. Ayrıca sııflamış bir veri içi toplam elema sayısıı ( veya ) sııfları freaslarıı toplamı olduğuu uutmayıız: = veya = 6.2 Ortalama Bir popülasyou ortalaması ile bir örelemi ortalaması bezer şeilde hesaplaır. Çizelge 6.2 de bu hesaplamalara ilişi ifadeler verilmetedir. Çizelge 6.2 Farlı veri tipleri içi ortalama ifadeleri ORTALAMA Popülasyo Örelem μ= μ= x i ^x i x= x= x i ^x i
6.3 Mod Bir popülasyou modu ile bir örelemi modu bezer şeilde hesaplaır. Çizelge 6.3 de bu hesaplamalara ilişi ifadeler verilmetedir. Çizelge 6.3 Farlı veri tipleri içi mod ifadeleri MOD Popülasyo Örelem Veridei e ço terarlaya değerdir. Δ 1 MOD L mod +c ( Δ 1 +Δ ) 2 veride e fazla elemaı ola sııfa mod sııfı deir. Bua göre: L mod Δ 1 Δ 2 c : Mod sııfıı alt sıırı : Mod sııfıı freası ile bir öcei sııfı freası arasıdai far (pozitif bir değer) : Mod sııfıı freası ile bir sorai sııfı freası arasıdai far (pozitif bir değer) : Sııf geişliği olara alımalıdır. 6.4 Medya Bir popülasyou medyaı ile bir örelemi medyaı bezer şeilde hesaplaır. Çizelge 6.4 te bu hesaplamalara ilişi ifadeler verilmetedir. Çizelge 6.4 Farlı veri tipleri içi varyas ifadeleri MEDYA Popülasyo Örelem Veriler üçüte büyüğe (veya tersie) doğru sıraladığıda ortada ala değerdir. i medya 1 i medya 1 2 2 MEDYA L medya +c ( ) MEDYA L f medya +c ( ) medya f medya veride ediside öce gele sııfları freaslarıı toplamı ile ediside sora gele sııfları freasları toplamıı birbirlerie e yaı olduğu sııfa medya sııfı deir. Bua göre: L medya : Medya sııfıı alt sıırı
i medya 1 f medya c : Medya sııfıa adar ola (medya sııfı hariç) sııfları freasları toplamı : Medya sııfıı freası : Sııf geişliği olara alımalıdır. 6.5 Varyas Bir popülasyou varyası ile bir örelemi varyası arasıdai far örelem içi varyas hesaplaıre paydaı 1 alımasıdır. Çizelge 6.5 de bu hesaplamalara ilişi ifadeler verilmetedir. Çizelge 6.5 Farlı veri tipleri içi varyas ifadeleri VARYAS Popülasyo Örelem σ 2 = σ 2 = (x i μ) 2 μ) 2 s 2 = s 2 = (x i x) 2 1 x) 2 1 6.6 Stadart Sapma Bir popülasyou stadart sapması ile bir örelemi stadart sapması arasıdai far örelem içi stadart sapma hesaplaıre paydaı 1 alımasıdır. Çizelge 6.6 de bu hesaplamalara ilişi ifadeler verilmetedir. Çizelge 6.6 Farlı veri tipleri içi stadart sapma ifadeleri STADART SAPMA Popülasyo Örelem = σ = σ (x i μ) 2 μ) 2 s= (x i x) 2 1 s= x) 2 1
6.7 Çarpılı Çizelge 6.7 de çarpılığı hesabıda ullaılabilece ifadeler suulmatadır. Popülasyo ve örelem içi verile çarpılı ifadelerii il etapta birbirlerie ço bezediği düşüülebilir. Aca paydaya diat edildiğide örelemde s 3 ifadesi buluduğu görülür. Burada s örelemi stadart sapması olup 1 terimii içide barıdırmatadır. Popülasyou stadart sapması ( σ ) ise değeride hesaplamatadır. Ayrıca, örelem içi verile basılı ifadesii başıda e bağlı bir stadartlaştırma ifadesi bulumatadır. Bu edele popülasyo ve örelem içi hesaplaa çarpılı değerlerii birbirleride bir mitar farlı olması beleir. Çizelge 6.7 Farlı veri tipleri içi çarpılı ifadeleri ÇARPIKLIK Popülasyo Örelem (x i μ) 3 (x i x ) 3 σ 3 ( 1)( 2) s 3 μ) 3 x ) 3 σ 3 ( 1)( 2) s 3 6.8 Basılı Çizelge 6.8 de basılığı hesabıda ullaılabilece ifadeler suulmatadır. Popülasyo ve örelem içi verile basılı ifadelerii il etapta yie birbirlerie ço bezediği düşüülebilir. Aca, paydaya diat edildiğide örelemde s 4 ifadesi buluduğu görülür. Burada s örelemi stadart sapması olup 1 terimii içide barıdırmatadır. Popülasyou stadart sapması ( σ ) ise değeride hesaplamatadır. Ayrıca, örelem içi verile basılı ifadesii başıda tıpı çarpılıta olduğu gibi e bağlı bir stadartlaştırma ifadesi bulumatadır. Bu edele popülasyo ve örelem içi hesaplaa çarpılı değerlerii birbirleride bir mitar farlı olması beleir. Çizelge 6.8 Farlı veri tipleri içi basılı ifadeleri BASIKLIK Popülasyo Örelem b= b= (x i μ) 4 (x (+1) i x ) 4 3 b= σ 4 ( 1)( 2)( 3) ( 1) 2 3 s 4 ( 2)( 3) μ) 4 f (+1) i x ) 4 3 b= σ 4 ( 1)( 2)( 3) ( 1) 2 3 s 4 ( 2)( 3)
6.9 Bir Veri ile Hesaplamalar Çizelge 6.9 de Gıda Mühedisliği öğrecilerii Astroomi derside aldığı otları sııflamış freas dağılımı yer almatadır. Öcelile her sııfı sııf göstergesii yaıa yazıız. Daha sora, bu dağılımı ullaara verii ortalama, mod, medya, stadart sapma, çarpılı ve basılı değerlerii hesaplayıız. Çizelge 6.9 Astroomi dersi sıav otlarıı sııflamış freas dağılımı ot Aralığı (Sııflar) Sııf Göstergesi ) Freas (öğreci sayısı) ( ) 1 10 5.5 1 11 20 15.5 1 21 30 25.5 1 31 40 35.5 3 41 50 45.5 4 51 60 55.5 9 61 70 65.5 10 71 80 75.5 14 81 90 85.5 8 91 100 95.5 1 Öcelile verii popülasyo mu yosa örelem mi olduğuu tespit edelim. Astroomi dersii ala Gıda Mühedisliği öğrecilerii hepsii otları bu veride yer almatadır (daha doğrusu bir ısmıı olduğua ilişi soruda bir ibare bulumamatadır). Ayrıca bu otlar ullaılara başa bir durumu tahmii yapılma istememete, sadece veriye ilişi bazı ölçütleri hesaplaması istemetedir. Bu bilgiler ışığıda verii bir popülasyoda geldiğii rahatlıla söyleyebiliriz. Verileri ayı zamada sııflamış olduğu da görülmetedir. Bu durumda hesaplamalarımızda popülasyo ve sııflamış veri içi ola bağıtıları ullaacağız. Ortalama Öcelile freaslar toplamıda toplam öğreci sayısıı belirleyelim: = =1+1+1+3+4+9+10+14+8+1=52 Şimdi popülasyou ortalamasıı hesaplayalım: μ= ^x i =(1 5.5)+(1 15.5)+(1 25.5)+...+(14 75.5)+(8 85.5)+(1 95.5) =63.9615 52
Mod Freası e fazla olduğu sııf (yai mod sııfı) 71 80 sııfıdır. Öcelile mod hesabı içi geree aşağıdai değerleri belirleyelim: L mod : 71 Mod sııfıı alt sıırı Δ 1 : 14 10 = 4 Mod sııfıı freası ile bir öcei sııfı freası arasıdai far Δ 2 : 14 8 = 6 Mod sııfıı freası ile bir sorai sııfı freası arasıdai far c : 10 Sııf geişliği Bu değerler ullaılırsa mod değeri Δ 1 4 MOD L mod +c ( )=71+10 ( Δ 1 +Δ 2 4+6 )=75 olara elde edilir. Buradai mod değerii bir yalaşı değer olduğu uutulmamalıdır. Medya Kediside öce gele sııfları freaslarıı toplamı ile ediside sora geleleriii toplamıı birbirlerie e yaı olduğu sııf (yai medya sııfı) 61 70 sııfıdır. Bua göre; L medya : 61 Medya sııfıı alt sıırı i medya 1 : 1+1+1+3+4+9 =19 Medya sııfıa adar ola sııfları freasları toplamı f medya : 10 Medya sııfıı freası c : 10 Sııf geişliği Bu değerler ullaılırsa medya değeri i medya 1 2 MEDYA L medya +c ( f medya 52 2 19 )=61+10 ( )=68 10 olara elde edilir. Burada medya değeri yie yalaşı bir medya değeridir. Stadart Sapma Stadart sapma hesaplaıre toplam işaretii olduğu ifadede paratez içide ala far μ) 2 değerlerii öcede hesaplaması işlemleri daha olay yapılmasıı sağlar. = μ) 2 σ = 1 (5.5 63.9615)2 +...+9 (55.5 63.9615) 2 +...+1 (95.5 63.9615) 2 =18.74778 52
Çarpılı Çarpılı hesaplaıre toplam işaretii olduğu ifadede paratez içide ala far μ) 3 değerlerii öcede hesaplaması işlemleri daha olay yapılmasıı sağlar. μ) 3 = 1 (5.5 63.9615)3 +...+9 (55.5 63.9615) 3 +...+1 (95.5 63.9615) 3 σ 3 52 (18.74778) 3 Çarpılı değeri verii egatif (sola) çarpı olduğuu göstermetedir. = 0.98 Basılı Basılı hesaplaıre toplam işaretii olduğu ifadede paratez içide ala far μ) 4 değerlerii yie öcede hesaplaması işlemleri daha olay yapılmasıı sağlayacatır. b= μ) 4 3= 1 (5.5 63.9615)4 +...+9 (55.5 63.9615) 4 +...+1 (95.5 63.9615) 4 σ 4 52 (18.74778) 4 3=0.86 Basılı değerii sıfırda büyü olması dağılımı ormal dağılıma azara daha sivri olduğuu gösterir. So olara Çizelge 6.10 da hesapladığımız değerler ile veri sııfladırılmada öcei ham verilerle elde edile gerçe değerleri bir arşılaştırılması verilmiştir. Çizelge 6.10 verilerde hesaplaa ölçütler ile sııflamamış verilerde hesaplaaları arşılaştırılması veride hesaplaa Gerçe değer Mutla Far Ortalama 63.9615 65.1346 ~1.2 Mod 75 80 5 Medya 68 67 1 Stadart Sapma 18.74778 19.93136 ~1.2 Çarpılı 0.98-0.95 0.03 Basılı 0.86 1.15 0.29 veride elde ettiğimiz ölçütler sııflamamış veriyi olduça başarılı şeilde temsil etmetedir. Çizelge 6.9 dai sııflamış verileri bir histogram grafiğide gösterere bulduğumuz bu parametreleri gözle deetleyiiz.