Bölüm 3 Tanımlayıcı İstatstkler
Tanımlayıcı İstatstkler Br ver setn tanımak veya brden fazla ver setn karşılaştırmak çn kullanılan ve ayrıca örnek verlernden hareket le frekans dağılışlarını sayısal olarak özetleyen değerlere tanımlayıcı statstkler denr. Analzlerde kullanılan ver tplerne (bast, gruplanmış, sınıflanmış) göre hesaplamalarda kullanılacak formüller değşmektedr. 2
Tanımlayıcı İstatstkler Yer Ölçüler )Artmetk ort. 2)Geometrk ort. 3)Harmonk ort. 4)Mod 5)Medyan 6)Kartller Değşkenlk Ölçüler ) Range (Değşm Aralığı) 2) Ort. Mutlak sapma 3) Varyans 4) Standart Sapma 5) Değşkenlk(Varyasyon) Katsayısı Çarpıklık Ölçüler )Pearson Asmetr Ölçüsü 2)Bowley Asmetr Ölçüsü Basıklık Ölçüler 3
Yer Ölçüler Yer ölçüsünü belrlemek amacıyla ver analzn yapacak kş, öncelkle ver set çn hang ölçüyü kullanması gerektğne karar vermeldr. 4
Tanım Merkez Eğlm Ölçüsü Ver setnn orta noktası veya merkeznn değerdr. 5
Yer Ölçüler Hesaplama tüm verlern kullanıldığı ölçüler -Artmetk Ort. -Ağırlıklı Art. Ort. -Geometrk Ort. -Harmonk Ort. Hesaplama tüm verlern kullanılmadığı ölçüler -Mod -Medyan -Kartl 6
) Artmetk Ortalama Üzernde nceleme yapılan ver setndek elemanların toplanıp ncelenen eleman sayısına bölünmesyle elde edlen yer ölçüsüne artmetk ortalama denr. Örnek: Sınav notlarının ortalaması, Yaz aylarında m 2 ye düşen ortalama yağış mktarı 7
Örnek Ortalaması ve x Anakütle Ortalaması, x-bar şeklnde telaffuz edlr ve örneklemn ortala masıdır. x = x n µ, mü şeklnde telaffuz edlr ve anakütle ortalamasıdır µ = x N 8
Br Denge Noktası Olarak Ortalama, 4, 9, 3, 50 sayılarının ortalaması =23 tür. Şekl sayıları br çzg üzernde yerleştrlmş eşt küçük ağırlıklar şeklnde gösterr.,4,9,3,50 Artmetk ortalama denge noktasıdır. 4 9 3 50 9
Eğer çzgy üzernde ağırlıklar olan br tahta olarak düşünürsek, tahtayı dengede tutmak çn nün bulunduğu yerden denge noktası koymalıyız. Bu artmetk denge noktasının özellğ; her br sayı çn x - yü hesaplarsak poztf ve negatf sayılar dengede kalır çünkü toplamları 0 olur. Herhang br ver set çn, olur. ( x ) 0 x x x uzaklığı 0
Bast Verler çn Artmetk Ortalama Örneğ Örnek: İzmr lnde lköğretm knc sınıfta okuyan öğrencler üzernde yapılan br araştırmada rasgele 8 öğrenc seçlmş ve alenzde kaç çocuk vardır sorusuna aşağıdak gb cevap vermşlerdr. Alelern çocuk sayılarının ortalamasını hesaplayınız.,3,2,,4,5,6,2 n = 8 =,2,,8 x n x 2 2 3 4 5 6 n 8 3
Gruplanmış Verler İçn Artmetk Ortalama x k k x f f k f n f : frekans k: grup sayısı =,2,3,.,k
Örnek: Br otomobl baysnde 80 gün boyunca yapılan nceleme sonucunda satılan arabaların adetlerne göre dağılımı yandak tabloda verlmştr. Buna göre br gün çnde satılan ortalama araba sayısını hesaplayınız. x Araba (x ) Gün (f ) k x f 0 2 70 42 32 30 86 k 80 80 f x.f 0 5 0 2 2 2 35 70 3 4 42 4 8 32 5 6 30 f =80 2,33
Sınıflanmış Verler İçn Artmetk f : frekans k : sınıf sayısı =,2,3,.,k x Ortalama k m m : sınıf orta noktası Sınıflanmış verlerde her br sınıf çndek değerlern neler olduğu blnmedğnden dolayı ve yalnızca her br sınıfın frekans değerler blndğnden dolayı sınıfı temsl etmek üzere sınıf orta noktaları hesaplamada kullanılır. Kullanılan formül gruplanmış verler çn kullanılan 4 formüle benzerdr. k f f k f n
Örnek: Br sınıftak öğrenclern boyları hakkında br araştırma yapılmaktadır. Bu amaçla 50 öğrencnn boyları ölçülerek kaydedlmştr.öğrenclern boylarının artmetk ortalamasını hesaplayınız. x Sınıflar f m m f 50-57 den az 5 53,5 767,5 57-64 den az 7 60,5 23,5 64-7 den az 4 67,5 2345 7-78 den az 9 74,5 570,5 78-85 den az 8 8,5 452 85-92 den az 4 88,5 754 92-99 dan az 3 95,5 586,5 Toplam 50 8599 k m f k 50 50 f 53,5(5) 60,5(7)... 95,5(3) 8599 7,98 cm.
Artmetk Ortalama x x x x nx nx 0. Artmetk ortalamadan sapmaların toplamı sıfırdır. 2. 2 x x mn 3. Örnek değerlernde meydana gelen değşm çok küçük de olsa artmetk ortalama bu değşmden etklenr. Verlern tümünün br fonksyonudur. 6
Artmetk Ortalama 4. Örnek gözlemlern tümü a gb br sabt le çarpılırsa bu yen ver setnn artmetk ortalaması da esk ver setnn artmetk ortalamasının a le çarpımı kadar değşr. 5. Örnek gözlemlern tümü a gb br sabt le toplanırsa bu yen ver setnn artmetk ortalaması da esk ver setnn artmetk ortalamasının a le toplamı kadar değşr. 6. Artmetk ortalama tüm verler hesaplama fonksyonu çnde kullanması neden le güçlü br statstktr. 7. Artmetk ortalama verlerdek uç değerlerden etklenmes se bu statstğn zayıf yönünü oluşturur. 7
Ağırlıklı Artmetk Ortalama Ver setndek gözlemlern belrl br krtere göre ağırlıklandırılması durumunda ver setnn ortalamasının hesaplanması çn kullanılan ortalamadır. x w wx w 8
Ağırlıklı Artmetk Ortalama Gözlemler bell br krtere göre ağırlıklandırılmış se ağırlıklı artmetk ortalama kullanılır. Ağırlıklı artmetk ortalama kullanılırken tüm gözlemlern ağırlıkları eşt se artmetk ortalama le aynı sonucu verr. 9
İktsad ve İdar Blmler Fakültes İşletme Bölümü ndek brnc sınıf öğrencsnn güz dönemnde aldığı dersler, başarı notları, başarı notlarının katsayıları ve kred değerler aşağıda verlmştr: Öğrencnn dönem not ortalamasını katsayı cnsnden hesaplayınız. 20
2
2) Geometrk Ortalama Br ver setnde bulunan n adet elemanın çarpımının n nc dereceden kökünün alınmasıyla elde edlen yer ölçüsüdür. G n x x2... Geometrk ortalamanın formülüne bakıldığında hesaplama zorluğu olduğundan dolayı logartma fades kullanılır. Genellkle bast verler çn kullanışlı olup negatf sayılar çn kullanışlı değldr. Log G n log n x G x n antlog n n log x 22
Geometrk Ortalama nın Kullanım Alanları Ortalama oranları, Değşm Oranları, Logartmk dağılış gösteren ver setler, çn kullanışlıdır. Örnek: fyat ndeksler, faz formüller.
Geometrk Ortalama. x 0 olmalıl 2. G x 3. Uç değerlerden artmetk ortalama kadar etklenmez. 24
Örnek: Abac şrketnn yıldan-yıla olan fuel dek tüketm harcamalarının değşm yüzde -5, 0, 20, 40, ve 60. büyüme faktörlernn geometrk ortalamasını kullanarak harcamalardak ortalama yıllık yüzde değşm belrlenr. Büyüme faktörler çn yüzde değşm dönüştürme le elde edlenler; 0.95.0.20.40.60
G n x 5 x2... x n (0,95)(,0)(,20)(,40)(,60) 5 2.80896, 229 Log G Log G n log x 0, 022276 0, 04393 0, 0798 0,4628 0, 20420 n 5 0, 448546 0, 0897 5 G = ant log 0,27045 = 0 0,0897,229
27 3) Harmonk Ortalama Br ver setnde bulunan n adet elemanın çarpma şlemne göre terslernn ortalamasının tersnn alınmasıyla elde edlen yer ölçüsüdür. Genellkle bast verler çn kullanışlıdır. n x n x x n n x x x H...... 2 2 n x H n
Harmonk Ortalama nın Kullanım Alanları Zaman verler çn kullanışlıdır. Örnek: Zaman brm başına hız, para brm başına satın alınan brm sayısı. Belrl koşullar ve fyat tpler çn zaman verlernn ortalamalarının hesaplanmasında kullanılan br yer ölçüsüdür. Zamana bağlı hız, fyat vermllk gb oransal olarak fade edleblen verlern ortalamasın alınmasında da kullanılablr. NOT: ARİTMETİK ORT. > GEOMETRİK ORT. > HARMONİK ORT. 28
Örnek: Br tekstl fabrkasında çalışan dört kşnn br pantolonu ütüleme süreler aşağıda verlmştr. Buna göre bu fabrkada br pantolon ortalama kaç dakkada ütülenr? İşç : 0 dk. İşç 2: 6 dk. İşç 3: 4 dk. İşç 4 : 5 dk. H n n x 4 5 6 4 0 43 240 H 240 43 5,58 dk. 29
Örnek: A ve B gb k şehr arasında 00km lk br yol vardır. Br otomobll yolun lk yarısını 30 km/saat hızla gdyor. Dğer yarısını 40 km/saat hızla gdyor. Hız ortalaması nedr? 30
Br hızlı tren gttğ mesafesnn lk üçte brnde 300km/s, knc üçte brnde 450 km/s ve son üçte brnde 360 km/s hız yapmıştır. Buna göre aracın ortalama hızı ne olmuştur. 3
4) Mod Br ver setnde en çok gözlenen ( en çok tekrar eden ) değere veya frekansı en fazla olan şans değşken değerne mod adı verlr. Ver setnn modu olmayacağı gb brden fazla da modu olablr. Mod genellkle keskl şans değşkenl çn oluşturulan gruplanmış verlerde artmetk ortalama yerne kullanılablr. 32
Mod Mod, büyük ver setlernde vernn daha çok nerede toplandığını bulmak çn kullanılır. Örneğn erkek kıyafetler satan br perakendec, potansyel müşterlern belrlemek çn gömlek kol uzunluğu ve gömlek yaka ölçüsüyle lgleneblr. 33
Örnekler ) 5,40,0 0,42 0,73 0,48,0 Modu,0 2) 27 27 27 55 55 55 88 88 99 3) 2 3 6 7 8 9 0 den fazla moda sahp, 27 ve 55 Modu yok 34
Gruplanmış Verler İçn Mod Bast verlerde bulunduğu gb hesaplanır. Örnek: Br gömlek baysnde 80 gün boyunca yapılan nceleme sonucunda satılan gömleklern adetlerne göre dağılımı yandak tabloda verlmştr. Buna göre gömlek satışları çn mod değer nedr? Gömlek beden(x ) Satış aded (f ) 0 5 2 2 35 3 4 4 8 5 6 En yüksek frekansa sahp olan gözlem değer 2 olduğundan dolayı gömlek satışları çn mod değer 2 dr. 35
Sınıflanmış Verler İçn Mod Sınıflanmış verlerde mod değer hesaplanırken lk olarak mod sınıfı belrlenr. Mod sınıfı frekansı en yüksek olan sınıftır. Mod sınıfı belrlendkten sonra bu sınıf çersnde yer alan modun tam değer sınıf frekansı ve kendne komşu olan sınıf frekansları dkkate alınarak hesaplanır. 36
Mod = L mod. 2 L Mod = Mod Sınıfı Aralığının Alt Sınırı = Mod Sınıfı Frekansı - Kendnden Br Öncek Sınıf Frekansı 2 = Mod Sınıfı Frekansı Kendnden Br Sonrak Sınıf Frekansı = Mod Sınıfının Sınıf Aralığı 37
Örnek: Br sınıftak öğrenclern boyları hakkında br araştırma yapılmaktadır. Bu amaçla 50 öğrencnn boyları ölçülerek kaydedlmştr.öğrenclern boylarının mod değern hesaplayınız. Mod sınıfı Sınıflar f 50-57 den az 5 57-64 den az 7 64-7 den az 4 7-78 den az 9 78-85 den az 8 85-92 den az 4 92-99 dan az 3 Toplam 50
Frekansı en yüksek olan sınıf mod sınıfı olarak belrlenr. Mod sınıfı belrlendkten sonra formülde lgl değerler yerne koyularak mod değer hesaplanır. Mod Lmod 2 (4 7) 64 7 68,08 cm. (4 7) (4 9)
5) Medyan Br ver setn büyükten küçüğe veya küçükten büyüğe sıraladığımızda tam orta noktadan ver setn k eşt parçaya ayıran değere medyan adı verlr. Ver setnde aşırı uçlu elemanlar olduğunda artmetk ortalamaya göre daha güvenlrdr. Medyan, ver setndek tüm elemanlardan etklenmez. 40
Bast Verler İçn Medyan Ver Setnn Hacm Tek Sayı İse; n 2 nc gözlem değer medyandır. Ver Setnn Hacm Çft Sayı İse; n 2 ve n 2 nc gözlem değernn artmetk ortalaması medyandır. 4
5.40.0 0.42 0.73 0.48.0 0.42 0.48 0.73.0.0 5.40 Medyan bu k noktanın arasına düşmektedr 0.73 +.0 2 MEDYAN 0.95 5.40.0 0.42 0.73 0.48.0 0.66 0.42 0.48 0.66 0.73.0.0 5.40 Tam ortadak değer medyandır. MEDYAN 0.73 42
Gruplanmış Verler İçn Medyan Gruplanmış verlerde medyan değer hesaplanırken ver setnn tam orta noktasının hang gruba at olduğunu belrlemek çn brkml frekans sütunu oluşturulur. Sıra numarası belrlendkten sonra o sıra numarasına at grup medyan değer olarak fade edlr. 43
Örnek: Br gömlek baysnn satış mağazasında br gün çnde satılan gömleklern dağılımı aşağıda verlmştr. Buna göre ver set çn medyan değern hesaplayınız. Gömlek beden Satış aded Brkml Frekans ( f ) 0 5 5 2 7 2 35 52 3 4 66 4 8 74 5 6 80 n/2 ve (n/2)+ nc gözlem değerlerne karşılık gelen değerler (40 ve 4 nc sıra ) 2 olduğundan dolayı medyan değer 2 dr.
Frekans dağılımı aşağıdak gb olsaydı (n+)/2 nc elemana (40 ncı elemana) karşılık gelen değer 8 olacağından dolayı ver setnn medyanı 3 olarak hesaplanacaktı. Gömlek beden Satış aded Brkml Frekans ( f ) 0 5 5 2 7 2 22 39 3 32 6 4 4 75 5 4 79
Sınıflanmış Verler İçn Medyan Sınıflanmış verlerde medyan değer hesaplanırken lk olarak medyan sınıfı belrlenr. Medyan sınıfı brkml frekanslar dkkate alındığında toplam frekansın yarısını çnde bulunduran sınıftır. Medyan sınıfı belrlendkten sonra medyan sınıfından br öncek sınıfın brkml frekansı ve medyan sınıfı frekansı dkkate alınarak hesaplanır. 46
Medyan L f 2 f med f l. med L med : Medyan sınıfının alt sınırı f l : Medyan sınıfından br öncek sınıfın brkml frekansı f med : Medyan sınıfının frekansı 47
Örnek: Br sınıftak öğrenclern boyları hakkında br araştırma yapılmaktadır. Bu amaçla 50 öğrencnn boyları ölçülerek kaydedlmştr.öğrenclern boylarının mod değern hesaplayınız. Medyan sınıfı Sınıflar f f 50-57 den az 5 5 57-64 den az 7 2 64-7 den az 4 26 7-78 den az 9 35 78-85 den az 8 43 85-92 den az 4 47 92-99 dan az 3 50 Toplam 50
Toplam 50 adet gözlem olduğundan dolayı, brkml frekans sütununda 50/2 =25 nc gözlemn bulunduğu sınıf medyan sınıfı olarak belrlenr. f fl Medyan L 2. med f med 25 2 64.7 70,5cm 4
Merkez Ölçüm Ortalama Medyan Mod Tanım x x n Orta değer En sık tekrar eden ver değer Nasıl Kullanılıyor En Blnen ortalama Sıklıkla Kullanılır Ara sıra kullanılır Varlığı Her değer Dkkate Alınırmı? Her zaman vardır. Evet Evet Her zaman vardır. Olmayablr ya da brden fazla olablr. Hayır Hayır Uç Değerlerden Etklenrm? Hayır Hayır Avantajları ve Dezavantajları Brçok statstksel metodla y çalışır. Brkaç uç değer varsa genellkle y br terchtr Nomnal düzeyde verler çn uygundur Verler mod etrafında smetrk oldukları zaman, mod, medyan ve artmetk ortalama brbrlerne eşt olur. Eğer örneklem aynı anakütleden çeklmşse, artmetk ortalama dğer ölçülere göre daha güvenlrdr 50
Br ver setn büyükten küçüğe veya küçükten büyüğe sıraladığımızda dört eşt parçaya ayıran üç değere kartller adı verlr. 6) Kartller İlk % 25 lk kısmı çnde bulunduran. Kartl (Q ), % 50 lk kısmı çnde bulunduran 2. Kartl (Q 2 ), % 75 lk kısmı çnde bulunduran 3. Kartl (Q 2 ), olarak adlandırılır. %25 %25 %25 %25 %50 lk kısmı çnde bulunduran 2. Kartl (Q 2 ) aynı zamanda ver setnn medyanıdır. Q Q 2 Q 3 5
Bast Verler İçn Kartller.Kartl Q 3.Kartl Q 3 n 4 nc gözlem değer, 3( n ) 4 nc gözlem değer, 52
Örnek: İstatstk I dersn alan 0 öğrencnn vze notları aşağıdak gb sıralanmıştır. Buna göre vze notları çn Q ve Q 3 değerlern hesaplayınız. 30,42,56,6,68,79,82,88,90,98 (n+)/4 ncü vernn sıra numarası (0+)/4 = 2,75 dr. Q = 42 + 0,75.(56-42) = 52,5, 3(n+)/4 ncü vernn sıra numarası 3(0+)/4 = 8,25 dr. Q 3 = 88 + 0,25.(90-88) = 88,5 dr. 53
Ver set aşağıdak gb verlseyd, 30,42,56,6,68,79,82,88,90,98 (n+)/4 ncü vernn sıra numarası (9+)/4 = 2,5 dr. Q = 42 + 0, 5.(56-42) = 49, 3(n+)/4 ncü vernn sıra numarası 3(9+)/4 = 7,5 dr. Q 3 = 82 + 0, 5.(88-82) = 85, olarak hesaplanacaktı.
Gruplanmış Verler İçn Kartller Gruplanmış verlerde kartller hesaplanırken ver setnn lk çeyrek ve son çeyrek kısmını tam olarak fade etmek amacıyla brkml frekans sütünü oluşturulur. Gruplanmış verlerde örnek hacmnn tek veya çft olduğuna bakılmaksızın (n+)/4 ncü eleman.kartl (Q ), 3(n+)/4 ncü eleman se 3.Kartl (Q 3 ), olarak fade edlr. 55
Örnek: Br gömlek baysnn bedenlerne göre satış adetler aşağıda verlmştr. Buna göre ver set çn Q ve Q 3 nedr? Gömlek beden Satış aded Brkml Frekans ( f ) 0 5 5 2 7 2 35 52 3 4 66 4 8 74 5 5 79 (n+)/4 ncü ( 20 nc ) sıra numarasına karşılık gelen gözlem 2 olduğundan;.kartl 2, 3(n+)/4 ncü ( 20 nc ) sıra numarasına karşılık gelen gözlem 3 olduğundan; 3.kartl 3 dür.
Sınıflanmış Verler İçn Kartller Sınıflanmış verlerde kartller hesaplanırken lk olarak brkml frekans sütunu oluşturularak kartl sınıfları belrlenr. Kartl sınıfları belrlenrken gruplanmış verlerde olduğu gb (n+)/4 ve 3(n+)/4 ncü sıralardak elemanların hang sınıflara at seler o sınıflar kartl sınıfları olur. Kartl sınıfları belrlendkten sonra bu sınıflardan br öncek sınıfın brkml frekansı ve mevcut sınıf frekansı dkkate alınarak kartl değerler hesaplanır. 57
58 f f f L Medyan Q Q l Q. 2 2 2 2 f f f L Q Q l Q. 4 3 3 3 3 f f f L Q Q l Q. 4. Kartl 3. Kartl 2. Kartl
Örnek: Br sınıftak öğrenclern 7 boyları hakkında br araştırma yapılmaktadır. Bu amaçla 50 öğrencnn boyları ölçülerek kaydedlmştr.öğrenclern boylarının brnc ve üçüncü kartllern hesaplayınız. Sınıflar f f 50-57 den az 5 5 57-64 den az 7 2 Q sınıfı 64-7 den az 4 26 7-78 den az 9 35 Q 3 sınıfı 78-85 den az 8 43 85-92 den az 4 47 92-99 dan az 3 50 Toplam 50 f fl Q 4 LQ. f Q 2,5 2 64.7 64,58cm 6 59
Yayılma (Değşkenlk) Ölçüler Br ver setn tanımak yada k farklı ver setn brbrnden ayırt etmek çn her zaman yalnızca yer ölçüler yeterl olmayablr. Dağılımları brbrnden ayırt etmede kullanılan ve genellkle artmetk ortalama etrafındak değşm dkkate alarak hesaplanan statstklere yayılma (değşkenlk) ölçüler adı verlr. 60
Frekans Aşağıdak k grafk n = 500 hacmlk alınan k farklı örnek doğrultusunda oluşturulan hstogramlardır. Her k örnek ortalaması yaklaşık olarak 00 olduğuna göre k örneğn aynı anakütleden alındığı söyleneblr m? 400 200 300 200 000 800 600 00 400 200 0 67,33 8,33 95,33 09,33 23,33 0 67,33 8,33 95,33 09,33 23,33 X X 6
Dağılımları brbrnden ayırt etmede kullanılan yayılım ölçüler artmetk ortalama etrafındak değşmler dkkate alan tanımlayıcı statstklerdr. Br ver setnde artmetk ortalamalardan her br gözlemn farkı alınıp bu değerlern tümü toplandığında sonucun 0 olduğu görülür. 62
Örnek: 4,8,9,3,6 şeklnde verlen br bast ver çn; n x n x 4 8 9 3 6 0 n 5 x x 4 0 8 0 9 0 3 0 6 0 0 Bu örnekten görüleceğ üzere gözlemlern artmetk ortalamadan uzaklığı alıp toplandığında 0 elde edldğnden dolayı bu problem mutlaka değer kullanarak veya karesel uzaklık alınarak ortadan kaldırılır. 63
7) Range (Değşm Aralığı) Ver setndek yayılımı fade etmede kullanılan en bast ölçü, değşm aralığıdır. Genel olarak az sayıda ver çn kullanılır. En büyük gözlem değer le en küçük gözlem değer arasındak fark değşm aralığını verr. Ver setndek tek br gözlemn aşırı derecede küçük veya büyük olmasından etklendğ çn br başka fadeyle örnekte yer alan sadece k ver kullanılarak hesaplanmasından dolayı tüm ver setnn değşkenlğn açıklamak çn yetersz kalmaktadır. 64
Değşm Aralığı Örnek: Aralık, ver set çndek en büyük değerle en küçük değer arasındak uzaklığı ölçerek vernn yayılımını ortaya koyar. Örneğn aşağıdak şeklde gösterldğ üzere A hsse sened belrl br yılda 36$ la 32$ arasında çeştllk gösterrken, B hsse sened 0$ la 58$ arasında gösterd. Hsse senednn fyatındak aralık A çn 36$-32$ = 4$ dır; B çn 58$-0$=48$.Aralıkları kıyasladığımızda B hsse senednn fyat aralığının A ya göre daha çok değşkenlk gösterdğn söyleyeblrz. B hssesnn aralığı A hssesnn aralığı 0 20 30 32 36 40 50 58 60 Ücret ($) 65
Kartller Arası Fark Dğer değşkenlk 3. ve. kartller arasındak farka dkkat çeker. Çeyrek aralık olarak adlandırılan bu fark, Q 3 -Q, bze ver setnn yarısını çeren genşlğ verr. 66
8) Ortalama Mutlak Sapma(OMS) Ver setndek her br gözlem değernn artmetk ortalamadan farklarının mutlak değerlernn toplamının örnek hacmne bölünmesyle elde edlr. Gözlem değerlernn artmetk ortalamadan faklarının toplamı 0 olacağından bu problem ortadan kaldırmak çn mutlak değer n fades kullanılır. x x Bast verler çn: OMS n Gruplanmış verler çn: Sınıflanmış verler çn : OMS k k OMS f k f k x f m f x x 67
Örnek: İstatstk I dersn alan 0 öğrencnn vze notları aşağıdak gb sıralanmıştır. Buna göre vze notları çn ortalama mutlak sapma değern hesaplayınız. 30,4,53,6,68,79,82,88,90,98 x n 30 98 n x 4... 0 69 OMS n x x n 45 4,5 0 30 69 4 69 0... 98 69 68
Sınıflanmış Verler İçn Ortalama Mutlak Sapma Örneğ x Sınıflar f m If (m - x )I 50-57 den az 5 53,5 92,4 57-64 den az 7 60,5 80,36 64-7 den az 4 67,5 62,72 7-78 den az 9 74,5 22,68 78-85 den az 8 8,5 76,7 85-92 den az 4 88,5 66,08 92-99 dan az 3 95,5 70,56 Toplam 50 470,96 k k m f f 7,98 kg. OMS k f m x 470,96 k 50 f 9.42 69
Yayılma Ölçülernn Gerekllğ Örnek Örnek 2 Ölçümler,2,3,4,5 2,3,3,3,4 Ortalama 2 3 4 5 5 2 3 x 3 x dan Uzaklıklar -3, 2-3, 3-3, 4-3, 5-3 veya -2, -, 0,, 2 5 5 x 3 3 3 4 5 5 5 2-3, 3-3, 3-3, 3-3, 4-3 veya -, 0, 0, 0, İk ver set çn uzaklıklar a) Örnek b) Örnek 2 70
9) Varyans Ortalama mutlak sapmada kullanılan mutlak değerl fadeler le şlem yapmanın zor hatta bazı durumlarda mkansız olması sebebyle yen değşkenlk ölçüsüne htyaç bulunmaktadır. Mutlak değer fadesndek zorluk artmetk ortalamadan farkların karelernn alınmasıyla ortadan kalkmaktadır. Ver setndek her br gözlem değernn artmetk ortalamadan farklarının karelernn toplamının örnek hacmnn br eksğne bölünmesnden elde edlen yayılım ölçüsüne örnek varyansı adı verlr. 7
72 Bast verler İçn: Anakütle Varyansı: : Anakütle Ortalaması N : Anakütle Hacm Örnek Varyansı : Gruplanmış verler çn: Sınıflanmış verler çn : N x 2 2 2 2 n x x s n ) ( 2 2 k k f x m f s ) ( 2 2 k k f x x f s
73 n x x 2 fades statstkte br çok formülde kullanılır ve kareler toplamı olarak adlandırılır. Matematksel olarak hesaplama kolaylığı sağlaması açısından formüllerde kareler toplamının açılımı olan aşağıdak eştlk kullanılablr. n x x x x n n n 2 2 2
74 2 2 2 n n x x s n n 2 2 2 k k k k f f x f x f s 2 2 2 k k k k f f m f m f s Gruplanmış Verler İçn: Sınıflanmış Verler İçn : Bast Verler İçn:
Örnek: Br gömlek fabrkasının satış mağazasında br gün çnde satılan gömleklern bedenlerne göre satış adetler aşağıda verlmştr. Buna göre ver set çn varyans değerlern hesaplayınız. Gömlek beden Satış aded x.f x 2.f 0 5 0 0 2 2 2 2 35 70 40 3 4 42 26 4 8 32 28 5 6 30 50 toplam k 802 86 556 k fx 2 fx k 2 f 86 556 2 s 80,56 k 79 f
x k k Sınıflanmış Verler İçn Varyans Sınıflar f m f (m - x ) 2 50-57 den az 5 53,5 707,552 57-64 den az 7 60,5 922,5328 64-7 den az 4 67,5 280,9856 7-78 den az 9 74,5 57,536 78-85 den az 8 8,5 725,0432 85-92 den az 4 88,5 09,642 92-99 dan az 3 95,5 659,57 Toplam 50 6444,48 m f f 7,98 kg. s 2 Örneğ k 2 f( m x) 6444,48 k 3,52 50 f 76
0) Standart Sapma Varyans hesaplanırken kullanılan verlern kareler alındığından verlern ölçü brmnn kares varyansında ölçü brm mevcut ölçü brmn kares olur. Örnek: kg 2, cm 2 gb. Bu ntelendrme verler açısından br anlam taşımayacağından varyans yerne ortalama etrafındak değşmn br ölçüsü olarak onun poztf karekökü olan standart sapma kullanılır. 77
78 Bast Verler İçn: Populasyon Standart Sapması: : Populasyon Standart Sapması N : Populasyon Hacm Örnek Standart Sapması : Gruplanmış Verler İçn: Sınıflanmış Verler İçn : N x 2 2 n x x s n ) ( 2 k k f x m f s ) ( 2 k k f x x f s
Örnek: İstatstk I dersn alan 0 öğrencnn vze notları aşağıdak gb sıralanmıştır. Buna göre vze notları çn varyans ve standart sapmayı hesaplayınız. 30,4,53,6,68,79,82,88,90,98 x n 30 4... 98 0 n x 69 s s 2 2 n 2 2 2 x x 30 69 4 69... 98 69 n 4538 9 504,22 504,22 s s 2 9 504,22 22,45 2 İstatstk I vzesnden alınan notların ortalama etrafında yaklaşık olarak 22 puan değştğ görülmektedr. 79
Aynı soru kareler ortalamasının açılımı kullanılarak çözüldüğünde aynı sonuçları verecektr. 30,4,53,6,68,79,82,88,90,98 n x x x 2 30 900 4 68 53 2809 6 372 68 4624 79 624 82 6724 88 7744 90 800 690 n x 2 s s s 5248 2 2 n x 504,22 s 2 2 x 690 n n n 2 5248 504,22 9 0 22,45 2 80
CHEBYSHEV TEOREMİ Herhang br ver setnde, verlern ortalamanın K standart sapma uzağında bulunması oranı -/K 2 dır. Burada K, brden büyük poztf sayıdır. K=2 ve K=3 çn; Verlern en az 3/4 ü (%75) ortalamanın 2 standart sapma uzagında bulunur. Verlern en az 8/9 u (%89) ortalamanın 3 standart sapma uzağında bulunur. 8
Örnek: X değşken br sınıftak İstatstk I dersnn başarı notlarını göstermek üzere, örnek ortalamasının 60 varyansının 00 olduğu blndğne göre, verlern ¾ ü hag aralıkta değşr? k 2 2 4 x k 3 2s 60 2.0 40,80 82
Standart Sapmanın Yorumlanması - Chebyshev teoremnden, frekans dağılımının şeklne bakılmaksızın, ölçümlern herhang br örneğne uygulanan kural: a- Ölçümlerden hçbrnn x s yada ( x s, x s) aralığına düşmemes mümkündür. b- Ölçümlern en az ¾ ü ( x 2s, x 2s) aralığına düşer.- ortalamanın c- Ölçümlern en az 8/9 u ( x 3s, x 3s) aralığına düşer.- d- Genellkle, ölçümlern en az (-/k 2 ) ı ( x ks, x ks) aralığına düşer. (k>) 83
- Smekrk dağılışlarda standart sapmanın yorumu: a- Ölçümlern yaklaşık %68 x s yada ( x s, x s) aralığına düşer.- ortalamanın standart sapması çn b- Ölçümlern yaklaşık %95 ( x2s, x 2s) aralığına düşer.- ortalamanın 2 standart sapması çn c- Temelde, tüm ölçümler ( x3s, x 3s) aralığına düşer. -ortalamanın 3 standart sapması çn 84
Amprk Kural 85
Amprk Kural 86
Amprk Kural 87
Örnek ver set: 50 şrketn AR-GE çn harcanan gelrlernn yüzdeler burada tekrar verlmştr: 3.5 9.5 8.2 6.5 8.4 8. 6.9 7.5 0.5 3.5 7.2 7. 9.0 9.9 8.2 3.2 9.2 6.9 9.6 7.7 9.7 7.5 7.2 5.9 6.6. 8.8 5.2 0.6 8.2.3 5.6 0. 8.0 8.5.7 7. 7.7 9.4 6.0 8.0 7.4 0.5 7.8 7.9 6.5 6.9 6.5 6.8 9.5 88
Örnek: Aralıkları çnde kalan bu ölçümlern kesrn(fracton) hesaplayınız Çözüm: İlk aralık = (8.49.98, 8.49 +.98) = (6.5, 0.47) 50 ölçümün 34 ünün ve ya %68 nn ortalamanın standart sapması çersnde olduğunu ortaya koyar. Aralık, = (8.49 3.96, 8.49 + 3.96 ) = (4.53, 2.45) 50 ölçümün 47 sn ya da %94 ünü çerr. ortalama etrafında 3 standart sapma aralığı, = (8.49 5.94, 8.49 + 5.94 ) = (2.55, 4.43) tüm ölçümler çerr. 89
) z Skoru Verlen br gözlem değernn ortalamanın kaç standart sapma uzağında olduğunu ölçer. Örneklem Anakütle z = x - x s z = x - µ 2 ondalık basamağa yuvarlanır. 90
z- skorunun Yorumlanması Br ver ortalamadan küçük olursa z-skoru değer negatf olur. Olağan Verler : z skoru 2 ve 2 s.s arasında Olağandışı Verler: z skoru < -2 veya z skoru > 2 s.s 9
92
Örnek: 200 çelk şçsnn yıllık gelrler ncelenmş ve ortalaması = 24.000$ ve standart sapması s= 2.000$ olarak bulunmuştur. Yıllık gelr 22.000$ olan Joe Smth n z-skoru kaçtır? 8.000$ 22.000$ Joe Smth n gelr 24.000$ 30.000$ 93
x x z= s = 22 =-.0 bulunur. Burada k -.0 ın.000$ 24.000$ 2.000$ anlamı Joe Smth n yıllık gelr ortalamanın standart sapma altındadır. z-skorunun sayısal değer görel durumlar çn ölçümü yansıtmaktadır. Br x değer çn bulunan en büyük poztf z-skoru değer, bu x değernn dğer bütün ölçümlerden daha büyük olduğunu gösterr ve mutlak değerce en büyük negatf z-skoru değer de bu ölçümün dğer tüm ölçümlerden daha küçük olduğunu gösterr. Eğer z skoru 0 veya 0 a yakın se ölçüm ortalamaya eşt veya ortalamaya çok yakındır. 94
2) Değşkenlk(Varyasyon) Katsayısı İk veya daha fazla populasyon üzernde aynı şans değşkenler çn yapılan araştırmalarda değşkenlklern karşılaştırılması çn kullanılan br ölçüdür. Standart sapmayı ortalamanın br yüzdes olarak fade eden ve k veya daha fazla populasyondak varyasyonu (değşkenlğ) karşılaştırmada kullanılan ölçüye varyasyon(değşkenlk) katsayısı denr. C V Varyasyon Katsayısı: s X *00 Örnek: İstanbul da ve Ankara da yaşayan alelern aylık gelrlernn değşkenlklernn karşılaştırılması 95
Örnek: A,B ve C hsse senetlernn kapanış fyatlarına lşkn yapılan br araştırmada, hsse senetlernn kapanış fyatlarının ortalamaları ve standart sapmaları hesaplanmış ve aşağıdak tabloda verlmştr. Buna göre hsse senetlern kapanış fyatlarının değşkenlkler açısından karşılaştırınız ve hang hsse senednn fyatındak değşkenlk daha fazladır fade ednz. x s A 8 2 B 5 C 5 3 C C C V A V B V C sa 2 *00 *00 25 %25 X A 8 sb *00 *00 20 %20 X 5 B sc 3 *00 *00 20 %20 X 5 C Üç hsse senednn kapanış fyatlarının değşkenlkler karşılaştırıldığında en büyük standart sapma değer C hsse senednde olmasına rağmen en büyük varyasyon katsayısına sahp olduğundan en fazla değşkenlğn A hsse senednde olduğu görülür. 96
Tanımlamalar Smetrk Verler Eğer ver smetrk se vernn hstogramının sağ tarafı ve sol tarafı eşt büyüklüktedr Çarpık Verler Eğer ver çarpık se (smetrk değlse), vernn hstogramın br kısmı dğer kısmın büyüktür veya küçüktür. 97
Çarpıklık 98
Çarpıklık (Asmetr) Ölçüler Anakütleler brbrnden ayırmak çn her zaman yalnızca yer ve yayılım ölçüler yeterl olmayablr. Aşağıda k farklı anakütleden alınmış örnekler çn oluşturulan hstogramlar verlmştr. 99
3) Asmetr Ölçüler PEARSON ÇARPIKLIK ÖLÇÜSÜ x mod Sk p s 3( X med ) Sk p s veya Sk P < 0 Negatf çarpık(sola) Sk P > 0 Poztf Çarpık(Sağa) Sk P = 0 se dağılış smetrk Sk b BOWLEY ÇARPIKLIK ÖLÇÜSÜ ( Q 3 Q2 ) ( Q2 Q ) Q 3 Q Sk b < 0 Negatf çarpık(sola) Sk b > 0 Poztf Çarpık(Sağa) Sk b = 0 se dağılış smetrk 00
Örnek: Aşağıdak tabloda 30 günlük süre çnde br restoranın kullandığı et mktarının dağılımından elde edlen bazı tanımlayıcı statstkler verlmştr. Buna göre pearson ve bowley asmetr ölçülern hesaplayıp yorumlayınız. A r t m e t k O r t. Mod Medyan Q Q 2 s 2 Sk p 46,6 45,4 46,2 4,5 5,9 54,46 3( X med ) s 3(46,6 46,2) 54,46 0,6 0 Sağa Çarpık, Poztf Asmetr Sk p x mod s 46,6 45,4 54,46 0,6 0 Sağa Çarpık, Poztf Asmetr Sk b ( Q 3 Q2 ) ( Q Q Q 3 2 Q ) (5,9 46,2) (46,2 4,5) 5,9 4,5 0,4 0,0 0 Sağa Çarpık, Poztf Asmetr 0
Smetrk Dağılım A.O = Med = Mod Sağa çarpık dağılım A.O > Med > Mod Sola çarpık dağılım A.O < Med < Mod İk modlu smetrk dağılım Modu olmayan dağılım Tekdüzen dağılım 02
4) Sapan Gözlemler Sapan gözlem, dğer bütün gözlemlerden uzakta bulunan gözlemdr. Sapan gözlem ortalama üzernde öneml br etkye sahp olablr. Sapan gözlem standart sapma üzernde öneml br etkye sahp olablr. Sapan gözlem dağılımın gerçek hstogramının ölçeğ üzernde öneml br etkye sahp olablr. 03
5) 5 Sayı Özet 5 sayı özet, br ver setnde mnmum değer,.kartl, 2.Kartl(medyan), 3.Kartl ve maksmum değer çerr. Kutu grafğ(veya kutu ve bıyık grafğ) br ver set çn, sınırları maksmum ve mnmum değer olmak üzere, çnde.kartl, 2.Kartl(medyan) ve 3.Kartl bulunduran kutu şeklndek grafktr. 04
Kutu Grafğ 05
Kutu grafğ hazırlama Q:Kutunun sol kenarı Q3:Kutunu sağ kenarı Q2:Kutunun ortasındak çzg Sapan harç mn.: Sol bıyık Sapan harç max.: Sağ bıyık Sapan değer kontrolu Q.5(Q3 Q) Q3 +.5(Q3 Q) bu değerler aşan verler * le gösterlr. 06
Örnek: Yazlık ürünler satan br mağazada haftalık satılan t-shrt sayıları yandak tabloda verlmştr. Verlen tablodan beş sayı özetn bulunuz ve kutu grafğn çznz. 27 22 20 7 8 8 22 2 29 20 32 7 30 9 28 25 20 3 22 23 2 28 22 24 8 8 32 25 8 44 7
Çözüm: Öncelkle verler yandak gb sıralanırsa; Q =(3+)/4=8.sıraya karşılık gelen ver olur. Q=8 Q 3 =3(3+)/4=24. sıraya karşılık gelen ver olur. Q 3 =28 Mnmum değer=7, Maksmum değer=44 ve Medyan(Q 2 )=22 olur. Sapan değerler kontrol etmek çn; Q -,5(Q 3 -Q )=8-,5(28-8)=3 Q 3 +,5(Q 3 -Q )=28+,5(28-8)=43 bulunur. Bu durumda elmzdek 44 değer sapan değerdr ve * le gösterlr.. 7 20 25 7 20 25 7 2 27 8 2 28 8 22 28 8 22 29 8 22 30 8 22 3 9 23 32 20 24 32 44
45 * 44 sapan değer 40 35 30 25 Medyan(Q 2 )=22 20
Kutu Grafğ Fgure 2-6 0
Kutu Grafğ Fgure 2-7
6) Basıklık Ölçüsü Aşağıdak A ve B dağılımlarının ortalamaları, değşkenlk ölçülernn aynı olmasından dolayı ve hatta ksnn de smetrk olmalarından dolayı bu k dağılışı ayırt etmek çn Basıklık Ölçüsü kullanılır. A B A = B 2
Herhang br olasılık fonksyonunun şekl le lgl parametrelerden br tanes de basıklık ölçüsüdür. Basıklık Ölçüsü ortalamaya göre dördüncü momentten gdlerek hesaplanır ve 4 olarak gösterlr. 4 4 4 Bast Ser İçn 4 n x n 4 4 = 3 se Ser Normal 4 < 3 se Ser Basık 4 < 3 se Ser Svr Ya da Yüksek 3