İle gösterilir. Kitle büyüklüğü içim N örneklem büyüklüğü için n kullanılmıştır.

Benzer belgeler
Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

TANIMLAYICI İSTATİSTİKLER

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

VERİ KÜMELERİNİ BETİMLEME

Ders 8: Verilerin Düzenlenmesi ve Analizi

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Mühendislikte İstatistik Yöntemler

İÇİNDEKİLER ÖN SÖZ...

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

BİYOİSTATİSTİK Merkezi Eğilim ve Değişim Ölçüleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Verilerin Özetlenmesinde Kullanılan Sayısal Yöntemler

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

Copyright 2004 Pearson Education, Inc. Slide 1

Örnek...4 : İlk iki sınavında 75 ve 82 alan bir öğrencinin bu dersin ortalamasını 5 yapabilmek için son sınavdan kaç alması gerekmektedir?

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

Merkezi Yığılma ve Dağılım Ölçüleri

Prof.Dr.İhsan HALİFEOĞLU

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

Merkezi Eğilim ve Dağılım Ölçüleri

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

VERİ SETİNE GENEL BAKIŞ

SÜREKLİ OLASILIK DAĞILIŞLARI

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Merkezi Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

İSTATİSTİK MHN3120 Malzeme Mühendisliği

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

Bölüm 3 Merkezi Konum (Eğilim) Ölçüleri. Giriş Veri kümesi. Ortalamalar iki grupta incelenir. A. Duyarlı olan ortalama. B. Duyarlı olmayan ortalama

Merkezi eğilim ölçüleri ile bir frekans dağılımının merkezi belirlenirken; yayılma ölçüleri ile değişkenliği veya yayılma düzeyini tespit eder.

Test İstatistikleri AHMET SALİH ŞİMŞEK

Bölüm 2. Verinin görsel betimlemesi. İstatistik Ders Notları 2018

BÖLÜM 9 NORMAL DAĞILIM

ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. Ders 2 Merkezi Eğilim Ölçüleri

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ


Merkezi Limit Teoremi

Bölüm 3. Tanımlayıcı İstatistikler

Prof.Dr.İhsan HALİFEOĞLU

7. HAFTA. Verilerin düzenlenmesi Verilerin gruplandırılması Merkezi eğilim ölçüleri Merkezi dağılım ölçüleri Standart puanlar. Yrd. Doç. Dr.

Veri Analizi. Isınma Hareketleri. Test İstatistikleri. b) En çok tekrar eden: 7 (mod) c) Açıklık = En büyük En küçük = 10 1 = 9. d)

IİSTATIİSTIİK. Mustafa Sezer PEHLI VAN

TEMEL İSTATİSTİK BİLGİSİ. İstatistiksel verileri tasnif etme Verilerin grafiklerle ifade edilmesi Vasat ölçüleri Standart puanlar

Ölçme Sonuçları Üzerinde İstatistiksel İşlemler

ALKÜ EKONOMİ ve FİNANS BÖLÜMÜ ISL 207 İSTATİSTİK I ALIŞTIRMALAR

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

7. HAFTA. Verilerin düzenlenmesi Verilerin gruplandırılması Merkezi eğilim ölçüleri Merkezi dağılım ölçüleri Standart puanlar. Yrd. Doç. Dr.

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

BÖLÜM 1 GİRİŞ: İSTATİSTİĞİN MÜHENDİSLİKTEKİ ÖNEMİ

BİYOİSTATİSTİK. Ödev Çözümleri. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

5. SUNUM. Verilerin düzenlenmesi Verilerin gruplandırılması Merkezi eğilim ölçüleri Merkezi dağılım ölçüleri Standart puanlar. Yrd. Doç. Dr.

EĞĠTĠMDE ÖLÇME VE DEĞERLENDĠRME BÖLÜM IV Ölçme Sonuçları Üzerinde Ġstatistiksel ĠĢlemler VERİLERİN DÜZENLENMESİ VERİLERİN DÜZENLENMESİ

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ DÖNEM SONU SINAV SORULARI

Tesadüfi Değişken. w ( )

İstatistik ve Olasılığa Giriş. İstatistik ve Olasılığa Giriş. Ders 3 Verileri Sayısal Ölçütlerle İfade Etme. Verileri Sayısal Ölçütlerle İfade Etme

GRAFİK YORUMLAMA. 1 ) Sütun Grafiği : Belirli bir zaman aralığında bazı veri grup-

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

Veri nedir? Bir öğrenci kümesine uygulanan bir sınavdan elde edilen puanların herhangi bir işlem yapılmamış haline ham veri denir (ham puanlar) denir.

17/01/2015. PowerPoint Template. Dr. S.Nihat ŞAD LOGO. İnönü University. Company Logo

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( )

SÜREKLĠ OLASILIK DAĞILIMLARI

İstatistik Dersi Çalışma Soruları Arasınav(Matematik Müh. Bölümü-2014)

BÖLÜM 12 STUDENT T DAĞILIMI

Sürekli Rastsal Değişkenler

KONU2 MERKEZİ EĞİLİM ÖLÇÜLERİ EĞİLİM ÖLÇÜLERİ ANALİTİK ORTALAMALAR ANALİTİK OLMAYAN MERKEZİ. Aritmetik ortalama **Medyan(median)

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

ÖĞRENCİNİN ADI SOYADI:. NO:

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ TELAFĐ SINAVI SORULARI

SÜREKLİ RASSAL DEĞİŞKENLER

Dr. Mehmet AKSARAYLI

İstatistik ve Olasılık

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5

Gruplanmış serilerde standart sapma hesabı

13. Olasılık Dağılımlar

GİRİŞ. Bilimsel Araştırma: Bilimsel bilgi elde etme süreci olarak tanımlanabilir.

MAK 210 SAYISAL ANALİZ

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

ÖLÇME VE DEĞERLENDİRME. Antrenörlük Eğitimi 4. Sınıf. Ölçme ve Değerlendirme - Yrd. Doç. Dr. Yetkin Utku KAMUK

BİYOİSTATİSTİK. Genel Uygulama 1. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ BÜTÜNLEME SINAVI SORULARI

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

İSTATİSTİK ÖRNEK SORULARI

Uygulama 3 Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

İstatistiksel Yorumlama

İstatistik Nedir? İstatistiğin Önemi Nedir? Tanımlayıcı ve Çıkarımcı İstatistik ttitik Tanımlayıcı İstatistik Türleri Çıkarımcı İstatistiğin i iği

BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Projenin Adı: İstatistik yardımıyla YGS ye hazırlık için soru çözme planlaması

Korelasyon, Korelasyon Türleri ve Regresyon

Temel Ġstatistik. Tanımlayıcı Ġstatistik. Dağılımları Tanımlayıcı Ölçüler Yer Ölçüleri. Y.Doç.Dr. Ġbrahim Turan Mart 2011

ALIŞTIRMALAR. Sayısal Bilginin Özetlenmesi:

3)Aşağıdaki tabloda gruplandırılmış bir veri kümesi bulunmaktadır. Bu veri kümesinin mutlak ortalamadan sapması aşağıdakilerden hangisidir?

Korelasyon. Korelasyon. Merkezi eğilim ve değişim ölçüleri bir defada sadece bir değişkenin özelliklerini incelememize imkan tanır.

CEVAPLAR. n = n 1 + n 2 + n 3 + n 4 + n 5 + n 6 + n 7 = = 11 dir.

Rastgele Değişkenlerin Dağılımları. Mühendislikte İstatistik Yöntemler

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

BÖLÜM 3 KURAMSAL ÇATI VE HİPOTEZ GELİŞ

Transkript:

Bölüm 3 Verinin sayısal olarak betimlenmesi İkinci bölümde verinin çizelge ve çizimle betimlenmesi incelenmişti. Bu bölümde verinin sayısal olarak betimlenmesi için kullanılan yöntemler incelenecektir. 3.1 Merkezi eğilim ve konum ölçüleri Verinin hangi değer etrafında toplandığını gösteren ölçülere merkezi eğilim ölçüleri denir. Veri kümesinin merkezi konumuna ilişkin en çok kullanılan sayısal ölçüler aritmetik ortalama, ortanca ve en-sık değerdir. Bunlara ek olarak iktisat uygulamalarında çokça karşılaşılan geometrik ortalama da tanıtılacaktır. Aritmetik Ortalama Bir veri kümesinin aritmetik ortalaması (kısa ortalama) veri değerleri toplamının veri sayısına oranıdır. Eşit aralıklı ve oran ölçme düzeyinde ölçülen nicel değişkenler için kullanılır. Aritmetik ortalama hem kitle hem de örneklem için hesaplanabilir. Bir kitlenin aritmetik ortalaması, Bir örneklemin aritmetik ortalaması N i 1 x N n x i i 1 n x i İle gösterilir. Kitle büyüklüğü içim N örneklem büyüklüğü için n kullanılmıştır. Ortanca (Medyan) Ortanca, azalan ya da artan büyüklük sırasına göre dizilmiş verinin ortadaki değeridir. Veri sayısı tek ise tam ortadaki çift ise ortaya gelen iki değerin aritmetik ortalaması alınarak hesaplanır. Kitledeki öğelerin sayısı çok fazla olduğunda veride ve aşırı büyük uç değerlerin olduğu veride merkezi eğilim ölçüsü olarak ortanca kullanılabilir. Nicel ve nitel değişkenler için kullanılabilir. Örneğin 14 adet nicel verinin biçimi 11, 1, 13, 14, 14, 15, 17, 18, 18, 18, 19, 19, 0, olsun. Ortanca ortaya gelen 7 ve sekizinci verinin ortalaması (17+18)/=17.5 tir. Nitel veride merkezi eğilim ölçüşü daha çok ortanca ile elde edilir. Örneğin en düşükten en yükseğe doğru 1ile 5 arasında tamsayı kod değeri alan eğitim düzeyi değişkeni için elde edilen veri 1,, 3, 3, 4, 4, 4, 5, 3,, 3, 1, 4, 3, 3, 5,3 olsun. Sıraya dizildiğinde 1, 1,

,, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4,5, 5 ortadaki 9. değer 3 tür. Oysa bu veriden elde edile aritmetik ortalama 3.11 i yorumlamak kolay değildir. En-sık değer (Tepe Değeri ya da Mod) Bir veri grubunda en çok tekrarlanan değere tepe değeri(mod) denir. Bir grup öğrencinin ağırlıklarına ilişkin veriler sırasıyla şöyledir: 55, 57, 57, 58, 65, 65, 65, 68, 81, 8, 8. En çok tekrarlanan değer 65 olduğundan tepe değer 65 tir. Denek sayısı çok olduğunda kullanılabilir. Nitel veri ortalamayla değil daha çok ortanca ve en-sık değer ile betimlenir. Örneğin en çok satılan ayakkabı ve gömlek numarası en-sık değerdir. Bu değer satıcı ya da üretici şirketlerin üretin ve stok düzeylerinin belirlenmesinde etkin olarak kullanılabilir. Avrupa da erkek gömleklerinin en-sık kullanılan büyüklüğünün 41, Türkiye de en-sık kullanılan ayakkabı büyüklüğünün 4 olduğu söyleniyorsa bu değerler kitleyi temsil eden en kullanışlı merkezi eğilim ölçüsüdür. Yani Gömlekler 41, ayakkabılar 4 etrafında dağılmaktadır. Değişkenin biçimi Bakışımlı(Simetrik) bir dağılımda aritmetik ortalama, tepe değeri ve ortanca birbirine çok yakın aynı değerdir. Simetri bozuldukça değerler ayrışır. Aşağıda simetrik sağa ve sola çarpık dağılımlarda aritmetik ortalama(or), en sık değer(tepe değeri-td) ve ortanca (OR) konumları görülmektedir. Sola çarpık dağılımda aritmetik ortalama en solda ortanca en sağda olmasına karşın sağa çarpık dağılımda tam tersidir. Bir dağılımın biçimi çarpıklık ölçüsü ile de betimlenebilir. Sağa çarpıklıkta çarpıklık ölçüsü artı, sola çarpıklıkta eksi, simetrik dağılımda sıfır çıkar. Burada s örneklem standart sapmasıdır. ( xi x) 1 i1 Çarpıklık= 3 n s n 3 Geometrik ortalama İktisat ve işletmede önemli merkezi eğilim ölçülerinden bir ortalamadır. Geometrik ortalama, n tane sayının n inci köküdür. de geometrik

Bir sayının birden çok zaman dönemi içindeki büyümesi ile ilgilenen iktisatçılar geometrik ortalama kullanır. Yıllar boyunca bileşik faiz oranı, toplam satışın artışı, nüfus artışlarının ortalaması geometrik ortalama ile hesaplanır. Örneğin satışlar 5 yılda %5 artmışsa yıllık büyüme hızı nedir?sezgisel olarak yıllık %5 gibi görünebilir. Ancak bu sonuç yanlıştır. Eğer yılda %5 büyürse (1.05) (1.05) (1.05) (1.05) (1.05)=1.763 ya da %7,63 büyüme olur. Doğru çözüm (1+r) 5 =1.5 eşitliğini sağlayan r yi bulmaktır. Bu da x 1. 046 dır. Yüzebölenler ve dördebölenler g Yüzebölenler ve dördebölenler bir verinin bütün veri kümesine göre yerini konumunu ölçer. Diyelim ki ÖSYM sınavında 9 inci yüzebölende yer aldınız. Bu demektir ki sınava girenlerin yaklaşık %9 si sizden düşük, yaklaşık %8 i sizden daha büyük puan almıştır. Yüzeböleni bulabilmek için veri küçükten büyüğe doğru sıraya konur. P inci yüzebölen, gözlemlerin yaklaşık %P kadarının altında kalan gözlemdir. Yüzebölenler, sıraya konmuş veri kümesini %1 lik parçalara ayırır. 50. yüzebölen ortancadır. N tane gözlen içeren veri kümesinde P inci yüzebölen değeri şöyle bulunur: P inci yüzebölen=(p/100)(n+1) Örneğin rastgele alınmış 104 müşterinin süper marketteki alışveriş süreleri küçükten büyüğe sıralanmıştır. 5. yüzebölen değeri =0.5(104+1)=6,5. sırada bulunan değerdir. 6. değer 8 dakika, 7. değer 30 dakikadır. Bu durumda 5 ini yüzebölen değeri=6+(0.5)(30-8)= 8.5 dir. Benzer biçimde 85 inci yüzebölen değeri=89.5 inci sırada bulunan değerdir. 89. değer 64, 90. değer 67 ise 85 inci yüzebölen değeri=64.75 dakika bulunur. Dördebölenler, sıralı büyük veri kümelerini dörtte birlik parçalara ayıran değerlerdir. D 1 alt dörde bölen(5. inci yüzebölen), D ikinci dörde bölen (50 inci yüzebölen), üçüncü dördebölen ya da üst dörde bölen (75 inci yüzebölen) verinin en küçük yaklaşık %75 ini, en büyük %5 ini ayırır. D 1=0.5(n+1) inci sırada bulunan değer D =0.50(n+1) inci sırada bulunan değer D 3=0.75(n+1) inci sırada bulunan değer Sayısal veriyi betimlerken sıklıkla beşli-özete başvururuz. Bunlar sırasıyla: en küçük değer < D 1 < ortanca < D 3 < en büyük değer Örnek: Florida da bir kasırga mevsiminde bir dükkanda satılan su damacana sayısı şöyledir: D1=0.5(1+1)=3.5 inci sırada bulunan değer. Üçüncü sıradaki değer 65 dördüncü sıradaki değer 67 olduğuna göre D 1=65+0.5(67-65)=65.5 damacana. Benzer olarak D3=81.5 bulunur. Ortanca yani D=73.5 dur. Bu verinin beşli özeti şöyledir: 60 < 65.5 <73.5 < 81.5 < 85

3. Değişkenlik ölçüleri Dağılım ölçüleri bir değişkenin aldığı değerlerin birbirinden ne kadar farklı olduğu gösterir. Yayılım aralığı (Değişim genişliği) Bir veri grubunda en büyük değer ile en küçük değer arasındaki farka yayılım genişliği denir, R ile gösterilir. Yayılım genişliği, verinin hangi aralıkta yayıldığını gösteren bir değişkenlik ölçüsüdür. Yayılım genişliğinin hesaplanmasında sadece iki uç değer işleme alındığından, diğer değerlerin hiçbir etkisi yoktur. Bu nedenle yayılım genişliği çok fazla kullanılan bir dağılım ölçüsü değildir. Örneğin 9, 11, 15, 3, 41, 56, 0, 58, 5, 60, 3, 77 gözlem değerlerinin oluşan bir dağılımın yayılım genişliği 77-11=66 dır. Veri bu aralıkta yayılmakta ya da değişkenlik göstermektedir. Dördebölenler aralığı (DA) Verinin ortadaki %50 bölümünün yayılımını ölçer: DA =D 3-D 1 Örneğin 104 müşterinin süper markette geçirdikleri alışveriş zamanları sıralandığında, ortada bulunan %50 bölümünün yayılımı DA=56.5-38.5=8 dakika dır. Kutu-çizimi Tukey in başka bir keşfedici çizimi de kutu-çizimidir Dal-yaprak çizimi gibi dağılımın biçimine ilişkin bilgi sunar. Kutu-çizimi ayrıca verinin yayılımını da gösterir. Kutu çizimi bir dağılımın biçimini beşli-özet ile betimler. Kutunun uzunluğu alt dördebölenden üst dördebölene kadar olan yayılımı gösterir. Ortanca noktasında bir çizgi kutuyu ikiye böler. İki kedi-bıyığı vardır. Biri 5 inci yüzebölenden( alt dördebölenden) en küçüğe, diğeri 75 inci yüzebölenden (üst dördebölenden) en büyüğe doğru uzanır. Örnek: Bir ünlü pizza şirketinin dört şubesindeki 10 günlük toplam satışlarının(100$) kutu çizimi aşağıda verilmiştir.

Çizimlerden Şube 1, Şube ve şube 4 ün ortancalarının aynı olduğu, ancak şube nin yayılımının Şube 1 e göre daha geniş olduğu, şube 3 ün en yüksek satışı yaptığı ama en geniş yayılımın da yine bu şubede olduğu söylenebilir. Şube 3 satış dağılımının sola çarpık olduğu yani düşük satışların daha fazla olduğunu gösterir, şube 4 satış dağılımının sağa çarpık olduğu, yüksek satışlı günlerin daha fazla olduğunu gösterir. Varyans Varyans, gözlemlerin ortalama etrafında ne kadar değişkenlik gösterdiğini, gözlemlerin ortalama ile olan farkların karelerini alarak ölçer. Örnek:, 3, 4, 5, 6, 7, 8 gözlemlerinin 5 olan ortalamalarından farkları (-5), (3-5), (4-5), (5-5), (6-5), (7-5), (8-5), (9-5) dır. Ortalamadan ayrılışlar/farklar negatif olabileceğinden, ölçünün pozitif kalmasını sağlamak ve aynı zamanda pozitif değerlerle negatif değerlerin birbirlerini götürmelerini engellemek için farkların kareleri alınır. Kareleri alınmış bu farklar toplanır ve gözlem sayısına bölünür. Kitle için, gözlemlerin kitle ortalamasından farklarının kareleri toplanır ve kitle büyüklüğüne (N) e bölünür. Kitle varyansı σ ile gösterilir. Örneklemlerde ise gözlemlerin örneklem ortalamasından farklarının kareleri toplanır gözlem sayısının bir eksiğine bölünür. Örneklem varyansı s ile gösterilir: N i1 ( x i N ) s n i1 ( x i x) n 1 Örneklem varyansı s aşağıdaki formüller kullanılarak daha kolay hesaplanabilir: Gözlemlerin ortalamadan farkları değişimlerdir. Varyans ne kadar büyükse gözlemelerin ortalama etrafındaki değişimi ve dolayısıyla yayılması o kadar fazladır denir. Varyans, dağılımın değişim ölçüsünü gözlemlerin ortalamadan farklarının karelerinin ortalaması olarak vermekle birlikte ortalama ile olan bağlantısı kuvvetli değildir. Kendi başına dağılım hakkında değişim bilgisi veremez. Başka bir dağılımla kıyaslandığında anlamlıdır. Varyansı küçük olan dağılımda değişim daha az olduğundan diğerine göre daha derli toplu, gözlemlerin ortalama etrafında birikme durumu daha fazladır. Aksi durumda ortalamadan uzak gözlemler daha fazla olup dağılımdaki yayılma daha fazladır. Ayrıca gözlemlerin ölçüm birimi ile de bağlantısı yoktur. Örneğin gözlemler ağırlıları kg birimi ile gösterdiğinde varyans bu birimle de ifade edilemez. Örnek: Bir kitlede gözlem kümesi 7,8,9,10,11,1,13 olsun. Gözlemler ortalama etrafında bir dağılım, saçılım gösterir. Bu dağılımda aritmetik ortalama=10 dur.

(7 10) (8 10) (9 10) (10 10) (11 10) (1 10) (13 10) / 7 Varyans =8/7= dir. Diğer bir dağılım 4,6,8,10,1,14,16 olsun. Bu dağılımda da aritmetik ortalama 10 dur. Varyans ise 11/7= 16 dır. Bu durumda birinci dağılımda değişim daha azdır, gözlemler ortalamaya daha yakındır. Kitle varyans formülünde simgesi, N tane gözlemin kitle ortalamasından farklarının kareleri toplamını ifade etmektedir. Benzer biçimde örneklem varyansı formülde simgesi örneklemdeki n tane gözlemin örneklem ortalamasından farklarının kareleri toplamını gösterir. Standart sapma Ortalamadan ayrılış ölçüsü olarak varyanstan daha kullanışlı olabilecek standart bir ölçüm aracına ihtiyaç vardır. Bu araç varyansın kare kökü olan standart sapmadır. Çünkü varyansın kare kökü, gözlemlerin ortalamadan farklarının karesel ortalamasıdır. Kendisi bir ortalama olduğu için, standart sapmanın birimi, gözlemleri ölçmek için kullanılan birimle aynıdır. Ağırlık ölçüsü kg ise standart sapma da kg olarak ifade edilir. Standart sapma gözlemlerin ortalamaya ne kadar uzak olduğunu gösteren ortalama bir ölçüdür. Kitle ve örnek standart sapmaları, kitle ve örneklem varyanslarının karekökleridir: s s Örnek: Bir şirket 10 yeni mezunu aşağıdaki yıllık ücretle(bin TL) işe başlatmıştır. Sapmalar, sapmaların kareleri ve karelerin toplamı aşağıdaki tabloda verilmiştir. 10 çalışanın yıllık ücretlerinin toplamı 415 ortalaması ise 41.5 tir. Buna göre standart sapma ve varyans hesaplanmıştır. Maaşlar ortalaması 41.5 Bin TL standart sapması 3 Bin TL dir. Maaşlar 41.5 Bin TL den ortalama olarak 3 Bin TL farklılık göstermektedir.

Örnek : Şube 1 deki pizza satışlarının varyans ve standart sapması aşağıdaki gibi hesaplanabilir: Satışlar(100$), xi Ortalamadan sapma ( x i x) ( x i x) veya kolay formüler kullanılarak hesaplanabilir: Değişkenlik katsayısı Ortalama getiri oranları aynı olan iki yatırım aracında getirilerin varyansı ya da standart sapması büyük olan daha risklidir çünkü değişkenliği daha fazladır. Getirilerin ortalamaları ve standart sapmaları farklı iki yatırım aracından hangisin daha riskli olduğu anlayabilmek için, standart sapmalarını değiş değişim katsayılarını karşılaştırmak gerekir. Değişkenlik katsayısı(dk), standart sapmayı, ortalama artı olmak koşuluyla, ortalamanın oranı olarak gösteren göreli bir yayılım ölçüsüdür. Kitle ve örneklem değişkenlik katsayıları aşağıdaki eşitliklerden hesaplanır. s DK %100 DK % 100 x

Örnek: A pay senedinin kapanış fiyatı 4$ standart sapması $, B pay senedinin kapanış fiyatı 60$ standart sapması 6$ dır. Hangi pay senedi daha risklidir. İlk bakışta standart sapması büyük olan B pay senedi daha riskli görünmektedir. Ancak değişkenlik katsayıları DK A=$/4$ x %100=%50 DK B=6$/60$ x %100=%10 hesabı A pay senedinin daha fazla değişkenliğe sahip olduğunu göstermektedir. Çebişev teoremi ve görgül kural Rus matematikçisi Çebişev (181-1894), dağılım biçimi ne olursa olsun her veri kümesindeki aralıkları saptamıştır. Şöyle ki : Ortalaması μ standart sapması σ olan herhangi bir kitlede k>1 iken [μ ± kσ ] aralığında kalan verilerin yüzdesi en az %100 [1 - (1/k ) ] kadardır. Burada k standart sapmaların sayısıdır. Örnek: Bir sınavda not ortalaması 7 standart sapması 4 olsun. Notların %75 i hangi aralıktadır? %100 [1 - (1/k ) ]=0.75 ise 100-100/k =75 75k -100k +100= 0 k= bulunur. Notların %75 i [7 ± *4 ]= [7 ± 8 ]= [64,7] aralığındadır. Ortalama ve standart sapma ne olursa olsun çeşitli k değerleri için [μ ± kσ ] aralığında kalan verilerin yüzdeleri aşağıda verilmiştir: Seçilen k değerleri 1.5.5 3 En az %100[1-(1/k )] %55.56 %75 %84 %88.89 Çebişev teoremi her kitleye uygulanabilmektedir. Bir çok dağılımda belli bir aralıkta verilen değerlerin yüzdesi, teoremin güvence verdiği en az sınırında hayli yüksektir. Örneğin k= için %75 olmasına rağmen, çan eğrisi biçimindeki bakışımlı bir dağılımda verinin %95 i bu aralıkta bulunur. Görgül kural Tümsekli çan eğrisi biçimindeki kitlede, gözlemlerin yaklaşık %68 si μ±1σ aralığındadır; gözlemlerin yaklaşık %95 i μ±σ aralığındadır; gözlemlerin neredeyse hepsi μ±3σ aralığındadır. z-değeri Bir verinin konumunu yüzebölenlerle dörde bölenlerle belirlemek mümkündür. Bir verinin konumu dağılımın ortalamasına göre de belirlenebilir. Bir z-değeri, bir değerin ortalamadan kaç standart sapma uzakta olduğunu gösteren standartlaştırılmış bir ölçüdür. Sıfırdan büyük bir z-değeri, verinin ortalamanın üstünde, negatif bir z-değeri verinin ortalamanın altında olduğunu gösterir. Eğer veri kümesi ortalaması μ, standart sapması σ olan bir kitle ise ve bunlar biliniyorsa, kitledeki bir x i değerinin z-değeri söyle tanımlanır: z x i

Örnek: Bir şirkette üretilen ampullerin ortalama ömrü 100 saat, standart sapması 110 100 50 saattir. Sadece 110 saat dayanan bir ampulün z-değeri z 1. 6 ve 50 1300 100 1300 saat dayanan bir ampulün z değeri z dir. 50 Tartılı ortalama ve öbekli veri ölçüleri Bazı durumlarda tartılı (ağırlıklı) ortalama denen özel bir ortalama türünü hesaplamak gerekir. Akademik ortalama, ortalama pay senedi önerileri ve öbeklenmiş verinin yaklaşık ortalaması birer tartılı ortalamadır. Bir veri kümesinin tartılı ortalaması şudur: Burada w i, i. inci gözlemin tartısı ve x w x n n w dir. Örnek: Akademik ortalama hesabında alınan notların değerleri dersin kredisi ile tartılır. Derslerden alına notlar ve derslerin kredileri aşağıdaki tabloda verilmiştir. i i i Not Kredi Not Değeri Kredi*Not Değeri Tartılı ortalama=34/15=.67 Öbekli verilerde yaklaşık ortalama ve varyans K tane öbekteki verilerin sıklıkları f 1, f,..., f K, öbek orta noktaları m 1, m,..., m K olsun. Bu durumda ortalama ve varyansın yaklaşık değerleri şöyle bulunur: Burada n= f 1 + f +...+ f K dir. Örnek: 50 haneden alınan çocuk sayıları aşağıdaki gibi öbeklenmiştir.

3.3 Değişkenler arası ilişki ölçüleri Önceki 1.1 kesiminde iki değişken arasındaki ilişkileri görsel olarak betimlemek için serpilme çizimi tanıtılmıştı. Bu bölümde ise iki değişken arasındaki ilişkileri sayısal olarak betimlemek için ortak varyans ve ilişki katsayısı tanıtılacaktır. Ortak-varyans Ortak-varyans(Orv) iki değişken arasındaki doğrusal ilişkinin bir ölçüsüdür. Artı değerli olması aynı yönde doğrusal ilişki, eksi değerli olması ters yönlü doğrusal ilişki anlamına gelir. Kitle ortak-varyansı: Burada xi ve yi gözlenen değerler, μx ve μy kitle ortalamaları, N, kitle büyüklüğüdür. Örneklem ortak varyansı:, Burada x i ve y i gözlenen değerler, x ve y örneklem ortalamaları, n, örneklem büyüklüğüdür. Ortak-varyansın değeri, kullanılan ölçme aracının birimine göre değişir. Yani ölçüm ölçeğine bağlıdır. Ortak-varyans ilişkinin gücünü göstermez.

İlişki katsayısı İki değişken arasındaki ilişkinin gücünü göstermesi için, ortak-varyans standartlaştırılarak ilişki katsayısı (ya da Pearson ın r katsayısı) elde edilir. Kitle ilişki katsayısı, ρ: Örneklem ilişki katsayısı:, r : Aşağıdaki eşitsizlik sağlanırsa ilişki vardır denebilir: İlişki katsayısının -1 ile +1 arasındadır. r, +1 e yaklaştıkça, veri noktaları sağa doğru yükselen bir doğruya yaklaşır, bu da arı ilişki anlamına gelir. r, -1 e yaklaştıkça veri noktaları sola doğru yükselen bir doğruya yaklaşır, bu da eksi ilişki anlamına gelir. r=0 iken x ile y arasında doğrusal bir ilişki yoktur ama bu ilişki yoktur anlamına gelmez, doğrusal olmayan bir ilişki olabilir. Aşağıdaki serpilme-çizimleri bunlara karşılık gelen ilişki katsayıları göstermektedir.

Aşağıdaki zaman seri çizimi bir perakende şirketin üçer aylık satışlarını göstermektedir. Zaman değişkeni ile üçer aylık satışlar arasında bir ilişki katsayısı sıfırdır. Ama çok belli bir mevsimsel ilişki görülmektedir, ilişki doğrusal değildir. Örnek: Bir kültür dergisi sosyal medya (Facebook) aracılığıyla okuyucularına dergiyle ilgili güncellemeler göndermektedir. Güncellemelerin İzleyicilerle olan etkileşimi etkileyip etkilemediği merak edilmektedir. Etkilemiyorsa güncelle göndermenin maliyetine katılmaya gerek görülmeyecektir. Bunun için dokuz hafta boyunca güncelleme sayısı ve etkileşim sayıları kaydedilmiştir. İlişki katsayısını hesaplayarak ilişkiyi ve etkileyip etkilemediğini görebileceğiz.

Buradan görüldüğü gibi, kuralı sağlanmamaktadır. Facebook güncellemeleri ile İzleyici etkileşimleri arasında güçlü bir ilişkiyi gösterecek kadar elimizde veri yoktur, sonucuna varılır. Son olarak sunu vurgulamak gerekir ki ilişki katsayısı nedensellik belirtmez. İlişki olması birisinin diğerinin nedeni olduğunu göstermez. Örnek: Aşağıda milli gelirle karbon salınımı arasındaki ilişki gösterilmiştir. Görüldüğü gibi milli gelir arttıkça karbon salınımı artmaktadır. Pozitif doğrusal bir ilişkinin varlığı görülebilmektedir. Aşağıdaki tabloda öğrencilerin bir haftada ders çalışma saati ile akademik ortalaması verilmiştir. Bu değişkenler arasında bir ilişki olmadığı aşağıdaki grafikten görülebilir:

Uygulamalarda r ilişki katsayısı aşağıdaki eşitlikten daha kolay hesaplanabilir: 10 ülkenin milli geliri (x: bağımsız değişken ) ile karbon salınımı(y:bağımlı değişken) arasındaki ilişki katsayısı aşağıda hesaplanmıştır. Milli Gelir(x) CO Salınımı(y) xy x y Görüldüğü gibi hesaplanan ilişki katsayısı r=0.91> /(10) 1/ olduğundan kuvvetli bir pozitif ilişkinin varlığını ortaya koymaktadır.

Eğer sınıflı ve sıralı ölçüm düzeyindeki değişkenler bağımsız değilse bu değişkenler arasındaki ilişkiler ölçülebilir. Sıralı ve sınıflı ölçme düzeyindeki değişkenler için en yaygın olarak kullanılanlar şunlardır: Adı Simgesi Veri türü Yüksek İlişki Bağımsızlık Lambda λ Sınıflı 1.0 0 Gamma γ Sıralı -1.0 ve 1.0 0 Tau-b(Kendal) τ Sıralı -1.0 ve 1.0 0 Alıştırmalar 1. 5 haftalık rastgele bir örneklemde Avrupa ya deniz yolculuğu acentesinden şu kadar bilet alınmıştır: 0 73 75 80 8 a) Ortalamayı, ortancayı ve en-sık değeri hesaplayın. b) Veriyi, hangi merkezi eğilim ölçüsü en iyi betimler?. On iktisatçıdan Tüketici Fiyat Endeksi nde gelecek yıl ortaya çıkacak artışı kestirmeleri istenmiştir. Ön-kestirimler 3.6 3.1 3.9 3.5 3.7 3.4 3.0 3.7 3.4 olarak verilmiştir. a) Örneklem ortalamasını hesaplayın. b) Örneklem ortancasını hesaplayın c) En sık değeri bulun. 3. Önlisans üçüncü dönem öğrencilerinin bir dönemde aldıkları derslerin kredi toplamları verilmiştir. Ortalama ortanca ve tepe değeri bulunuz. 4. Aşağıdaki kutu-çizimleri kullanarak her dağılımın beşli-özetini veriniz. 5. Aşağıdaki kutu-çizimleri kullanarak her dağılımın simetrik, sağa çarpık ya da sola çarpık olup olmadığına karar veriniz.

6. Aşağıdakileri doğru yanlış olarak işaretleyiniz. Yanlış ise neden yanlış olduğunu belirtiniz. a) Verinin ilk dörtte biri alt dördebölen değeri Q 1 altında kalır. b) İkinci dördebölen değeri sıralanmış veri kümesinin aritmetik ortalamasıdır. c) Bir uç değer alt dördebölenin (Q 1 ) altında veya üst dördebölenin(q 3) üstünde kalan herhangi bir sayıdır. 7. Aşağıdaki veri kümesinde a) dördebölenleri bulunuz b) Dördebölenler aralığını (DA) bulunuz c) Varsa herhangi bir uç değeri belirleyiniz. 8. Aşağıda ABD de 0-9 yaş öbeğindeki yetişkin erkeklerin boy uzunluklarının ojiv çizimini kullanarak soruları cevaplayınız? a) Hangi değer 80 incin yüzebölen değerini temsi eder? Bunu nasıl yorumlarsınız? b) Hangi yüzebölen değeri 73 inch tir? Bunu nasıl yorumlarsınız. 9. Herhangi bir otomobil lastiğinin ömrünün ortalaması 35000 Mil standart sapması 50 Mildir. Lastik ömürlerinin çan biçiminde bir dağılım gösterdiğini varsayalım. Lastik ömrünün tamamlandığı ölçümle belirlemiş ve kaç Mil kullanıldıkları kaydedilmiştir. a) Rastgele seçilmiş üç tane lastiğin ömürleri 34000, 37000, 30000 Mildir. Her birinin z-değerine bakarak lastik ömürlerinin olağan ya da olağan dışı olup olmadığına karar veriniz. b) Rastgele seçilmiş üç tane lastiğin ömürleri 34000, 37000, 30000 Mildir. Görgül Kural ı kullanarak her lastiğin ömrüne karşılık gelen yüzebölen değerini bulunuz. 10. Bir futbol maçını izleyen rastgele seçilmiş seyirci örnekleminin yaş dağılımı şöyledir: a) Ortalama yaşı bulun. b) Standart sapmayı bulun. c) Değişkenlik katsayısını bulun d) Dal-yaprak gösterimini düzenleyin.

11. Hesaplama yapmadan her veri kümesinin kitle standart sapmasını tahmin ediniz. 1. Bir iş kolunda çalışanların yıllık gelirleri n=13 kişilik örneklemde gözlenmiştir: 4, 36, 48, 51, 39, 39, 4, 6, 48, 33, 39, 4, 45. Örneklem ortalamasını, ortancasını, tepe değerini, genişliğini, varyansını ve standart sapmasını hesaplayınız. 13. Histogramda görülen veri kümelerinin her ikisinin de ortalaması 50 dir. Birinin standart sapması.4 diğerinin ki 5 dir. Grafiğe bakarak hangisinin standart sapmasının ne olduğunu sebebini açıklayarak yazınız. 14. Yerel yönetimin uygulamaları hakkında yapılan ankette 100 kişi 10 üzerinden puan vermiştir. Ortalama=6, standart sapma=1.5 bulunmuştur. Puanlar simetrik bir dağılım gösterdiğine göre ankete katılanların %95 i hangi aralıkta puan vermiştir? 15. Aşağıdaki parametre ya da istatistiklere sahip veri kümesini yaratınız. 16. Bir basketbol takımının boy uzunluklarının ortalaması ve standart sapması 7.8 inch ve 3.3 inch dir. Ağırlıklarının ortalama ve standart sapması ise 187.8 pound ve 17.7 pound dur. Her birinin değişkenlik katsayılarını bulup karşılaştırınız (C:4.5, 9.4). 17. New York için yaş dağılımı aşağıdaki histogramda verilmiştir. k= için Çebişev Teoremini uygulayınız. New York nüfusunun en az % kaçı hangi sayılar arasındadır?

Nüfus(1000) 18. İstatistik dersinin sınavın ortalama puan 88 standart sapması 4 tür. k= kullanarak veriye Çebişev Teoremini uygulayınız ve sonucu yorumlayınız. 19. Bir otoyolda araçların saatteki ortalama hızı 67 mil, standart sapması 4 Mildir. Araçların yüzde kaçının saatteki hızları 63 ile 71 Mil arasındadır? (Dağılım çan eğrisine uymaktadır) 0. Çan gibi bir veri kümesinin ortalaması 450, varyansı 65 tir. Aşağıdaki bölgelere düşen gözlemlerin yüzdesi yaklaşık kaçtır? a) 45 ten büyük b) 550 den az c) 55 den büyük Yaş 1. Aşağıdaki beş örneklem değeri ile tartılarını ele alalım. a) xi değerlerinin tartısız ortalamasını hesaplayın. b) x i değerlerinin tartılı ortalamasını hesaplayın.. Aşağıdaki örneklemde yer alan 40 gözlemin sıklık dağılımını ele alalım. Sınıf Sıklık a) Örneklem ortalamasını hesaplayınız. b) Örneklem varyansını ve standart sapmasını hesaplayın.

3. Rastgele seçilmiş 50 bina sigortası poliçesinden son iki yılda gelen hasar sayıları aşağıdadır: Hasar sayısı 0 1 3 4 5 6 Poliçe sayısı 1 13 5 4 3 a) Poliçe başına düşen ortalama hasar sayısını bulun. b) Örneklem varyansı ile standart sapmasını bulun. 4. Bir yatırım araştırma ajansı, bir pay senedi için uzman görüşlerini tartı olarak kullanarak pay senedi hakkında karar verecektir. Tartılı ortalama 1 ise alın, 1.1- arasında ise alabilirsiniz,.1-3.0 arasında ise işlem yapmayın, 3.1-4 arasında ise satabilirsiniz, 4.1-5 arasında ise satın anlamına gelmektedir. İŞLEM Uzman Değer Sayısı (w i ) (x i) w ix i Al 10 1 10 Alabilirsin 3 6 İşlem yapma 6 3 18 Satabilirsin 0 4 0 Sat 0 5 0 5. Bir ders için yapılan altı adet sınavdan alınan puanlar aşağıda verilmiştir. İlk 5 sınav %15 son sınav %5 tartıya sahiptir. Tartılı ortalama ile dersin geçme puanını hesaplayınız. 6. 1000 yetişkin kişiye bir yıldaki ulaştırma masrafları sorulmuş ve öbekli veri oluşturulmuştur. Buna göre yaklaşık olarak ulaştırma harcamalarını ortalama ve standart sapmasını bulunuz. 7. Bir bölgede hanehalkı başına düşen araba sayısının çubuk-çizimi aşağıda verilmiştir. Grafiği kullanarak örneklem ortalamasını ve standart sapmasını yaklaşık olarak tahmin ediniz.

Hanehalkı sayısı Araba sayısı 8. Aşağıdaki veride X, belli bir malın fiyatını, Y, satılan miktarı(bin) göstermektedir. Fiyat Satılan Miktar(bin) a) Ortak-varyansı hesaplayın. b) İlişki katsayısını hesaplayın.