VERİ SETİNE GENEL BAKIŞ Outlier : Veri setinde normal olmayan değerler olarak tanımlanır. Ders: Kantitatif Yöntemler 1
VERİ SETİNE GENEL BAKIŞ Veri setinden değerlendirme başlamadan çıkarılabilir. Yazım hatası olup olmadığına bakılabilir Örneklem seti düşünülenden daha karmaşık olabilir ve aykırı değer bunun sonucu olabilir. Aykırı değerleri içeren ve içermeyen veri setleriyle analiz yapılıp sonuçlar kıyaslanır ve sonuç farklı değilse veri setinde değerler kalabilir. Ders: Kantitatif Yöntemler 2
VERİSETİNE GENEL BAKIŞ Ders: Kantitatif Yöntemler 3
MERKEZİ EĞİLİM ÖLÇÜLERİ MERKEZİ EĞİLİM ÖLÇÜLERİ ANALİTİK ORTALAMALAR ANALİTİK OLMAYAN ORTALAMALAR Aritmetik Ortalama Ağırlıklı Ortalama Medyan Mod Geometrik Ortalama Ders: Kantitatif Yöntemler 4
ANALİTİK ORTALAMALAR Bir örneklemede tüm veri değerlerini dikkate alan merkezi eğilim ölçüleridir. Aritmetik ortalama Ağırlıklı ortalama Geometrik ortalama Ders: Kantitatif Yöntemler 5
ARİTMETİK ORTALAMA -Basit Seriler Gözlenen değerlerin tümü toplanarak gözlem sayısına bölündüğünde elde edilen değere aritmetik ortalama denir. 6
ARİTMETİK ORTALAMA -Basit Seriler Bir öğrencinin beş dersten aldığı notlar; 50,75,40,60, 65. Aritmetik ortalama bütün değerlerin önemini eşit kabul ettiği için her zaman dağılımı iyi temsil etmemektedir. Bütün değerlerin aynı öneme sahip olmadığı serilerde ağırlıklı ortalama kullanılır. 7
ARİTMETİK ORTALAMA -Frekans Serileri- Frekans serilerinde, her değer frekansı kadar tekrar eder. Aritmetik ortalama hesabında her değeri frekansı ile çarparak toplam frekans sayısına oranlarız. 8
ARİTMETİK ORTALAMA -Frekans Serileri- İşletmenizde bir ay boyunca her gün için üretimden çıkan kusurlu ürün sayısı yandaki tabloda verilmiştir. Günlük ortalama kusurlu ürün sayısı nedir? Hatalı Ürün Sayısı X İ Gözlem Gün Sayısı Ƒ i 0 2 1 3 2 5 3 7 4 5 5 8 30 9
ARİTMETİK ORTALAMA -Frekans Serileri- Hatalı Ürün Sayısı X İ Gözlem Gün Sayısı Ƒ i X İ Ƒ i 0 2 0 X = 94/30 = 3.13 1 3 3 2 5 10 3 7 21 4 5 20 5 8 40 30 94 10
ARİTMETİK ORTALAMA -Sınıflı Seriler- Bir işletmenin bir ay boyunca kesmiş olduğu faturaların miktar aralığı ve frekansları yandaki tabloda verilmiştir. İşletmenin ortalama fatura miktarı nedir? Fatura Tutarı (TL) Fatura Sayısı 0-500 32 500-1000 24 1000-1500 22 1500-2000 18 2000-2500 11 2500-3000 8 115 11
ARİTMETİK ORTALAMA -Sınıflı Seriler- Fatura Tutarı Fatura Değeri Orta Noktası X İ Fatura Sayısı Ƒ i X İ Ƒ i 0-500 250 32 8,000 500-1000 750 24 18,000 Ortalama Fatura Miktarı = 131,750/115 = 1,146 TL 1000-1500 1250 22 27,500 1500-2000 1750 18 31,500 2000-2500 2250 11 24,750 2500-3000 2750 8 22,000 115 131,750 12
ARİTMETİK ORTALAMA ÖZELLİKLERİ Aritmetik ortalamanın hesaplanışında veri setindeki tüm veri değerleri kullanılır. Aritmetik ortalama, verisetindeki aşırı uç değerlerden etkilenir. Örnek: 5 öğrencinin bir sınavda almış olduğu notlar 70, 71, 73, 72, ve 5`dir. Aritmetik ortalama 58.2 olacaktır. Bu aritmetik ortalama verisetini iyi bir şekilde temsil etmemektedir. Bahar, 2013-2014 13
AĞIRLIKLI ORTALAMA Aritmetik ortalamada, her bir veri değerinin öneminin eşit olduğu varsayılmaktadır. Fakat bazı değerlerin önemi diğerlerinden farklı olabilir. Bu durumlarda ağırlıklı ortalama kullanılır. 14
AĞIRLIKLI ORTALAMA Bir öğrenci, İşletme dersinden 75, Muhasebe dersinden 50, Hukuk dersinden 60, İngilizce dersinden 67 almış olsun. Ders kredilerinin de İşletme 4, Muhasebe 4, Hukuk 3, İngilizce 1olduğunu varsayalım. Bu öğrencinin ders ortalamasını hesaplayalım. Dersin Adı Not Kredi Muhasebe 75 4 Finans 50 4 Hukuk 60 3 Ekonomi 67 1 15
GEOMETRİK ORTALAMA Geometrik ortalama iktisat ve işletme alanlarında yaygın olarak kullanılan bir ortalama türüdür. Geometrik ortalama özellikle; değişim oranlarının (yüzde, oran, vb.) ortalamasının hesaplanmasında bir zaman aralığı içerisindeki bir üretimin yada satışın artış miktarının ortalamasının belirlenmesinde yaygın olarak kullanılmaktadır. 16
GEOMETRİK ORTALAMA Örnek: Bir işletmenin dört farklı ürünün satışından elde ettiği kar yüzdeleri %3, %2, %4, ve %6 dır. Bu işletmenin ortalama karı nedir? 4 4 G.O = 3*2*4*6 144 %3, 46 Aritmetik Ortalama = %3,75 Not: - Eğer veri değerlerinden biri 0 yada negatif değerlikli ise Geometrik ortalama hesaplanamaz. 17
ANALİTİK OLMAYAN ORTALAMALAR Bir örnekteki bütün veri değerlerini dikkate almayan merkezi eğilim ölçüleridir. Medyan (Ortanca) Mod 18
MEDYAN (ORTANCA) Veriler en küçükten en büyüğe ya da en büyükten en küçüğe sıralandığında en ortada kalan değerdir. Aritmetik ortalama gibi uç değerlerden etkilenmemesi avantajdır. n tek ise n çift ise 19
MEDYAN (ORTANCA) 2,3,2,4,4,6,6,5,8,8,9 sayıları için ortancayı bulunuz. Önce veriler, küçükten büyüğe doğru sıralanır. 20
MEDYAN (ORTANCA) -Excel Uygulaması- 21
MEDYAN (ORTANCA) -Excel Uygulaması- 22
MEDYAN (ORTANCA) -Excel Uygulaması- Medyan = 5 23
MEDYAN (ORTANCA) 1,2,3,3,5,5,5,6,7,7,7,8,9,9 biçiminde sıralanmış veriler için ortancayı bulalım. n:14 çift sayıdır. 1,2,3,3,5,5,5,6,7,7,7,8,9,9 24
MEDYAN (ORTANCA) Medyan= 5.5 25
MOD (TEPE DEĞER) Bir seride en çok tekrarlanan değere Mod denir. Mod, veri setinin hakim değerini gösterir. Modu bulabilmek için, basit gruplandırma yapılır. Frekansı en fazla olan grup, mod değeridir. Bazı veri setlerinde, birden fazla mod bulunabilir. Eğer iki mod varsa, veri seti bimodaldir. Mod, veri setindeki çok büyük veya çok küçük değerlerden etkilenmez. 26
MOD (TEPE DEĞER) 27
ÖRNEK X1 4 6 8 78 5 4 9 4 X2 4 6 8 78 4 5 4 ÖRNEK: X1 ve X2 değişkenleri için mod, medyan, ve aritmetik ortalama değerlerini hesaplayınız. X1 değişkeni için Mod=4 Medyan=(6+5)/2=5.5 Aritmetik ortalama=14.75 X1 4 4 4 5 6 8 9 78 X2 4 4 4 5 6 8 78 X2 değişkeni için Mod=4 Medyan=5 Aritmetik ortalama=15.57 Ders: Kantitatif Yöntemler 28
Özet Bilgi Merkezi Ölçüm Ortalama Medyan Mod Tanım x x n Orta değer En sık tekrar eden veri değeri Nasıl Kullanılıyor En Bilinen ortalama Sıklıkla Kullanılır Ara sıra kullanılır Varlığı Her değer Dikkate Alınırmı? Her zaman vardır. Evet Evet Her zaman vardır. Olmayabilir ya da birden fazla olabilir. Hayır Hayır Uç Değerlerden Etkilenirmi? Hayır Hayır Avantajları ve Dezavantajları Birçok istatistiksel metodla iyi çalışır. Birkaç uç değer varsa genellikle iyi bir tercihtir Nominal düzeyde veriler için uygundur Eğer örneklem aynı anakütleden çekilmişse, aritmetik ortalama diğer ölçülere göre daha güvenilirdir Ders: Kantitatif Yöntemler 29
Merkezi Dağılım Ölçüleri İki farklı anakütleyi birbirinden ayırmak için her zaman yalnızca yer ölçüleri yeterli olmayabilir. Dağılımları birbirinden ayırt etmede kullanılan ve genellikle aritmetik ortalama etrafındaki değişimi dikkate alarak hesaplanan istatistiklere merkezi dağılım ölçüleri adı verilir. Ders: Kantitatif Yöntemler 30
Merkezi Dağılım Ölçüleri Aşağıdaki iki grafik iki farklı üretim hattından alınan numuneler doğrultusunda oluşturulan histogramlardır. Her iki örnek ortalaması yaklaşık olarak 95.33 olduğuna göre iki örneğin aynı anakütleden alındığı söylenebilir mi? 400 300 Frekans 1200 1000 800 200 600 100 400 200 0 67,33 81,33 95,33 109,33 123,33 0 67,33 81,33 95,33 109,33 123,33 X X Ders: Kantitatif Yöntemler 31
Merkezi Dağılım Ölçüleri Ranj Varyans Standart Sapma Değişim Katsayısı Ders: Kantitatif Yöntemler 32
Haftaya görüşmek üzere... Ders: Kantitatif Yöntemler 33