VERİLERİN TABLO VE GRAFİKLARLE GÖSTERİLMESİ Dr. Mehmet AKSARAYLI D.E.Ü. İ.İ.B.F..B.F. EKONOMETRİ BÖLÜMÜ mehmet.aksarayli@deu.edu.tr Bölümün Amaçları Bu Bölümü tamamladıktan sonra neleri yapabileceksiniz: Tablo ve grafikleri okuma ve yorumlama, Temel veri sunum araçlarını kullanma, Verileri uygun şekilde tablo ve grafiklerle gösterme, Construct a frequency distribution both manually and with a computer Construct and interpret a histogram Create and interpret bar charts, pie charts, and stem-and-leaf diagrams Present and interpret data in line charts and scatter diagrams Frequency Distributions Niçin Dağılımlarını Kullanırız? dağılımı nedir? dağılımı bir liste veya bir tablodur Değişkenin değerlerini içerir ve her bir değerin gözlem sayısını gösterir Bir frekans dağılımı verileri özetleme yoludur. Dağılım ham verileri daha kullanışlı bir şekle dönüştürür. ve verilerin hızlı bir şekilde yorumlanmasına olanak verir. Verilerin Organizasyonu Tek bir etiketle tanımlanabilen verilere kalitatif veri denir. Örnek: Televizyon kanalları, araba markaları Tablo Metotları 1. Dağ..Relatif Fr.Dağ. Kalitatif Veriler Grafik Metotları.Çubuk gr..daire gr..çizgi gr. VERİ Kantitatif Veriler Tablo Metotları. Dağ. Üzerinde dört işlem yapılabilen, sayısal verilere kantitatif veriler denir. Örnek: Boy, Kilo, Notlar Grafik Metotları 9.Histogram 7.Rel.Fr.Dağ. 1.Fr.Poligonu 11.Gövde-Yaprak. Küm.Rel.Fr.Dağ. gösterimi İstatistiksel verileri anlamlı hale getirmenin ayrı yolu: 1. Sözel ifadelerle açıklama. Tablolar halinde düzenleme. Grafikle gösterme. Verileri değerlendirerek istatistiksel ölçüler bulma. Bu yöntemlerde birkaçını birlikte uygulama
Dağılımı Kesikli Veriler Kesikli Veri: Olası veriler sayılabilirdir Göreli Göreli : Her kategorideki oran nedir Örnek: Bir reklamcı müşteriye haftanın kaç günü günlük gazete okuduklarını sorar. Haftanın Gün sayısı 1 1 1 7 Total Haftanın Gün sayısı Göreli. 1.1 1.9 1..1.11.1 7.1 Total 1. =. Örneklem raporundaki İnsanların % si haftanın günü gazete okuyor(haftada bir kere bile gazete okumuyor) Dağılımı: Sürekli Veri Sürekli Veri: Bir aralıktaki her değeri alabilir. Örnek: Bir izolasyon ürünleri üreticisi kış günlerinden sini rastsal olarak seçer ve günlük en yüksek sıcaklıkları kayıt altına alır.,, 17, 1,, 7,,,,,, 1, 1,, 1,,, 7,, 7 (Sıcaklık sürekli bir değişkendir çünkü ölçüme göre herhangi bir değer alabilir) Sınıflara göre Veri Sınıflandırma Yatay veriyi küçükten büyüğe sıralama 1, 1, 17, 1,,,, 7, 7,,,, 7,, 1,,,,, Aralık Bulunur: - 1 = Sınıf numarası seçilir: (Genelde - arasındadır) Sınıf genişliğini hesaplanır (Genişlik) : 1 (/ sonra yuvarla) Sınıf sınırlarını tahminlenir (Limitler):,,, (Bazen sınıf orta noktaları şeklindedir: 1,,,, ) Her sınıftaki değerlerin sayısını yazılır. Frequency Distribution Example küçükten büyüğe veri: 1, 1, 17, 1,,,, 7, 7,,,, 7,, 1,,,,, Dağılımı Sınıf Göreli 1- arasında.1 - arasında. - arasında. - arasında. - arasında.1 Toplam 1. Dağılımı Tablosu Örneği Ham Veriler,,, 1, 7, 7,, 1,, Sınıf Orta Nokta Genişlik 1 ve < ve < ve < Sınırlar (Üst + Alt Sınırlar) /
Bağıl & % Yüzde Dağılımı Tabloları Kontenjans Tablosu Örneği Bağıl Dağılımı Sınıf oran 1 ve <. ve <. ve <. Yüzde Dağılımı Sınıf % 1 but <. but <. but <. Yerleşim: C C O O C C O O C O Cinsiyet: E E K K E E K E E K (C=Kampüste, O=Kampüs Dışı; E=Erkek, K=Kadın) Cinsiyet Yerleşim Erkek Kadın Total Kampüste Kampüs Dışı 1 Total 1 SERİLERİN GRAFİKLE GÖSTERİLMESİ 1 1 İstatistiksel Verileri Tasnif Etme Çizgi Grafik Puan 7 9 1 1 İstatistiksel Verileri Tasnif Etme Çubuk Grafik 7 9 Çözülen net soru sayısı İstatistiksel Verileri Tasnif Etme Çubuk Grafik 1 1 1 TÜRKÇE SOSYAL MATEMATİK FEN Yıllar
Çubuk Diyagramı Çubuk Grafik Örneği Kategorik Değişkenler için Yatay Çubuklar 1/ Çubuk Genişliği Yön. Ekon. Muh. Branş Çubuk uzunluğu frekansı veya % yi gösterir Eşit çubuk genişlikleri Yatırımcı Portföyü Savings CD Bonds Stocks 1 Değerler 1$ türündedir. Sıfır Noktası 1 1 Yüzde de kullanılabilir (Çubuk Grafikler yatay olarak da gösterilebilir.) Çubuk Grafik Örneği Histogram Gün bazlı okuma sayısı 1 1 1 7 Total 1 Haftalık gazete okuyuculuğu 1 7 Haftada günlük gazete okuma sayısı Bağıl Yüzde Adet 1 1 Sınıf Frek. 1 (hariç)< (hariç) < (hariç) < Çubuklar temas halinde Alt Sınır Histogramları Histogram Örneği Sınıflar veya Aralıklar, yatay eksende gösterilir. dikey eksende ölçülür. Uygun yükseklikteki çubuklar (Bar) her sınıftaki gözlem sayısını temsil etmek için kullanılabilir. Bu tür bir grafiğe Histogram denir. Sıralanmış veri dizisi: 1, 1, 17, 1,,,, 7, 7,,,, 7,, 1,,,,, Histogram 7 1 1 1 More Class Midpoints Sınıflar Sürekli veri olduğundan çubuklar arasında boşluk olmaz!!!
Verileri Sınıflandırmaya İlişkin Sorular Kaç Sınıf Olmalı? 1. Aralıkların genişliği nasıl olmalı? (Kaç sınıf kullanılmalı?). Aralık üst sınırları nasıl tahminlenecek? Deneme yanılmayla cevaplanır, kullanıcı kararına bağlı Amaç Çıkıntılı veya Kümeleşmemiş bir dağılım yaratmaktır. Amaç veri içindeki uygun izleri gösterebilmektir, temsil ettirebilmektir. Çok (Dar sınıf aralığı) Boş sınıflar arasında boşluk olmasından çıkıntılı bir dağılım meydana gelir. Sınıflar arasındaki çeşitlilik açısından yetersiz ipucu verir. Az (Geniş sınıf aralığı) Çeşitliliği sıkıştırarak kümeleşmiş bir dağılım gösterir. Çeşitliliğin ipuçlarını gizleyebilir. Frequency Frequency.. 1. 1. 1 1 1 1 More Temperature More Temperature (X axis labels are upper class endpoints) Genel Kurallar Sınıf Genişliği Veri Sayısı Sınıf Sayısı altında - 7 1-1 1 7-1 üstünde 1 - Gözlem sayısı arttıkça sınıf aralıkları tipik olarak azalabilir. Çok sayıda gözlem içeren dağılımlar daha pürüzsüz ve boşlukları dolmuş olabilir çünkü veri fazladır. Sınıf Genişliği, Sınıfında en küçük olası değerle en büyük olası değer arası mesafedir Sınıf Aralığı En büyük Değer En küçük değer W = Sınıf Sayısı Excel de Histogram 1 Veri Menüsü seçilir Veri Analizi Excel de Histogram (Devamı) Veri girişi ve aralığı belirlenir. Çıktı grafiği seçilir Histogram Seçilir
Bağıl Yüzde Adet 1 Poligonu Fiktif Sınıf 1 Orta nokta Sınıf Frek. 1 (hariç) < (hariç) < (hariç) < (devamı) 1, 1, 17, 1,,,, 7, 7,,,, 7,, 1,,,,, Kümülatif göreli frekans sütunu eklenir. Sınıf 1 -.1.1 -.. -..7 -..9 -.1 1. Total 1. Frequency Distribution Göreli Kümülatif Göreli Gövde-Yaprak Gösterimi Histogram 7 1 1 1 More Class Midpoints Sınıflar 1 Kümülatif (%) Her Gözlem Gövde ve Yaprak Değerlerine Ayrıştırılır Gövde Değeri Sınıfı Belirler Yaprak Değeri ı Belirler (Adet) 177 1 X i Gövde Yaprak Diyagramı (Stem and Leaf Diagram) Kalitatif veri detaylarını kolayca görmeye yarar. METOD 1. Sıralanmış veriye ait ortak ilk rakamlar gövdeyi kalan rakamları yaprağı oluşturur.. Gövde verileri küçükten büyüğe aynı sütunda gösterilir.. Her gövde için, yaprakları listelenir. Örnek: Küçükten büyüğe sıralı veriler 1, 1, 17, 1,,,, 7, 7,,,, 7,, 1,,,,, Ondalık Rakamlar gövde için kullanılır. 1 gösterimi gösterimi Stem Leaf 1
Örnek: Sıralı dizide veri: 1, 1, 17, 1,,,, 7,,,,, 7,, 1,,,,, Tamamlanmış Gövde-Yaprak Gösterimi Gövde Yaprak 1 7 1 7 7 1 Diğer Gövde Birimleri Yüzdeliğin gövde olarak kullanımı: Yapraklardaki ondalık kısım yuvarlanır. Stem Leaf 1 would become 1 77 would become 7... 1 becomes 1 Pasta Grafik Örneği Pasta Diyagramı Yatırım Miktar Yüzde Türü (1 $) Menkul Kıy...7 Tahvil. 9.9 Mevduat 1. 1.9 Tasarruf 1. 1. Toplam 11 1 (Değişkenler Kalitatif) Şu anki Yatırımcı Portföyü CD 1% Tasarruf 1% Tahvil 9% Menkul Kıymet % Yüzdeler en yakın rakama yuvarlanmıştır 1. Toplam miktarın kategorilere dağılışını gösterir. Bağıl farkları Ekonomi. göstermek için kullanışlı 1%. Açı Büyüklüğü ( )(%) ( ) (1%) = Branşlar Yönetim. % Muhas. % İstatistiksel Verileri Tasnif Etme Pasta grafiği Çok Değişkenli Kategorik Veri Grafiği Oluşturma Genel lise Meslek lisesi 1$ cinsinden yatırım % % Pasta grafiği, bir bütünün parçalarını karşılaştırmada kullanılır Yatırım Investor A Investor B Investor C Total Kategorisi Menkul Kıy.. 7. 19 Tahvil. 19. 9 Mevduat 1. 1. 9 Tasarruf 1. 7. 1 Toplam 11. 17 7.
Çok Değişkenli Kategorik Veri Grafiği Oluşturma Yanyana grafik Comparing Investors (devamı) Yanyana Grafik Örneği Bölgeye ait aylık Satışlar: 1st Qtr nd Qtr rd Qtr th Qtr. 7.. East 9 West... 1. North.9.9.9 Savings CD Bonds Stocks 1 1 East West North Investor A Investor B Investor C 1st Qtr nd Qtr rd Qtr th Qtr Çift Değişkenli Sayısal Verilerin Grafik Gösterimi 1. İkili Diyagram Birarada çalışılan iki farklı şans değişkeninin oluşturduğu (X i, Y i ) noktalarını gösterir. Zaman Serisi Plotu Sayısal veri serilerinin zamana karşı nasıl bir değişim gösterdiğini sergiler Y İkili Diagram (X i, Y i ) çiftlerinin oluşturduğu noktalar X Zaman Serisi Plotu Verilerin haritalar şeklinde sunumu - Tematik Haritalar Satışlar 91 9 9 9 9 9 Yıl
Verilerin Sunumundaki Hatalar Doğru Grafik Seçme AB Ülkelerinde Genel Lise Meslek Lisesi Oranları 1. Gereksiz Tabloların Kullanımı. Verilerin Karşılaştırılmasında Temelde Uyumsuzluk. Dikey Eksenin Sıkıştırılması. Dikey Eksende Sıfır Noktasının Bulunmayışı Genel Lise % Meslek Lisesi % 1 Genel Lise İkisi de olabilir. Birincisi daha uygun Meslek Lisesi Doğru Grafik Seçme 1 9,,,,,, 9,, Dünya Avrupa 1'ler Ülkelere Göre Eğitim Yaşı Doğu Avrupa Türkiye Doğru Yanlış Dünya Avrupa 1'ler Doğu Avrupa Türkiye Kötü Sunum Minimum Maaş 19: $1. 197: $1. 19: $.1 199: $. İyi Sunum Minimum Maaş $ 19 197 19 199 Temelde Uyumsuzluk Dikey Eksenin Sıkıştırılması Kötü Sunum İyi Sunum Kötü Sunum İyi Sunum Sınıflardaki A lar Frek. 1 FR SO JR SR Sınıflardaki A lar % % % 1% % FR SO JR SR $ 1 Mevsimlik Satışlar Q1 Q Q Q $ Mevsimlik Satışlar Q1 Q Q Q
Dikey Eksende Sıfır Noktası Bulunmaması Bölüm Özeti $ Kötü Sunum Aylık Satışlar 9 J M M J S N İyi Sunum Aylık Satışlar $ J M M J S N Satır halindeki veriler karar vermede kullanımı uygun değildir. Aşağıdaki gibi bir organizasyon lazımdır. Tablo Grafik Bu bölümde incelenen konular Dağılımları, Histogram ve Poligonu Çubuk, Çizgi ve Pasta Grafikleri Gövde Yaprak Diyagramı Zaman Serisi Grafiği ve Serpilme Diyagramı İstatistiksel Haritalar (Tematik Haritalar) Grafik ve tablo özetleme araçlarında yapılan yanlışlıklar