3. Ders Çok Boyutlu (Değişkenli) Veri Analizi

Benzer belgeler
Üç Boyutlu Serpilme (Saçılım) Grafikleri

*Bir boyutlu veri (bir özellik, bir rasgele değişken, bir boyutlu dağılım): ( x)

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

BÖLÜM 4 FREKANS DAĞILIMLARININ GRAFİKLE GÖSTERİLMESİ

BİYOİSTATİSTİK Grafikler Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Ders 8: Verilerin Düzenlenmesi ve Analizi

Yrd. Doç. Dr. Sedat Şen 9/27/2018 2

Değer Frekans

VERİLERİN GRAFİKLER YARDIMIYLA SUNUMU Daire Grafikleri Yardımıyla Verilerin Sunumu Sütun(Çubuk) Grafikleri Yardımıyla Sunumu

İSTATİSTİK I KISA ÖZET KOLAYAOF

VERİ KÜMELERİNİ BETİMLEME

ĐŞLE 544 ĐSTATĐSTĐK ARA SINAV 11 Mayıs 2006

MATLAB de GRAFİK İŞLEMLERİ

Prof.Dr.İhsan HALİFEOĞLU

SÜREKLĠ OLASILIK DAĞILIMLARI

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

BÖLÜM 9 NORMAL DAĞILIM

İÇİNDEKİLER ÖN SÖZ...

BİYOİSTATİSTİK. Genel Uygulama 1. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Matlab da 2-boyutlu Grafik Çizimi. Arş. Gör. Mehmet Ali ÜSTÜNER

Bölüm 2 VERİLERİN DERLENMESİ VE SUNUMU

Ders 1 Minitab da Grafiksel Analiz-I

25/10/2008. Bölüm 1 Verileri Grafiklerle İfade Etme. Bir bireyi belirleyen niteliklerin her

İstatistik Nedir? Ders 1 Minitab da Grafiksel Analiz-I ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. İstatistiğin Konusu Olan Olaylar

GRAFİK YORUMLAMA. 1 ) Sütun Grafiği : Belirli bir zaman aralığında bazı veri grup-

Bölüm 2. Frekans Dağılışları VERİLERİN DERLENMESİ VE SUNUMU. Frekans Tanımı. Verilerin Derlenmesi ve Sunulması

contourf, imagesc, surf, pcolor imagesc patch patch

TANIMLAYICI İSTATİSTİKLER

TOPOĞRAFYA Kesitlerin Çıkarılması, Alan Hesapları, Hacim Hesapları

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

DENEY 1: Matlab de Temel Uygulamalar

NİCELİKSEL KONTROL GRAFİKLERİ

T.C. Ölçme, Seçme ve Yerleştirme Merkezi

Bertrand, kirişin rasgele seçimi ile ilgili üç farklı yöntem ele alıp sorulan olasılığı hesaplamıştır.

FREKANS VERİLERİ. Prof.Dr. Levent ŞENYAY III - 1

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER

Grafik Komutları. Grafik Türleri plot: çizgisel grafikler bar: sütun bar şeklindeki grafikler stem: sütun çizgisel grafikler pie: pasta grafikleri

Bölüm 2: Kuvvet Vektörleri. Mühendislik Mekaniği: Statik

T.C. ESKİŞEHİR OSMANGAZİ ÜNİVERSİTESİ KONTROL GRAFİKLERİ. Prof. Dr. Nimetullah BURNAK Prof. Dr. A. Sermet ANAGÜN. Endüstri Mühendisliği Bölümü

ÜNİTE. İSTATİSTİĞE GİRİŞ Doç.Dr.Suphi Özçomak İÇİNDEKİLER HEDEFLER GRAFİKLER

YARDIRMALI MATEMATİK TÜREV FASİKÜLÜ

Üretim Süreci: Girdi İşlem Ürün (Sonuç) Araştırma Süreci: Hangi alanda olursa olsun araştırma bir BİLGİ ye ulaşma sürecidir.

Bertrand Paradoksu. Şekil-1

T.C. Ölçme, Seçme ve Yerleştirme Merkezi

TEKSTİL SEKTÖRÜNDE ÖRGÜT KÜLTÜRÜNÜN ÖĞRENEN ÖRGÜTE OLAN ETKİSİ

istatistik 4. Bir frekans dağılımına ilişkin birikimli seriler 1. Birimlerle ilgili aşağıdaki ifadelerden hangisi

T.C. Ölçme, Seçme ve Yerleştirme Merkezi

İstatistik ve Olasılık

Ödev 1. Ödev1: 600N luk kuvveti u ve v eksenlerinde bileşenlerine ayırınız. 600 N

Regresyon. Regresyon korelasyon ile yakından ilişkilidir

BÖLÜM 8 BİLGİSAYAR UYGULAMALARI - 2

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

İSTATİSTİK DERS NOTLARI

TABLO ve GRAFİKLER. Epidemiyoloji Konferansları Serisi Prof. Dr. Bahar GÜÇİZ DOĞAN, HÜTF Halk Sağlığı AD.

objektif değerlendirilmesini sağlayan bilim - veri arasındaki farkın olup olmadığını tespit

HAFTA-2 Norm Yazı Çizgi Tipleri ve Kullanım Yerleri Yıliçi Ödev Bilgileri AutoCad e Genel Bakış Tarihçe Diğer CAD yazılımları AutoCAD Menüleri

BATMIŞ YÜZEYLERE GELEN HİDROSTATİK KUVVETLER

VERİLERİ ÖZETLEME. Prof.Dr. Levent ŞENYAY III - 1

Mühendislik Mekaniği Statik. Yrd.Doç.Dr. Akın Ataş

DENEY 1 SABİT HIZLA DÜZGÜN DOĞRUSAL HAREKET

Sürekli Rastsal Değişkenler

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

İSTATİSTİK MHN3120 Malzeme Mühendisliği

1- Temel MATLAB Fonksiyonları ve Programlama

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

Bir araştırma veya projenin içinde Veri Analizinin yeri:

Copyright 2004 Pearson Education, Inc. Slide 1

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ TELAFĐ SINAVI SORULARI

Vektörler Bölüm Soruları 1. İki vektör eşit olmayan büyüklüklere sahiptir. Toplamları sıfır olabilir mi? Açıklayınız.

Korelasyon. Korelasyon. Merkezi eğilim ve değişim ölçüleri bir defada sadece bir değişkenin özelliklerini incelememize imkan tanır.

5. Adım: Listeyi hata frekanslarına göre azalan sırada yeniden listele. Kümülatif Yüzde sütununu oluştur.

Üç Boyutlu Uzayda Koordinat sistemi

Kırım Filtresi ve Alt Örnekleme

UYGULAMA 4 TANIMLAYICI İSTATİSTİK DEĞERLERİNİN HESAPLANMASI

3/6/2014. Küresel Isınma. Öğrenme Amaçlarımız. Küresel Isınma. Aritmetik Ortalama. Veri Özetleme ve Gösterme

DENGELEME HESABI-I DERS NOTLARI

MATEMATİK MATEMATİK-GEOMETRİ SINAVI LİSANS YERLEŞTİRME SINAVI-1 TESTİ SORU KİTAPÇIĞI 08

TASARI GEOMETRİ SINAV SORULARI

HARİTA, TOPOGRAFİK HARİTA, JEOLOJİK HARİTA. Prof.Dr. Atike NAZİK Ç.Ü. Jeoloji Mühendisliği Bölümü

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ BÜTÜNLEME SINAVI SORULARI

Sözel ifadelerle açıklama 2. Tablolar halinde düzenleme 3. Grafikle gösterme

1.58 arasındaki her bir değeri alabileceği için sürekli bir

İstatistik Dersi Çalışma Soruları Arasınav(Matematik Müh. Bölümü-2014)

BİLGİSAYAR PROGRAMLAMA VE FİZİKTE PROGRAMLAMA DERSLERİ İÇİN MATLAB ÇALIŞMA NOTLARI. Mehmet ÖZKAN

Bar Diyagramı ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. Ders 3 Minitab da Grafiksel Analiz-III. Bar Diyagramı İçin Checklist.

Istatistik ( IKT 253) 1. Çal şma Sorular - Cevaplar

13. Olasılık Dağılımlar

ĐST 349 Doğrusal Programlama ARA SINAV I 15 Kasım 2006

MAKSİMUM-MİNİMUM PROBLEMLERİ

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

ELEKTRİKSEL POTANSİYEL

2.3. MATRİSLER Matris Tanımlama

Perspektif: Bir cismin bir bakışta, genel olarak üç yüzünün birden görünecek şekilde çizilen resimlerine denir. PERSPEKTİF. Kavaliyer Kabinet Militer

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

SÜRTÜNMELİ EĞİK DÜZLEMDE HAREKETTE SERBEST CİSİM DİYAGRAMI ÇİZME

UZAYDA VEKTÖRLER ve DOĞRU DÜZLEM

Parametrik doğru denklemleri 1

A A A A A A A A A A A

Transkript:

3. Ders Çok Boyutlu (Değişkenli) Veri Analizi

Veri: Boy ölçüleri (boy-kol-omuz-kalça-bacak uzunluğu) Ölçü birimi: cm boy kol omuz kalca bacak 18 77 98 12 11 163 66 72 9 97 183 73 99 113 91 16 86 7 95 12 166 7 91 15 98 165 91 78 1 1 162 8 72 11 115 191 8 15 1 117 178 76 95 97 92 195 78 11 11 1 187 82 17 17 11 185 81 16 113 9 177 75 92 12 1 17 7 9 111 1 175 75 93 111 1 181 77 93 117 15 188 81 117 15 113 18 8 97 12 17 178 7 96 13 96 178 76 96 11 11 167 71 97 99 9 168 68 9 96 1 18 78 97 19 12 18 79 99 121 19 177 7 95 111 18 186 8 11 115 99 163 68 13 98 89 155 65 8 93 9 171 75 9 11 9 155 68 8 85 98 156 7 86 95 87 167 8 1 97 95 165 72 85 1 93 168 71 85 116 15 178 75 97 128 111 186 83 13 12 19 185 79 1 13 119 16 7 95 95 9

Covariances: boy; kol; omuz; kalca; bacak boy kol omuz kalca bacak boy 115,5228 kol 27,577 32,3215 omuz 83,9331 8,5619 15,521 kalca 85,7852 2,612 8,367 133,7383 bacak,16 22,8663 13,8137 57,63 7,356 Correlations: boy; kol; omuz; kalca; bacak boy kol omuz kalca kol,51 omuz,76,17 kalca,69,37,8 bacak,89,8,16,59 Matrix Plot of boy; kol; omuz; kalca; bacak 2 7 8 9 1 12 1 175 boy 15 12 kol 9 8 7 1 8 omuz 1 kalca 12 1 12 15 bacak 9 15 175 2 8 1 12 9 15 12

S-PLUS

*** Summary Statistics for data in: Veri3Ders *** V1 V2 V3 V V5 Min: 155. 65. 7. 85. 87. 1st Qu.: 165.25 72.25 9. 98.25 9.25 Mean: 17.1316 75.9737 93.897 17.7895 11.2632 Median: 177. 75.5 95.5 19.5 1. 3rd Qu.: 182.5 8. 99.75 11.75 16.5 Max: 195. 91. 117. 1. 119. Variance: 115.5228 32.3218 15.5213 133.7383 7.356 *** Covariances for data in: Veri3Ders *** V1 V2 V3 V V5 V1 115.52276 27.5768 83.9331 85.78521.155 V2 27.5768 32.32179 8.561878 2.612 22.86629 V3 83.9331 8.561878 15.5213 8.367 13.81366 V 85.78521 2.6122 8.367 133.73826 57.628 V5.155 22.866287 13.813656 57.628 7.356 *** Correlations for data in: Veri3Ders *** V1 V2 V3 V V5 V1 1..5126.762722.691616.892328 V2.5126 1..166199.373195.79533 V3.762722.166199 1..7778.1638 V.691616.373195.7778 1..593839 V5.892328.79533.1638.593839 1. 6 7 8 9 8 9 11112131 9 V1 19 18 17 16 15 8 7 V2 6 1 13 12 11 1 9 8 V3 V 12 11 1 9 8 7 6 12 11 V5 1 9 15 16 17 18 19 6 7 8 9 1 11 12 8 8 9 1 11 12

Veri: Ders Notları > # Kitle:isim_listesi, örneğe çıkan isimler: isimler=sample(isim_listesi, 12) > isimler=c("gül","yaprak","đrem","merve","esin","emre","hasan","ali","mert","ahmet","mehmet","can") #örnek > matnotu=c(67,75,5,3,92,95,35,8,6,15,25,5) > fiziknotu=c(85,7,6,2,1,9,25,8,25,2,2,15) > biyoloji=c(6,65,5,1,9,9,25,7,7,35,95,25) > tarih=c(55,65,75,5,85,95,6,7,8,5,9,6) > veri = data.frame(isimler,matnotu,fiziknotu,biyoloji,tarih) > veri isimler matnotu fiziknotu biyoloji tarih 1 Gül 67 85 6 55 2 Yaprak 75 7 65 65 3 Đrem 5 6 5 75 Merve 3 2 1 5 5 Esin 92 1 9 85 6 Emre 95 9 9 95 7 Hasan 35 25 25 6 8 Ali 8 8 7 7 9 Mert 6 25 7 8 1 Ahmet 15 2 35 5 11 Mehmet 25 2 95 9 12 Can 5 15 25 6 > cor(matnotu,biyoloji) [1].8752 > cor(veri$matnotu,veri$biyoloji) [1].8752 > cor(matnotu,fiziknotu) [1].983283

> X=matrix(cbind(matnotu,fiziknotu,biyoloji,tarih),ncol=) > X [,1] [,2] [,3] [,] [1,] 67 85 6 55 [2,] 75 7 65 65 [3,] 5 6 5 75 [,] 3 2 1 5 [5,] 92 1 9 85 [6,] 95 9 9 95 [7,] 35 25 25 6 [8,] 8 8 7 7 [9,] 6 25 7 8 [1,] 15 2 35 5 [11,] 25 2 95 9 [12,] 5 15 25 6 > boxplot(x) Notlarla ilgili yukarıdaki çıktıları yorumlayınız. Đsimler sütununa gerek varmıdır?

Kitle: Üç özellik: saç rengi, göz rengi, ten rengi Üç Boyutlu Veri (Üç Değişkenli Kitle Dağılımı) Veri: Sac Goz Ten siyah siyah beyaz sari mavi beyaz sari yesil beyaz kumral ela beyaz siyah ela esmer siyah siyah esmer kumral siyah kumral mavi esmer beyaz sari mavi beyaz sari yesil beyaz kumral ela kumral ela kumral yesil beyaz esmer beyaz kumral kahve esmer kumral kahve beyaz kumral mavi beyaz sari mavi beyaz kumral siyah beyaz siyah siyah esmer siyah mavi beyaz siyah siyah beyaz sari yesil beyaz kumral yesil kumral ela beyaz beyaz siyah ela beyaz kumral mavi beyaz sari mavi beyaz siyah kahve esmer kumral kahve beyaz kumral yesil beyaz sari mavi beyaz kumral ela esmer siyah siyah beyaz sari mavi beyaz siyah siyah beyaz

(Marjinal Dağılımlar ile ilgili betimlemeler.) Tally for Discrete Variables: Sac; Goz; Ten Sac Count CumCnt Percent CumPct Goz Count CumCnt Percent CumPct kumral 16 16 5,71 5,71 ela 7 7 2, 2, sari 9 25 25,71 71,3 kahve 11 11,3 31,3 siyah 1 35 28,57 1, mavi 1 21 28,57 6, N= 35 siyah 8 29 22,86 82,86 yesil 6 35 17,1 1, N= 35 Ten Count CumCnt Percent CumPct beyaz 27 27 77,1 77,1 esmer 8 35 22,86 1, N= 35 Saç ile göz renginin ortak dağılımı ile ilgili çapraz tablo (frekans tablosu).

Üç Boyutlu Serpilme Grafikleri (Sürekli Dağılımlardan Alınan Veriler)

3D Scatterplot of boy vs kol vs bacak 19 boy 18 17 16 9 7 1 11 bacak 12 8 9 kol 3D Scatterplot of kol vs omuz vs kalca 9 kol 8 7 1 kalca 12 1 8 12 1 omuz

Standartlaştırma Matlab Kodları: veri=[ ]; n=size(veri,1); p=size(veri,2); ort=mean(veri); S=cov(veri); veriortsap=(eye(n)-1/n*ones(n,n))*veri; veristand=veriortsap./kron(ones(n,1),(sqrt(diag(s)))')

>> n=size(veri,1); >>p=size(veri,2); >>ort=mean(veri); >>S=cov(veri); >>veriortsap=(eye(n)-1/n*ones(n,n))*veri; >> veristand=veriortsap./kron(ones(n,1),(sqrt(diag(s)))') >> veri=[ 18 77 98 12 11 163 66 72 9 97 183 73 99 113 91 16 86 7 95 12 166 7 91 15 98 165 91 78 1 1 162 8 72 11 115 191 8 15 1 117 178 76 95 97 92 195 78 11 11 1 187 82 17 17 11 185 81 16 113 9 177 75 92 12 1 17 7 9 111 1 175 75 93 111 1 181 77 93 117 15 188 81 117 15 113 18 8 97 12 17 178 7 96 13 96 178 76 96 11 11 167 71 97 99 9 168 68 9 96 1 18 78 97 19 12 18 79 99 121 19 177 7 95 111 18 186 8 11 115 99 163 68 13 98 89 155 65 8 93 9 171 75 9 11 9 155 68 8 85 98 156 7 86 95 87 167 8 1 97 95 165 72 85 1 93 168 71 85 116 15 178 75 97 128 111 186 83 13 12 19 185 79 1 13 119 16 7 95 95 9]; veristand =.9182.1852.3997 1.559 1.568-1.357-1.797-2.1316-1.5383 -.8.8251 -.518.97.56-1.195-1.318 1.7682-2.3263-1.159.1161 -.7566 -.325 -.2818 -.212 -.368 -.896 2.677-1.575 -.6736 -.122-1.1287 1.16-2.1316.1911 1.666 1.569.7128 1.812 2.7853 1.95.3599.93.176 -.933-1.762 1.916.361 1.568.1911 -.122 1.1973 1.66 1.2759 -.683 -.31 1.112.8887 1.1785.56 -.8377.2669 -.1666 -.185 1.17.355 -.122 -.325 -.3792.2776.355.88 -.1666 -.871.2776 -.122.639.1852 -.871.796.738 1.293.8887 2.295 -.212 1.276.56.7128.323 1.559.7122.3599 -.325.25 -.12 -.5993.3599.93.25.537 -.31 -.6635 -.872.323 -.76-1.316 -.575-1.3979 -.3792-1.195 -.122.56.361.323.17.1161.56.5369.97 1.123.957.2669 -.325.176.2776.831 1.12.7128.6918.6235 -.216-1.357-1.3979.8865 -.865-1.338-1.78-1.9256 -.9633-1.2789-1.316 -.291 -.1666 -.3792.1911-1.316-1.78-1.3979 -.9633-1.976 -.368-1.6869-1.61 -.7686-1.159-1.6723 -.6635.7128.59 -.933 -.7185 -.896 -.693 -.866 -.6736 -.9569 -.575 -.872 -.866.71.738.3599 -.1666.323 1.776 1.1891 1.12 1.25.8865 1.559.957 1.112.5369.59 -.12 2.129-1.318-1.61.176-1.159 -.8377

%veri:boy uzunluğu ile kol uzunluğu >>veri=veri(:,1:2); >>n=size(veri,1); >>p=size(veri,2); >>ort=mean(veri); >>S=cov(veri); >>veriortsap=(eye(n)-1/n*ones(n,n))*veri; >>veristand=veriortsap./kron(ones(n,1),(sqrt(diag(s)))'); >>[ veri veriortsap veristand] ans = 18. 77. 9.868 1.526.9182.1852 163. 66. -11.1316-9.97-1.357-1.797 183. 73. 8.868-2.97.8251 -.518 16. 86. -1.1316 1.526-1.318 1.7682 166. 7. -8.1316-1.97 -.7566 -.325 165. 91. -9.1316 15.526 -.896 2.677 162. 8. -12.1316 8.526-1.1287 1.16 191. 8. 16.868.526 1.569.7128 178. 76. 3.868.526.3599.93 195. 78. 2.868 2.526 1.916.361 187. 82. 12.868 6.526 1.1973 1.66 185. 81. 1.868 5.526 1.112.8887 177. 75. 2.868 -.97.2669 -.1666 17. 7. -.1316-1.97 -.122 -.325 175. 75..868 -.97.88 -.1666 181. 77. 6.868 1.526.639.1852 188. 81. 13.868 5.526 1.293.8887 18. 8. 5.868.526.56.7128 178. 7. 3.868-1.97.3599 -.325 178. 76. 3.868.526.3599.93 167. 71. -7.1316 -.97 -.6635 -.872 168. 68. -6.1316-7.97 -.575-1.3979 18. 78. 5.868 2.526.56.361 18. 79. 5.868 3.526.56.5369 177. 7. 2.868-1.97.2669 -.325 186. 8. 11.868.526 1.12.7128 163. 68. -11.1316-7.97-1.357-1.3979 155. 65. -19.1316-1.97-1.78-1.9256 171. 75. -3.1316 -.97 -.291 -.1666 155. 68. -19.1316-7.97-1.78-1.3979 156. 7. -18.1316-5.97-1.6869-1.61 167. 8. -7.1316.526 -.6635.7128 165. 72. -9.1316-3.97 -.896 -.693 168. 71. -6.1316 -.97 -.575 -.872 178. 75. 3.868 -.97.3599 -.1666 186. 83. 11.868 7.526 1.12 1.25 185. 79. 1.868 3.526 1.112.5369 16. 7. -1.1316-5.97-1.318-1.61

plot(veri(:,1),veri(:,2),'.') 95 9 85 8 75 7 65 155 16 165 17 175 18 185 19 195 figure;hold on;plot(veri(:,1),veri(:,2),'.') plot(veriortsap(:,1),veriortsap(:,2),'.g') 1 8 6 2-2 -5 5 1 15 2 figure;plot(veriortsap(:,1),veriortsap(:,2),'.g') 2 15 1 5-5 -1-15 -2-15 -1-5 5 1 15 2 25

hold on; plot(veristand(:,1),veristand(:,2),'.r') 2 15 1 5-5 -1-15 -2-15 -1-5 5 1 15 2 25 plot(veri(:,1),veri(:,2),'.') 1 8 6 2-2 -5 5 1 15 2

Đki Boyutlu Veri: Çubuk Grafiği ve Histogram Çubuk grafikleri, isimlendirme (nominal), sıralama (ordinal), oran, aralık ölçme düzeyinde gözlenen ve kitle dağılımı kesikli olan verilere uygulanır. Đki boyutlu veriler için çubuk grafiği, üç boyutlu bir koordinat sisteminde, yatay düzlemde veriler için hazırlanan çapraz tablo ve düşey eksende göze frekansları olacak şekilde kolayca görüntülenebilir. Aşağıdaki çapraz tablo için çubuk grafiği (d) dedir. 1 2 3 8 17 8 33 1 33 56 8 11 2 15 2 85 122 81 28 7 323 3 69 137 76 21 2 35 3 62 2 13 16 5 8 11 9 1 29 26 5 26 7 11 1, 1, 2, 3,, 5, (a) 3 2 1 (b) 5 1 12 1 3 8 6 2 1 2 1 2 3 5 3 2, 1, 2, 3,, (c) (d) Histogramlar, aralık ile oran ölçme düzeyinde (interval level of measurement, ratio level of measurement) gözlenen ve kitle dağılımı sürekli olan verilere uygulanır. Bir boyutlu verilerde histogram; sınıf aralıkları üzerinde yükseklikleri o sınıfın frekansı olan bitişik dikdörtgenlerden oluşmaktadır. Đki boyutlu veriler için histogram; tabanda eşit uzunluklu sınıf aralıklarının kartezyen çarpımı olan dikdörtgenler üzerinde, yükseklikleri o dikdörtgenin frekansı olan prizmalardan oluşturulabilir. Bu prizmaların üst yüzeylerinin konumları görsel etkiyi yaratmaktadır. 1 n = birimlik iki boyutlu (değişkenli) bir veri için serpilme diyagramı (a) da, SPSS de çizilen histogram (d) dedir. Diğer iki histogram bireysel değişkenlerin marjinal dağılımlar hakkında fikir vermektedirler.

, 3, 1 2, 8 1,, 6-1, -2, -3, 2 -, -3, -2, -1,, 1, 2, 3, -, -3, -2, -1,, 1, 2, 3, (a) (b) 1 8 6 2-3, -2, -1,, 1, 2, 3,, (c) (d) Matlab: Serpilme diyagramı >>plot(veri(:,1),veri(:,2),'.') Đki boyutlu veri için histogram cizimi (iki değişkenli dağılımdan alınan veri) >> veri=[ ]; >> hist3(veri) 3 2 1-1 -2-3 - -3-2 -1 1 2 3

*** Đst2 dersini alan öğrencilerin ağırlık ile boy uzunluğunun ortak dağılımının normal dağılım olduğu söylenebilir mi? *** Ortalamanın 173 (cm) ve 7 (kg) olduğu iddia edilmektedir. Bu iddiayı %5 anlam düzeyinde test ediniz.

Veri: Đki Değişkenli Düzgün Dağılım (simülasyon verisi) veri=rand(1,2); n=size(veri,1) k=1 [frx,sx]=hist(veri(:,1),k); [fry,sy]=hist(veri(:,2),k); for i=1:k for j=1:k x1=sx(i)-(sx(2)-sx(1))/2 ; x2=sx(i)+(sx(2)-sx(1))/2 ; y1=sy(j)-(sy(2)-sy(1))/2 ; y2=sy(j)+(sy(2)-sy(1))/2 ; frekans=; for ii=1:n if veri(ii,1)<x2 if veri(ii,1)>=x1 if veri(ii,2)<y2 if veri(ii,2)>=y1 frekans= frekans+1; end,end,end,end end frekanslar(i,j)=frekans; end end frekanslar frekanslar = 19 13 1 12 12 1 9 12 12 13 7 16 1 1 5 8 17 11 1 11 13 9 8 9 12 11 12 13 9 8 5 11 11 9 12 8 8 11 1 1 3 6 13 7 9 9 13 12 12 1 15 1 5 1 7 9 1 8 6 15 8 7 6 7 1 9 7 9 16 9 5 8 11 1 8 11 8 11 7 9 11 5 8 8 1 9 13 8 9 5 1 13 9 11 9 1 1 9 7 11 plot(veri(:,1),veri(:,2),'.');figure;hist3(veri)

Sürekli Dağılımlar Veri (Veri Bulutu) En Büyük Değişkenlik Gösteren Doğrultu (Birinci Temel Bileşen Ekseni) Değişkenliğin Betimlenmesi, Temel Bileşenler Đzdüşüm ve Temel Bileşenler clc;clear all;close all veri=mvnrnd([1 1],[9 5;5 ],5); plot(veri(:,1),veri(:,2),'.') ort=mean(veri) ort = 1.118 1.128 S=cov(veri) S = 8.5726.2552.2552 2.78 n=size(veri,1);p=size(veri,2); veriortsap=(eye(n)-1/n*ones(n,n))*veri; [veri veriortsap] ans = 8.723 8.1618-1.157-1.9663 5.32 7.933-5.117-2.227 1.376 1.772.258.622 1.863 12.355.75 2.2225 6.566 8.729-3.557-1.3851 13.5727 11.2733 3.58 1.153 13.5675 12.2 3.95 2.27 9.8871 8.8217 -.239-1.36 1.9819 1.5239.8639.3959 1.5239 1.2378.59.197 9.399 9.6889 -.6781 -.392 12.177 1.8582 2.59.732 8.2351 1.23-1.8829.12 16.596 11.5669 6.316 1.388 9.598 1.26 -.5272.118 1.318 11.181.2238 1.52 13.23 12.5861 3.823 2.58 1.1778 1.7376.599.696 9.7131 9.8852 -.9 -.229 7.53 9.3613-2.615 -.7667 1.8832 11.1196.7652.9916 5.9915 7.9 -.1265-2.6376 12.13 1.7732 2.25.652 1.877 12.3788.7527 2.258 7.927 7.2162-2.1933-2.9118 12.57 11.1713 2.56 1.32 13.762 12.229 3.6 2.929 5.2188 7.6918 -.8992-2.362 5.6771 9.193 -.9 -.9338 11.713 1.5639 1.595.359 8.83 1.225-1.3177 -.155 12.7 12.33 1.952 1.953 12.69 12.3996 2.3289 2.2715 12.1357 1.897 2.177 -.383 13.877 12.388 3.7528 2.2568 12.58 11.3773 1.8878 1.293 13.5725 1.876 3.55.726 6.3926 7.1755-3.725-2.9525 9.96 11.1635 -.177 1.355 9.5298 9.593 -.5881 -.536 5.1877 7.7576 -.933-2.375 1.7719 1.5261.6539.3981 6.836 7.5367-3.287-2.591 1.25 11.7399.127 1.6119 7.587 9.187-2.5333 -.979 11.5862 9.8311 1.682 -.297 1.658 11.2292.5 1.111 7.233 9.925-2.8837-1.355 3.88 5.738-6.63 -.653 9.822 9.677 -.2956 -.523

figure; plot(veri(:,1),veri(:,2),'.') figure; plot(veriortsap(:,1),veriortsap(:,2),'.g') 13 3 12 2 11 1 1 9-1 8-2 7 6 5 2 6 8 1 12 1 16 18-3 - -5-8 -6 - -2 2 6 8 figure; plot(veriortsap(:,1),veriortsap(:,2),'.g') ; hold on %dğrultu alfa=pi/; dog=[cos(alfa); sin(alfa)]; t=-1:.1:1; plot(t*cos(alfa),t*sin(alfa)) % izdüşüm matrisi P=dog*pinv(dog); Pveri=veriOrtSap*P; plot(pveri(:,1),pveri(:,2),'.r') 8 6 2-2 - -6-8 -8-6 - -2 2 6 8

alfa=pi/6;dog=[cos(alfa); sin(alfa)]; t=-1:.1:1; plot(t*cos(alfa),t*sin(alfa)) P=dog*pinv(dog); Pveri=veriOrtSap*P; plot(pveri(:,1),pveri(:,2),'.r') 8 6 2-2 - -6-8 -1-8 -6 - -2 2 6 8 1 figure;hold on;plot(veriortsap(:,1),veriortsap(:,2),'.g') for i=1:18 alfa=pi*i/18; dog=[cos(alfa); sin(alfa)]; P=dog*pinv(dog); t=-1:.1:1; plot(t*cos(alfa),t*sin(alfa)) Pveri=veriOrtSap*P; h=plot(pveri(:,1),pveri(:,2),'.r');set(h,'erasemode', 'none'); drawnow; end 1 8 6 2-2 - -6-8 -1-1 -8-6 - -2 2 6 8 1

>> X=veriOrtSap; >> [V D]=eig(X'*X) V =.676 -.8839 -.8839 -.676 D = 25.932 53.3656 Temel Bileşenler Ekseni figure; plot(veriortsap(:,1),veriortsap(:,2),'.g') hold on dog=v(:,2); t=-1:.1:1; plot(t*dog(1),t*dog(2)) P=dog*pinv(dog); Pveri=veriOrtSap*P; plot(pveri(:,1),pveri(:,2),'.r') 5 3 2 1-1 -2-3 - -5-1 -8-6 - -2 2 6 8 1

Diğer Bazı Grafiksel Betimlemeler Değişken Sayısı=12 Birim sayısı=1 >> veri =[ 1 1 2 3 3 1 1 1 2 1 1 1 2 2 3 1 2 2 3 1 2 2 1 3 1 1 1 3 2 1 1 1 3 2 2 1 2 2 2 3 6 8 6 7 1 8 12 12 9 8 9 9 3 6 6 6 11 9 1 11 7 8 9 9 12 1 1 1 6 9 7 7 11 11 11 12 8 8 1 9 8 9 1 1 1 11 8 8 1 1 6 9 9 8 1 1 8 7 9 8] >> plot(veri) 1 12 1 8 6 2 1 2 3 5 6 7 8 9 1 %paralel koordinatlar >> plot(veri') 1 12 1 8 6 2 2 6 8 1 12

%Andrews eğrileri clc ; clear all ; close all veri =[ 1 1 2 3 3 1 1 1 2 1 1 1 2 2 3 1 2 2 3 1 2 2 1 3 1 1 1 3 2 1 1 1 3 2 2 1 2 2 2 3 6 8 6 7 1 8 12 12 9 8 9 9 3 6 6 6 11 9 1 11 7 8 9 9 12 1 1 1 6 9 7 7 11 11 11 12 8 8 1 9 8 9 1 1 1 11 8 8 1 1 6 9 9 8 1 1 8 7 9 8]; v=veri(1,:); syms t A=[1/sqrt(2) sin(t) cos(t) sin(2*t) cos(2*t) sin(3*t) cos(3*t) sin(*t) cos(*t) sin(5*t) cos(5*t) sin(6*t)]; figure; hold on for j=1:12 v=veri(j,:); Av=sum(v.*A); deltat=.1; t=; for i=1:fix(2*pi/deltat) AW(i)=eval(Av); t=t+deltat; end tt=:deltat:fix(2*pi/deltat); plot(aw) end 1 8 6 2-2 - 1 2 3 5 6 7

Veri Merkezi ve Derinlik Kavramları (okuma parçasına bakınız) >> veri=mvnrnd([1 1],[9 5;5 ],1); % sanal veri, simülsyon verisi >> plot(veri(:,1),veri(:,2),'.') 16 1 12 1 8 6 2 6 8 1 12 1 16 18 >> ort=mean(veri) ort = 1.275 1.1257 >> hold on; >> plot(1.275,1.1257,'*') %veri ortalaması >> plot(1,1,'*r') % kitle ortalaması 16 1 12 1 8 6 2 6 8 1 12 1 16 18

Kitle Mahalonobis Uzaklığı: MahUzak = ( x µ ) Σ 1 ( x µ ) >> x=[15 15]; >> MahUzak=(x-[1 1])*pinv([9 5;5 ])*(x-[1 1])' MahUzak = 6.8182 >> x=[1 15]; >> MahUzak =(x-[1 1])*pinv([9 5;5 ])*(x-[1 1])' MahUzak = 2.55 >> plot(1,15,'*g') % yesil nokta (+) Mahalonobis Uzaklığı daha büyük >> plot(15,15,'*k') % siyah nokta (+) 16 1 12 1 8 6 2 6 8 1 12 1 16 18 2 1 % Örnek Mahalonobis Uzaklığı: >> S=cov(veri) S = 9.2736 5.3961 5.3961.133 MahUzak = ( x X ) ( S ) ( x X ) >> MahUzak=([1 15]-ort)*pinv(S)*([1 15]-ort)' MahUzak = 19.973 >> MahUzak =([15 15]-ort)*pinv(S)*([15 15]-ort)' MahUzak = 5.9527 >> mahal([15 15],veri) ans = 5.9527 >> mahal([1 15],veri) ans = 19.973

Mahalonobis Derinliği: 1 MD(F; x) = [ 1 +(x µ F ) Σ F (x µf )] 1 MD ˆ 1 (F; x) = 1+ (x X ) (S 2 ) 1 (x X ) X = n 1 n X k=1 k S ij = n 1 n ( X ik X i ) (X jk X j ), i, j = 1, 2,..., d k=1 S 2 = (S ij ) d d Maholonobis Uzaklığı >> MahUz_veri=mahal(veri,veri) Mahalonobis Derinlikleri >> MD=(1+MahUz_veri).^(-1) >> [MD_sort indis]=sort(md) MahUz_veri = MD = MD_sort = indis = 3.3952 3.616 1.8233 5.2 3.185 3.9 1.8636.18 1.3726 5.215 3.2716 2.9233.7596 1.5359 2.5823.376.576.577 1.7172.576.327 1.327.8992.3251 2.277.5215 2.7 2.616.3 1.1.2399 1.53 2.2688 2.8379.281.22.87 1.796 3.3852.372 6.755 2.27 1.359 6.332 5.8961.73.6695 1.928 6.999 1.825 1.389.1189 1.133 3.366 1.973.2275.2169.352.1553.2392.223.392.872.215.162.231.259.5683.393.2791.7275.6367.661.368.6861.759.269.5265.757.3118.1811.3325.2767.997.92.198.9.359.266.7788.83.1966.3637.228.961.129.2939.15.1369.15.5733.599.315.1251.3539.185.8937.1.2291.3362.993.112.1251.129.1369.15.159.1553.162.178.1811.198.1966.223.235.2169.2275.228.2291.2337.231.2387.2392.259.2563.266.268.276.2767.2791.286.2939.2958.332.359.3118.3325.3362.36.315.392.3539.352.3637.3663.368.393.9.15.16.1.185.215.269.28 6 93 9 1 5 58 1 1 26 31 37 6 96 2 1 39 5 68 11 85 5 12 87 3 7 98 28 15 65 2 69 67 33 25 27 55 91 8 7 5 3 38 83 19 1 32 3 61 53 51 9 22 75

.87.3177 5.553.372.195 1.353.9765.272 9.737 2.911.1871 2.2986 3.2785 2.3812 2.777.6778.7893.5656 1.3291 1.33.557.56 1.167.315.6357.617.197 1.7298.657 3.1897.9576 2.916.2.61.783 1.936.1583 7.8992.622.663 3.915 1.26 2.617.1215.652.6735.7589.159.723.988.16.559.77.993.286.82.332.2337.2958.268.596.5589.6387.29.28.973.956.628.762.611.628.912.3663.6228.2387.518.2563.712.685.567.36.8633.112.6839.6225.235.63.276.8916.178.29.63.628.92.559.518.5265.5589.567.5683.5733.596.599.611.628.6225.6228.6367.6387.661.6735.6839.685.6861.77.712.7275.723.757.759.7589.762.7788.83.82.872.8633.8916.8937.912.973.956.961.988.997 7 97 78 3 62 86 23 72 9 13 6 71 7 8 81 95 8 17 73 18 56 9 89 2 63 88 16 59 2 21 57 79 35 36 66 8 92 99 52 82 76 77 6 29 Merkezdeki gözlem (en derin): >> veri(29,:) ans = 1.356 1.23 En uzak gözlem): >> veri(6,:) ans = 8.188 12.2197 2 6 8 1 12 1 16 18 6 8 1 12 1 16

DD-çizitleri DD ˆ ˆ ( F, G) = {( Dˆ ( F; x), Dˆ ( G; x)) : x { X 1, X 2,..., Xn} { Y 1, Y 2,..., Ym }} DD ˆ ( F, G) = {( Dˆ ( F; x), D( G; x)) : x { X 1, X 2,..., X n }} DDˆ ( F, G) = {( D( F; x), Dˆ ( G; x)) : x { Y 1, Y 2,..., Y m }} Mahalonobis derinliğine dayalı DD-çizitleri >> veri2=rand(5,2)*1+5*ones(5,2); >> figure >> hold on >> plot(veri(:,1),veri(:,2),'.') >> plot(veri2(:,1),veri2(:,2),'.r') >> veri3=mvnrnd([1 1],[9 5;5 ],5); >> figure >> hold on >> plot(veri(:,1),veri(:,2),'.') >> plot(veri3(:,1),veri3(:,2),'.r') 16 16 1 1 12 12 1 1 8 8 6 6 2 6 8 1 12 1 16 18 >> DD1=[mahal(veri,veri);mahal(veri2,veri)]; >> DD2=[mahal(veri,veri2);mahal(veri2,veri2)]; >> figure;plot(dd1,dd2) 2 6 8 1 12 1 16 18 >> DD1=[mahal(veri,veri);mahal(veri3,veri)]; >> DD2=[mahal(veri,veri3);mahal(veri3,veri3)]; >> figure;plot(dd1,dd2) 12 1 8 6 1 9 8 7 6 5 2 5 1 15 2 25 3 35 3 2 1 1 2 3 5 6 7 8 9 1