İstatistik Laboratuvarı I Vize Ödevi Levent TERLEMEZ 30 Kasım 2016 İçindekiler 1 Soru 1 1.1 Veri Girişi............................................... 1 1.2 Boy Değişkeni............................................. 2 1.2.1 Karekök Metodu....................................... 2 1.2.2 Sturges Metodu........................................ 2 1.2.3 Rice Metodu......................................... 3 1.2.4 Scott Metodu......................................... 4 1.2.5 Freedman-Diaconis Metodu................................. 5 1.3 Vücut Ağırlığı Değişkeni....................................... 6 1.3.1 Karekök Metodu....................................... 6 1.3.2 Sturges Metodu........................................ 7 1.3.3 Rice Metodu......................................... 8 1.3.4 Scott Metodu......................................... 9 1.3.5 Freedman-Diaconis Metodu................................. 10 1.4 Vücut Kitle İndeksi Değişkeni.................................... 11 1.4.1 VKİ Değişkeninin Hesaplama................................ 11 1.4.2 Karekök Metodu....................................... 11 1.4.2.1 Histogram..................................... 12 1.4.3 Sturges Metodu........................................ 13 1.4.3.1 Histogram..................................... 14 1.4.4 Rice Metodu......................................... 15 1.4.4.1 Histogram..................................... 16 1.4.5 Scott Metodu......................................... 16 1.4.5.1 Histogram..................................... 17 1.4.6 Freedman-Diaconis Metodu................................. 17 1.4.6.1 Histogram..................................... 18 1 Soru Anadolu Üniversitesi öğrencileri arasında yapılan bir araştırmada, öğrencilerin boy (metre) ve vücut ağırlığı (kg) özellikleri de ölçülmüştür. Öğrencilerin bu özellikleri için, Karekök, Sturges, Rice, Scott ve Freedman-Diaconis metotlarını kullanarak, gruplandırılmış frekans serilerini oluşturunuz. Bu araştırmada, ayrıca öğrencilerin vücut kitle endeksleri de araştırma konusuna dail edilmiştir. Öğrencilerin vücut kitle endeks değerlerini de esaplayarak, Karekök, Sturges, Rice, Scott ve Freedman-Diaconis metotlarından istediğiniz bir tanesini kullanarak gruplandırılmış frekans serisini oluşturunuz ve istogramını çiziniz. 1.1 Veri Girişi veriler <- read.csv("clipboard", dec = ",", sep = "\t", eader = TRUE) ead(veriler, n = 5) 1
B.m VA.kg 1 1.58 48 2 1.68 52 3 1.76 52 4 1.70 62 5 1.62 57 1.2 Boy Değişkeni 1.2.1 Karekök Metodu Karekök metodu, k = n formülü ile sınıf sayısını (k) belirler. Sınıf aralığı () ise, değişim aralığının sınıf sayısına bölünmesi ile elde edilir; = R/k. k = ceiling(sqrt(lengt(veriler$b.m))) k [1] 10 = diff(range(veriler$b.m))/k = round(, 3) [1] 0.035 Boy değişkeni için sınıf sayısı 10, sınıf aralığı ise 0.035 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. <- seq(min(veriler$b.m), max(veriler$b.m), ) [1] 1.500 1.535 1.570 1.605 1.640 1.675 1.710 1.745 1.780 1.815 1.850 # Son sınıf üst limiti B.m değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(veriler$b.m)) <- c(, max() + ) [1] 1.500 1.535 1.570 1.605 1.640 1.675 1.710 1.745 1.780 1.815 1.850 [12] 1.885 1.2.2 Sturges Metodu Sturges metodu, k = log 2 n + 1 formülü ile sınıf sayısını (k) belirler. Sınıf aralığı () ise değişim aralığının sınıf sayısına bölünmesi ile elde edilir; = R/k. k = ceiling(log2(lengt(veriler$b.m))) + 1 k [1] 8 = diff(range(veriler$b.m))/k = round(, 3) [1] 0.044 2
Boy değişkeni için sınıf sayısı 8, sınıf aralığı ise 0.044 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. <- seq(min(veriler$b.m), max(veriler$b.m), ) [1] 1.500 1.544 1.588 1.632 1.676 1.720 1.764 1.808 # Son sınıf üst limiti B.m değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(veriler$b.m)) <- c(, max() + ) [1] 1.500 1.544 1.588 1.632 1.676 1.720 1.764 1.808 1.852 <- table(cut(veriler$b.m,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [1.5,1.54) [1.54,1.59) [1.59,1.63) [1.63,1.68) [1.68,1.72) [1.72,1.76) 2 6 22 17 22 15 [1.76,1.81) [1.81,1.85) 3 2 colnames() = c("b (m)", "Frekans") B (m) Frekans 1 [1.5,1.54) 2 2 [1.54,1.59) 6 3 [1.59,1.63) 22 4 [1.63,1.68) 17 5 [1.68,1.72) 22 6 [1.72,1.76) 15 7 [1.76,1.81) 3 8 [1.81,1.85) 2 1.2.3 Rice Metodu Rice metodu, k = 2n 1/3 formülü ile sınıf sayısını (k) belirler. Sınıf aralığı () ise değişim aralığının sınıf sayısına bölünmesi ile elde edilir; = R/k. k = ceiling(2 * lengt(veriler$b.m)^(1/3)) k [1] 9 = diff(range(veriler$b.m))/k = round(, 3) [1] 0.039 3
Boy değişkeni için sınıf sayısı 9, sınıf aralığı ise 0.039 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. <- seq(min(veriler$b.m), max(veriler$b.m), ) [1] 1.500 1.539 1.578 1.617 1.656 1.695 1.734 1.773 1.812 # Son sınıf üst limiti B.m değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(veriler$b.m)) <- c(, max() + ) [1] 1.500 1.539 1.578 1.617 1.656 1.695 1.734 1.773 1.812 1.851 <- table(cut(veriler$b.m,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [1.5,1.54) [1.54,1.58) [1.58,1.62) [1.62,1.66) [1.66,1.7) [1.7,1.73) 2 4 13 20 23 13 [1.73,1.77) [1.77,1.81) [1.81,1.85) 11 1 2 colnames() = c("b (m)", "Frekans") B (m) Frekans 1 [1.5,1.54) 2 2 [1.54,1.58) 4 3 [1.58,1.62) 13 4 [1.62,1.66) 20 5 [1.66,1.7) 23 6 [1.7,1.73) 13 7 [1.73,1.77) 11 8 [1.77,1.81) 1 9 [1.81,1.85) 2 1.2.4 Scott Metodu Scott metodu, = 3.5ˆσ/n 1/3 formülü ile sınıf aralığını () belirler. Sınıf sayısı (k) da esaplanmak istenir ise değişim aralığının sınıf aralığına bölünmesi ile elde edilebilir; k = R/. = 3.5 * sqrt(var(veriler$b.m))/lengt(veriler$b.m)^(1/3) = round(, 3) [1] 0.051 Boy değişkeni için sınıf aralığı ise 0.051 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. 4
<- seq(min(veriler$b.m), max(veriler$b.m), ) [1] 1.500 1.551 1.602 1.653 1.704 1.755 1.806 # Son sınıf üst limiti B.m değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(veriler$b.m)) <- c(, max() + ) [1] 1.500 1.551 1.602 1.653 1.704 1.755 1.806 1.857 <- table(cut(veriler$b.m,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [1.5,1.55) [1.55,1.6) [1.6,1.65) [1.65,1.7) [1.7,1.75) [1.75,1.81) 3 14 22 27 16 5 [1.81,1.86) 2 colnames() = c("b (m)", "Frekans") B (m) Frekans 1 [1.5,1.55) 3 2 [1.55,1.6) 14 3 [1.6,1.65) 22 4 [1.65,1.7) 27 5 [1.7,1.75) 16 6 [1.75,1.81) 5 7 [1.81,1.86) 2 1.2.5 Freedman-Diaconis Metodu Freedman-Diaconis metodu, = 2 IQR(x)/n 1/3 sınıf aralığını () belirler. Sınıf sayısı (k) da esaplanmak istenir ise değişim aralığının sınıf aralığına bölünmesi ile elde edilebilir; k = R/. = 2 * IQR(veriler$B.m)/lengt(veriler$B.m)^(1/3) = round(, 3) [1] 0.04 Boy değişkeni için sınıf aralığı ise 0.04 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. <- seq(min(veriler$b.m), max(veriler$b.m), ) [1] 1.50 1.54 1.58 1.62 1.66 1.70 1.74 1.78 1.82 5
# Son sınıf üst limiti B.m değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(veriler$b.m)) <- c(, max() + ) [1] 1.50 1.54 1.58 1.62 1.66 1.70 1.74 1.78 1.82 1.86 <- table(cut(veriler$b.m,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [1.5,1.54) [1.54,1.58) [1.58,1.62) [1.62,1.66) [1.66,1.7) [1.7,1.74) 2 4 13 20 23 13 [1.74,1.78) [1.78,1.82) [1.82,1.86) 11 1 2 colnames() = c("b (m)", "Frekans") B (m) Frekans 1 [1.5,1.54) 2 2 [1.54,1.58) 4 3 [1.58,1.62) 13 4 [1.62,1.66) 20 5 [1.66,1.7) 23 6 [1.7,1.74) 13 7 [1.74,1.78) 11 8 [1.78,1.82) 1 9 [1.82,1.86) 2 1.3 Vücut Ağırlığı Değişkeni 1.3.1 Karekök Metodu Karekök metodu, k = n formülü ile sınıf sayısını (k) belirler. Sınıf aralığı () ise değişim aralığının sınıf sayısına bölünmesi ile elde edilir; = R/k. k = ceiling(sqrt(lengt(veriler$va.kg))) k [1] 10 = diff(range(veriler$va.kg))/k = round(, 3) [1] 3.8 Vücut ağırlığı değişkeni için sınıf sayısı 10, sınıf aralığı ise 3.38 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. 6
<- seq(min(veriler$va.kg), max(veriler$va.kg), ) [1] 39.0 42.8 46.6 50.4 54.2 58.0 61.8 65.6 69.4 73.2 77.0 # Son sınıf üst limiti VA.kg değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(veriler$va.kg)) <- c(, max() + ) [1] 39.0 42.8 46.6 50.4 54.2 58.0 61.8 65.6 69.4 73.2 77.0 80.8 <- table(cut(veriler$va.kg,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [39,42.8) [42.8,46.6) [46.6,50.4) [50.4,54.2) [54.2,58) [58,61.8) 1 3 9 18 13 14 [61.8,65.6) [65.6,69.4) [69.4,73.2) [73.2,77) [77,80.8) 13 7 5 5 1 colnames() = c("va (kg)", "Frekans") VA (kg) Frekans 1 [39,42.8) 1 2 [42.8,46.6) 3 3 [46.6,50.4) 9 4 [50.4,54.2) 18 5 [54.2,58) 13 6 [58,61.8) 14 7 [61.8,65.6) 13 8 [65.6,69.4) 7 9 [69.4,73.2) 5 10 [73.2,77) 5 11 [77,80.8) 1 1.3.2 Sturges Metodu Sturges metodu,k = log 2 n + 1 formülü ile sınıf sayısını (k) belirler. Sınıf aralığı () ise değişim aralığının sınıf sayısına bölünmesi ile elde edilir; = R/k. k = ceiling(log2(lengt(veriler$va.kg))) + 1 k [1] 8 = diff(range(veriler$va.kg))/k = round(, 3) [1] 4.75 7
Vücut ağırlığı değişkeni için sınıf sayısı 8, sınıf aralığı ise 4.75 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. <- seq(min(veriler$va.kg), max(veriler$va.kg), ) [1] 39.00 43.75 48.50 53.25 58.00 62.75 67.50 72.25 77.00 # Son sınıf üst limiti VA.kg değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(veriler$va.kg)) <- c(, max() + ) [1] 39.00 43.75 48.50 53.25 58.00 62.75 67.50 72.25 77.00 81.75 <- table(cut(veriler$va.kg,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [39,43.8) [43.8,48.5) [48.5,53.2) [53.2,58) [58,62.8) [62.8,67.5) 1 6 20 17 19 11 [67.5,72.2) [72.2,77) [77,81.8) 9 5 1 colnames() = c("va (kg)", "Frekans") VA (kg) Frekans 1 [39,43.8) 1 2 [43.8,48.5) 6 3 [48.5,53.2) 20 4 [53.2,58) 17 5 [58,62.8) 19 6 [62.8,67.5) 11 7 [67.5,72.2) 9 8 [72.2,77) 5 9 [77,81.8) 1 1.3.3 Rice Metodu Rice metodu, k = 2n 1/3 formülü ile sınıf sayısını (k) belirler. Sınıf aralığı () ise değişim aralığının sınıf sayısına bölünmesi ile elde edilir; = R/k. k = ceiling(2 * lengt(veriler$va.kg)^(1/3)) k [1] 9 = diff(range(veriler$va.kg))/k = round(, 3) [1] 4.222 8
Vücut ağırlığı değişkeni için sınıf sayısı 9, sınıf aralığı ise 4.222 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. <- seq(min(veriler$va.kg), max(veriler$va.kg), ) [1] 39.000 43.222 47.444 51.666 55.888 60.110 64.332 68.554 72.776 76.998 # Son sınıf üst limiti VA.kg değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(veriler$va.kg)) <- c(, max() + ) [1] 39.000 43.222 47.444 51.666 55.888 60.110 64.332 68.554 72.776 76.998 [11] 81.220 <- table(cut(veriler$va.kg,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [39,43.2) [43.2,47.4) [47.4,51.7) [51.7,55.9) [55.9,60.1) [60.1,64.3) 1 5 9 21 22 10 [64.3,68.6) [68.6,72.8) [72.8,77) [77,81.2) 8 7 5 1 colnames() = c("va (kg)", "Frekans") VA (kg) Frekans 1 [39,43.2) 1 2 [43.2,47.4) 5 3 [47.4,51.7) 9 4 [51.7,55.9) 21 5 [55.9,60.1) 22 6 [60.1,64.3) 10 7 [64.3,68.6) 8 8 [68.6,72.8) 7 9 [72.8,77) 5 10 [77,81.2) 1 1.3.4 Scott Metodu Scott metodu, = 3.5ˆσ/n 1/3 formülü ile sınıf aralığını () belirler. Sınıf sayısı (k) da esaplanmak istenir ise değişim aralığının sınıf aralığına bölünmesi ile elde edilebilir; k = R/. = 3.5 * sqrt(var(veriler$va.kg))/lengt(veriler$va.kg)^(1/3) = round(, 3) [1] 6.429 Vücut ağırlığı değişkeni için sınıf aralığı ise 6.429 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. 9
<- seq(min(veriler$va.kg), max(veriler$va.kg), ) [1] 39.000 45.429 51.858 58.287 64.716 71.145 # Son sınıf üst limiti VA.kg değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(veriler$va.kg)) <- c(, max() + ) [1] 39.000 45.429 51.858 58.287 64.716 71.145 77.574 <- table(cut(veriler$va.kg,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [39,45.4) [45.4,51.9) [51.9,58.3) [58.3,64.7) [64.7,71.1) [71.1,77.6) 3 12 33 20 13 8 colnames() = c("va (kg)", "Frekans") VA (kg) Frekans 1 [39,45.4) 3 2 [45.4,51.9) 12 3 [51.9,58.3) 33 4 [58.3,64.7) 20 5 [64.7,71.1) 13 6 [71.1,77.6) 8 1.3.5 Freedman-Diaconis Metodu Freedman-Diaconis metodu, = 2 IQR(x)/n 1/3 formülü ile sınıf aralığını () belirler. Sınıf sayısı (k) da esaplanmak istenir ise değişim aralığının sınıf aralığına bölünmesi ile elde edilebilir; k = R/. = 2 * IQR(veriler$VA.kg)/lengt(veriler$VA.kg)^(1/3) = round(, 3) [1] 5.375 Vücut ağırlığı değişkeni için sınıf aralığı ise 5.375 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. <- seq(min(veriler$va.kg), max(veriler$va.kg), ) [1] 39.000 44.375 49.750 55.125 60.500 65.875 71.250 76.625 10
# Son sınıf üst limiti VA.kg değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(veriler$va.kg)) <- c(, max() + ) [1] 39.000 44.375 49.750 55.125 60.500 65.875 71.250 76.625 82.000 <- table(cut(veriler$va.kg,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [39,44.4) [44.4,49.8) [49.8,55.1) [55.1,60.5) [60.5,65.9) [65.9,71.2) 2 8 26 22 13 10 [71.2,76.6) [76.6,82) 7 1 colnames() = c("va (kg)", "Frekans") VA (kg) Frekans 1 [39,44.4) 2 2 [44.4,49.8) 8 3 [49.8,55.1) 26 4 [55.1,60.5) 22 5 [60.5,65.9) 13 6 [65.9,71.2) 10 7 [71.2,76.6) 7 8 [76.6,82) 1 1.4 Vücut Kitle İndeksi Değişkeni 1.4.1 VKİ Değişkeninin Hesaplama Vücut kitle indeksi aşağıdaki formül yardımıyla esaplanır: V KI = V A/B 2 # data.frame R nesnesinin içerdiği değişkenlere formülde kullanılan iki # şekilde de erişilebilir. Siz de satır ve sütün için tam tersini deneyiniz. vki <- veriler[, 2]/veriler$B.m^2 ead(vki, n = 5) [1] 19.22769 18.42404 16.78719 21.45329 21.71925 1.4.2 Karekök Metodu Karekök metodu,k = n formülü ile sınıf sayısını (k) belirler. Sınıf aralığı () ise değişim aralığının sınıf sayısına bölünmesi ile elde edilir; = R/k. 11
k = ceiling(sqrt(lengt(vki))) k [1] 10 = diff(range(vki))/k = round(, 3) [1] 1.172 Vücut kitle indeksi değişkeni için sınıf sayısı 10, sınıf aralığı ise 3.38 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. <- seq(min(vki), max(vki), ) [1] 15.23437 16.40637 17.57837 18.75037 19.92237 21.09437 22.26637 [8] 23.43837 24.61037 25.78237 # Son sınıf üst limiti vki değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(vki)) <- c(, max() + ) [1] 15.23437 16.40637 17.57837 18.75037 19.92237 21.09437 22.26637 [8] 23.43837 24.61037 25.78237 26.95437 <- table(cut(vki,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [15.2,16.4) [16.4,17.6) [17.6,18.8) [18.8,19.9) [19.9,21.1) [21.1,22.3) 1 3 6 23 17 17 [22.3,23.4) [23.4,24.6) [24.6,25.8) [25.8,27) 7 7 6 2 colnames() = c("vki", "Frekans") VKİ Frekans 1 [15.2,16.4) 1 2 [16.4,17.6) 3 3 [17.6,18.8) 6 4 [18.8,19.9) 23 5 [19.9,21.1) 17 6 [21.1,22.3) 17 7 [22.3,23.4) 7 8 [23.4,24.6) 7 9 [24.6,25.8) 6 10 [25.8,27) 2 1.4.2.1 Histogram 12
ist(vki, breaks =, rigt = FALSE, col = "red", xlab = "vki", ylab = "f", axes = F, main = "Vücut Kitler İndeksi (Karekök)") axis(1, pos = 0, at =, labels = round(, 1)) axis(2, las = 1) Vücut Kitler Indeksi (Karekök) f 20 15 10 5 0 15.2 17.6 19.9 22.3 24.6 27 vki 1.4.3 Sturges Metodu Sturges metodu,k = log 2 n + 1 formülü ile sınıf sayısını (k) belirler. Sınıf aralığı () ise değişim aralığının sınıf sayısına bölünmesi ile elde edilir; = R/k. k = ceiling(log2(lengt(vki))) + 1 k [1] 8 = diff(range(vki))/k = round(, 3) [1] 1.465 Vücut kitle indeksi değişkeni için sınıf sayısı 8, sınıf aralığı ise 4.75 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. <- seq(min(vki), max(vki), ) [1] 15.23437 16.69937 18.16437 19.62937 21.09437 22.55937 24.02437 25.48937 # Son sınıf üst limiti vki değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(vki)) <- c(, max() + ) [1] 15.23437 16.69937 18.16437 19.62937 21.09437 22.55937 24.02437 25.48937 [9] 26.95437 13
<- table(cut(vki,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [15.2,16.7) [16.7,18.2) [18.2,19.6) [19.6,21.1) [21.1,22.6) [22.6,24) 1 5 22 22 17 10 [24,25.5) [25.5,27) 10 2 colnames() = c("vki", "Frekans") VKİ Frekans 1 [15.2,16.7) 1 2 [16.7,18.2) 5 3 [18.2,19.6) 22 4 [19.6,21.1) 22 5 [21.1,22.6) 17 6 [22.6,24) 10 7 [24,25.5) 10 8 [25.5,27) 2 1.4.3.1 Histogram ist(vki, breaks =, rigt = FALSE, col = "red", xlab = "vki", ylab = "f", axes = F, main = "Vücut Kitler İndeksi (Sturges)") axis(1, pos = 0, at =, labels = round(, 1)) axis(2, las = 1) Vücut Kitler Indeksi (Sturges) f 20 15 10 5 0 15.2 18.2 21.1 24 27 vki 14
1.4.4 Rice Metodu Rice metodu, k = 2n 1/3 formülü ile sınıf sayısını (k) belirler. Sınıf aralığı () ise değişim aralığının sınıf sayısına bölünmesi ile elde edilir; = R/k. k = ceiling(2 * lengt(vki)^(1/3)) k [1] 9 = diff(range(vki))/k = round(, 3) [1] 1.302 Vücut kitle indeksi değişkeni için sınıf sayısı 9, sınıf aralığı ise 4.222 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. <- seq(min(vki), max(vki), ) [1] 15.23437 16.53637 17.83837 19.14037 20.44237 21.74437 23.04637 [8] 24.34837 25.65037 26.95237 # Son sınıf üst limiti vki değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(vki)) <- c(, max() + ) [1] 15.23437 16.53637 17.83837 19.14037 20.44237 21.74437 23.04637 [8] 24.34837 25.65037 26.95237 28.25437 <- table(cut(vki,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [15.2,16.5) [16.5,17.8) [17.8,19.1) [19.1,20.4) [20.4,21.7) [21.7,23) 1 4 12 22 20 12 [23,24.3) [24.3,25.7) [25.7,27) [27,28.3) 9 7 1 1 colnames() = c("vki", "Frekans") VKİ Frekans 1 [15.2,16.5) 1 2 [16.5,17.8) 4 3 [17.8,19.1) 12 4 [19.1,20.4) 22 5 [20.4,21.7) 20 6 [21.7,23) 12 7 [23,24.3) 9 8 [24.3,25.7) 7 9 [25.7,27) 1 15
10 [27,28.3) 1 1.4.4.1 Histogram ist(vki, breaks =, rigt = FALSE, col = "red", xlab = "vki", ylab = "f", axes = F, main = "Vücut Kitler İndeksi (Rice)") axis(1, pos = 0, at =, labels = round(, 1)) axis(2, las = 1) Vücut Kitler Indeksi (Rice) f 20 15 10 5 0 15.2 17.8 20.4 23 25.7 28.3 vki 1.4.5 Scott Metodu Scott metodu, = 3.5ˆσ/n 1/3 formülü ile sınıf aralığını () belirler. Sınıf sayısı (k) da esaplanmak istenir ise değişim aralığının sınıf aralığına bölünmesi ile elde edilebilir; k = R/. = 3.5 * sqrt(var(vki))/lengt(vki)^(1/3) = round(, 3) [1] 1.814 Vücut kitle indeksi değişkeni için sınıf aralığı ise 6.429 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. <- seq(min(vki), max(vki), ) [1] 15.23437 17.04837 18.86237 20.67637 22.49037 24.30437 26.11837 # Son sınıf üst limiti vki değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(vki)) <- c(, max() + ) [1] 15.23437 17.04837 18.86237 20.67637 22.49037 24.30437 26.11837 27.93237 16
<- table(cut(vki,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [15.2,17) [17,18.9) [18.9,20.7) [20.7,22.5) [22.5,24.3) [24.3,26.1) 2 11 29 25 11 9 [26.1,27.9) 2 colnames() = c("vki", "Frekans") VKİ Frekans 1 [15.2,17) 2 2 [17,18.9) 11 3 [18.9,20.7) 29 4 [20.7,22.5) 25 5 [22.5,24.3) 11 6 [24.3,26.1) 9 7 [26.1,27.9) 2 1.4.5.1 Histogram ist(vki, breaks =, rigt = FALSE, col = "red", xlab = "vki", ylab = "f", axes = F, main = "Vücut Kitler İndeksi (Scott)") axis(1, pos = 0, at =, labels = round(, 1)) axis(2, las = 1) Vücut Kitler Indeksi (Scott) f 30 25 20 15 10 5 0 15.2 18.9 22.5 26.1 vki 1.4.6 Freedman-Diaconis Metodu Freedman-Diaconis metodu, = 2 IQR(x)/n 1/3 formülü ile sınıf aralığını () belirler. Sınıf sayısı (k) da esaplanmak istenir ise değişim aralığının sınıf aralığına bölünmesi ile elde edilebilir; k = R/. 17
= 2 * IQR(vki)/lengt(vki)^(1/3) = round(, 3) [1] 1.174 Vücut kitle indeksi değişkeni için sınıf aralığı ise 5.375 olarak esaplanmıştır. Buna göre sınıflar ve sınıf frekansları şu şekilde elde edilecektir. <- seq(min(vki), max(vki), ) [1] 15.23437 16.40837 17.58237 18.75637 19.93037 21.10437 22.27837 [8] 23.45237 24.62637 25.80037 # Son sınıf üst limiti vki değişkeni maksimum değerini içeriyor mu? # İçermiyor ise bir sınıf daa oluşturulur. if (max() <= max(vki)) <- c(, max() + ) [1] 15.23437 16.40837 17.58237 18.75637 19.93037 21.10437 22.27837 [8] 23.45237 24.62637 25.80037 26.97437 <- table(cut(vki,, rigt = FALSE)) # rigt=false sınıf üst limitine eşit değerlerin bir sonraki sınıfa dail [15.2,16.4) [16.4,17.6) [17.6,18.8) [18.8,19.9) [19.9,21.1) [21.1,22.3) 1 3 6 23 17 17 [22.3,23.5) [23.5,24.6) [24.6,25.8) [25.8,27) 7 7 6 2 colnames() = c("vki", "Frekans") VKİ Frekans 1 [15.2,16.4) 1 2 [16.4,17.6) 3 3 [17.6,18.8) 6 4 [18.8,19.9) 23 5 [19.9,21.1) 17 6 [21.1,22.3) 17 7 [22.3,23.5) 7 8 [23.5,24.6) 7 9 [24.6,25.8) 6 10 [25.8,27) 2 1.4.6.1 Histogram ist(vki, breaks =, rigt = FALSE, col = "red", xlab = "vki", ylab = "f", axes = F, main = "Vücut Kitler İndeksi (FD)") axis(1, pos = 0, at =, labels = round(, 1)) axis(2, las = 1) 18
Vücut Kitler Indeksi (FD) f 20 15 10 5 0 15.2 17.6 19.9 22.3 24.6 27 vki 19