Verilerin Düzenlenmesi İstatistiksel verileri anlamlı hale getirmenin 5 ayrı yolu: 1. Sözel ifadelerle açıklama 2. Tablolar halinde düzenleme 3. Seriler halinde düzenleme 4. Grafiklerle gösterme 5. Bu yöntemlerde birkaçını birlikte uygulama 1
Verilerin Düzenlenmesi Hangi yöntemlerle elde edilirse edilsin elimize ulaşan veriler ham veri olarak adlandırılır ve bu verilerin analize uygun hale getirilmeleri için düzenlenmeleri gereklidir. Seri, istatistiksel gözlemle elde edilen verilerin belirli kurallara göre sıralanmış halidir. Zaman serileri, verilerin yıl, ay, hafta ve gün şıklarına göre sıralanmış serilerdir. Mekan serileri, verilerin ülke, bölge, kent ve köy şıklarına göre sıralanması ile elde edilen serilerdir. Dağılma serileri, zaman ve mekan değişkenlerinin dışında kalan tüm maddi değişkenlerin sınıflandırılması ve gruplandırılması ile elde edilen serilerdir. 2
Dağılma serileri Basit Seri, Frekans Seri, Sınıflanmış veya gruplanmış seri olarak 3 grupta incelenir. 1.Basit Seri: Elde edilen ham verinin küçükten büyüğe yada büyükten küçüğe sıralanmasıyla elde edilen serilerdir. Örnek: Herhangi bir market kasasından yapılan 10 alışverişin TL olarak değerleri Tabloda görülmektedir. 3.4 5.3 10.8 5.3 2.0 3.4 3.9 9.1 1.8 5.3 Mevcut veriler basit seri olarak düzenlenirse : 1.8 2.0 3.4 3.4 3.9 5.3 5.3 5.3 9.1 10.8 3
2. Frekans Seri: Herhangi bir nicel değerin veya niteliğin ana kütlede veya örneklemde kaç kez tekrarlandığını gösterir. İncelenecek birim sayısının artması ile basit seriler yan yana veya alt alta yazılmış uzun sayı dizileri oluşturacaktır. Böyle bir durumda çalışma kolaylığı açısından frekans serileri düzenlenir. Frekans serilerinin, değişkenin çok sayıda farklı değer almadığı fakat aynı değerlerin çok sayıda tekrarlandığı durumlarda düzenlenmeleri daha uygundur. Basit seri için verilen örnek frekans serisi olarak düzenlenirse: Değerler (x) 1.8 2.0 3.4 3.9 5.3 9.1 10.8 Frekanslar (f) 1 1 2 1 3 1 1 4
Örnek: Bir sınıftaki 100 öğrencinin ağırlıkları belirlenmiş ve ham veriler tablo olarak verilmiştir. Verileri frekans serisi olarak düzenleyiniz? 48 48 49 50 50 50 50 49 51 51 51 52 52 51 48 52 51 50 50 50 50 48 48 48 48 48 51 51 52 49 49 49 49 50 52 51 50 48 49 52 50 50 52 48 48 48 48 48 51 48 50 48 48 48 50 50 51 48 49 49 49 49 50 49 49 50 49 51 49 49 49 49 50 49 50 49 50 50 49 49 49 49 50 50 50 50 50 51 51 50 50 51 50 50 51 51 50 52 50 49 5
6
3.Gruplanmış (Sınıflanmış) Seri: İncelenecek birim sayısının çok olması ve değişkenin birbirinden farklı çok sayıda değer alması durumunda frekans serileri de basit seriler gibi uzun sayı dizileri şekline dönüşürler. Böyle durumlarda gruplandırılmış seriler oluşturulur. Gruplama yada sınıflama işlemi yapılırken dikkat edilmesi gereken araştırmanın özellikleri ve sınıflama işleminin neden olduğu sapmalardır. Sınıf sayısının genellikle dörtten az sekizden çok olması istenmez. (İncelenen konuya göre sınıf sayısı 5-20 arasında da seçilebilmektedir). Sturges formülü ile sınıf sayısı (k)= 1+3.322 log n n: terim sayısı 7
8
SINIF SINIRLARININ BELİRLENMESİ İncelenen değişkenle ilgili daha önce yapılmış uygun bir sınıflandırma varsa, aynı sınıf sınırları kullanılabilir. Aksi halde sınıf sınırlarının yeniden belirlenmesi gerekir. Bu amaçla sırasıyla şu işlemler yapılır; 1. Dağılım aralığı (R) belirlenir (en büyük değer ile en küçük değer arasındaki fark). 2. R değeri bir kez 8 e, bir kez de 15 e bölünür. 3. Bulunan bu iki değer arasındaki herhangi bir uygun değer sınıf aralığı (C) olarak alınırsa, 8-15 arasında sınıf elde edilir. 4. Dağılımdaki en küçük değer ilk sınıfın alt sınırı olarak alınır. 5. Bu alt sınıra sınıf aralığına uygun ilaveler yapılarak, diğer sınıfların alt ve üst sınırları belirlenir. 6. Bu işleme, dağılımdaki en büyük değer kapsanıncaya kadar devam edilir. 9
Sınıf aralığı (C) 10
11
12
13
14
Sınıf sayısı (k) için 2. yöntem: =R/ k 15
16
Gruplama Yapılırken Sınıf Aralığının (C) Hesaplanması: Yaklaşık sınıf aralığı = en büyük değer - en küçük değer sınıf sayısı Gruplanmış Serilerde Sınıf Orta Noktasının Hesaplanması: Sınıf Orta Noktası = ( Sınıf alt sınırı + sınıf üst sınırı) / 2 17
Örnek: Verilen frekans serisini gruplanmış seri olarak düzenleyiniz. Frekans Serisi Gruplanmış Seri x i f i sınıflar fi 0 3 0-2 den az 7 1 4 2-4 den az 11 2 5 4-6 dan az 2 3 6 6-8 den az 1 5 2 8-10 dan az 1 6 1 22 8 1 18
Birikimli (Kümülatif) Frekans: Bazı istatistiksel araştırmalarda, bir frekans serisinde veya sınıflı seride belirli bir değerden daha küçük veya daha büyük değer alan birim sayısının belirlenmesi gerekebilir. Birikimli frekanslar seride belirli bir değerden daha küçük veya daha büyük değer alan birim sayısının belirlenmesi için kullanılabilir. Birikimli frekans dağılımları; değişkenin aldığı değerlerde bir düzenleme yapılarak değil; frekanslarda bir değişiklik yapılarak elde edilir. Xi f i Artan birikimli frekanslar X 1 f 1 f 1= F 1 X 2 f 2 f 1+ f 2= F 1+ f 2 = F 2 X 3 f 3 f 1+ f 2+ f 3= F 2+ f 3= F 3 X 4 f 4 f 1+ f 2+ f 3+ f 4= F 3+ f 4= F 4 X n f n f 1+ f 2+ f 3+ f 4+.+ f n= F n-1+ f n= F n 19
Kümülatif frekans dağılımlarının en önemli özellikleri belirli bir düzeyin altında veya üstünde bulunan birimlerin frekansını gösterebilmeleridir. Kümülatif frekans dağılımları, sınıf aralıkları farklı olan serilerin kıyaslanmasını kolaylaştırır. Kıyaslamanın sağlıklı olabilmesi için önceden mutlak frekansların nisbi frekanslara çevrilmesi gerekir. 20
21
Örnek: Verilen seride artan birikimli frekansları hesaplayınız? x i f i Artan birikimli frekanslar 0 3 3 =3 1 4 3+4 =7 2 5 7+5 =12 3 6 12+6 =18 4 3 18+3 =21 5 2 21+2 =23 6 1 23+1 =24 8 1 24+1 =25 22
Bir sınıfın Nisbi frekansı, o sınıfın frekansının toplam frekansa oranlanmasıyla bulunur. 23
Örnek: Tablodaki ham verileri frekans serisi ve 5 sınıflı bir gruplanmış seri şeklinde düzenleyiniz. 3 7 8 4 7 8 3 9 0 9 3 8 4 8 8 2 9 3 7 7 0 1 8 3 0 9 8 9 5 8 8 9 9 4 6 5 4 8 8 6 7 0 0 2 8 7 4 8 7 6 8 7 6 3 6 6 2 8 0 1 2 1 7 3 6 4 7 7 3 8 9 9 2 8 4 0 8 7 3 6 5 9 8 8 2 0 9 4 8 5 7 8 8 8 1 0 3 9 8 4 24
X i f i 0 9 1 4 2 6 3 10 4 9 5 4 6 8 7 13 8 25 9 12 Top. 100 Sınıflar f i 0 2 den az 13 2 4 den az 16 4 6 dan az 13 6 8 den az 21 8 10 dan az 37 Toplam 100 Frekans serisi incelendiğinde en küçük değerin 0, en büyük değerin 9 olduğu ve en çok tekrarlanan değerin en yüksek frekansa sahip olan 8 olduğu belirtilebilir. en büyük değer - en küçük değer Yaklaşık sınıf aralığı = sınıf sayısı = (9-0) / 5 = 1.8 2 25
Örnek: Aşağıdaki frekans serisini 2 eşit aralıklı gruplanmış seri şekline çeviriniz. X i f i Sınıflar f i 0 3 1 4 2 5 3 6 5 2 6 1 Top. 21 0 2 den az 7 2 4 den az 11 4 6 dan az 2 6 8 den az 1 Toplam 21 26
Örnek: Sınıflar f i m i 0 10 dan az 2 (0+10)/2=5 10 20 den az 6 (10+20)/2=15 20 30 dan az 12 25 30 40 an az 25 35 40 50 en az 3 45 (Sınıf Orta Noktası) mi alt limit üst limit 2 Not: Sınıf orta noktaları (m i ) arasındaki farklar sınıf aralığına eşittir. 27
Örnek. Aşağıdaki tabloyu nisbi frekans tablosu haline dönüştürünüz. Not Kız Erkek Toplam geçmez 3 4 7 orta 10 2 12 iyi 8 10 18 pekiyi 9 4 13 28
Not Kız Erkek Toplam geçmez 3 4 7 orta 10 2 12 iyi 8 10 18 pekiyi 9 4 13 Toplam 30 20 50 Not Kız (% nisbi) Erkek (% nisbi) Toplam (% nisbi) geçmez 6 8 14 orta 20 4 24 iyi 16 20 36 pekiyi 18 8 26 Toplam 60 40 100 29
Örnek: 2003 yılı nüfus cüzdanı veriliş sebepleri. 30