SAKARYA ÜNİVERSİTESİ İstatistik Proses Kontrol Hafta 1.1 Prof. Dr. Yılmaz ÖZKAN Bu ders içeriğinin basım, yayım ve satış hakları Sakarya Üniversitesi ne aittir. "Uzaktan Öğretim" tekniğine uygun olarak hazırlanan bu ders içeriğinin bütün hakları saklıdır. İlgili kuruluştan izin almadan ders içeriğinin tümü ya da bölümleri mekanik, elektronik, fotokopi, manyetik kayıt veya başka şekillerde çoğaltılamaz, basılamaz ve dağıtılamaz. Her hakkı saklıdır 2012 Sakarya Üniversitesi
KAVRAMLAR & YÖNTEMBİLİM KAVRAM İstatistik denince akla ilk gelen belli bir konuda toplanmış bilgilerdir. Örneğin, çalışma istatistikleri iş hayatında çalışanlarla ilgili sayısal bilgileri, rakamları gösterir. İstatistik kavramı manasız bir rakam yığını için kullanılmaz. Burada rakamdan kasıt, araştırma konusu ile ilgili hacim, büyüklük, değer, değişmeler gibi açıklayıcı bilgilerdir. Bu tür bilgileri içeren rakamlara ise veri-data denir. İstatistik sözcüğünün ifade etmek istediği bir diğer kavram istatistik yöntembilimidir. İstatistik, verilerin toplanması, işlenmesi, belirli esaslara göre gösterilmesi, analiz edilmesi ve bulunan sonuçların yorumlanması anlamına gelir. Farklı sahalarda uygulanmasıyla istatistik sözcüğünün değişik isimler aldığını görüyoruz. Örneğin, iktisadi konulara uygulandığında ekonometri, sosyal olaylara uygulandığında sosyometri, tıb ve biyoloji sahasında ise biyometri gibi isimler alır. TANIM Latince kökenli olan istatistik kelimesi bu yönü ile devletin ihtiyaç duyduğu ve rakamla ifade edilen, devlete ait bilgiler demektir. Devletin ihtiyaç duyduğu bilgiler nüfustan dış ticarete kadar çok çeşitli konuları kapsar. İstatistik; çok sebebe bağlı ve değişkenlik gösteren olayları inceleyen bilim dalıdır. Bilgilerin toplanması, işlenmesi, belirli esaslar dâhilinde sunulması ve yapılan analizle sonuç çıkarmaya çalışan metotlar topluluğu olarak da tanımlanabilir. Bazı uzmanlar ise, istatistiği eksik bilgilerden doğru sonuç çıkarma sanatı şeklinde de tarif etmişlerdir. Irk, irsiyet, beslenme, iklim, hayat şartları vs gibi tesadüfî sebeplerin etkisiyle boy uzunlukları değişkenlik gösterir. Bu durumda olayın normal boyutunu bulmak veya görmek zordur. İşte istatistik, böyle tesadüfî sebeplere bağlı ve değişkenlik gösteren olayları inceleyen bir bilim dalı olarak karşımıza çıkar. Günümüzde istatistik, fizikten biyolojiye, sosyolojiden iş âlemine kadar geniş bir yelpazede başarıyla uygulanan, her türlü sosyal ve teknik araştırmalarda ihtiyaç duyulan bir bilim dalı haline gelmiştir. YÖNTEMBİLİM Her bilim dalında olduğu gibi istatistik de sistematik bir yöntem izlemektedir. Çeşitli konularda istatistik araştırma yapabilmek için öncelikle bu aşamaların gerçekleşmesi gerekir. İzlenmesi gereken sistematik sıra şu şeklindedir: 1 - ilk bilgilerin toplanması 2 - toplanan bilgilerin işlenmesi ve düzenlenmesi 3 - düzenlenen bilgilerin gösterilmesi 4 - istatistik analiz ve yorum
İLK BİLGİLERİN TOPLANMASI Röleve veya gözlem adı verilen bu safhada araştırmanın konusu ve birimlerin sınırları belirlenerek ilk bilgiler toplanır. Bilgi derleme adı verilen bu işlemde, yığını (ana kütle) oluşturan birimler sayılırken bu birimlerin sahip oldukları vasıf ve şık özellikleri de araştırılarak ilk bilgiler toplanmış olur. İşlenmemiş bilgiler anlamına gelen ve veri olarak tanımlan bu bilgileri daha yakından tanıyabilmek için gerekli kavramların üzerinde kısaca duralım. BİRİM Bilgi derleme adı verilen bu safhada, araştırmanın konusu ve birimlerin sınırları belirlenerek ilk bilgiler toplanır. Yığını (ana kütle) oluşturan birimler sayılırken bu birimlerin sahip oldukları özellikler de araştırılarak ilk bilgiler toplanmış olur. İşlenmemiş bilgiler anlamına gelen ve ham veri veya done olarak tanımlanabilen bu bilgileri daha iyi anlayabilmek için gerekli kavramların üzerinde kısaca duralım. MADDİ - MADDİ OLMAYAN BİRİMLER İnsan, ağaç, masa, buzdolabı gibi maddi bir varlık gösteren birimlere maddi birim, doğum, iflas, trafik kazası gibi olay şeklinde meydana gelen birimlere de maddi olmayan birimler denir. DEVAMLI VE ANİ BİRİMLER Sınırlı da olsa belirli bir ömrü olan insan, hayvan, ağaç gibi birimler belirli zaman dilimi içinde gözlenebilir olduklarından devamlı birim özelliği taşırlar. Böyle birimlerden oluşan yığınlar ani bir sayımla gözlenebilirler. Olay şeklinde ortaya çıkan trafik kazası, doğum, ölüm, alışveriş gibi birimlerin ömürleri çok kısadır, bir anda olup biterler. Tekrar olmalarını beklemek mümkün olmaz. Böyle birimler devamsız olup, zaman içinde dağınık bulunurlar. Ani birimlerin hep beraber meydana gelmeleri ve birlikte bir yığın oluşturmaları mümkün olmadığından, böyle birimlerin sürekli kaydedilmesi gerekir. BAĞIMLI - BAĞIMSIZ BİRİMLER Bağımsız birimler bölünmez, parçalanmaz ve birleştirilemezler. İnsan, hayvan, buzdolabı gibi birimler buna örnek verilebilir. Bağımlı birimlerde bu durumlar söz konusu değildir. Zaman, mekan ve mesafe birimleri bu çeşit birimlerdendir. GERÇEK - FARAZİ BİRİMLER Bina, ağaç, evlenme, boşanma, trafik kazası gibi birimler gerçek, üretilen mamulün kusurlu yada kusursuz olmasını beklemek farazi birim sayılabilir. VASIF - ŞIK Birimlerin sahip oldukları özelliklere vasıf adı verilir. Örneğin nüfus sayımında birim olan insanın cinsiyeti, yaşı, mesleği, medeni durumu gibi özellikler vasıf olarak adlandırılır. Yabancı turistlerin mesleği, milliyeti, dini, geliş maksadı,
geldiği vasıta, giriş yaptığı gümrük kapısı, kalış süresi gibi hususlar da birer vasıf olarak sayılabilir. Vasıfların çeşitli şekillerine ise şık adı verilir. Örneğin cinsiyet vasfının erkek, kadın gibi iki şıkkı olmasına karşın, medeni durum vasfının şıkları bekâr, evli, dul, boşanmış gibi dört farklı grupta toplanabilir. Birim, vasıf ve şık kavramlarının daha iyi anlaşılabilmesi için aşağıdaki tablonun incelenmesi yararlı olabilir. Tablo 1-3 Yabancı Turist biriminin vasıfları ve şıkları BİRİM VASIF ŞIK Y. Turist Dini Müslüman, Hıristiyan, Musevi, Memleketi Almanya, İtalya, Mısır,.. Geliş nedeni Eğitim, Spor, Ticaret, Gezi,.. Geldiği vasıta Uçak, Gemi, Tren, Otobüs, Kalış süresi (gün) 2, 7, 15, 30,.. Tahsil durumu İlkokul, ortaokul, lise, Mesleği İşçi, Esnaf, Memur, Ev hanımı, Yaşı 17, 18, 19, 20, 45, ANA KÜTLE Kütle aynı cinsten birimlerden meydana gelen topluluktur. Kütle aynı cinsten birimlerin meydana getirdiği yığın olduğuna göre, ülke sınırları içinde yaşayan fertlerin tamamı nüfus kütlesini oluşturur. Buna, bir yıl içindeki boşanma sayısı, bir gün içinde 1. boğaz köprüsünden geçen araç sayısı, bir ay içinde karşılıksız çıkan çek veya senet sayısı gibi örnekler birer kütle olarak gösterilebilir. Kütle yerine populasyon veya nüfus kavramları da kullanılmaktadır. KONUNUN BELİRLENMESİ Veri toplamaya başlamadan önce konunun belirlenmesi gerekir. Öncelikle birim tanımlanır, birimlerin hangi özelliklerinin araştırılacağı ve nasıl seçileceği belirlenir. Birimlerin hangi mekanda ve hangi zaman aralığında ele alınacağı, yani kütlenin sınırları çizilir. BİRİMİN TANIMLANMASI Veri toplamada maksat, birimlerin sayısı ve sahip oldukları özellikler hakkında bilgi edinmek olduğundan, birimin ne olduğu, neyin gözleminin yapılacağı açık bir şekilde tanımlanmalıdır. Birimin kesin bir tanımı olması halinde gözlem yapanların tamamının bu tanımdan aynı şeyi anlamaları mümkün olabilir. Aksi takdirde gözlemciler bilgi toplarken kendi bilgi ve anlayışlarına göre hareket etmeleri sonucunda homojen olmayan bilgiler toplanmış olur. Bu nedenle, gözlem yapanların yapılan birim tanımından aynı şeyi anlamaları halinde toplanan bilgiler anlamlı olacaktır.
DEĞİŞKENLERİN ÖZELLİKLERİNİN BELİRLENMESİ Yığını oluşturan birimlerin sahip oldukları özellikler çok sayıda olabilir. Ancak araştırma konusu birim için çok sayıda özellik hakkında bilgi toplamak zor, zaman alıcı ve maliyeti yüksek olabilir. Birim için belirlenen özelliklerin sayısını artırmak yapılacak araştırmada sorulacak soruların sayısını artırmak anlamına gelir. DEĞİŞKENLERİN ALACAĞI DEĞERLERİN BELİRLENMESİ Değişkenlerin alacağı değerlerin doğru biçimde belirlenebilmesi için geçerli kural, ölçü biriminin belirlenen değişkenin büyüklüğü ile orantılı olmasıdır. Örneğin, bir işletmede çalışan işçilerin aylık ücretlerini göstermek için Bin TL. kullanılmasına karşılık ülke bütçesi için Milyar TL., dış ticaret hacmini belirtmek için ise Milyar $ kullanmak uygun olacaktır. YIĞININ SINIRLANDIRILMASI Araştırma konusu birimin hangi özelliklerinin dikkate alınacağı ve ölçü birimi açık biçimde tanımlandıktan sonra, hangi mekanda, hangi zaman dilimi içinde olduğu da dikkatli bir şekilde açıklığa kavuşturulmalıdır. Aynı özelliğe sahip birimlerden oluşacak olan yığın bu şekilde mekan ve zaman bakımından sınırlandırılmış olur. Yığının sınırlandırılması ise araştırma yöntemleri için araştırma konusunun çerçevesinin belirlenmesi anlamına gelir. MEKÂN BAKIMINDAN SINIRLANDIRMA Mekân bakımından sınırlandırmak, yığının coğrafi özelliğini dikkate alarak sınırlandırılması anlamına gelir. Aynı tanıma uyan birimler, belirli bir mekâna göre sınırlandırılmış olur. Nüfus sayımında ana kütle ülke sınırları ile, Marmara Bölgesindeki işsiz sayısı bölge sınırları ile, X firmasında çalışan işçi sayısı ise adı geçen firma ile mekan bakımından sınırlandırılmış olur. ZAMAN BAKIMINDAN SINIRLANDIRMA Yığının zaman bakımından sınırlandırılması yığının hazır veya hareket yığını olmasına göre ayrı ayrı yapılır. Hazır yığınlarda birimler bir arada bulunduklarından bunların sayımı ve gözlemlenmesi çok kısa bir zaman dilimi ile sınırlandırılabilir. Nüfus sayımının ülke çapında bir günlük zaman diliminde yapılması, firmalarda stokların sayılıp envanterin çıkarılması hazır yığınların zaman bakımından sınırlandırılmasına örnek olabilir. VERİ TOPLAMA ŞEKLİ Veri toplama devamlı, ani, genel, kısmi, vasıtalı ve vasıtasız olmak üzere farklı şekillerde yapılabilir.
ANİ / DEVAMLI VERİ TOPLAMA Yığını oluşturan birimlerin hazır veya devamlı oluşuna göre veri toplama işlemi ani veya devamlı türde yapılabilir. Burada esas olan; devamlı olayların ani, ani olayların ise sürekli biçimde kaydedilerek gözlemlenmesidir. Devamlı olayların, kısa veya uzun bir zaman aralığı içinde ve herhangi bir anda sayılabilme, ölçülebilme özellikleri vardır. Bu türden olayları bir anda, hepsini bir arada bulmak ve incelemek mümkündür. Nüfus, işyeri, binalar devamlı olduklarından bunları bir arada bulmak ve belirlemek mümkün olur. İşte, bu türden olaylar için bilgiler ani şekilde toplanır. Genel Veri Toplama Araştırma yapılan konu ile ilgili kütledeki birimlerin tamamının incelenmesine genel veri toplama denir. Genel Nüfus Sayımları, Genel İşyeri Sayımları bu tür veri toplamaya örnek olarak gösterilebilir. Genel veri toplama, birimlerin tamamını kapsadığından kütle hakkında tam fikir verir. Kısmi Veri Toplama Genel veri toplama, yığın hakkında tam ve kesin bilgi vermesine karşılık güç, zaman alıcı ve pahalı bir bilgi toplama çeşididir. Hakkında bilgi edinilmek istenen yığının büyük olması halinde toplanan verilerin tasnifi ve sınıflandırılması da oldukça fazla zaman aldığından, yığının tamamının değil de bir kısmının incelenmesi yoluna gidilir. Bu şekilde yığının tamamı yerine bir kısmının incelenmesine kısmi veri toplama adı verilir. Kısmi veri toplama halinde bilgi toplamak üzere seçilen bir kısım birimden oluşan küçük gruba örnek, örneğin çekildiği ve birimlerin tamamının bulunduğu yığına ise ana kütle veya yığın adı verilir. Kısmi veri toplama yönteminde, birimlerin seçim esasını dikkate alarak bir tasnife gidebiliriz. Örnekteki birimler, bilerek (iradi) veya rasgele (tesadüfi) olacak şekilde seçilirler. İRADİ SEÇİM YÖNTEMİ Monografi Yöntemi Bu örnekleme yönteminde az sayıda birimin çok ayrıntılı bir şekilde incelenmesi yapılır. Prensip olarak bu yöntemin uygulanabilmesi için örneğe az sayıda alınan birimlerin ait oldukları grupların tüm özelliklerini taşımaları gerekir. Bu bilgi toplama yöntemine örnek olarak bir şehirde yaşayan işçi ailelerinin geçinme şartlarını belirlemek için yapılan hane halkı gelir ve harcama araştırmaları gösterilebilir. Kota Yöntemi Kota yönteminde esas olan düşünce, yığındaki özelliklerin aynı oranda örneğe yansıtılmasıdır. Bunun için ana kütle hakkında etraflı bir bilgi sahibi olmak gerekir. Yöntemin uygulanışında takip edilmesi gereken noktalar şu şekildedir:
1- Öncelikle ana kütlenin yapısı, hangi gruplardan meydana geldiği araştırılır, 2- Grupların ana kütle içindeki oranları hesaplanır. Bunun için mevcut istatistiklerden yararlanılır, yoksa tahmin yoluna gidilir, 3- Her gruptan, o grubun ana kütle içindeki oranı kadar orantılı şekilde birimler seçilir. Bu şekilde örnekteki grupların oranı ile ana kütledeki grupların oranı aynı tutulmuş olur. Erkek Tablo 1-4 Kota yönteminde örneğin yapısı İşçi Grupları Ana kütle yapısı ( 1 ) % 10 luk örnek yapısı ( 2 ) İlkokul 200 20 Ortaokul 300 30 Lise 150 15 Yüksek 50 5 Kadın İlkokul 100 10 Ortaokul 80 8 Lise 70 7 Yüksek 50 5 Toplam 1000 100 Örnek olarak, 1000 kişinin çalıştığı bir işyerinde % 10 oranında yapılacak bir örnekleme ile çalışanların işten duydukları memnuniyet düzeyleri üzerinde araştırma yapılmak istendiğini farz edelim. Kota usulünün uygulanmasında izlenecek adımlar dikkate alınırsa, her gruptan seçilecek birim sayısının tablonun ikinci sütunundaki gibi olması gerekir. % 10 oranında ve 100 birimden oluşan bu örnek seçildikten sonra, bunlara işten duydukları memnuniyet düzeyini ölçebilecek sorular sorulur. Alınan cevaplar ve bunlara göre yapılan hesaplar çalışan 1000 işçinin işten duydukları memnuniyet düzeyleri hakkında bir tahmin olur. TESADÜFİ SEÇİM YÖNTEMİ Tesadüfî seçim yönteminde ana kütledeki birimlere ait bir listenin mevcut olması gerekir. Eğer böyle bir liste yoksa öncelikle bir listenin oluşturulması yoluna gidilir. Ancak liste hazırlamak için gerekli masraf ve zorluk ana kütledeki birim sayısı ile orantılı olarak artar. Bu nedenle mümkün mertebe liste görevini yapacak imkânlar araştırılır. Nüfus kayıtları, SSK kayıtları, telefon rehberleri gibi hazır imkânlar bu maksatla kullanılabilir. Böyle bir imkân da yoksa bu sefer kademeli seçim tekniğine başvurulabilir. Kura ile seçim Ana kütledeki birimlerin tamamı numaralandırılır ve standart boyutlu fişlere yazılarak bir torba veya kutuya doldurulur. Bu fişler iyice karıştırıldıktan sonra
aralarından örneğe girecek kadar fiş çekilir. Fişlerdeki numaralar örneğe girecek birimlerin listedeki sıra numaraları olur. Rastgele Sayılar Tablosu ile seçim Tesadüfî seçim için hazırlanan rasgele sayılar tablosu tesadüfî olarak seçilmiş çok sayıdaki rakamların sıralanmasıyla elde edilirler. Tablodaki hangi satır ve hangi sütundaki rakamdan başlanacağına kura ile karar verilerek tesadüfîlik sağlanmış olur. İlk rakam kura ile belirlendikten sonra hangi aralıklarla rakamların seçileceğine karar verilir. Sistematik Seçim Seçilecek birimlerin sıra numaraları arasındaki aralık sabit tutmak suretiyle yapılan seçim sistematik seçim adını alır. Örneğin, 1000 birimlik bir yığından 100 birimlik bir örneği sistematik seçimle almak için, çekilecek birimler arasındaki aralık 1000 100=10 olacaktır. Hangi numaradan başlamak gerektiği kura ile belirlendikten sonra seçime devam edilir. Bunun için, ilk 10 sayı arasından kura ile 5 sayısının çıktığını farz edersek, örneğe girecek ilk birimin numarası 5 olmak üzere diğerleri bu 5 sayısına 10 eklemek suretiyle 15, 25, 35,... şeklinde bulunur. BİRİNCİL - İKİNCİL KAYNAKTAN VERİ TOPLAMA Birincil kaynaktan veri toplama; incelenmek istenen ana kütleye ait birimler üzerinde doğrudan yapılan araştırma ve incelenmelerdir. Nüfus sayımı, işyeri sayımı gibi araştırmalar birincil kaynaktan veri toplama yöntemlerinden olup, doğrudan insanlar üzerinde bilgi toplanması, doğum, ölüm gibi olayların takip edilmesi veya bir işyerinde çalışanların öğrenim durumları, çalıştıkları birim gibi bilgilerin toplanması ile yapılır. Bazı kurum ve kuruluşlar, ilgililere bilgi verebilmek amacıyla belirli konularda yaptıkları araştırmaları ve topladıkları bilgileri yayınlarlar. Türkiye İstatistik Kurumu (TÜİK), Devlet Planlama Teşkilatı (DPT), Sosyal Sigortalar Kurumu (SSK) gibi kurumların yayınladıkları bilgiler bu gruba girer. Bu kurumlar tarafından yayınlanan bilgilerin kullanılmasına ikincil kaynaktan veri toplama yöntemi adı verilir. VERİLERİN İŞLENMESİ Araştırma maksadıyla toplanan ilk bilgiler dağınık, düzensiz ve karmaşık bir yığın oluşturur. İstatistik analizin hammaddesi olan bu karmaşık yığın, ilk bakışta araştırma yapılan olay hakkında fikir vermekten oldukça uzaktır. Bu yığından elde edilen ilk bulgular yığının büyüklüğü ve yığındaki birimlerin sayısından ibarettir. Yığının yapısını ve özelliklerini ortaya çıkaracak şekilde verilerin işlenmesi, belirli esaslar dâhilinde düzenlenmesi gerekir. Verilerin işlenmesi sırasında yapılması gereken işlemler tasnif ve gruplamadır.
TASNİF Tasnif, kütlenin yapısını belirli bir vasıf veya vasıflar cinsinden görebilmek için kullanılır. Yığındaki birimlerin hangi vasfı ile ilgileniliyor ise, o vasıfla ilgili aynı şıkka sahip olan birimler bir araya getirilir. Bu şekilde oluşturulan kümelere "tasnif" adı verilir. Basit ve bileşik olmak üzere iki farklı şekilde yapılabilir. BASİT TASNİF Tasnif, yalnızca bir vasfın şıklarına göre yapılır. Örnek olarak beş yüz kişinin çalıştığı bir işyerinde, çalışanları departman vasfının şıklarına göre tasnifi aşağıdaki gibi bir tablo çıkabilir. Tablo 1-5 Departmanlara göre çalışanların sayısı Departmanlar (Şıklar) Çalışan sayısı (Frekanslar) Üretim 390 Pazarlama 45 Personel 15 K. Kontrol 20 Muhasebe 25 Satın alma 5 Toplam 500 Tasnif sonucunda elde edilen bu bilgiler, işyerinde çalışanların çalıştıkları departmanlara göre ayırımını yapmakta, hangi bölümde kaç kişi çalıştığını göstermektedir. Üretim, pazarlama, personel vs. gibi bölümler yığındaki birimlerin departman vasfına göre bulundukları şıkları göstermektedir. Tasnif sonucunda tabloda verilen rakamların her biri belirli bir şıkkın yığındaki kaç birimde bulunduğunu, başka bir ifade ile yığında kaç kere tekrar edildiğini göstermektedir. Bu nedenle bunlara tekrar edilme sayısı veya sıklık anlamına gelen "frekans" adı verilir. BİLEŞİK TASNİF Tasnifin sadece bir vasfın şıklarına göre değil, aynı zamanda birden fazla vasfın şıklarına göre yapılması gerekebilir. Bu durumda basit tasnif yetersiz kalacağından bileşik tasnife ihtiyaç duyulur. Yukarıdaki örneği aynı zamanda cinsiyet bakımından da görmek istersek bileşik tasnif yapmamız gerekir. Bu sayede departmanlarda çalışanların kaçının erkek kaçının kadın olduğunu bilebiliriz.
Tablo 1-6 Departmanlardaki erkek ve kadın sayısı Departman Erkek Kadın Toplam Üretim 345 45 390 Pazarlama 20 25 45 Personel 2 10 12 K. Kontrol 18 2 20 Muhasebe 10 15 25 Satın alma 3 2 5 Planlama 2 1 3 Toplam 400 100 500 GRUPLAMA Tasnif işleminde çok sayıda şık olması durumunda toplanan bilgileri gruplar halinde göstermek gerekebilir. Bu şekilde bir vasfın birbirine yakın olan şıklarının bir arada toplanarak gösterilmesine "gruplama" denir. Örneğin, aynı dalda faaliyet gösteren işletmeleri çalıştırdıkları işçi sayılarına göre tasnif edelim: Birkaç işçiden binlerce işçi çalıştıran işyerlerine kadar çok sayıda şıkla karşı karşıya kalırız. Böyle durumlarda tabloyu gereksiz şekilde büyütmek yerine gruplama yöntemiyle gözlem sonuçları daha kısa ve daha anlamlı bir tabloya dönüştürülebilir. Tablo 1-7 İşçi sayısı gruplarına göre işletme sayıları İşçi Sayısı İşletme Sayısı (frekans) 10-24 3925 25-49 2438 50-99 1252 100-199 802 200-499 627 500-999 241 1000 + 160 Toplam 9445 Kaynak, Türkiye İstatistik Yıllığı, 1991, İmalat Sanayii, DİE, 1992, s.345. Ankara, Örnekte Görüldüğü gibi firmalar işçi sayısına göre beş grupta toplanmış olup sınıf sayısı beştir. Birinci sınıfın alt sınırı 10, üst sınırı 24, sınıf aralığı ise 14' tür. Sınıf aralığının, ilgili sınıfın üst sınırı ile alt sınırı arasındaki farkla hesaplandığı açıkça
görülmektedir. Diğer sınıflar için de benzer şeyler söylenebilir. Sınıf aralıkları eşit olabileceği gibi olayın yapısına göre farklılık da gösterebilir. Dikkat edilirse sınıf sayısı ile sınıf aralığı arasında ters bir ilişki vardır. Sınıf aralığı küçüldükçe sınıf sayısı artarken, sınıf aralığının büyümesi ise sınıf sayısını azaltacaktır. Gruplama yöntemlerine geçmeden önce, kullanılan ortak sembollerin ne anlama geldiği üzerinde kısaca durulması yararlı olacaktır. X max X min s N k : En büyük gözlem değeri : En küçük gözlem değeri : Sınıf aralığı : Gözlem sayısı : Sınıf sayısı SINIF ARALIĞININ STURGES YÖNTEMİYLE BELİRLENMESİ H.A.Sturges ideal sınıf sayısının aşağıda verilen formülle hesaplanabileceğini ileri sürmüştür. X max X min s 1 3.322 log N Formüle göre paydaki fark paydadaki birim sayısına nispetle büyüdükçe sınıf aralığı genişleyecek, bunun tersi olunca da küçülecektir. Formülün vereceği sonuç tamsayı çıkmayabilir. Bu durumda, sınıf sayısı en yakın tamsayıya göre belirlenir. Örnek 1-2 200 kişinin çalıştığı bir işyerinde çalışanların kıdem esasına göre gruplanması isteniyor. Firmanın en kıdemli işçisi 9, en yeni elemanı 1 yıldır çalıştığına göre Sturges'in ideal sınıf aralığı yöntemiyle sınıf sayısını ve sınıf aralığını belirleyelim. Sınıf sayısı (k), formülün paydası ile belirlenirse: k =1+ 3.322 logn =1+ 3.322 log200 =1+ 3.322 (2.30102) = 8.64 9 Buna göre gruplamada dokuz sınıf olacaktır. için değerler formülde yerine konacak olursa sınıf aralığı:
X max X min s 1 3.322log N 9 1 1 3.322log 200 8 8.6439 0.925 1 yaklaşık bir olarak bulunur. Sonucun kesirli olması halinde sınıf aralığı olarak en yakın tamsayı alınır. Tablo 1-9 200 İşçinin Gözlenen Kıdem (Yıl) Değerleri 2 9 6 2 3 3 5 8 2 3 1 3 5 1 2 1 3 5 4 3 2 6 2 7 4 4 2 8 2 7 7 1 5 4 2 5 5 3 4 4 3 7 5 3 4 3 2 4 1 3 5 4 1 1 6 3 6 8 5 3 2 2 5 3 1 2 4 2 4 6 2 3 6 1 8 3 6 3 3 1 5 4 7 5 8 9 4 2 5 5 3 4 3 2 3 1 4 6 7 5 1 4 3 5 4 3 5 3 3 7 2 5 8 3 6 4 2 4 5 3 3 3 2 5 4 3 4 7 1 4 1 4 6 4 1 6 4 5 6 6 8 9 3 6 7 3 6 2 4 2 4 4 2 1 5 5 3 8 5 4 3 5 4 4 1 4 1 3 4 4 6 5 4 3 4 6 4 4 2 6 5 4 3 5 4 2 4 3 4 4 5 2 4 3 5 2 7 5 3 6 Gözlem değerleri karmaşık ve düzensiz bir yapıya sahip olduğundan,.bu durumu düzeltmek için ilk işlem olarak gözlem değerleri küçükten büyüğe doğru sıralanır.
Tablo 1-10 Küçükten Büyüğe Doğru Sıralanmış Gözlem Değerleri 1 2 2 3 3 4 4 5 6 7 1 2 2 3 3 4 4 5 6 7 1 2 2 3 3 4 4 5 6 7 1 2 2 3 3 4 4 5 6 7 1 2 2 3 3 4 4 5 6 7 1 2 3 3 4 4 4 5 6 7 1 2 3 3 4 4 4 5 6 7 1 2 3 3 4 4 4 5 6 7 1 2 3 3 4 4 4 5 6 7 1 2 3 3 4 4 5 5 6 8 1 2 3 3 4 4 5 5 6 8 1 2 3 3 4 4 5 5 6 8 1 2 3 3 4 4 5 5 6 8 1 2 3 3 4 4 5 5 6 8 1 2 3 3 4 4 5 5 6 8 1 2 3 3 4 4 5 5 6 8 1 2 3 3 4 4 5 5 6 8 1 2 3 3 4 4 5 5 6 9 1 2 3 3 4 4 5 5 6 9 2 2 3 3 4 4 5 5 7 9 Görüldüğü gibi, aynı değere sahip olan gözlem değerleri tekrarlanıp durmaktadır. Bunları tekrar tekrar yazmak yerine, her farklı gözlem değerinin yanına ne kadar tekrarlandığını göstermek üzere sıklık anlamına gelen frekansları yazılsaydı, tablonun boyutları çok daha küçük ve anlamlı sonuçlar verebilen bir yapıya kavuşmuş olurdu. Pratiklik kazandırmak için çetele diyagramını kullanmak yararlı olabilir.
Tablo 1-11 Kıdem Değerleri için Çetele Tablosu Kıdem (yıl) Kıdeme Göre İşçi Sayısı Çetelesi 1 ///// ///// ///// //// 2 ///// ///// ///// ///// ///// / 3 ///// ///// ///// ///// ///// ///// ///// ///// 4 ///// ///// ///// ///// ///// ///// ///// ///// //// 5 ///// ///// ///// ///// ///// ///// / 6 ///// ///// ///// //// 7 ///// ///// 8 ///// //// 9 /// Çetele diyagramındaki sonuçlar tasnif edilerek bir frekans tablosu şeklinde gösterilir. Tablo 1-12 Kıdem Değerleri için Frekans Tablosu Kıdem (yıl) İşçi Sayısı (frekans) 1 19 2 26 3 40 4 44 5 31 6 19 7 10 8 8 9 3 Toplam 200 Gözlem değerleri çok farklı olursa tablo gereğinden fazla büyür ve tasnif yapmanın pratik faydası kalmaz. Bu durumda tasnif yerine gruplama yapmak gerekir.
SÜREKLİ VASIFLARDA SINIF SINIRLARININ BELİRLENMESİ Sürekli vasıflar kesirli, kesirsiz her türlü değerleri alabilir. Bu nedenle sınıf sınırlarını kesin olarak belirlemek zor olabilir. Örneğin aylık ücretleri göstermek üzere sınıf sınırları şöyle belirlenebilir: Aylık Ücretler (milyon TL) 20-29 30-39 40-49 50-59 60-69 70-79 Dikkat edilirse 29 ile 30 milyon arasında kalan bir ücretin hangi sınıfta gösterilecektir? Sınıf sınırlarını kesirli şekilde belirleyip birbirlerine son derece yaklaştırsak bile bu sınırlar arasına düşen bir değer kalabilir. Bunu önlemek için sürekli vasıflarda sınıf sınırlarını şu şekilde belirlemek gerekir: Aylık Ücretler (milyon TL) 10 20 den az 20 30 den az 30 50 den az 50 70 den az 70 100 den az AÇIK SINIFLAR Bazen gruplama yapılırken ilk sınıfın alt sınırı ile son sınıfın üst sınırı boş bırakılabilir. Bunlara açık sınıf adı verilir. Belirli bir değerin altında veya üstünde olan sınıflara ait frekansların çok küçük kalması ve sınıf sayısını gereksiz yere artırmamak için açık sınıf kullanılır.
Aylık Ücretler (milyon TL) - 20 den az 20 30 den az 30 50 den az 50 70 den az 70 100 den az 100 + BELİRSİZ GRUPLAR Kantitatif vasıflarda olduğu gibi kalitatif vasıflarla ilgili sınıfların sonunda bazen "bilinmeyen", "diğerleri" ve "vs" gibi ifadeler bulunur. Bunların hangi gözlem değerleri için kullanıldığını bilmek, ait oldukları sınıfı veya şıkkı belirlemek zor olabilir. Veri toplama sırasında bazı bilgiler çeşitli nedenlerden elde edilememiş olabilir. Bu takdirde bilinmeyen grubunda gösterilmesi gereken bazı bilgiler bulunacak demektir. Bazı durumlarda da şıkların çok sayıda ortaya çıkması ve gereksiz ayrıntıları önlemek için frekansı küçük şıkları "diğerleri" başlığı altında toplamak gerekebilir.