TEMEL İSTATİSTİK BİLGİSİ İstatistiksel verileri tasnif etme Verilerin grafiklerle ifade edilmesi Vasat ölçüleri Standart puanlar
İstatistiksel Verileri Tasnif Etme Verileri daha anlamlı hale getirmek amacıyla verilerin tasnif edilmesi gerekir. En çok kullanılan yol verilerin tablolaştırılmasıdır.
İstatistiksel Verileri Tasnif Etme Frekans Tablosu Düzenleme Öğrencilerin sınavdan aldığı puanlar aşağıdaki gibi olsun; 44-30-14-19-14-16-17-42-33-31-28-24- 27-27-27-15-23-20-9-12-13-34-24-20-19-28-30-24-11-25-34-39
İstatistiksel Verileri Tasnif Etme Frekans Tablosu Düzenleme Puan f Puan f Puan f 44 1 30 2 19 1 42 1 28 2 17 1 40 2 27 5 16 2 39 1 25 2 15 2 36 1 24 1 14 2 34 1 23 2 12 2 33 2 21 2 11 1 31 1 20 2 9 1
İstatistiksel Verileri Tasnif Etme Verilerin Gruplanması Verilerin frekans tablosuna işlenmesi her zaman yeterli değildir. Çok fazla verinin olduğu durumlarda verilerin gruplandırılması gerekir
İstatistiksel Verileri Tasnif Etme Verilerin Gruplanması Veriler gruplandırılırken ardışık ölçümler, 8-9-10 gibi aynı grupta kabul edilir. Veriler gruplandırılmadan önce aralık katsayısının (a) belirlenmesi gerekir. Aralık katsayısı (a) bize verilerin ne kadar açıklıkta olacağını gösterir.
İstatistiksel Verileri Tasnif Etme Verilerin Gruplanması Aralık katsayısı şöyle tespit edilir; Veri tablosundaki en yüksek ve en düşük değer arasındaki fark bulunur. 44-9= 35 Basamak sayısı tespit edilir. Kabul edilen basamak sayısı 10 dan az 25 den çok olmamalıdır.
İstatistiksel Verileri Tasnif Etme Verilerin Gruplanması Basamak sayısını 12 olarak kabul edelim. Şimdi en yüksek değer en düşük değer farkını basamak sayısına bölerek aralık katsayısını bulabiliriz. 35 / 12 = 2.9 bu değeri 3 olarak kabul edebiliriz.
İstatistiksel Verileri Tasnif Etme Verilerin Gruplanması Gruplar 44-42 41-39 38-36 35-33 32-30 29-27 26-24 23-21 20-18 17-15 14-12 11-9 Frekans 2 3 1 3 3 7 3 4 3 5 4 2 Gruplama yapılırken bazı noktalara dikkat etmek gerekir. Gruplarımız en alt ve en üst noktaları içine almalı. Gruba başlangıç noktamız aralık katsayısına tam bölünmeli. Eğer bölünüyorsa bir küçük sayı başlangıç noktası olarak kabul edilebilir.
İstatistiksel Verileri Tasnif Etme Verilerin Gruplanması Bir önceki tablodaki değerler bir grubun gerçek alt ve üst sınırlarını göstermez. Bir grubun gerçek alt ve üst değerleri, grubun başlangıç noktasının yarım birim altından başlar ve yarım birim üstünde biter. Örn: 42-44 grubunun gerçek sınırları 41,5-44,5
İstatistiksel Verileri Tasnif Etme Gruplar Grupların gerçek sınırları 44-42 41-39 38-36 35-33 32-30 29-27 26-24 23-21 20-18 17-15 14-12 11-9 44,5-41,5 41,5-38,5 38,5-35,5 35,5-32,5 32,5-29,5 29,5-26,5 26,5-23,5 23,5-20,5 20,5-17,5 17,5-14,5 14,5-11,5 11,5-8,5 Frekans 2 3 1 3 3 7 3 4 3 5 4 2
İstatistiksel Verileri Tasnif Etme Verilerin Gruplanması Frekans tablosundan yaralanarak ortalama ve standart sapma gibi değerleri hesaplayabilmemiz için aralığın orta noktasının bulunması gerekir. Grubun orta noktası = Aralığın üst sınırı + aralığın alt sınırı 2
İstatistiksel Verileri Tasnif Etme Gruplar Grupların gerçek sınırları Orta nokta (Aralık indeksi) Frekans 44-42 41-39 44,5-41,5 41,5-38,5 43 40 2 3 38-36 35-33 38,5-35,5 35,5-32,5 37 34 1 3 32-30 29-27 26-24 32,5-29,5 29,5-26,5 26,5-23,5 31 28 25 3 7 3 23-21 20-18 23,5-20,5 20,5-17,5 22 19 4 3 17-15 14-12 11-9 17,5-14,5 14,5-11,5 11,5-8,5 16 13 10 5 4 2
İstatistiksel Verileri Tasnif Etme Bu tablodan yararlanarak aşağıdaki sorulara yanıt verebiliriz. 27-29 aralığına düşen kaç öğrenci vardır? Gerçek sınırları 14,5-17,5 olan puan grubunun frekansı nedir? Aralık indeksi 22 olan grupta kaç öğrenci yer almaktadır Öğrenciler en fazla hangi puan aralıklarında yığılma göstermişlerdir.
İstatistiksel Verileri Tasnif Etme Fakat bu tablodan yararlanarak aşağıdaki sorulara yanıt veremeyiz. 23,5 puan ve altında kaç öğrenci bulunmaktadır En düşük puandan başlamak üzere 14 öğrencinin içine girdiği puan aralıkları nedir?
İstatistiksel Verileri Tasnif Etme Bu sorulara cevap verebilmek için toplamlı (yığmalı) frekansı da bulmamamız gerekir. Örn: Puan Frekans Toplamlı Frekans 30 3 15 (12+3) 28 4 12 (8+4) 23 5 8 (3+5) 20 2 3 (1+2) 19 1 1
İstatistiksel Verileri Tasnif Etme Gruplar Grupların gerçek sınırları Orta nokta (Aralık indeksi) f Toplamlı frekans (tf) 44-42 41-39 44,5-41,5 41,5-38,5 43 40 2 3 40 38 38-36 35-33 38,5-35,5 35,5-32,5 37 34 1 3 35 34 32-30 29-27 26-24 32,5-29,5 29,5-26,5 26,5-23,5 31 28 25 3 7 3 31 28 21 23-21 20-18 23,5-20,5 20,5-17,5 22 19 4 3 18 14 17-15 14-12 11-9 17,5-14,5 14,5-11,5 11,5-8,5 16 13 10 5 4 2 11 6 2
İstatistiksel Verileri Tasnif Etme Toplamlı frekans sütunundan yararlanarak; 28 öğrencinin 29 ve daha az başarı elde ettiğini söyleyebiliriz. Eğer tablomuza yüzde ve toplamlı yüzde sütunlarını da eklersek, öğrencilerimizin puanlarını yüzdelerle ifade etme şansımızda olur.
İstatistiksel Verileri Tasnif Etme Gruplar Grupların gerçek sınırları Orta nokta f (tf) Yüzde (p) Toplamlı Yüzde (tp) 44-42 41-39 44,5-41,5 41,5-38,5 43 40 2 3 40 38 5 7,5 100 95 38-36 35-33 38,5-35,5 35,5-32,5 37 34 1 3 35 34 2,5 7,5 87,5 84 32-30 29-27 26-24 32,5-29,5 29,5-26,5 26,5-23,5 31 28 25 3 7 3 31 28 21 7,5 17,5 7,5 77,5 70 52,5 23-21 20-18 23,5-20,5 20,5-17,5 22 19 4 3 18 14 10 7,5 45 35 17-15 14-12 11-9 17,5-14,5 14,5-11,5 11,5-8,5 16 13 10 5 4 2 11 6 2 12,5 10 5 27,5 15 5
İstatistiksel Verileri Tasnif Etme Artık tabloya bakılarak ; Örn; Öğrencilerin % 70 inin 28 puan ve altında aldığı söylenebilir.
Verilerin Grafiklerle İfade Edilmesi Verilerin daha kolayca anlaşılması için onları grafiklerle de ifade edebiliriz. En çok kullanılan grafikler; Çizgi Sütun Toplamlı yığmalı frekans
Çizgi Grafikler 9 8 7 6 5 4 3 2 9 8 7 6 5 4 3 2 1 1 10 13 16 19 22 25 28 31 34 37 40 43
Sütun Grafikler 8 7 7 8 7 6 6 5 5 5 4 4 4 4 3 3 3 3 3 3 3 2 2 2 2 1 1 1 0 10 13 16 19 22 25 28 31 34 37 40 43 0
Yığmalı Frekans Grafiği 40 35 30 25 20 15 10 5 10 13 16 19 22 25 28 31 34 37 40 43
Vasat Ölçümleri (Merkezi Eğilim Ölçüleri) Aritmetik ortalama Ortanca (medyan) Mod (tepe değer)
Vasat Ölçümleri (Merkezi Eğilim Ölçüleri) Merkezi eğilim ölçüleri, puan dağılımında bilgilerin hangi puan etrafında toplandığı hakkında bilgi veren ve veri grubunu özetleyen değerlerdir.
Aritmetik Ortalama Vasat ölçüleri içinde, her puanın işleme katılmasından dolayı en istikrarlı olan ölçüdür. Aritmetik ortalama bir dizi ölçümün ağırlık merkezini gösterir.
Aritmetik Ortalama Örn; Kişi 25 20 15 10 5 20 30 40 50 60 70 Puan
Aritmetik Ortalama Örn; Kişi 25 20 15 10 5 20 30 40 50 60 70 Puan Kişi sayısı= 5+20+15+10+25+5=80 Toplam puan= (20x5)+(30x20)+(40x15)+(50x10)+(60x25)+(70x5)= 3650 Aritmetik ortalama= toplam puan / kişi sayısı =3650/80= 45.6
Aritmetik Ortalama Örn; Gruplandırılmış puanların aritmetik ortalamasını hesaplayınız? Gruplar f 30-28 4 27-25 3 24-22 21-19 2 5 18-16 1 29 26 23 20 19 Öncelikle grupların orta noktasının bulunması gerekir. Kişi sayısı = 4+3+2+5+1 =15 =(29x4)+(26x3)+(23x2)+(20x5)+( 19x1) =359 =359/15 =23.9
Ağırlıklı Ortalama Öğretmenin bir ders için öğrenciyi farklı yöntemlerle ölçtüğünü varsayalım. Eğer öğretmen bu ölçümlerin ortalamayı farklı oranlarda etkilemesini istiyorsa ağırlık ortalamadan yararlanabilir.
Ağırlıklı Ortalama Örn; Öğrenci coğrafya dersinde sözlü sınavdan 50, yazılı sınavdan 60, ödevden 75 almış olsun. Öğretmen sınavların ağırlığını sözlü notu için % 20, yazılı için %60, ödev için ise %20 olarak belirlemiş. Buna göre bu öğrencinin notu kaçtır? (50x20)+(60x60)+(75x20) = 1000+3600+1500 = 6100 = 61 100 100 100
Ortanca (Medyan) Sıralanmış bir veri grubunu tam ortadan ikiye ayıran ölçme sonucuna ortanca denir. Ölçümlerin yarısı bu değerin altında yarısı ise üstündedir.
Ortanca (Medyan) Örn: 13 15 17 19 25 27 30 dağılımının medyanı nedir? 13 15 17 19 25 27 30 MEDYAN
Ortanca (Medyan) Örn: 13 15 17 19 25 27 30 35 dağılımının medyanı nedir? 13 15 17 19 25 27 30 35 19+25 = 22 2
Ortanca (Medyan) Örn: Dağılımın medyanı kaçtır? Puan 15 1 28 3 34 4 42 5 56 6 60 1 f Bu dağılımın medyanını bulmak için öncelikle gruptaki kişi sayısı belirlenir. Bu grupta; 1+3+4+5+6+1= 20 kişi bulunmaktadır. Dağılımın orta noktası; 20: 2= 10 dur Tabloda 10. sıraya denk gelen puan bulunur.
Mod (tepe değer) Ölçme sonucu elde edilen ölçümlerden en çok tekrarlanan değere mod denir. Frekansı en çok tekrar eden değere mod denir.
Mod (tepe değer) Örn: 1 3 3 4 4 4 4 5 5 5 7 7 8 8 8 dizisinin modu kaçtır? En çok tekrar eden değere bakacağız. 1 3 3 4 4 4 4 5 5 5 7 7 8 8 8
Mod (tepe değer) Örn: Yandaki dağılımın modu kaçtır? 20 15 10 20 30 40 50
Mod (tepe değer) Örn: Ölçümlerin frekansı birbirine eşit olan bir ölçme işleminde aşağıdakilerden hangisi hesaplanamaz? a) Ranj b) Aritmetik ortalama c) Mod d) Standart sapma e) Medyan
Merkezi Değişim Ölçüleri Ranj Standart Sapma Dağılımlar
Standart Sapma Standart sapma ölçümlerin gösterdiği değişimi ortaya koyar. S= (x- ) 2 n-1 X Örn
Standart Sapma Bir dağılımın standart sapması küçük ise dağılımdaki puanlar birbirine yakın yani homojendir. Bir dağılımın standart sapması büyük ise dağılımdaki puanlar birbirine uzak yani heterojendir.
Standart Sapma Bir dağılımın aritmetik ortalaması ve standart sapmasına bakılarak grubun başarısı hakkında fikir sahibi olunabilir. Dağılımın aritmetik ortalaması büyük standart sapması küçükse başarı yüksektir.
Standart Sapma Örn: Aşağıdaki tabloda bir sınıfın bazı derslerden aldığı puanların aritmetik ortalaması ve standart sapması verilmiştir. Bu sınıftaki öğrenciler hangi dersten daha başarılıdır. (KPSS 2002) Dersler S Matematik 60 7 Fizik 80 9 Tarih 40 15 Türkçe 60 6 Vatandaşlık 60 5 X A) Matematik B) Fizik C) Tarih D) Türkçe E) Vatandaşlık
Standart Sapma Örn: Aşağıdaki tabloda bir sınıfın bazı derslerden aldığı puanların aritmetik ortalaması ve standart sapması verilmiştir. Bu sınıftaki öğrenciler hangi dersten daha başarılıdır. Dersler S Matematik 60 7 Fizik 50 9 Tarih 40 15 Türkçe 60 6 Vatandaşlık 60 5 X A) Matematik B) Fizik C) Tarih D) Türkçe E) Vatandaşlık
Standart Sapma Örn:Tablodaki derslerden hangisinde farklılaşma en yüksektir? (hangi grup daha heterojendir) Dersler S Matematik 60 7 Fizik 50 9 Tarih 40 15 Türkçe 60 6 Vatandaşlık 60 5 X A) Matematik B) Fizik C) Tarih D) Türkçe E) Vatandaşlık
Dağılımlar Normal dağılım Sağa çarpık dağılım Sola çarpık dağılım
Normal Dağılım Normal dağılım, aritmetik ortalamaya göre simetrik olan dağılımdır. Normal dağlımda; = mod= medyan X
Sağa Çarpık Dağılım > mod > medyan X Sağa çarpık dağılımlarda öğrencilerden çoğu düşük puan almıştır. Aritmetik ortalamayı birkaç tane çok yüksek puan alan öğrenci yükseltmiştir. Mod Medyan Ortalama
Sola Çarpık Dağılım < mod < medyan X Sola çarpık dağılımlarda öğrencilerin büyük bölümü yüksek puan almıştır. ortalama Medyan Mod
Dağılımın Yorumlanması Bağıl değişkenlik katsayısına bakılarak dağılım hakkında fikir sahibi olunabilir.
Değişim Katsayısı (Bağıl Değişkenlik) Değişim katsayısından yararlanarak grupların normal dağılım gösterip göstermediği, homojen ya da heterojen olup olmadıkları hakkında fikir sahibi olunabilir. Değişim katsayısı= (S / ). 100 X
Değişim katsayısı; Değişim Katsayısı (Bağıl Değişkenlik) 20-25 arasında ise grup normal dağılım gösteriyor demektir. 20 den küçük ise grup homojen 25 den büyük ise grup heterojen demektir.
Değişim Katsayısı (Bağıl Değişkenlik) Örn: Aşağıda 3 derse ait aritmetik ortalama ve standart sapma değerleri verilmiştir. Bu derslerdeki öğrencilerin puan dağılımları için ne söylenebilir? Dersler Türkçe 40 6 S Tarih 50 10 Kimya 60 18 X (6:40)x100= 15 grup homojen (10:50)x100=20 grup normal dağılım göstermiş (18/60)x100=30 grup heterojen
Değişim Katsayısı (Bağıl Değişkenlik) Örn: Aşağıda 3 derse ait aritmetik ortalama ve standart sapma değerleri verilmiştir. Bu derslerdeki öğrencilerin puan dağılımları için ne söylenebilir? Dersler Türkçe 50 5 S Tarih 60 21 Kimya 100 22 X (5:50)x100= 10 grup homojen (21:60)x100=35 grup heterojen (22/100)x100=22 grup normal dağılım göstermiş
Standart Puanlar Z puanı T puanı Korelasyon
Standart Puanlar Değişik testlerde gösterilen başarıların birbiri ile karşılaştırılmasında ve yorumlanmasında standart puanlar kullanılır. Farklı testlerden elde edilen puanlar birbiri ile aynı birimlerle ifade edilmemiştir. Bu sebeple karşılaştırma yapabilmek için test puanlarının standart puanlara çevrilmesi gerekir.
X Standart Puanlar Z puanı Z puanı, bir puanın standart sapma açısından ortalamaya göre farklılığın ne olduğunu gösterir. Z = x- S
Z puanı Z puanı (+) değer çıkarsa öğrenci gruptan daha başarılı Z puanı (0) çıkarsa öğrenci grupla aynı başarı düzeyinde Z puanı (-) değer çıkarsa öğrenci gruptan başarısız
Z Puanı Test S Ahmet Ali X Tarih 70 5 70 75 Türkçe 68 8 64 54 Fizik 74 12 78 75 Kimya 58 6 64 68 1. Ahmet hangi derste en başarılıdır? 2. Ali hangi derste en başarılıdır? 3. Genel olarak Ahmet mi Ali mi daha başarılıdır? X Test S Ahmet in Z puanı Ali nin Z puanı Tarih 70 5 (70-70)/5 = 0 (75-70)/ 5 = 1 Türkçe 68 8 (64-68)/8 = -0.5 (54-68) / 8 = -1.75 Fizik 74 12 (78-74)/12 = 0.33 (75-74) / 12 = 0.08 Kimya 58 6 (64-58)/6 = 1 (68-58)/ 6 = 1.6 TOPLAM 0.83 0.99
T puanı T puanlarının ortalaması 50, standart sapması 10 kabul edilir. T ve z puanlarından elde edilen sonuç aynı biçimde yorumlanır. T puanı = 50+ X- x 10 S X
Test S Can Ali X Tarih 68 4 70 66 Coğrafya 70 8 64 78 Türkçe 80 6 82 80 Matematik 47 7 56 51 Felsefe 55 5 45 54 1. Can hangi derste en başarılıdır? A) Tarih B) Coğrafya C) Türkçe D) Matematik E) Felsefe 2. Ali hangi derste en başarılıdır? A) Tarih B) Coğrafya C) Türkçe D) Matematik E) Felsefe 3. Tüm derslerden 80 alan bir öğrenci hangi deste en başarılıdır? A) Tarih B) Coğrafya C) Türkçe D) Matematik E) Felsefe
Test S Can Ali 77 X Tar 68 4 (70-68)/4= 0.5 (66-68)/4=-0.5 (77-68)/4= 2.2 Coğ 70 8 (64-70)/8= -0.75 (78-70)/8=1 (77-70)/8=1.25 Türk 80 6 (82-80)/6=0.33 (80-80)/6=0 (77-80)/6=-0.8 Mat 47 7 (56-47)/7=1.28 (51-47)/7= 0.57 (77-47)/7= 4.2 Fel 55 5 (45-55)/5= - 2 (54-55)/5=-0.2 (77-55)/5= 4.4
Korelasyon İki ya da daha fazla değişken arasındaki ilişki korelasyondur. Korelasyon -1 den +1 e kadar değer alır. İki değişken arasında doğru orantı varsa pozitif korelasyon (+1) İki değişken arasında ters orantı varsa negatif korelasyon (-1) İki değişken arasında ilişki yoksa sıfır korelasyon (0)
Korelasyon Örn: Aşağıdakilerin hangisinde negatif korelasyon vardır? (KPSS 2004) A) Yorgun öğrencinin öğrenme hızının düşmesi B) Tekrar yapan öğrencinin başarısının artması C) Çok pratik yapanın cevaplama hızının artması D) Çalışan öğrencinin başarısının artması E) Çok kitap okuyanın okuma hızının artması
Korelasyon Örn: Ders çalışmakla başarı arasındaki ilişkinin korelasyon katsayısı aşağıdakilerden hangisi olabilir? A) -0.20 B) 0.09 C) -0.98 D) 0.70 E) 0.87
Türkçe Fizik Kimya Tarih Türkçe 1 0.20-0.15 0.80 Fizik 0.20 1 0.90 0.30 Kimya -0.15 0.90 1 0.05 Tarih 0.80 0.30 0.05 1 1. Hangi iki ders arasındaki korelasyon en düşüktür? A) Tarih- Türkçe B) Kimya- Tarih C) Fizik- Kimya D) Türkçe- Kimya E) Türkçe- Fizik 1. Hangi iki ders arasındaki korelasyon en yüksektir? A) Tarih- Türkçe B) Kimya- Tarih C) Fizik- Kimya D) Türkçe- Kimya E) Türkçe- Fizik