Ölçme Ve Değerlendirme Ders Notları 1 ÖLÇME VE DEĞERLENDİRME (DERS NOTLARI) Eğitim: Kendi yaşantıları yoluyla, istendik yönde davranış değişikliği meydana getirme sürecidir. Öğrenci merkezli Olumlu davranış değişikliği Başı-ara ve sonu var.!!! EĞİTİM = Öğretim + Rehberlik hizmetleri Öğrenme: Kalıcı izli davranış değişikliği. Ezber eğitimin doğru olmamasının nedeni, kalıcılık yoktur. Yaşantı yoktur. Öğretim: Öğretim ortamında gerçekleştirilen planlı etkinliklerin tümü. Örneğin; 14 hafta ölçme değerlendirmede sınıf içinde yapılan her şey ÖĞRETİM dir. Beden eğitimi spor salonunda öğretim Eğitim; öğretimi kapsar ve rehberlik hizmetlerini Rehberlik Hizmetleri: Öğrencinin okulda sanatsal, sosyal, spor, sağlık hizmetleri (bedensel ve ruhsal) aktivitelere yönlendirmek. ÖZETLERSEK: EĞİTİM= ÖĞRETİM + REHBERLİK HİZMETLERİ + YÖNETSEL HİZMETLER Sanatsal * ulaşım Sosyal * yemek Spor müdürün denetlemesi Sağlık hizmetleri EĞİTİM: 1) sınıf içinde yapılan etkinlikler (öğretim) 2) şiir dinletisi, spor, sağlık hizmetleri ( rehberlik hizmetleri) 3) yönetsel hizmetler (ulaşım,yemek ) Öğretmenlik Mesleğinde Bulunması Gereken 3 Özellik; Mesleki ( alan) bilgisi Pedagojik formasyon bilgisi feni nasıl öğretmek Hangi öğretim yöntemi Hangi materyali kullanacağım Öğrenmeyi nasıl ölçeceğim Genel kültür rehberlik hizmetleri ile verilir. ÖĞRETİM PLANI VEYA PROGRAMI ( ders planı, günlük plan, yıllık plan ) 1) Hedefler ( kazanımlar) : Neyi öğrenmeliler? Öğrencinin kazanması gereken beceriler. Davranış: hedefin ölçülebilir, gözlemlenebilir hale getirilmiş biçimidir. Eskiden davranış vardı ölçme kolaydı. Davranışa bakılıp soru yazılırdı. Yeni programda ölçme daha zor öğretme kolay. 2) İçerik: hangi konu yardımıyla hedefi kazandıracağım? Belirlenen hedefleri kazandırmak için; Hangi üniteleri işleyeceksin? Her bir ünite için hangi konu başlıklarına yer vereceksin? Her bir konu başlığını hangi detayda vereceksin? Ünitelerin işleniş sırası ne olacak? Örneğin; problem çözme becerisini kazandırmak için, İçerik, problem çözme becerisi için hangi ünitede ele alacaksın. Ünite çevreyse çevre ile ilgili bölüm seçeceksin. İçerik konudur. Hedefi kazandırmak için içeriği veya konuyu araç olarak kullanıyorsun. 3) Öğretim Durumu: Öğretme yöntem ve teknikleri
Ölçme Ve Değerlendirme Ders Notları 2 Öğretim materyalleri 4) Değerlendirme: Eğer bu aşamada problem çıkarsa geri dönüp 3 nü düzeltmek lazım. Eğitim ve Öğretim farkı nedir? Planlı etkinlikler Sınıf içinde yapılan planlı programlı ders. Sınıf içinde Temel ihtiyaçlar ÖLÇME ve DEĞERLENDİRME Ölçme: Betimleme, tasvir etme işidir. Ölçtüğümüz şey bir takım özelliklerdir. Eğitimde; insan özelliği. Başarısının özelliği, zeka, yetenek, ilgileri, tutumları öğrencide bu özellikleri ölçeriz. Fende; bitkinin özelliği, yapraklarının özelliği, kökleri, emici tüyleri * Neleri ölçtüğümüz önemli! Neden ÖLÇME kullanırız? Ölçme, farktan doğmuştur. İnsanların aynı zekası olmasaydı. Ölçme yapılmazdı. İnsan özellikleri ölçeriz, bitki özelliklerini ölçeriz sebebi farklılık olmasıdır. Ölçme, İnsan özelliklerini betimler. Bireyler ya da nesneler söz konusu o özelliğe sahip mi? ne kadar sahip? Bunun gözlemlenip ( ölçme araçları kullanılır) gözlem sonuçlarını sayı sembolleri ile ifade edilmesidir. Sınav Burcu 40 Ölçmedir. Ne kadar sahip? Sahip mi? Hakan 90 Veli 60 Ali 50 Sayı kullanılır. Çünkü küsarıtları gösterir, evrenseldir, sayılarla matematiksel işlemler yapılabilir. Pratiktir ve kolaydır. Bu nedenlerden dolayı ölçmede sayı kullanılır. Ölçme sonuçlarını alıp bir kriterle ya da ölçütle karşılaştırıp yorumlamaya, karar vermeye DEĞERLENDİRME denir. Kriter/ Ölçüt 55 Sınav Ölçme Sonucu Yorum Değerlendirme Sonucu Burcu 40 Başarısız KALDI Hakan 90 Başarılı GEÇTİ Veli 60 Başarılı GEÇTİ Ali 80 Başarılı GEÇTİ Değerlendirme Ölçme sonucu Kriter 3 ayaktan oluşur. Yorumlama Geçip/ geçmemeye karar vermek için sınav yapılır. Ölçme sonucu ( sayı) ne ile karşılaştıracağıma kriterime göre anlam kazanır. Sayılara anlam veren kriter, değerdir. ÖLÇÜT KULLANIRKEN; Mutlak Kriter: Daha önceden karar verilen ölçütü kullanma. Örneğin; 55 kullanma Bağıl Kriter: Öğrencinin durumuna bağlı olarak değişen ölçüt kullanma. Kriteri sınıfın düzeyine göre belirleme.
Ölçme Ve Değerlendirme Ders Notları 3 Örneğin; 30 kullanma DEĞERLENDİRME KULLANRKEN; Mutlak Değerlendirme: Sınıfın düzeyi ne olursa olsun daha önceden uygulana kriteri uygulamadır. Eğitimsel açıdan doğru olan mutlak değerlendirmedir. Örneğin, 2. dönemde farkı hoca gelmişse derse ve öğrenciler o dersi bağıl değerlendirme ile geçmişse sorun çıkartabilir. Programın başarılı olup olmadığını Mutlak Değerlendirme söyler. Bağıl Değerlendirme: Öğrencinin durumuna göre değerlendirme yapmaktır. Öğretmenler ne zaman Bağıl Değerlendirme kullanabilir? Sınıfın durumu düşükse ama bu çözüm değildir. Sınavın yüzdesi düşürülebilir. Kavrama düzeyi öğretilip uygulama seviyesinde soru sorulmamalıdır. Düzey iyi ayarlanmalıdır. Bağıl değerlendirme yapmaktansa öğretmen öğrencilerin seviyelerine uygun yeni bir sınav yapmalıdır. Örneğin, çan eğrisinde 70 ile öğrenci kalabilir. Gerçek durumu ortaya çıkarmaz. Sonuçları doğruyu yorumlamayı engeller. DEĞERLENDİRME TÜRLERİ Ne amaçla ve ne zaman yaptığımıza göre değerlendirme 3 e ayrılır. Tanımaya ve yerleştirmeye dönük değerlendirme 2. Biçimlendirmeye ve yerleştirmeye dönük değerlendirme 3. Değer biçmeye yönelik değerlendirme Dönemin başında yapılan değerlendirme; Öğrenciye not verilmez Kavram yanılgıları tespit etmek için Derse karşı tutumlarını belirlemek için Düzeyleri belirleme Duyuşsal Davranış tercih imkânlarına göre değişir. Örn; çevreye çöp atma Bilişsel Davranış kişiye göre değişmez. Örn; 2+2=4 Psikomotor Davranış kas-zihin koordinasyonu. Örn; gitar çalma Örnek: gitar çalma isteği Duyuşsal Gitar çalma için Psikomotor Tanımlamaya ve Yerleştirmeye Dönük Değerlendirme Dönem başında yapılan değerlendirme 2. Biçimlendirmeye ve Yetiştirmeye Dönük Değerlendirme Dönem arasında yapılan değerlendirme Ara sınavlarda not kaygısı olmaz. Öğretmen eksik ve yanlış öğrenmeleri düzeltir. Değer Biçmeye Yönelik Değerlendirme Not verilir. Örneğin; vize * biçimlendirmeye yönelik ( eksikleri gidermek için) * not vermek için ise, değer biçmeye yönelik Öğrencinin gelişimini destekleyici değerlendirme : 1 ve 2 dir. Tam Öğrenme Kuramı Bir dersin % 70 ve 80 ni öğrenmişse başarılıdır. Doğru yerden başlatmak için 2. Biçimlendirmeye yönelik değerlendirme için önemlidir. Bu değerlendirme yapılınca öğrencini eksik ve yanlış bilgileri düzeltip tam öğrenme kuramı sağlanabilir. Bu 3 değerlendirmede amaç ve zaman önemlidir. ÖLÇME Başlangıç noktası bitim noktası Somuttur!
Ölçme Ve Değerlendirme Ders Notları 4 Zeka; soyuttur. Başlangıç ve bitim noktası belli değildir. Zekanın sıfır olduğu yer yok. Zekanın maksimum olduğu noktada belirtilemez. Bir şeyin başlangıç ve bitim noktası belirtilemezse SOYUTTUR. Örneğin başarıda soyuttur. Ölçme İşlemi Nasıl Yol İzlediğimize Göre 2 ye Ayrılır Doğrudan Ölçme 2. Dolaylı Ölçme 3. DOLAYLI ÖLÇME: Ölçmek istediğimiz özelliği soyut oluşu vb. nedenlerden dolayı ölçemiyorum fakat onun göstergesi kabul ettiğim başka özellikleri ölçüyorum. Sonucu da asıl ölçmek istediğim şeyin sonucu gibi yorumluyorum. Bu ölçmeye dolaylı ölçme denir. Bunun nedeni ölçülen kavramın SOYUT olmasıdır. Örneğin; Burcunun zekasını ölçmek istiyorum. Burcunun zekasını direk ölçemeyeceğim için ona matematik, tarih vs sorular olan bir test uyguluyorum. Bu testten aldığım sonucu burcunun zekası ile ilişkilendiriyorum. DOĞRUDAN ÖLÇME: Ölçmek istediğim özelliği kendisi cinsinden bir ölçme aracıyla karşılaştırarak yapılan ölçmeye doğrudan ölçme denir. Örneğin; Alinin boyunun metre ile ölçülmesi. Kilo doğrudan ölçme zaman ( saat) doğrudan ölçme Termometre dolaylı ölçme Ek olarak da Türetilmiş Ölçme: Hacim= taban alanı* yükseklik O özelliği, iki yada daha çok özellikten yola çıkarak bulunur. Örneğin, su sayacı. Sayacın dönme sayısı= kullanılan su Anlamı: eşit aralık cinsinden birimleri olan ölçme aracına ölçek denir. Örneğin; metre, cetvel, termometre ÖLÇEK Anlamı: ölçmede kullandığımız sayılar ne anlama geliyor ve bu sayıları o miktarlara hangi kurala göre veriyoruz. Örneğin; 1 kilo elma ÖLÇEK TÜRLERİ Sınıflandırma ölçeği 2. Sıralama ölçeği 3. Eşit aralık ölçeği 4. Oran ölçeği 5. Sınıflandırma Ölçeği Bireyleri ya da grupları benzerlikleri yada farklılıklara göre sınıflandırılması Kişileri gruplara ayırma Sayıların matematiksel değeri yok Örneğin; göz rengi, arabaların plakaları Göz rengi= mavi yeşil siyah kahverengi 1>2 demek anlamsızdır. Bu 1 2 3 4 yüzden sayılarla işlem yapılamaz. Sıralama Ölçeği Bireylerin yada grupların bir özelliğe sahip oluş miktarına göre en çok sahipten en az sahibe göre sıralanmış biçimidir. Sayıların matematiksel değeri var. Eşit aralıklarından söz edilemez. Aynı boyda olan kişilere aynı numara verilebilir. Örneğin; I I I I I I I I I I I I I I I I I I I I 5>4 diyebiliriz. I I I I I I I I I I Sıralama ölçeği, sınıflandırma ölçeğine göre daha
Ölçme Ve Değerlendirme Ders Notları 5 I I I I I I I I I I I I çok bilgi verir. 1 2 3 4 5 5 4 3 2 1 Eşit Aralıklı Ölçek 2 tane özelliği var. Keyfi olarak saptanan bir başlangıç noktası var. O noktaya izafi sıfır ( keyfi sıfır) diyoruz. Çünkü gerçek yokluğu ifade etmiyor. 2. Birimler arasında eşitlik var. _- sonsuz -3-2 -1 1 2 3 + sonsuz İzafi (keyfi) sıfırdır. Takvim, termometre örnek verilebilir. Oran Ölçeği Eşit aralıklı ölçeklerde gerçek sıfırı tespit edersen bu oran ölçeği olur. 0 1 2 3 2 tane özelliği var: Bir başlangıç noktası var. Oraya sıfır diyoruz. Bu sıfır gerçek yokluğu ifade ediyor. Birimler arasında eşitlik var. Eşit aralıktan farkı gerçek sıfır vardır. Cetvel, ağırlık örnek verilebilir. Zeka (gerçek aralık yok) eşit aralıklı ölçek Isı eşit ağırlıklı ölçek!!! Toplama, çıkarma, anlamında yorumlama yapılabilir. EŞİT ARALIKLI ÖLÇEK Çarpma, bölme anlamında yorumlama yapılamaz. Örneğin; Ahmet 80 Ahmet velinin yarısı kadar başarılı diyemem! Veli 40 gerçek sıfır yok! Ahmet 80 cm veli, ahmetin yarısı kadardır diyebilirim. Veli 40 cm gerçek sıfır var! Ölçtüğün şeyin kendi özelliğine bakarak hangi ölçeği kullanacağım Azlık çokluk belirtiyorsa; sınıflandırma ölçeği Sınıflandırma Ölçeği, Sıralama Ölçeği, Eşit Aralıklı Ölçek, Oran Ölçeği Bu sırada gittikçe daha ayrıntılı hale gelir. Değerlendirmede çıkan yorumun doğru olabilmesi için; Ölçme sonuncunun Ölçme kriterinin (ölçütün) doğruluğuna bağlıdır. Örneğin; Ölçme Sonucu kriter (ölçütüm) 65 belirlenmesi önemli Ali _ 40 Veli_ 80 DEĞERLENDİRME Ayşe_ 50 değerlendirmenin doğru olması için; Ölçüt ve ölçme sonucu önemli! Benim sınavlarım nasıl olsun ki ölçme sonucu öğrencinin notunu yansıtsın? Konu dağılımı düzgün olsun Soru düzeyi iyi olsun Yanlılık olmasın Süre eşit olsun Sorular net olsun vs. Bir testte 3 temel özellik varsa o sınav sonucunu ciddiye alabiliriz. Testin geçerliliği 2. Testin güvenirliliği 3. Testin kullanışlılığı 4. TESTİN GEÇERLİLİĞİ
Ölçme Ve Değerlendirme Ders Notları 6 Testin kullanış amacına hizmet etme derecesidir. Bir test ölçmek istediği o özelliği; Tam olarak ölçüyorsa Başka özelliklere karıştırmadan ölçüyorsa Hatasız ölçüyorsa O test GEÇERLİ testtir Tam olarak ölçüyorsa; Hangi konuları, hangi davranışları, hangi hedefleri öğrettiysen sınav bunları TAM olarak içermelidir. Sınavda tüm konuları kapsarsak, geçerlilik artar. Daraltırsak, geçerlilik azalır. Başka özelliklere karıştırmadan ölçüyorsa; Fen dersinde fen becerilerini ölçmeli. Tarih, Türkçe ( yazı güzelliği) ölçmemeli! Sorulara hedef davranışa göre not verme önemlidir. Yazı güzelmiş not vermek uygun değildir. Hatasız ölçüyorsa; X= G +,- H X: öğrencinin gözlenen puanı ÖRN: 80= 90-10 G: gerçek puanı H: hata puanı baş ağrısı Dikkat eksikliği vs. 80= 70+10 Kopya, atarak cevaplama +,- HATA + hata: kopya, sallamak (bilmediğin soruyu yapmak) hata: baş ağrısı, dikkatsizlik ( bildiğin soruyu yapamamak) Öğrencinin gerçek bilgisi ile aldığı puan dışında onun notuna +,- yönde karışan puana hata puanı denir. Geçerlilik: ölçülen puan, öğrencinin gerçek notuna ne kadar yakınsa geçerlilik o kadar yüksek X=G+,-H X ile G ne kadar yakınsa geçerlilik yüksek X ile G ne kadar uzaksa geçerlilik o kadar düşük olur. Kapsam geçerliliği Geçerlilik Türleri 2. Yordama geçerliliği 3. Yapı geçerliliği 4. Görünüş geçerliliği KAPSAM GEÇERLİLİĞİ Sınavın hangi konularını becerilerini verdiysen bunları kapsamalıdır. 5 ünite/ 3 ünite sorduysa kapsam geçerliliği düşük 5 ünite/ 5 ünite sorduysan kapsam geçerliliği yüksek Sınavımda kapsam geçerliliğinden nasıl emin oluruz? Belirtme tablosu ile Belirtke Tablosu: Ünite konular canlılar a. bitkiler b. hayvanlar c. mantarlar 2. kuvvet a. aynı yönlü b. zıt yönlü Bilgi Kavrama bilgisi + olgular bilgisi 3 + 1 2+2 2+1 1+0 2+1 Kavrama.+. 2+3 1+0 2+1 2+1 2+0 Uygulama Analiz Şimdi bu şekilde belirtme tablosu hazırladığımız zaman 50 soru çıktı. Bu 50 soruyu 25 indirmek için; Her konudan eşit soru azaltılacak diye bir kanun yok. Bloom taksonomosi kavramayı biliyorsa bilgiyi 6 1 2 4 2 0 2 1 2 1
Ölçme Ve Değerlendirme Ders Notları 7 biliyordur. Uygulamayı biliyorsa kavramayı biliyordur. Soru sayısı da azaltılacaksa kavrama ve uygulamadan soru sayısı azaltılmalıdır. Ve son olaraktan soru azaltılacaksa önemli konulardan çok soru azaltılmamalıdır. Belirtke tablosunda soru hazırlanarak kapsam geçerliliği yükseltilir. Kapsam geçerliliği başarı testinde uygulanır. YORDAMA GEÇERLİLİĞİ Bir testi bireyin ileride akademik yada mesleki başarısını tahmin etmek için kullanıyorsanız. O testin iyi tahmin yapabildiği yani yordama geçerliliğinin yüksek olduğunu kanıtlamanız gerekir. ÖSS hangi öğrenciler hangi meslekte başarılı KPSS adaylar arasından en iyisini seçmek Yetenek Sınavları bölümünde başarılı öğrencileri seçer. Yordama Geçerliliği: başarı ve psikolojik test içinde kullanılır. Tabi tahmin etme varsa! ** iyi dediysen iyi çıksın, kötü dediysen kötü çıksın= yordama geçerliliği Not: kapsam geçerliliği; bu kadar konu işledim bakayım ne öğrendi. Bireyin yordama geçerliliğinin olması için kapsam geçerliliğine gerek yok! ÖRNEĞİN; Öğrenci no ÖSS ÜNİV. Bu iki sıralama ( ÖSS ile üniv. Ortalaması) 350 3,20 ne kadar örtüşüyorsa yordama geçerliliği 2. 340 3,15 o kadar yüksek!!! 3. 337 3,10 4. 250 2,70 Bu ikisi arasında hesaplamayı da Korelâsyon kullanılır. R korelasyon katsayısı= -1, 0, +1 R=+,- 1 mükemmel ilişkiyi gösterir. R=0 ilişki yoktur. R nin yorumu; 0,70 ve üstü yüksek geçerlilik ÖRN: ÖSS ve üniv. için r= 0,80 çıksaydı 0,69 ve 0,50 orta geçerlilik yüksek geçerlilik diyecektik 0,49 ve altı düşük geçerlilik YAPI GEÇERLİLİĞİ Yalnız psikolojik testlerde önemlidir. Yapı; psikolojik testin ölçtüğü o özelliğe yapı denir. Zeka, ilgi, yetenek testi Yapı geçerliliği, psikolojik testin ölçtüğü ya da ölçtüğünü idda ettiği o özelliği gerçekten ölçüp ölçmediğini o testin yapı geçerliliği denir. Bir testin yapı geçerliliğin olduğunu ispat etmenin 3 yolu; yol: Benim geliştirdiğim zeka testi Daha önceden kabul gören zeka testi.. 80 90.. 2. 40 2. 55.. 3.70 3.70.... R=+,- 1 testimin geçerliliği 2.yol: Benim geliştirdiğim zeka testi Sahip olunan problem sayısı * zeki insanın az problemi olur. 80 40. 30 2. 40 39. 60 3. 70 38. 35 R=-1 ne kadar yakın çıkarsa testim o kadar zekayı ölçer. Beklentim negatif yönde!!!
Ölçme Ve Değerlendirme Ders Notları 8 3.yol: Yüksek grup Düşük grup * geçerliliğim yüksek gelir. Ortalama= 90 40 GÖRÜNÜŞ GEÇERLİLİĞİ Testin neyi ölçtüğü ile ilgili değil, neyi ölçüyor göründüğü ile ilgilidir. Testteki sorular, sayfa düzeni, ya da kullanılan kelimeler, terimler açısından o dersin sorusu izlenimi doğuruyorsa o testin görünüş geçerliliği yüksektir. Sorular o dersin sorusu değilmiş izlenimi doğuruyorsa görünüş geçerliliği düşüktür. Bir sorunun kimya mı, matematik mi olduğunu anlamak için soruyu çözerken kimya bilgini kullanıp çözersek soru kimya sorusudur. Beceri neyi ölçüyorsa ifade ile orantılı olmalıdır. Görünüş geçerliliği psikolojik testlerde önemlidir. Örneğin, şiddete eğilim var mıdır? Direk sorulursa doğru cevap alınamayabilir. Bunu gizli saklı sorulabilir. İşte bunda görünüş geçerliliği kullanılır. Görünüş geçerliliği başarı testinde uygulanır. Geçerlilik test neyi ölçüyor? 2. Güvenirlik test nasıl ölçüyor? 2. TESTİN GÜVENİRLİĞİ Aynı testin aynı bireylere eşit şartlarda defalarca uygulandığında her seferinde aynı sonuçlar vermesidir. uygulama 2. uygulama 3. uygulama Burcu 80 80 80 Demet 70 70 70 Berk 90 90 90 Eşit Şartlarda; kişilerin o özelliğe sahip oluşları aynı, günün aynı saatlerinde aynı uygulama koşulları ile yapılması Burcu, Demet ve Berk eşit şartlarda birden fazla uygulanan aynı testlerde aynı sonuçlar alınması ile testin güvenirliğinden bahsederiz. Öğrencinin Notuna Gelen Hatalar Öğrenci kaynaklı hatalar 2. Öğretmen kaynaklı hatalar 3. Sınav ortamı kaynaklı hatalar 4. Test kaynaklı hatalar 5. Öğrenci Kaynaklı Hatalar Öğrencinin psikolojik yada fizyolojik durumu. Baş ağrısı, kopya çekme, hasta, morel durumu, stres, atarak cevaplama Öğretmen Kaynaklı Hatalar Uygulama sırasında; zamansız uyarılar, konuşma, öğrenciyle çok ilgilenme, gereksiz stres yaratılması Okuma sırasında; öğretmenin psikolojik durumu ( yorgun, baş ağrısı, hasta ) puanları yanlış toplaması, eksik soru okuması, yanlılık yapması 2. Sınav Ortamı Kaynaklı Hatalar Sıranın bozuk olması, sınıfın ısı, ışık vb. açıdan uygun olmaması, ortamın gürültülü olması Test Kaynaklı Hatalar Aynı sorunun veya şıkkın iki kere yazılması, iki tane doğru yanıtın olması, saman kağıt kullanılması, sorunun anlaşılır olmaması, test yönergesinin olmayışı, doğru yanıtın olamaması, yazıların silik çıkması. OLUŞ ŞEKLİNE GÖRE HATALAR Sabit hata
Ölçme Ve Değerlendirme Ders Notları 9 2. Sistematik hata 3. Rastgele ( tesadüfi) hata Sabit Hata Herkesi eşit yönde aynı oranda etkileyen hatadır. Herkese + 10 puan verilmesi. Herkesi aynı oranda etkileyen hata öğretmen kaynaklıdır. Öğrenci kaynaklı hatalar sabit hata olmaz. Öğretmen yada test kaynaklı hatalar sabit hatadır. 2.Sistematik Hata Sistemli olarak bir grup öğrenci hatadan etkilenir. Bir grup etkilenmez. Kızlara + 5puan, yazısı güzel olanlara +10 puan A/B grubu sınavında B grubunun sorusunun eksik olması Öğretmen yanlılığı ( ailesini tanıma, memleketlisi olma ) Sistematik hata Rastgele ( tesadüfî) Hata Belirlenmesi en zor hatadır. Sınavda başın ağrıması, gürültü (biri çok etkilenir biri az etkilenir), kopya, güneş gelmesi, sıranın çizik olması Ortam koşulları= tesadüfî hata Öğrenci kaynaklı hatalar= tesadüfî hata GEÇERLİLİK GÜVENİRLİLİK Sabit Hata ETKİLER ETKİLEMEZ Sistematik Hata ETKİLER ETKİLEMEZ Rastgele Hata ETKİLER ETKİLER Sistematik hatada/ geçerlilik; hak edilen notun dışında başka not alınması Sistematik hatada/güvenirlilik; tutarlık var notlar arasında etkilemez. Rastgele hatada/ güvenirlilik; 80.70.90 farklı notlar oldu tutarsızlık var etkilenir. NOT: Geçerlilik: hatasız olsun. Öğrencinin aldığı puan öğrencini kendi bilgisi olsun. Başka özelliği karıştırmasın Güvenirlilik; tutarlı olsun. Öğrencinin notlarına baktığım zaman aynı notları göreyim. Notun içine bakmaz. Test puanların rastgele hatalardan arınık olma derecesidir. GÜVENİRLİK Güvenirlik Türleri: Test- tekrar- test yöntemi 2. Paralel formlar (testler) yöntemi 3. İki yarı test yöntemi 4. KR- 20/21 yöntemi 5. Test Tekrar Test Yöntemi Aynı testi belli zaman aracılığıyla aynı bireylere iki kez uyguluyoruz ve iki uygulama arasındaki tutarlığa bakıyoruz. ÖRN: uygulama (zeka) 2. uygulama (zeka) 80 80 65 66 40 40.... R= +1 ( zaman farkı önemli)
Ölçme Ve Değerlendirme Ders Notları 10 Benim testim tutarlıysa hata puanı az karışmıştır. Korelasyon (r) kullanılır güvenirlikte; güvenirlikte r 0 +1 değer almaz güvenirlikte!!! zıt yönlü ilişki beklenmez. Zaman farkı başarı testinde aralık için, öğrencilerin birinci uygulamada ki soruları hatırlamayacağı kadar uzun konuları unutmayacağı kadar kısa olmalıdır. BİR TEST İKİ UYGULAMA!!! Öğrencinin girdiği sınav bir daha gireceği söylenmez ki çalışma olmasın aynı puanı alsın. Güvenirlik yüksek çıksın. Paralel Test Yöntemi Aynı konuları aynı davranışları ölçen aynı soruda sayıya sahip olan zorluk derecesine ve aynı tip sorulardan oluşan birbirlerine paralel (ikiz) iki tane ayrı test hazırlıyorsunuz daha sonra peş peşe bu iki testi aynı bireylere uyguluyoruz ve bu iki uyguluma arasında tutarlığa bakıyoruz. Her iki testte tutarlılık yüksekse güvenirlik yüksektir. ÖRN: paralel form 2. paralel form Bu iki form çok zaman 2*3=6 3*4=12 geçmeden uygulanmalıdır. 98+5 45+7.. R=+1 80 80 65 66 40 40.... Notların tutarlığa bakılır. Notlar tutarlı ise güvenirlik yüksek İKİ TEST İKİ UYGULAMA!!! Avantajı: Zaman aralığı olmadığı için öğrencinin çalışma riski yok. Güvenirlik daha yüksek çıkar. Dezavantajı: 2 tane ayrı test hazırlamak ve iki testi paralel olacak. Bütün derslerde zor uygulanır örneğin tarih. Başarı testi paralel teste daha uygun Psikolojik testparalel teste uygun hazırlanmayabilir. Test tekrar test daha uygun. Çünkü psikolojik testte iki tane paralel soru hazırlamak zor olabilir. İki Yarı Test Yöntemi Matematik testi BURCU 2. EDA yarı test 2. yarı test 3. Burcu=20 2. Burcu=22. Eda=15 3. 4. Eda=16. 5. 6.. 7. 8. 20..... R=+1 Burcu= yarı testten: 20 2. yarı testten: 22 Eda= yarı testten: 15 2. yarı testten: 16 Bir testten iki not almaya çalışılır. BİR TEST BİR UYGULAMA!!! Burcu aslında 50 soruyu yaptı. Öğretmen sınav kâğıdını ikiye böler eve gidince 2 not yaratır. Bu iki not arasındaki tutarlığa (r ) bakılır. Testteki soru sayısı güvenirliği etkiler. Güvenirlikle soru sayısı artıkça güvenirlik artar, azaldıkça azalır. ÖRN: 5 soruluk testin güvenirliği < 10 soruluk testin güvenirliği
Ölçme Ve Değerlendirme Ders Notları 11 Kapsam geçerliği de artar Adım: r korelasyon hesaplanır iki uygulama arasında. 2. Adım: Sperman- Brown Düzeltme formülü; Rson= 2r/ 1+r Mesela; adımda r= 0.70 bulduk diyelim. adımda ise; 2*0.70/ 1+0.70= 0.82 buluruz. Ben birinci adımda r yi buldum ama pek sağlıklı değil. Bunun için Rson uygulanarak gerçek r yi bulurum. (2. adımda yani) R= 0.82 yorumu; testimizin güvenirliği yüksek yani test puanlarımıza az miktarda rastgele hata karışmıştır. UYARI!!! Sperman- Brown formülü bir tek İKİ YARI TESTTE UYGULANIR. KR- 20/ 21 Yöntemi 1,2,3 maddeler çoktan seçmeli dahil bütün sınav tekniklerine uygulanabilir. Ancak, KR 20,21 formülü yalnızca çoktan seçmeli sorularda kullanabiliyoruz. KR 20,21 Çoktan Seçmeli Sınavlarda Uygulanır. ÖRN: ÖSS sınavının güvenirliği KR yöntemi ile hesaplanır. Bir test bir uygulama!!! KR-21 KR-20 nin özel bir halidir. Testteki bütün sorular zorluk dereceleri bakımından homojen ise ( hepsi zor, hepsi kolay ya da hepsi orta zorlukta ise) KR- 21 ile formülünü kullanarak güvenirliği hesaplarız. KR-20 testteki sorular zorluk seviyeleri bakımından heterojen ise o zaman KR-20 formülünü kullanarak güvenirliği hesaplıyoruz. Zorluk dereceleri hakkında fikrimiz yoksa KR-20 kullanıyoruz. Soru seviyeleri heterojen ise ama ben KR-21 kullanırsam, çıkan sonuç KR-20 nin alt sınırını verir. Güvenirlik ile Geçerlilik Arasında Nasıl Bağ Var? Güvenirlik, geçerliliğin ön koşuludur. Güvenirlik yoksa geçerlilikte yoktur. Güvenirli değil hata var o zaman geçerlilikte olmaz. Bir test güvenirli olabilir ama geçerli olacağı anlamına gelmez. Örneğin, ben sabit hata yaptım. Güvenirli ama geçerli değil. geçerlilik 2.güvenirlik 3.kullanışlılık 3. Kullanışlılık Bir testin geliştirilmesi, uygulanması ve puanlaması aşamalarında para, zaman ve emek açısından ekonomik olmasına testin kullanışlığı diyoruz. Kullanışlılık= testin ekonomikliği Örneğin: çoktan seçmeli testin hazırlanması zordur, kullanışlı değil çoktan seçmeli testin uygulanması, çok konu kapsaması kolaydır, kullanışlıdır. SORU: 16 kişilik bir sınıfta bir fen bilgisi testi birer hafta arayla 2 kez uygulanıyor. Buna göre bu testin test tekrar test güvenirliğini bulun? N: 16 syf: 60 İşlemler var. KR20/21 formülleri var defterden bak