Pedagojik Formasyon Eğitimi ÜNİTE 2 ÖLÇME ARACINDA BULUNMASI GEREKEN NİTELİKLER

Benzer belgeler
Pedagojik Formasyon Eğitimi

Ders 5: ÖLÇME VE DEĞERLENDİRME. Prof. Dr. Tevhide Kargın

Ölçme Araçlarında Bulunması Gereken Nitelikler. Geçerlik. Geçerlik Türleri. Geçerlik. Kapsam Geçerliği

Korelasyon Ölçme aracında bulunması gereken özellikler. Korelasyon katsayısının yorumlanması-1

Yrd.Doç.Dr.Ahmet HAKYEMEZ (Bu sunum Yrd. Doç. Dr. Serap EMİR ve Doç. Dr. Sevinç HATİPOĞLU nun sunumlarına dayanılarak hazırlanmıştır)

BİLİMSEL ARAŞTIRMA YÖNTEMLERİ

2. SUNUM. 3 temel özellik Ölçmede hata ve hata türleri Güvenirlik Güvenirlik hesaplama yöntemleri Ölçmenin standart hatası Geçerlik Kullanışlılık

BİLİMSEL ARAŞTIRMALARDA ÖLÇME ARAÇLARI VE ÖZELLİKLERİ

Eğitsel Davranışsal Değerlendirme. Yrd. Doç. Dr. Pınar ŞAFAK

Ölçme aracındaki 3 temel özellik Ölçmede hata Hata türleri Güvenirlik Güvenirlik hesaplama yöntemleri Ölçmenin standart hatası Geçerlik Kullanışlılık

5. HAFTA PFS 107 EĞİTİMDE ÖLÇME VE DEĞERLENDİRME. Yrd. Doç Dr. Fatma Betül Kurnaz. KBUZEM. Karabük Üniversitesi

BÖLÜM 1 ÖLÇME VE DEĞERLENDİRMEDE TEMEL KAVRAMLAR

ÖLÇME VE DEĞERLENDİRME ZERRİN SARIGÜL

DEĞERLENDİRME ARASINDAKİ İLİŞKİLER... 1

Pedagojik Formasyon Eğitimi ÖLÇME VE DEĞERLENDİRME

Ölçme ve Değerlendirmenin. Eğitim Sistemi Açısından. Ölçme ve Değerlendirme. TESOY-Hafta Yrd. Doç. Dr.

ÖLÇMEDE HATA KPSS AKADEMİ. ölçme ve değerlendirme HATA KAYNAKLARI. 1.Ölçenden

Test İstatistikleri. Test İstatistikleri Madde İstatistikleri Madde Güçlük İndeksi. Madde Ayırt Edicilik İndeksi Madde Varyansı Madde Güvenirliği

BİLİMSEL ARAŞTIRMA YÖNTEMLERİ. Bazı Temel Kavramlar

İÇİNDEKİLER BÖLÜM 1 ÖLÇMENİN TEMEL KAVRAMLARI / 1

PSİKOLOJİDE ÖLÇEK KAVRAMI VE ÖLÇEK TÜRLERİ /11 Bogardus Tutum Ölçeği /12 Thurston Ölçeği /13 Likert Tipi Ölçekler /13 Guttmann Tutum Ölçeği /15

ÖĞRETİM MATERYALLERİNİN DEĞERLENDİRİLMESİ. Dr. Emine CABI

EĞİTİM ÖĞRETİM YILI II. DÖNEM ORTAK SINAV TEST VE MADDE İSTATİSTİKLERİ

FEN BİLGİSİ ÖĞRETMENLERİNİN KULLANDIKLARI ÖLÇME ARAÇLARININ KAPSAM GEÇERLİĞİ YÖNÜNDEN ARAŞTIRILMASI

EĞĠTĠMDE ÖLÇME ve DEĞERLENDĠRME

M d a d dd e A l na i li i z

Madde güçlük indeksi: Herbir maddenin zorluk derecesini, uygun güçlük düzeyine sahip olup olmadığını gösterir.

Test Analizi. Test analizi iki şekilde yapılır; 1. Testin tamamı analiz edilir (test analizi), 2. Her bir test maddesi analiz edilir (madde analizi).

NİCEL (Quantitative) VERİ TOPLAMA ARAÇLARI

Medde İstatistikleri, Test İstatiskleri

EĞĠTĠMDE ÖLÇME VE DEĞERLENDĠRME BÖLÜM V Test ve Madde Ġstatistikleri

TEST VE MADDE ANALİZLERİ

MADDE VE TEST ANALİZİ. instagram: sevimasiroglu


Doç. Dr. Şeref TAN ÖĞRETİMDE ÖLÇME VE DEĞERLENDİRME ISBN

Okullarda Kullanılan Sınavlar ve Özellikleri

RECEP TAYYİP ERDOĞAN ÜNİVERSİTESİ YABANCI ÖĞRENCİ SINAVI 2016 RAPORU

KPSS/1-EB-CÖ/ Bir öğretim programında hedefler ve kazanımlara yer verilmesinin en önemli amacı aşağıdakilerden hangisidir?

ÖLÇME DEĞERLENDİRME ÜNİTE BAŞLIKLARI

A 11. A) Olayın karışık ve anlaşılması zor bir ifadeyle yazılmış. Bu ön koşul işlemiyle ilgili olarak,

Diğer sayfaya geçiniz KPSS / EB CÖS soruları aşağıdaki bilgilere göre cevaplayınız. 43.

Testler AHMET SALİH ŞİMŞEK

Öğrenim Kazanımları Bu programı başarı ile tamamlayan öğrenci;

Bilimsel Araştırmanın Temelleri

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Veri Toplama Teknikleri

Siirt Üniversitesi Eğitim Fakültesi. Halil Coşkun ÇELİK

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

EĞİTİMDE ÖLÇME VE DEĞERLENDİRME ARŞ. GÖR. MUHİTTİN ÇALIŞKAN

17/01/2015. PowerPoint Template. Dr. S.Nihat ŞAD LOGO. İnönü University. Company Logo

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

ÖLÇME VE DEĞERLENDİRME

ARAġTIRMALARDA ÖLÇME VE ÖLÇEKLER. Kezban SEÇKİN Vildan GÜNEŞ

Editörler: Doç. Dr. Şeref TAN ÖĞRETİMDE ÖLÇME VE DEĞERLENDİRME

İÇİNDEKİLER REHBERLİK VE PSİKOLOJİK DANIŞMADA ÖLÇME ARAÇLARININ KULLANIM

KPSS-EB-CÖ/ Öğrenciyi merkeze alan sınıf içi öğretim etkinlikleri düzenlenirken aşağıdakilerden öncelikle hangisi dikkate alınmalıdır?

Bilgisayar Destekli Ölçme ve Değerlendirme

Merkezi Eğilim ve Dağılım Ölçüleri

Merkezi Yığılma ve Dağılım Ölçüleri

KONU KAVRAMA TESTI 7. Bir testin güvenilir ve ayırt edici olabilmesi için testin ortalama güçlüğünün hangi düzeyde olması gerekir?

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

BÖLÜM 2 VERİ SETİNİN HAZIRLANMASI VE DÜZENLENMESİ

7. BİREYİ TANIMA TEKNİKLERİ. Abdullah ATLİ

İÇİNDEKİLER BİLİMSEL ARAŞTIRMAYA İLİŞKİN TEMEL KAVRAMLAR

ÖLÇME VE DEĞERLENDĠRME (1)

ÖLÇME ÖRNEK ÖLÇME DEĞ. Ahmet tarih dersinin sınavından 83 puan aldı. Bugün havanın sıcaklığı 15 C o dir.

TEMEL İSTATİSTİK BİLGİSİ. İstatistiksel verileri tasnif etme Verilerin grafiklerle ifade edilmesi Vasat ölçüleri Standart puanlar

ULUDAĞ ÜNİVERSİTESİ EĞİTİM FAKÜLTESİ GÜZEL SANATLAR EĞİTİMİ BÖLÜMÜ, MÜZİK ANABİLİM DALINDA UYGULANAN GİRİŞ ÖZEL YETENEK SINAVINDAKİ

Test geliştirme dinamik bir süreçtir.

2 Tarihsel, Kültürel ve Yasal/Etik Konular 35

SINAVLARIN PLANLANMASI EĞİTİMDE KULLANILAN ÖLÇME ARAÇLARI

Geçerlilik ve Güvenilirlik Araştırması. Özet rapor

Ölçme. BBY606 Araştırma Yöntemleri Güleda Doğan

1. GEÇERLİLİK VE GÜVENİLİRLİLİK

Öğrenim Kazanımları Bu programı başarı ile tamamlayan öğrenci;

ölçme ve değerlendirme

DERS 3 ÖLÇÜ HATALARI Kaynak: İ.ASRİ

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

kpss ÖLÇME ve DEĞERLENDİRME SORU Önce biz sorduk Güncellenmiş Yeni Baskı Eğitim Bilimleri 80 Soruda 64

BEM. Öğrencinin tüm hayatını temelden etkileyen öğrenme stillerini belirleyerek. Eğilimlerini belirleyerek. Öğrencinin kendini tanımasını sağlayarak

MİLLÎ EĞİTİM BAKANLIĞI İLKÖĞRETİM KURUMLARI YÖNETMELİĞİ ÖLÇME VE DEĞERLENDİRME İLE İLGİLİ BÖLÜMLER DÖRDÜNCÜ KISIM

Bana göre; öğrenemeyen öğrenci yoktur. Herkes öğrenebilir Tüm bilgiler okulda öğrenilebilir Hedeflenen başarı %70-%90 arasındadır.

EĞİTİMDE KULLANILAN ÖLÇME ARAÇ VE YÖNTEMLERİ

Beden Eğitimi Öğretmenleri için Futbol Genel Alan Bilgisi Testinin Güvenirlik ve Geçerliği

Dersin Adı Kodu Yarıyılı T + U Kredisi AKTS. Türkçe. Seçmeli. Bu dersin sonunda öğrenci;

Korelasyon, Korelasyon Türleri ve Regresyon

ÖLÇME VE DEĞERLENDİRME

KPSS. Eğitim Bilimleri. ezberbozan. serisi. KPSS Ders Notları. özetlenmiş içerik pratik bilgiler kritik notlar ilgi çekici görseller

ÖLÇME VE DEĞERLENDİRME FARKINDALIK SEMİNERİ. Ahmet EŞ Sancaktepe Rehberlik ve Araştırma Merkezi

Nitel Araştırmada Geçerlik ve Güvenirlik

2 Tarihsel, Kültürel ve Yasal/Etik Konular 35

Çukurova Üniversitesi Lisans Öğrencilerine Düzenlenen Temel Bilgi Teknolojileri Kullanımı Dersinin Muafiyet Sınavı Üzerine Bir Çalışma

ÖLÇME VE DEĞERLENDİRME

İSTATİSTİK HAFTA. ÖRNEKLEME METOTLARI ve ÖRNEKLEM BÜYÜKLÜĞÜNÜN TESPİTİ

Olasılık ve Normal Dağılım

Doç. Dr. Şeref TAN ÖĞRETİMDE ÖLÇME VE DEĞERLENDİRME ISBN

30 GÜNDE EĞİTİM BİLİMLERİ

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

2 Hata Hesabı. Hata Nedir? Mutlak Hata. Bağıl Hata

Non-Parametrik İstatistiksel Yöntemler

Transkript:

Recep Tayyip Erdoğan Üniversitesi Eğitim Fakültesi Pedagojik Formasyon Eğitimi SERTİFİKA PROGRAMI ÜNİTE 2 ÖLÇME ARACINDA BULUNMASI GEREKEN NİTELİKLER Recep Tayyip Erdoğan Üniversitesi Eğitim Fakültesi Doç. Dr. Ahmet TEKBIYIK Pedagojik Formasyon Eğitimi Sertifika Programı Ders Notları ı ÖLÇMEDE HATA Somut ya da soyut niceliklerin ölçülmesinde daima hata yapma ihtimali vardır, Hata kaynakları: Ölçülen özellik Ölçülen bireylerin özellikleri Ölçmenin yapıldığı ortam Ölçme aracı Ölçmeyi yapan kişi 1

1. Sabit Hata: Bir ölçmeden diğerine değişmeyen hata türüdür. Örnek: Tüm öğrencilerin sınav notlarına 10 puan eklemek, Baskül ün her defasında 2 kg eksik tartması Bir soruyu tüm sınıfın cevapsız bırakması Sabit hataların miktarı ve kaynağı bellidir. Bu nedenle güvenirliği etkilemez, geçerliği doğrudan etkiler Sabit hata ortalamayı değiştirir Standart sapmayı etkilemez, 2. Sistematik hata: Miktarı değişken olan ve tüm ölçümlere aynı oranda etki etmeyen hatadır. Ölçmeyi yapan kişiye, ölçülen niceliğe ve ölçme koşullarına bağlı olarak değişebilir. Ölçmede amaçlanan değişkenin dışında başka bir değişkenin de ölçülmesi durumunda görülebilir Örnek: Sıcaklıktan etkilenen bir şerit metreyle farklı sıcaklıklarda ölçüm yapılması, Bir terazinin her 1 kg da 25 gr fazla tartması Öğretmenin kendisine yakın gördüğü öğrencilerin sınav kağıtlarını okurken fazla puan vermesi Her sınav kağıdına %10 puan eklemesi Sistematik hatalar güvenirliği etkilemezken, geçerliği düşürür. Ortalamayı da etkiler 2

3. Rasgele Hata: Kaynağı ve miktarı belli olmayan hatalardır. Ölçmeyi yapan kişiden, ortamdan veya şans başarısından kaynaklanabilir. Hatanın kaynağı, yönü ve miktarı bilinemediğinden arındırılamaz. Örnek; Dikkatsiz puanlama Sınıf ortamının elverişsizliği Öğrencilerin duyuşsal özellikleri (Sınav kaygısı vb.) Rasgele hatalar öncelikle güvenirliği ve dolaylı olarak geçerliliği düşürür Kopya çekme davranışı ölçmede hata kapsamına girer mi? BIR ÖLÇME ARACıNDA BULUNMASı GEREKEN ÖZELLIKLER Bir ölçme ve değerlendirmeişlemindeverilenkararların doğruluğu ve yerindeliği, kararın dayandığı ölçümlerin hatasız ve ölçütün uygun olmasına bağlıdır. Bu nedenle ölçme araçlarında bazı özelliklerin aranması gerekmektedir. 6 3

GÜVENİRLİK Bir ölçme aracının ölçtüğü özelliğin hatalardan arınık olarak ölçebilme derecesidir Güvenilir bir ölçme aracı Tutarlı, Kararlı, Hassas ve Objektif ölçümler yapar 1. Kararlılık Ölçülen özelliğin aynı ölçme aracıyla farklı zamanlarda birkaç kez ölçüldüğünde birbirine yakın değerler vermesi 2. Tutarlılık Bir ölçme aracındaki maddelerin birbirine ve testin bütününe uyumluluğu (iç tutarlılık) 3. Duyarlılık (Hassasiyet) Birim aralığının mümkün olduğunca küçük olması 4. Objektiflik Farklı Puanlayıcıların ölçme aracından aynı sonuçları elde etmesi 4

Güvenirliği Etkileyen Özellikler 1.Soru sayısının fazla olması güvenirliği artırır 2.Puanlama objektifliği: Birden fazla puanlayıcının aynı sonuçlar elde etmesi güvenirliği artırır 3.Testin uygulama koşullarının elverişli olması güvenirliği artırır 4.Soruların orta güçlükte ve yüksek ayırt edicilikte olması güvenirliği artırır 5.Maddelerin homojen olması, benzer konulardan oluşması güvenirliği artırır 6.Şans başarısının en aza indirilmesi güvenirliği artırır GÜVENIRLIK TAHMIN YÖNTEMLERI GÜVENİRLİK Kararlılık İç tutarlılık İki Uygulama Tek Uygulama Test-Tekrar Test Eşdeğer Formlar Eşdeğer Yarılar KR-20 KR-21 Cronbach Alfa (α) 5

KORELASYON KAVRAMI Korelasyon:İki değişken arasındaki ilişkinin miktarını ve yönünü belirler Korelasyon katsayısı -1 +1 aralığında değer alır +1: Güçlü olumlu ilişki 0: İlişki Yok -1: Güçlü olumsuz ilişki 0 0,4 0,7 1 Düşük Orta Yüksek 6

Test-tekrar test yöntemi (Kararlılık) 1 test-2 uygulama 0,70 ve üzeri yüksek güvenirlik Test Gruba Uygulanır Belli bir süre beklenir İki Uygulama Arasındaki Korelasyon Hesaplanır Aynı test aynı gruba tekrar uygulanır Eşdeğer/Paralel Formlar Yöntemi (Kararlılık) 2 test-2 uygulama Aynı özelliği ölçen iki test 0,70 ve üzeri yüksek güvenirlik A Testi Gruba Uygulanır Kısa bir süre beklenir A ve B testi arasındaki Korelasyon Hesaplanır B testi aynı gruba uygulanır 7

Testi Yarılama/Eşdeğer yarılar yöntemi (İç tutarlılık) 1 test-1 uygulama Test bir gruba bir kez uygulanır, iki yarıya ayrılır Rasgele iki bölüme Tam ortadan ikiye bölme Tek numaralı sorular-çift numaralı sorular Test Gruba Uygulanır Test İki Eşdeğer Yarıya Ayrılı İki yarı arasındaki korelasyon (r) hesaplanır Güvenirlik için Spearman Brown Formülü Kuder-Richardson (KR-20 ve KR-21) ve Cronbach Alfa (İçtutarlılık) Yöntemi 1 test, 1 Uygulama Maddeler arası uyuma yöneliktir KR-20: Maddeler 1 veya 0 şeklide kategorik kodlanmışsa KR-21: Maddeler farklı ağırlıkta puanlanmış veya düzeltme formülü kullanılmışsa Cronbachα: Doğru cevabı olmayan maddelerde (1-Katılmıyorum, 2- Kararsızım, 3-Katılıyorum ) 8

KR-20, KR-21 ve Cronbach Alfa nın Yüksek Olması Durumunda Yapılabilecek Yorumlar: Test tesadüfi hatalardan arınıktır Ölçülen özellik tek boyutludur Testi oluşturan maddeler homojendir, maddeler arası uyum yüksektir İç tutarlılık yüksektir Testin yapı geçerliğinin yüksek olması muhtemeldir Ölçmenin Standart Hatası Bir ölçme aracında tesadüfi hata miktarı tahmin edilemez. Ancak her bir öğrenci başına düşen tesadüfi hata miktarı hesaplanabilir. Standart hata teste karışan hatanın test puanı cinsinden miktarını verir Ölçmenin standart hatası arttıkça güvenirlik azalır S e = Standart Hata r=güvenirlik katsayısı S x =Standart sapma 9

Puanlayıcılar Arası Güvenirlik (Objektiflik) Subjektif testlerde iki farklı puanlayıcının verdiği puanların uyumlu olması puanlama güvenirliğini artırır. A puanlayıcısı öğrencilerin kağıtlartını puanlar B puanlayıcısı öğrencilerin kağıtlartını puanlar İki Puanlama Arasındaki Korelasyon Hesaplanır GEÇERLİK Bir ölçme aracının ölçmek istediği özelliği başka özelliklerle karıştırmadan ölçebilme derecesidir. Bir anlamda testin uygunluğudur. Bir ölçme aracının veya yönteminin onunla ölçülmek istenen değişkeni ölçüp ölçmediği; ölçebiliyorsa, onu başka değişkenlerden ne derece arınık olarak ölçtüğüdür (Turgut, 1993) 20 10

!!! ölçme araç ve yöntemlerinin nitelikleri arasında en önemlisi geçerliktir. Geçerlik, ölçme aracının amaca hizmet etme derecesidir. Bir ölçme aracının geçerli olabilmesi için onun sadece ölçmek için düzenlendiği özelliği ölçmesi, yani onu başka özelliklerle karıştırmadan ölçmesi gerekir. Eğitimde kullanılan araç ve yöntemlerle ölçülmek istenen değişkenler bireylerin yeteneği, başarısı gibi deyimlerle tanımlanmaya çalışılan değişkenlerdir. Aracın veya yöntemin ölçülmek istenen değişkenin ölçüsü olabilecek bir puan vermesi, bu ölçüyü başka değişkenlerle karıştırmaması beklenir. Bir araç veya yöntem, bu niteliği sağlayabileceği derecede geçerli puanlar verir. Bir testin geçerliği bir derece sorunudur. Bir test geçerli veya geçersiz olmaktan öte daha çok veya daha az geçerli olabilir. 21 Testin geçerli olması için güvenilir olması gerekir, ancak güvenilir olmak geçerliği garanti etmez. Bir test geçerli ise; Test amaca hizmet etmektedir, Sorular öğretimin hedeflerini ve konuları temsil etmektedir Test ölçmek istediği özellikleri başka değişkenlere karıştırmadan ölçmektedir 22 11

Geçerlik Türleri Kapsam Geçerliği Ölçüt Geçerliği Yapı Geçerliği Eşzaman (uygunluk) geçerliği Yordama geçerliği 1. KAPSAM GEÇERLİĞİ: Ölçme araç ve yöntemlerinin kapsamlarına ve içeriklerine bakılarak varılan geçerlik yargılarına kapsam geçerliği denir. Bir bütün olarak testin ve testteki her bir maddenin amaca ne derece hizmet ettiğidir. Bir testin kapsam geçerliği; A. Testteki toplam maddelerin ölçülecek davranışları ve konu içeriğini örnekleme derecesine, B. Testteki sorulan soruların ilgili davranışları ölçmede uygun olup olmadığına bağlıdır. 24 12

Kapsam Geçerliğinin belirlenmesinde iki yol izlenebilir 1.1. Mantıksal yol: -Belirtke tablosu hazırlama: İlk sütunda konu ana başlıklarının, ilk satırda ise davranışların bilişsel boyutunun yer aldığı tablodur. Üniteler 1.Giriş 2.Ölçmenin Temelleri 3. Güvenirlik ve Geçerlik 4. Yazılı Yoklama 5.Kısa cevaplı testler 6. Doğru-yanlış testler 7. Çoktan seçmeli testler 8. Sözlü sınavlar Yüzde Davranış Düzeyleri Bilgi Kavrama Uygulama Toplam Yüzde -Uzman görüşü alma: Konu alanı uzmanlarının görüşlerinin alınması yöntemidir. Hazırlanan ölçme aracı uzmanlara gösterilerek ölçülecek konu alanını yeterince temsil edip etmediğinin sorulmasıdır. 25 2.1. İstatistiksel yol:aynı alanda daha önce geliştirilmiş, aynı davranışları ölçen ve geçerliği yüksek bir test ile yeni hazırladığımız iki testin aynı gruba uygulayıp öğrencilerin bu testlerden elde ettikleri puanları arasındaki korelasyona (olumlu ilişkiye) bakma yöntemidir. 13

2. Ölçüt geçerliği: İstatistiksel teknikler kullanılarak ve bilinenlerden yaralanılarak bilinmeyen durumlar hakkında yapılan geleceğe yönelik tahminlerde bulunma işlemidir. Bir tahmin işidir. Testten elde edilen puanlarla testin yordamakiçin düzenlendiği değişkenin doğrudan ölçüsü olan ve daha sonra elde edilen ölçüt arasındaki korelasyon da yordama geçerliğidir. Korelasyon katsayısının büyüklüğü yüksek yordama geçerliğine işarettir. Eğitimde bir öğrencinin ya da grubun gelecekteki başarı durumunun nasıl olacağını tahmin etmek için kullanılır. Örneğin; YGS-LYS sınavları, uygulanan testlerden elde edilen puanlar, adayların üniversitedeki ve gelecekteki başarılarının yordayıcısıolarak kullanılmaktadır. Bu amaçla kullanılan testlerin amaca hizmet etme derecesi yani yordama geçerliğinin olması gerekmektedir. 27 Ölçüt geçerliği, iki grupta incelenebilir; 2.1.Yordama geçerliği: Yordama geçerliği aranan test uygulanır, o testin yordayacağıözellik ya da puan elde edinceye kadar beklenir. Bir okulun giriş sınavında kullanılan testin o okuldaki başarıyı yordama derecesine bakmak istediğimizde testi uyguladıktan sonra o öğrencilerin okulda ders notları ortalamalarını beklememiz gerekmektedir. Söz konusu puanlar geldikten sonra iki puan grubu arasındaki korelasyona bakılır. Elde edilen korelasyon değeri giriş sınavında kullanılan testin girilen okuldaki başarıyı yordama derecesi olarak kabul edilir. Öğrencilerin giriş testi puanları yordayıcı, öğrencilerin başarıları ise ölçüttür. Yordama geçerliği, özellikle seçme amacıyla kullanılan testlerde aranması gereken bir özelliktir. Örneğin personel seçmek amacıyla yapılan bir ölçmenin yordayıcılığı yüksek ise personelin iş başarısının da yüksek olabileceği yorumu yapılır 28 14

2.2. Uygunluk geçerliği (mevcut hal, eş zaman geçerliği): Yeni bir ölme aracı geliştirildiğinde, bu aracın sonuçlarının geçerliği olup olmadığını bulmak için, yeni geliştirilen test ile ilişkili olan ve daha önce uygulanmış bir testin sonuçları ölçüt olarak kullanılabilir. Bu durumda iki test soncu arasındaki korelasyona ilişkin kanıtlara bakılır. Örneğin LYS puanlarının yordama ve uygunluk geçerliği belirlenmek isteniyorsa, korelasyon korelasyon Lise Akademik Başarı Ortalaması Geçmiş LYS Puanı Gelecek Üniversite 1. Sınıf Başarısı Eş zaman Yordama 29 3. Yapı geçerliği:ölçme işleminin teorik bir yapıyı (özelliği) ölçüp ölçmediğinin belirlenmesidir. Birbiri ile ilgili olduğu düşünülen belli öğelerin yada öğeler arasındaki ilişkilerin oluşturduğu bir örüntüye yapı denir. Yapı geçerliği ile maddelerin dersin yapısını oluşturan özelliklere ve birbiriyle olan uyumuna bakılır Bu, bir ölçüde bilimsel kuram geliştirme süreciyle aynıdır. Eğitimde ölçmeye çalışılan bazı özellik yada değişkenler birer kuramsal yapıdır. Örneğin zeka türü ölçülecekse ölçme aracının 8 ayrı alt boyutlu bir yapıya sahip olması beklenir. 30 15

TEST TÜRLERİNDE ARANAN GEÇERLİK-GÜVENİRLİK ve GÜÇLÜK BAŞARI TESTİ SEÇME SINAVI İZLEME TESTİ Kapsam Geçerliği Yordama Geçerliği Yüksek Orta veya Yüksek Yüksek ------- Yüksek -------- Güvenirlik 0,70 ve üzeri 0,70 ve üzeri 0,70 ve üzeri Güçlük Orta düzeyde 0,40-0,60 arası Test zor olmalı 0,40 ve altında Kolay olmalı 0,60 ve üzeri Görünüş geçerliği: Bir testin gerçekten ne ölçtüğüyle değil, onun ne ölçüyor göründüğü ile ilgilidir. Bir testin görünüş geçerliği, o testin ölçmek istediği şeyi ölçüyor görünmesidir. Görünüş geçerliği olan bir test kapağında ne yazılıysa onu ölçüyor görünür. Örneğin;kapağında "Fizik testi" yazılı olan bir testin içinde fizikle ilgili sorular varsa söz konusu testin geçerliği vardır denilir. Bunun için konu alanı uzmanlarının görüşü yeterlidir. 32 16

Kullanışlılık Araç ve yöntemin uygulanabileceği eğitim seviyesi, uygulama süresi, ölçmeden istediği beceriler, maliyet ve ekonomi gibi etkenlerin o araç ve yöntemin kullanılmasına etkileri kullanışlılık olarak ifade edilmektedir. Kullanışlığı artıran önlemler güvenirliği ve geçerliği de dolaylı olarak artırır. ölçme araç ve yöntemlerinin kullanışlılığı hakkında bir yargıya varırken göz önünde bulundurulması gereken noktalar şöyledir; Ekonomi; Araç ve yöntem maliyet yönünden ekonomik olmalı, öğretmene, öğrenciye, yöneticiye ağır mali yük getirmemelidir. Hazırlama süresi; Her araç ve yöntem bir hazırlık gerektirir. Testlerde bu süre daha uzun, yazılı yoklamada daha kısadır. Hazırlama süresi kısa olan bir sınav tercih edilmelidir. Yalnız kalabalık gruplarda yazılı yoklamaların cevaplarının puanlanması zorluğu da göz önünde bulundurulmalıdır. 33 Uygulama süresi; Bir yöntemin kullanılışlığı, verdiği puanın önemine oranla, uygulamada gerektirdiği zaman azaldıkça artar. Hazırlayıcı ve uygulayıcıların nitelikleri; Bir aracın uygulanması ne kadar özel beceriler gerektirirse, kullanışlığı da o oranda sınırlanır. Cevapların Nitelikleri; Öğrenciler cevaplama yönergesini kolayca anlayabilir ve cevaplarını kolayca kaydedebilirlerse, o araç kullanışlıdır. 34 17

Uygulama kolaylıkları;testlerde sayfa düzeni, baskı mükemmelliği, cevap kağıdının düzeni, yazılı yoklamada soruların yazılı verilmesi gibi konular uygulama kolaylığı o araçların kullanılışlığını artırır. Puanlama kolaylıkları; Testlerde cevap kağıdının ayrı olması, iyi düzenlenmesi, cevapların optik okuyucu ile puanlanabilmesi, puanlama anahtarının olması kullanılışlığı artırır. Puanları yorumlama kolaylıkları; Bir araç yorumlamaya yardımcı, yorumlamayı kolaylaştırıcı ve yorumda hatayı azaltıcı araçlarla beslenirse daha kullanışlı olur. 35 Geçerliği Etkileyen faktörler Ölçme yöntemi ve soru sayısı: Bir testte kullanılan yöntem (yazlı, yoklama, sözlü yoklama, testler) öğrencinin alacağı puanı (hata miktarını) etkileyebilir. Testteki soru sayısının fazla olması, kapsam geçerliğini artırır. İstenmeyen özelliklerin ölçülmesi: Her soru, o araçla ölçülmek istenen davranışlardan en az bir tanesini yoklamalı, başka özellikleri ölçmemelidir. Örneğin; matematik bilgisini ölçerken yazı güzelliği, tertip düzen gibi özelliklerin ölçülmesi geçerliği düşürür. Ölçülecek Özelliği Tam Olarak Ölçen Sorular: Her soru, o soruyla ölçülmek istenen bilgi ve becerilere sahip öğrencilerin tereddütsüz doğru cevaplandırılabileceği ve bu bilgi, beceri ve yeteneklere sahip olmayanların doğru cevaplandırılamayacağı nitelikte olmalıdır. Puanlayıcı yanlılığı: 36 18

Kapsamlı ve dengeli dağılım: Sınav belli bir sürede okutulan konular ve o konulara dayanılarak geliştirilmesi beklenen bilgi, beceri ve yetenekler bakımından hem kapsayıcı hem de dengeli olmalıdır. Güvenirlik:Herhangi bir puanın geçerliği için ön şart, onun güvenirliğidir. Güvenirlikten yoksun bir puan sadece tesadüfi hataları gösterir. Hatada geçerli ölçü olamaz. Her ölçme sonucu güvenirliği oranında geçerlik kazanır. Fakat güvenirliğin sağlanmış olması geçerliğinde mutlaka sağlanacağı anlamına gelmez. Sınavın güçlük derecesi: Sınavın ve ölçme araçlarının güçlüğü de geçerliğe etki eder. Güçlük derecesi o sınavdan elde edilecek puanların kullanılacağı amaca göre ayarlanmalıdır. 37 Aynı sınavların her yıl kullanılması, kopya, sınav süresinin yetersizliğinden boş bırakma, soruları sınavdan önce açıklama, derslerde sınav sorularının çözülmesi, öğrencilerin çeşitli nedenlerle sınavı yanda bırakması, gürültü, hastalık gibi nedenlerle sağlıklı bir cevaplandırmanın yapılmayışı gibi etkenler güvenirliği ve geçerliği düşürür. Hedeflere uygun soru hazırlamak, etkili bir sınav planı geçerliği artırır. 38 19