Erişi Testlerine Madde Seçiminde Klasik Test Kuramı ve Rasch Modelinin K arşılaştırılm ası

Benzer belgeler
RASCH MODELİ İLE ELDE EDİLEN YETENEK ÖLÇÜLERİNİN NİTELİKLERİ ÜZERİNDE BİR ÇALIŞMA

ÖLÇMEDE OBJEKTİFLİK VE RASCH MODELİ

MADDE VE TEST ANALİZİ. instagram: sevimasiroglu

Klasik Test Teorisine ve Örtük Özellikler Teorisine Göre Kestirilen Madde Parametrelerinin Karşılaştırılması Üzerine Ampirik Bir Çalışma

Test İstatistikleri AHMET SALİH ŞİMŞEK

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

ÖRTÜK ÖZELLIKLER TEORIsINDEKI b VE a PARAMETRELERI ile KLAsIK TEST TEORIsINDEKI p VE r istatistikleri ARASINDAKı ILIşKI

Öğrenci Başarısının Öğretmen Yapımı Bir Testle Klasik Test Kuramı ve Madde Tepki Kuramı Yöntemleriyle Elde Edilen Puanlara Göre Karşılaştırılması

Ölçme Araçlarında Bulunması Gereken Nitelikler. Geçerlik. Geçerlik Türleri. Geçerlik. Kapsam Geçerliği

Bilimsel Araştırma Ödevlerinin Çok Yüzeyli Rasch Ölçme Modeli ile Değerlendirilmesi

BÖLÜM 9 NORMAL DAĞILIM

EĞİTİM ÖĞRETİM YILI II. DÖNEM ORTAK SINAV TEST VE MADDE İSTATİSTİKLERİ

17/01/2015. PowerPoint Template. Dr. S.Nihat ŞAD LOGO. İnönü University. Company Logo

İNŞAAT MÜHENDİSLİĞİ BÖLÜMÜ ÖĞRENCİLERİNİN BAŞARI NOTLARININ DEĞERLENDİRİLMESİ. Tamer Yılmaz, Barış Yılmaz, Halim Sezici 1 ÖZET

MİLLİ EĞİTİM BAKANLIĞI ÖZEL OKULLAR SINAVI VERİLERİNİN MADDE TEPKİ KURAMI MODELLERİNE UYUMU

2018 MSÜ. Değerlendirme Raporu MSÜ

THOMAS TÜRKİYE PPA Güvenilirlik, Geçerlilik ve Standardizasyon Çalışmaları Özet Rapor

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

Lise Öğrencilerinin Kimya Dersine Yönelik Tutum Ölçeği Geliştirme Çalışması

Medde İstatistikleri, Test İstatiskleri

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

ÖLÇÜT DAYANAKLı TESTLERİN MADDE ANALİzİNDE UYUŞMA İNDEKSLERİ~lN KULLANIMI

Hacettepe Üniversitesi E itim Fakültesi Dergisi 26 : [2004] Devrim ÖZDEM R** 1. G R fi

ÖRNEKLEM BÜYÜKLÜĞÜNÜN VE TEST UZUNLUĞUNUN MTK PARAMETRE KESTİRİMİNE ETKİSİ

GİRİŞ. Bilimsel Araştırma: Bilimsel bilgi elde etme süreci olarak tanımlanabilir.

Bir Normal Dağılım Ortalaması İçin Testler

ULUSLARARASI 9. BEDEN EĞİTİMİ VE SPOR ÖĞRETMENLİĞİ KONGRESİ

Madde Tepki Kuramına ait Parametrelerin ve Model Uyumlarının Karşılaştırılması: Bir Monte Carlo Çalışması*

2 Tarihsel, Kültürel ve Yasal/Etik Konular 35

BÖLÜM 1 ÖLÇME VE DEĞERLENDİRMEDE TEMEL KAVRAMLAR

Açıköğretimde kullanılan sınavlardan Klasik Test Kuramına ve Madde Tepki Kuramına göre elde edilen yetenek ölçülerinin karşılaştırılması

Bireyselleştirilmiş Testler Üzerine Bir Çalışma 1

2018 KPSS Ortaöğretim. Değerlendirme Raporu

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5

PSİKOLOJİDE ÖLÇEK KAVRAMI VE ÖLÇEK TÜRLERİ /11 Bogardus Tutum Ölçeği /12 Thurston Ölçeği /13 Likert Tipi Ölçekler /13 Guttmann Tutum Ölçeği /15

Türkçe Öğretmenliği Programında Ders Değerlendirmelerinin Çok-Yüzeyli Rasch Ölçme Modeli ile Analizi

SPSS UYGULAMALARI-II Dr. Seher Yalçın 1

Siirt Üniversitesi Eğitim Fakültesi. Halil Coşkun ÇELİK

PROJE TABANLI ÖĞRENMEDE ÇOKLU ZEKÂ YAKLAŞIMININ MATEMATİK ÖĞRENME BAŞARISINA VE MATEMATİĞE KARŞI TUTUMA ETKİSİNİN KARŞILAŞTIRILMASI

FEN BİLGİSİ ÖĞRETMEN ADAYLARININ FEN BRANŞLARINA KARŞI TUTUMLARININ İNCELENMESİ

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

TEST VE MADDE ANALİZLERİ

HS-003. Nuray ŞAHİN ORAK (Marmara Üniversitesi, Sağlık Bilimleri Fakültesi, Hemşirelik Bölümü, Hemşirelik Esasları Anabilim Dalı.

Dikey Ölçeklemede Klasik Test ve Madde Tepki Kuramına Dayalı Yöntemlerin Karşılaştırılması *

ISSN : csemerci@firat.edu.tr Elazig-Turkey

KİMYAYA İLİŞKİN TUTUMLARIN ÖLÇÜLMESİ

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

Temel ve Uygulamalı Araştırmalar için Araştırma Süreci

TOTBİD-TOTEK UZMANLIK EĞİTİMİ GELİŞİM SINAVI (UEGS) DEĞERLENDİRME RAPORU

SÜREKLİ OLASILIK DAĞILIMI

MESLEĞE VE ÖRGÜTE BAĞLILIĞIN ÇOK YÖNLÜ İNCELENMESİNDE MEYER-ALLEN MODELİ

Beden Eğitimi Öğretmenleri için Futbol Genel Alan Bilgisi Testinin Güvenirlik ve Geçerliği

Açık ve uzaktan öğrenmede şans başarısı: Klasik Test Kuramı (KTK) ve Madde Tepki Kurama (MTK) temelinde karşılaştırmalı bir analiz

M d a d dd e A l na i li i z

Doç. Dr. Şeref TAN ÖĞRETİMDE ÖLÇME VE DEĞERLENDİRME ISBN

2 Tarihsel, Kültürel ve Yasal/Etik Konular 35

Pedagojik Formasyon Eğitimi ÖLÇME VE DEĞERLENDİRME

EĞİTİCİLERİN EĞİTİMİ PROGRAMI II.OTURUM

6. SINIF GÖRME ENGELLİ ÖĞRENCİLERE ÜREME BÜYÜME VE GELİŞME ÜNİTESİNİN ÖĞRETİMİ

EĞĠTĠMDE ÖLÇME VE DEĞERLENDĠRME BÖLÜM IV Ölçme Sonuçları Üzerinde Ġstatistiksel ĠĢlemler VERİLERİN DÜZENLENMESİ VERİLERİN DÜZENLENMESİ

ÖRNEK BULGULAR. Tablo 1: Tanımlayıcı özelliklerin dağılımı

ULUDAĞ ÜNİVERSİTESİ EĞİTİM FAKÜLTESİ GÜZEL SANATLAR EĞİTİMİ BÖLÜMÜ, MÜZİK ANABİLİM DALINDA UYGULANAN GİRİŞ ÖZEL YETENEK SINAVINDAKİ

5. HAFTA PFS 107 EĞİTİMDE ÖLÇME VE DEĞERLENDİRME. Yrd. Doç Dr. Fatma Betül Kurnaz. KBUZEM. Karabük Üniversitesi

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

İŞLETMECİLER İÇİN İSTATİSTİK II UYGULAMA III. Yrd. Doç. Dr. Pembe GÜÇLÜ

Merkezi Eğilim ve Dağılım Ölçüleri

GEDİZ ÜNİVERSİTESİ PSİKOLOJİ YÜKSEK LİSANS PROGRAMI

TEMEL EĞİTİMDEN ORTAÖĞRETİME GEÇİŞ ORTAK SINAV BAŞARISININ ÇEŞİTLİ DEĞİŞKENLER AÇISINDAN İNCELENMESİ

Ders Bilgileri Ders Kodu Yarıyıl T+U Saat Kredi AKTS FEN BİLİMLERİNDE İSTATİSTİKSEL TEKNİK VE UYGULAMALAR

BÖLÜM 10 PUAN DÖNÜŞÜMLERİ

SÜREKLĠ OLASILIK DAĞILIMLARI

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

MATEMATİKSEL DÜŞÜNMEDE SÜRECİ VE SONUCU YOKLAYAN TESTLER ARASINDA BİR KARŞILAŞTIRMA

ORTA ÖĞRETİM KURUMLARI ÖĞRENCİ SEÇME VE YERLEŞTİRME SINAVININ YORDAMA GEÇERLİĞİNE İLİŞKİN BİR ARAŞTIRMA *

Nedelsky ve Angoff Standart Belirleme Yöntemleri ile Elde Edilen Kesme Puanlarının Genellenebilirlik Kuramı ile Karşılaştırılması

Siirt Üniversitesi Eğitim Fakültesi. Yrd. Doç. Dr. H. Coşkun ÇELİK Arş. Gör. Barış MERCİMEK

Ders 5: ÖLÇME VE DEĞERLENDİRME. Prof. Dr. Tevhide Kargın

Kazanımlar. Z puanları yerine T istatistiğini ne. zaman kullanacağını bilmek. t istatistiği ile hipotez test etmek

ÖLÇME VE DEĞERLENDĠRME (3)

Liselere Geçiş Sistemi (LGS) Merkezi Sınavla Yerleşen Öğrencilerin Performansı. No: 3 T.C. MİLLÎ EĞİTİM BAKANLIĞI

DINA Model Parametreleri Kullanılarak Tahminlenen Madde Ayırıcılık İndekslerinin İncelenmesi

T TESTİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ. Yrd. Doç. Dr. C. Deha DOĞAN

ÇOK BOYUTLU MADDE TEPKİ KURAMININ FARKLI MODELLERİNDEN ÇEŞİTLİ KOŞULLAR ALTINDA KESTİRİLEN PARAMETRELERİN İNCELENMESİ

SANAYİ İŞÇİLERİNİN DİNİ YÖNELİMLERİ VE ÇALIŞMA TUTUMLARI ARASINDAKİ İLİŞKİ - ÇORUM ÖRNEĞİ

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

TEMEL İSTATİSTİK BİLGİSİ. İstatistiksel verileri tasnif etme Verilerin grafiklerle ifade edilmesi Vasat ölçüleri Standart puanlar

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

ŞANS BAŞARISININ TEST EŞİTLEMEYE ETKİSİ THE IMPACT OF CHANCE SUCCESS ON TEST EQUATING

Test Eşitleme : Aynı Davranışları Ölçen, Farklı Madde Formlarına Sahip Testlerin İstatistiksel Eşitliğinin Sınanması

Yeşim Özer Özkan 2. Volume: 11 Issue: 1 Year: 2014

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

HEMġEHRĠ ĠLETĠġĠM MERKEZĠ ÇALIġANLARIYLA STRES VE KAYGI DURUMLARI ÜZERĠNE BĠR DEĞERLENDĠRME

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

BİLİMSEL ARAŞTIRMA YÖNTEMLERİ. Bazı Temel Kavramlar

İleri Mikro İktisadi Analiz. Bahar Prof.Dr. Ertuğrul Deliktaş

Temel ve Uygulamalı Araştırmalar için Araştırma Süreci

ALKÜ EKONOMİ ve FİNANS BÖLÜMÜ ISL 207 İSTATİSTİK I ALIŞTIRMALAR

daha çok göz önünde bulundurulabilir. Öğrencilerin dile karşı daha olumlu bir tutum geliştirmeleri ve daha homojen gruplar ile dersler yürütülebilir.

Transkript:

Erişi Testlerine Madde Seçiminde Klasik Test Kuramı ve Rasch Modelinin K arşılaştırılm ası Yard. Doç. Dr. G iray BERBEROĞLU (*) Eğitim ve öğretim süreci içerisinde kullanılan testler ve ölçekler bir çok amaca hizmet etmektedir. Amaç, sınıf içinde ele alınan hedet ve davranışların yoklanması ve elde edilen sonuçlara göre eğitim ve öğrenim sürecinin tekrar gözden geçirilmesi ya da not vermek olduğunda, sınıf içerisinde kullanılan erişi testlerinden elde edilen puanların da sözkonusu kararlardaki isabeti arttıracak nitelikte olması kaçınılmazdır. Bir testten elde edilen puanların niteliği, o testteki maddelerin niteliği ile doğrudan ilgilidir. Bu nedenle, test geliştirme süreci içerisinde öncelikle testte yer alan maddelerin nitelikleri İncelenmektedir. Madde analizinde sıkça kullanılan yöntemler klasik test kuramına dayanmaktadır. Burada sözkonusu olan yöntem, test puanları ile düşük korelasyon veren maddelerin testten atılarak, tanımlanan amacı ölçen homojen bir ölçek geliştirmektir. Klasik test kuramına alternatif olarak Örtük Özellik Kuramı (Lafent Trait Theory veya Item Response Theory) modelleri önerilmektedir (Hambleton ve Svvaminathan, 1985). Bu kuram içerisinde ele alınan Rasch modeli bir test maddesine cevap verme olasılığını, maddenin güçlüğüne ve bireyin yetenek düzeyine bağlı bir fonksiyonla açıklamaktadır (Özçelik, Berberoğlu, 1989). Madde seçimi ise X2 uyum testi ile yapılmaktadır. Bu modele göre kabul edilebilir bir maddede, bireyin yetenek düzeyi arttıkça doğru cevap verme olasılığının da artması beklenmektedir. Böyle bir maddeye her bir yetenek diliminde doğru cevap verilme olasılığı lojistik fonksiyon eğrisini takip eden bir dağılım göstermekte ve bu eğriye madde karakteristik eğrisi adı verilmektedir (Keeves, 1988, s. 407). X2 uyum testi ile, ölçekleme sonucu madde güçlüğü ve yetenek düzeyinde elde edilen teorik dağılımla, o maddeye verilen cevapların oluşturduğu gözlenen puan dağılımı karşılaştırılmakta, bu iki dağılım arasındaki uyum arttıkça X2 değeri küçülmektedir. X2 uyum testi ile elenen bir maddenin, (1) yazımında teknik bir hata olduğu; (2) ( ) O.D.T.Ü. Eğitim Fakültesi Öğretim Üyesi. 61

ayırıcılığın düşük ya da testteki diğer maddelerden farklı olduğu; (3) test' ile ölçülen yeterlik dışında bir boyutu ölçtüğü; (4) şansla cevaplanabildiği; (5) testteki diğer maddelerden güç olduğu ya da yetenek dağılımı çok geniş bir kitleye uygulandığı, düşünülmektedir (Özçelik, Berberoğlu, 1989, s. 42). Klasik kuramın ve Rasch modelin madde seçiminde birbirinden farklı yöntemler öne sürmesi birçok araştırmacıyı bu iki yöntemi karşılaştırmaya yönlendirmiştir. Helsley, Suber ve Ryan (1977) Rasch modeli ile elenen maddelerin, klasik kuram yöntemleri ile de eleneceğini öne sürmüşler ve Rasch modelini klasik test kuramının matematiksel bir uzantısı olarak göstermişlerdir. Douglass, Khavari ve Farber (1979) ise, Mac Andrew alkolizm ölçeğinde klasik test kuramını ve Rasch modelini karşılaştırmışlar ve bu iki yöntemle seçilen maddeler arasında önemli farklılıklar olduğunu göstermişler ve Rasch modelinin klasik test kuramının matematiksel bir uzantısı olmadığını belirtmişlerdir. Masters (1984, 1988), klasik test kuramı ile Rasch modelinin birçok durumda birbirine benzediğini, klasik kuram tarafından elenen bir maddenin Rasch modeli tarafından da eleneceğini göstermiştir, X2 uyum testinin sınıf içi testlere madde seçiminde uygun bir yöntem olabileceğini belirtmiştir. Bazı araştırmacılar erişi testlerine madde seçiminde Rasch modelini diğer örtük özellik modelleri ile karşılaştırmışlar ve Rasch modelinin diğer modellere göre daha çok sayıda maddeyi elediğini göstermişlerdir (Bock, 1979; Divgi, 1981; Albane Se ve Forsyth, 1984). Bu çalışmalardan da görüldüğü gibi, birçok yönleri ile klasik test kuramı ve Rasch modeli benzer özellikler göstermekte ancak madde seçiminde yöntemler arası bazı farklılıkları dikkate çekmektedir. Bu araştırmanın amacı, sınıf içinde kullanılan erişi testlerinin geliştirilmesinde klasik test kuramına ve Rasch modeline göre seçilen maddeleri karşılaştırmaktır. Y ö n te m Bu araştırmada kavrama ve uygulama düzeyinde, dört seçenekli 43 maddeden oluşan ve güvenirlik, geçerlik, madde yazım teknikleri konularını kapsayan bir Ölçme ve Değerlendirme testi kullanılmış, madde seçimi amacı ile sözkonusu test Orta Doğu Teknik Üniversitesi Eğitim Fakültesi, Yabancı Diller Eğitimi Bölümü 3. sınıfta olan ve Eğitimde Ölçme ve Değerlendirme dersini alan 64 kişilik bir gruba uygulanmıştır. 62

Tablo l'de test puanlarının ortalama, ortanca standart sapma, çarpıklık ve basıklık ölçüleri verilmektedir. Tablo I. Test p uanlarının O rtalam a, O rtanca, S tandart Sapma, Ç a rp ıklık, B a s ık lık Ö lçü le ri Ham Puanlar k 43 N 64 X 24.83 Ortanca 25 Standart Sapma 6.04 Çarpıklık - 0.727 Basıklık 2.969 Tablo l'de görüldüğü gibi, testen elde edilen ham puan dağılımları negatif yönde çarpıktır. Bu ilk uygulamada elde edilen KR (20) güvenirlik katsayısı 0.77 olarak bulunmuştur. Klasik test kuramına göre madde seçimi madde test korelasyonuna (biserial correlation) göre yapılmış, madde-test korelasyonu 0.20'den az olan maddeler testten çıkarılm ası gereken maddeler olarak düşünülmüştür (Ebel, 1965, s. 399, Douglas, Khavari, Farber, 1979). Rasch modeline göre yapılan madde seçimi X2 uyum testi ile yapılmış, a = 0.05 düzeyinde anlamlı X2 değerine sahip olan maddeler testten çıkarılması gereken maddeler olarak düşünülmüştür. Analiz sonucunda her iki yönteme göre testten çıkarılması gereken maddelerin birbirinden farklı maddeler olup olmadığı karşılaştırılmıştır. Klasik madde analizi ve Rasch modeli analizleri MicroCAT (tm) - Testing System (1986) paket programları kullanılarak yapılmıştır. Bulgular Klasik madde analizine göre her bir madde için elde edilen madde güçlük ölçüsü (p) ile, madde test korelasyonu ya da madde ay incilik ölçüsü (r) ve Rasch modeline göre her bir madde için elde edilen madde güçlük ölçüsü (bj) ile x2 değerleri Tablo ll'de gösterilmiştir. 63

Tablo II. Her Bir Maddenin p, r, bj ve X2 değerleri. M adde N o. P r bj X2 1 0.58 0.39-0.607 11.629 2 0.75 0.64-1.936 8.367 3 0.23-0.08** 1.927 25.093* 4 0.84 0.64-2.943 8.445 5 0.81 0.47-2.563 8.646 6 0.53 0.33-0.285 15.704 7 0.78 0.60-2.233 7.424 8 0.78 0.48-2.233 7.430 9 0.33 0.27 1.142 15.715 10 0.39 0.14** 0.682 24.103 11 0.53 0.64-0.285 13.500 12 0.45 0.48 0.247 9.877 13 0.53 0.54-0.285 13.464 14 0.70 0.71-1.535 14.979 15 0.81 0.68-2.563 12.343 16 0.64 0.35-1.053 10.208 17 0.50 0.41-0.072 6.812 18 0.50 0.64-0.072 17.856 19 0.36 0.19 ** 0.908 25.408* 20 0.11 0.65 3.429 10.611 21 0.75 0.26-1.936 11.811 22 0.81 0.37-2.563 10.363 23 0.70 0.36-1.535 10.408 24 0.77 0.53-2.081 10.578 25 0.48 0.31 0.034 10.021 26 0.38 0.40 0.794 8.517 27 0.84 0.54-2.943 13.802 28 0.67 0.44-1.288 12.264 29 0.34 0.53 1.024 7.982 30 0.47 0.24 0.149 7.132 31 0.23 0.25 1.927 21.877* 32 0.64 0.31-1.053 9.835 33 0.47 0.01** 0.140 21.518* 34 0.53 0.12** -0.285 14.603 35 0.47 0.64 0.140 20.675 36 0.41 0.50 0.571 17.024 37 0.56 0.22-0.499 20.336 38 0.58 0.47-0.607 6.477 39 0.78 0.60-2.233 7.628 40 0.78 0.52-2.233 8.577 41 0.86 0.48-3.159 9.478 42 0.63 0.39-0.939 11.713 43 0.50 0.29-0.072 8.797 * a = 0.05 düzeyinde modele uyum vermeyen maddeler * r değeri 0.20"nin altında olan maddeler G4

Tablo ll'de görüldüğü gibi klasik test kuramına göre testten elenmesi gereken maddeler 3, 10, 19, 33, 34 numaralı maddelerdir. Rasch modeline göre testten elenmesi gereken maddeler ise 3, 10, 19, 31, 33 numaralı maddelerdir. Her iki yönteme göre aynı sayıda madde elenmiştir. 31 ve 34 numaralı maddeler hariç her iki yönteme göre testten çıkarılması gereken maddeler aynıdır. Sonuç Bu araştırmada sınıf içinde kullanılan bir erişi testinin geliştirilmesinde klasik test kuramına ve Rasch modeline göre seçilen maddelerin birbirinden farklı olup olmadığına bakılmıştır. Tablo ll'deki bilgiler yakından incelendiğinde klasik test kuramına ve Rashc modeline göre testten elenmesi gereken maddeler arasında büyük ölçüde benzerlik vardır. Ancak bir madde klasik kurama göre elenmiş buna rağmen X2 uyum testine göre teste konulması uygun görülmüş (madde no: 34), aynı şekilde bir madde de X2 uyum testine göre elenmiş, ancak klasik kurama göre teste konulması uygun görülmüştür (madde no: 31). Bu maddelerden 31 numaralı maddenin X2 değeri tablo değerine çok yakın bir değerdedir ve çok az bir farkla modele uyum göstermektedir. Maddenin p ve bj değerlerine bakıldığında, testteki diğer maddelere göre oldukça zor olduğu, r değerinin ise 0.20'ye yakın olduğu dikkati çekmektedir. Bu nedenle 31 numaralı maddede şans başarısının sözkonusu olduğu ve bunun da X2 uyum testi ile belirlendiği söylenebilir (VVright, Panchapakesan, 1969). Ancak 34 numaralı madde düşük r değerine sahip olmasına rağmen Rasch modeline göre teste konulması uygun görülmüştür. 34 numaralı maddenin r değeri düşük olmasına rağmen gözlenen puanlardan elde edilen madde karakteristik eğrisinin lojistik fonksiyona uyduğu ve düşük yetenek düzeyindeki bireylerin maddeye doğru cevap verme olasılıklarının yetenek düzeyi yüksek bireylere nazaran daha düşük olduğu gözlenmiştir. Tablo ll'de, genel olarak zor gözüken ve r değerleri düşük olan maddelerin her iki yöntem tarafından da elendiğini, madde ay incilik ölçüleri ile X2 uyum testi arasında büyük bir benzerlik olduğunu gösteren kanıtlar vardır, r değeri yükseldikçe gözlenen puan dağılımlarının madde r değeri yükseldikçe gözlenen puan dağılımlarının madde karakteristik eğrilerini takip ettiği ve X2 uyum testine göre modele uyum gösterdiği söylenebilir. Ancak 34 numaralı maddede de görüldüğü üzere yalnızca r değeri maddenin Rasch modeline uyum verip vermeyeceğinin bir göstergesi olmamaktadır. Rasch modeline göre elenen maddeler testten atılıp klasik madde analizi yeniden yapıldığında ortalama madde güçlük ölçüleri (p) 0.58'den 0.61'e yükselmekte, ortalama madde ayırıcılık ölçüleri de (r) 0.42'den 0.46'ya 65

yükselmekledir. Ayrıca, testin güvenirlik katsayısı da maddeler atıldıktan sonra 0.77'den 0.80'e yükselmektedir. X2 değerleri ve r değerleri arasında -,048'lik bir korelasyon vardır. Bu da madde ayırıcılık ölçüleri yükseldikçe X2 değerlerinin küçüldüğünü ve klasik kuram tarafından düşük ayırıcılık ölçüsü nedeni ile testten elenen maddelerin büyük olasılıkla Rasch modeli tarafından da eleneceğini göstermektedir. Bu bulgular Helsley, Suber, Ryan (1977), ve Masters'ın (1988) bulduğu sonuçları destekler niteliktedir. Bu araştırmanın bulgularından şu sonuçlara gidilebilir: Klasik test kuramı ve Rasch modeline göre madde seçiminde bazı yöntem farklılıkları vardır, ancak bu araştırmada kullanılan teste seçile maddelerde klasik test kuramı ve Rasch modeli arasında büyük farklılıklar gözlenmemiştir. Ayrıca X2 uyum testi tek boyutlu sınıf içi testlerinin geliştirilmesinde uygun bir yöntem olarak kullanılabilir. Sözkonusu araştırma probleminin daha büyük örneklem gruplarında ve farklı testlerde incelenmesinde yarar görülmektedir. KAYNAKLAR Albanese, M.A., Forsyth, A.R. (1984) "The One-Two-and Modified Two-Parameter Latent Trait Models: An Empirical Study of Relative Fit". Educational and Psychological Measurement. 44. ss. 229-245. Bock, R.D. (1979). "A Feasibility Study of the One- two-and three parameter Item-Response Models for the Analysis and Reporting of the California Assessment Data". Alındığı Kaynak: Albanese ve Forsyth. Educational and Psychological Measurement. 1984: 44. Divgi, D.R. (1981) "Model-free Evaluation of Equating and Scaling". Alındığı Kaynak: Skaggs ve Lissitz. Review of Educational Research. 1986: 56. Douglas, F.M., Khavari, K.A., Farber, P.D. (1979). "A Comparison of Classical and Latent Trait Item Analysis Procedures". Educational and Psychological Measurement 39. ss. 337-352. Abel, R.L. (1965). Essentlals of Educational Measurement. New Jersey: Prentice-Hall, İne. Hambleton, K.R., Svvaminathan, H. (1985). Item Response Theory: Principles and Applications. Boston: Kluwer. Nijhoff Publishing. Helsley, T.L., Suber, J.S., Ryan, J.P. (1977). "Item Homogeneity Unidimentionality and Test Reliabilitiy: Comparing Classical and Latent Trait Psychometric Procedures". Alındığı Kaynak: Douglass Khavari, Farber. Educational and Psychological Measurement. 1979: 39. s. 339. Keeves, J.P. (1988). "Scaling Achievement Test Scores". Keeves, J.P. (Ed.) (1988). Educational Research M ethodology and Measurement: An International Handbook. New York: Pergamon Press. 66

Masters, G.N. (1984) "DICOT: Analyzing Classroom Tests With the Rasch Model" Educational and Psychological Measurement. 44. ss. 145-150. Masters, G.N. (1988). "Item Discrimination: When More is VVorse". Journal of Educational Measurement. 25-1. ss. 15-29. MicroCAT (tm) - Testing System (1986). Assessment Systems Corporation. Özgelik, D.A., Berberoğlu, G. (1989). "Ölçme Objektiflik ve Rasch Modeli". Eğitim ve Bilim. 13-72. ss. 34-44. Thorndika, R.L. (1082). Applied Psychometrics. Boston: Houghton Mifflin Company. VVright, B.D., Panchapakesan, N. (1969). "A Procedure for Sample-free Item Analysis". Educational and Psychological Measurement. 29: 23-48.