ÖRTÜK ÖZELLIKLER TEORIsINDEKI b VE a PARAMETRELERI ile KLAsIK TEST TEORIsINDEKI p VE r istatistikleri ARASINDAKı ILIşKI

Benzer belgeler
Klasik Test Teorisine ve Örtük Özellikler Teorisine Göre Kestirilen Madde Parametrelerinin Karşılaştırılması Üzerine Ampirik Bir Çalışma

Erişi Testlerine Madde Seçiminde Klasik Test Kuramı ve Rasch Modelinin K arşılaştırılm ası

RASCH MODELİ İLE ELDE EDİLEN YETENEK ÖLÇÜLERİNİN NİTELİKLERİ ÜZERİNDE BİR ÇALIŞMA

Bireyselleştirilmiş Testler Üzerine Bir Çalışma 1

Öğrenci Başarısının Öğretmen Yapımı Bir Testle Klasik Test Kuramı ve Madde Tepki Kuramı Yöntemleriyle Elde Edilen Puanlara Göre Karşılaştırılması

BÖLÜM 9 NORMAL DAĞILIM

M d a d dd e A l na i li i z

Madde güçlük indeksi: Herbir maddenin zorluk derecesini, uygun güçlük düzeyine sahip olup olmadığını gösterir.

5. HAFTA PFS 107 EĞİTİMDE ÖLÇME VE DEĞERLENDİRME. Yrd. Doç Dr. Fatma Betül Kurnaz. KBUZEM. Karabük Üniversitesi

EĞİTİM ÖĞRETİM YILI II. DÖNEM ORTAK SINAV TEST VE MADDE İSTATİSTİKLERİ

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

Bağımlı Gruplar İçin t Testi Wilcoxon İşaretli Sıralar Testi

QUANTILE REGRESYON * Quantile Regression

Açık ve uzaktan öğrenmede şans başarısı: Klasik Test Kuramı (KTK) ve Madde Tepki Kurama (MTK) temelinde karşılaştırmalı bir analiz

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

İstatistik ve Olasılık

SPSS UYGULAMALARI-II Dr. Seher Yalçın 1

ÖLÇMEDE OBJEKTİFLİK VE RASCH MODELİ

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

Ölçme Araçlarında Bulunması Gereken Nitelikler. Geçerlik. Geçerlik Türleri. Geçerlik. Kapsam Geçerliği

Test İstatistikleri AHMET SALİH ŞİMŞEK

BÖLÜM 1 ÖLÇME VE DEĞERLENDİRMEDE TEMEL KAVRAMLAR

BÖLÜM 12 STUDENT T DAĞILIMI

ULUDAĞ ÜNİVERSİTESİ EĞİTİM FAKÜLTESİ GÜZEL SANATLAR EĞİTİMİ BÖLÜMÜ, MÜZİK ANABİLİM DALINDA UYGULANAN GİRİŞ ÖZEL YETENEK SINAVINDAKİ

BÖLÜM 13 HİPOTEZ TESTİ

ÇOK BOYUTLU MADDE TEPKİ KURAMININ FARKLI MODELLERİNDEN ÇEŞİTLİ KOŞULLAR ALTINDA KESTİRİLEN PARAMETRELERİN İNCELENMESİ

Farklı Boyutluluk Özelliklerindeki Basit ve Karmaşık Yapılı Testlerin Çok Boyutlu Madde Tepki Kuramına Dayalı Parametre Kestirimlerinin İncelenmesi*

pmadde GÜÇLÜK İNDEKSİ İ~E ~SCH. ft4.0de~inin. b PARAMETRESİ ve BUNLARA DAY ALI YETENEK OLÇULERI UZERINE BIR KARŞıLAŞTıRMA *

İÇİNDEKİLER ÖN SÖZ...

Korelasyon, Korelasyon Türleri ve Regresyon

Kazanımlar. Z puanları yerine T istatistiğini ne. zaman kullanacağını bilmek. t istatistiği ile hipotez test etmek

Parametrik Olmayan Testler. İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi

BİR, İKİ, ÜÇ VE DÖRT PARAMETRELİ LOJİSTİK MADDE TEPKİ KURAMI MODELLERİNİN KARŞILAŞTIRILMASI AYŞENUR ERDEMİR YÜKSEK LİSANS TEZİ

Merkezi Eğilim ve Dağılım Ölçüleri

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37


DEĞERLENDİRME ARASINDAKİ İLİŞKİLER... 1

Test Analizi. Test analizi iki şekilde yapılır; 1. Testin tamamı analiz edilir (test analizi), 2. Her bir test maddesi analiz edilir (madde analizi).

17/01/2015. PowerPoint Template. Dr. S.Nihat ŞAD LOGO. İnönü University. Company Logo

Bir Normal Dağılım Ortalaması İçin Testler

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

TEMEL EĞİTİMDEN ORTAÖĞRETİME GEÇİŞ ORTAK SINAV BAŞARISININ ÇEŞİTLİ DEĞİŞKENLER AÇISINDAN İNCELENMESİ

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

Ortalamaların karşılaştırılması

ÖRNEKLEM BÜYÜKLÜĞÜNÜN VE TEST UZUNLUĞUNUN MTK PARAMETRE KESTİRİMİNE ETKİSİ

EĞİTİMDE ÖLÇME VE DEĞERLENDİRME

İNŞAAT MÜHENDİSLİĞİ BÖLÜMÜ ÖĞRENCİLERİNİN BAŞARI NOTLARININ DEĞERLENDİRİLMESİ. Tamer Yılmaz, Barış Yılmaz, Halim Sezici 1 ÖZET

Yrd. Doç. Dr. Sedat ŞEN

Açıköğretimde kullanılan sınavlardan Klasik Test Kuramına ve Madde Tepki Kuramına göre elde edilen yetenek ölçülerinin karşılaştırılması

MADDE VE TEST ANALİZİ. instagram: sevimasiroglu

TEMEL İSTATİSTİK BİLGİSİ. İstatistiksel verileri tasnif etme Verilerin grafiklerle ifade edilmesi Vasat ölçüleri Standart puanlar

Mühendislikte İstatistiksel Yöntemler

GÜVEN ARALIĞI KESTİRİM

Sınavlı ve Sınavsız Geçiş İçin Akademik Bir Karşılaştırma

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

İSTATİSTİK II. Hipotez Testleri 1

Degree Department Üniversity Year B.S. Statistics Gazi University 1993 M.s. Statistics Gazi University 1998 Ph.D. Statistics Gazi University 2005

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

THOMAS TÜRKİYE PPA Güvenilirlik, Geçerlilik ve Standardizasyon Çalışmaları Özet Rapor

The Study of Relationship Between the Variables Influencing The Success of the Students of Music Educational Department

İçindekiler. Pazarlama Araştırmalarının Önemi

Hacettepe Üniversitesi E itim Fakültesi Dergisi 26 : [2004] Devrim ÖZDEM R** 1. G R fi

ÖĞRENCİLERİNİN SINAV NOTLARI DAĞILIMININ DEĞERLENDİRİLMESİ: İNŞAAT MÜHENDİSLİĞİ ÖĞRENCİLERİ ÖRNEĞİ

İstatistik ve Olasılık

MİLLİ EĞİTİM BAKANLIĞI ÖZEL OKULLAR SINAVI VERİLERİNİN MADDE TEPKİ KURAMI MODELLERİNE UYUMU

Dikey Ölçeklemede Klasik Test ve Madde Tepki Kuramına Dayalı Yöntemlerin Karşılaştırılması *

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

Yrd. Doç. Dr. Sedat ŞEN

2018 MSÜ. Değerlendirme Raporu MSÜ

Ölçme ve Değerlendirme

ARALIK TAHMİNİ (INTERVAL ESTIMATION):

BÖLÜM 14 BİLGİSAYAR UYGULAMALARI - 3 (ORTALAMALARIN KARŞILAŞTIRILMASI)

Bilimsel Araştırma Ödevlerinin Çok Yüzeyli Rasch Ölçme Modeli ile Değerlendirilmesi

Parametrik İstatistiksel Yöntemler (t testi ve F testi)

İstatistik ve Olasılık

BÖLÜM 10 ÖRNEKLEME YÖNTEMLERİ

MADDE DÜZEYİNDE BOYUTLULUK MODELLERİNİN BİLGİSAYAR ORTAMINDA BİREYSELLEŞTİRİLMİŞ TEST YÖNTEMLERİ ÜZERİNDEKİ ETKİSİNİN İNCELENMESİ

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

Yeşim Özer Özkan 2. Volume: 11 Issue: 1 Year: 2014

FİNANSAL RİSK ANALİZİNDE KARMA DAĞILIM MODELİ YAKLAŞIMI * Mixture Distribution Approach in Financial Risk Analysis

BÖLÜM 10 PUAN DÖNÜŞÜMLERİ

DEĞİŞEN MADDE FONKSİYONUNUN TEST EŞİTLEMEYE ETKİSİ THE EFFECT OF DIFFERENTIAL ITEM FUNCTIONING ON TEST EQUATING

ANKARA ÜNİVERSİTESİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ ÖLÇME VE DEĞERLENDİRME ANABİLİMDALI ÖLÇME VE DEĞERLENDİRME DOKTORA PROGRAMI

Mühendislikte İstatistik Yöntemler

Ders 5: ÖLÇME VE DEĞERLENDİRME. Prof. Dr. Tevhide Kargın

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

TEST VE MADDE ANALİZLERİ

DERS BİLGİLERİ Ders Kodu Yarıyıl T+U Saat Kredi AKTS Çok Değişkenli İstatistik EKO428 Bahar Ön Koşul Dersin Dili

SÜREKLĠ OLASILIK DAĞILIMLARI

PISA 2009 TUTUM ANKETİ MADDE PUANLARININ AŞAMALI MADDE TEPKİ MODELİ İLE İNCELENMESİ

EĞĠTĠMDE ÖLÇME VE DEĞERLENDĠRME BÖLÜM IV Ölçme Sonuçları Üzerinde Ġstatistiksel ĠĢlemler VERİLERİN DÜZENLENMESİ VERİLERİN DÜZENLENMESİ

ilkögretim ÖGRENCilERi için HAZıRLANMıŞ BiR BEDEN EGiTiMi DERSi TUTUM

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları II (19 Nisan 2012)

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

SON BEŞ YIL İÇİNDE YAPILAN LİSANS YERLEŞTİRME (LYS) SINAVLARI İLE ÖĞRETMENLİK ALAN BİLGİSİ (ÖABT) SINAVLARI ARASINDAKİ İLİŞKİNİN İNCELENMESİ

Transkript:

Hacettepe Üniversitesi Eğitim Fakültesi Dergisi 20 : 104-110 [2001] [ J. of Ed 20 ÖRTÜK ÖZELLIKLER TEORIsINDEKI b VE a PARAMETRELERI ile KLAsIK TEST TEORIsINDEKI p VE r istatistikleri ARASINDAKı ILIşKI THE RELATIONSHIP BETWEEN b VE a PARAMETERS IN LATENT TRAIT THEORY AND p AND r STATISTISCS IN CLASSICAL TEST THEORY Hülya KELECİOGLU* ÖZET: Test geliştirrnede klasik test teorisi ve örtük özellikler (latent traits) teorisine dayalı yöntemler kullanılmaktadır. Test puanları dağılımının normal olması durumunda, klasik test teorisinin madde güçlük indeksi (p) ve madde ayıncılık gücü (1') indeksleri ile örtük özellikler teorisinin iki parametreli lojistik modelinde yer alan madde güçlük (b) ve madde ayrıcılık gücü (a) indekslerine bir geçiş mümkün olmaktadır. Bu çalışmada Milli Eğitim Bakanlığının Anadolu Lisesi Giriş Sınavının Türkçe ve Matematik alt testleri kullanılarak, klasik test teorisi madde istatistiklerinden örtük özeııikler teorisinin madde parametreleri kestirilmiştir. Araştırmanın sonunda, Türkçe puanları dağılımının Matematik puanları dağılımına göre normale daha yakın olduğu; her iki alt test için b parametrelerinin kestirilen değerleri ile geçiş formüııerinden hesaplanan değerlerine ait korelasyonun a parametresine ait korelasyondan daha yüksek olduğu ve Türkçe testinden elde edilen parametrelerin Matematik testinden elde edilenlere göre daha yüksek korelasyon verdiği görülmüştür. ANAHTAR KELİMELER: Klasik test teorisi, örtük özellikler teorisi, örtüközellikler teorisi ile kliisikteori arasındaki ilişki. madde parametreleri. ABSTRACT: In test development approaches methods relying on classical test theory and latent traits theory are used. On condition that the distribution of the test scores is normal, transformation is likely to be achieved. From the item difficulty index (p) and item discrimaination index (1') in classical test theory to the item difficulty (b) and item discrimination index (a) in the two parameter iogistic model of latent traits theory. In this study, the Turkish and Maths subtests of Anadolu High School Entrance Exam by the Ministry of Education are utilised and item parameters of latent traits theory are estimated from the item statistics of the classical test theory. The findings demonstrated that the distribution of the Turkish test scores resembles to normal distribution more than that of the Math test scores, that the correlation between the values of the b parameters of both subtests, which are estimated and the values which are calculated from the transformatian formulas is more than that of the a parameter; and finaııy that the parameters obtained from Turkish test are in higher correlations with the ones obtain from the Maths test. KEY WORDS: Clasiccal test theory, latent trait theory, re. lating item response theory to classical test theııry, item parameters. 1. GIRiş Test geliştirme, istenilen niteliklere sahip bir test oluşturma sürecidir. Bir test, maddelerden oluştuğundan maddelerin nitelikleri de test geliştirme sürecinde çok önemlidir. İstenilen nitelikte test geliştirmek için, hazırlanan test formu uygun bir grup üzerinde denenir ve deneme uygulamasından elde edilen verilerden madde ve test istatistikleri kestirilir. Bu kestirilen istatistiklere dayanarak, istenilen özellikteki maddeler seçilir ve geliştirilmek istenen test oluşturulur. Test geliştirmede madde ve test istatistiklerini kestirme aşamasında kullanılan başlıca iki yöntem vardır. Bunlardan birincisi klasik test teorisine, ikincisi de örtük özellikler (latent traits) teorisine dayanan yöntemlerdir. Klasik test teorisine dayalı yöntemler, testi uygulama ve parametreleri kestirme kolaylığı, daha az varsayım gerektirmesi ve üzerinde daha çok çalışılmış olmasından dolayı örtük özellikler teorisine dayanan yöntemlere göre daha yaygın kullanılmaktadır. Ancak 1950' lerden sonra geliştirilen örtük özellikler teorisine dayalı yöntemler de giderek yaygınlık kazanmaktadır. Bu iki teori arasındaki temel farklılıklar aşağıdaki gibi özetlenebilir. *Yrd. Doç.Dr., Hacettepe Üniversitesi, Eğitim Fakültesi, Eğitim Bilimleri Bölümü, Eğitimde Ölçme ve Değerlendirme Anabilim Dalı Öğretim Üyesi. e-posta: hulyakelecioglu@hoımail.com

ıos Hülya Kelecioğlu 1. of [ Ed 20 Örtük özellikler teorisine göre, bireylerin belli bir alandaki doğrudan gözlenemeyen yetenekleri ya da özellikleri ile bu alanı yoklayan sorulardan oluşan test maddelerine verdikleri cevaplar arasında bir ilişki vardır ve bu ilişki matematiksel olarak ifade edilebilir. Bu teoriye göre geliştirilen testlerden elde edilen yetenek ölçüleri, bireylere uygulanan testlerden bağımsız olarak elde edilebilmektedir. Bu özellik, test puanları eşitlendiğinde, bireylerin yeteneklerinin gruptan bağımsız olarak karşılaştırılmasını sağlamaktadır. Oysa klasik teoride, bireylerin puanları, onlara uygulanan teste bağımlıdır. Örneğin, kolay bir testten 50 puan alan bir öğrenci ile, daha zor bir testten 50 puan alan öğrencinin puanlarının karşılaştırılması mümkün değildir. Klasik teoride elde edilen madde istatistikleri, testin uygulandığı grubun özelliklerine bağlıdır. Örtük özellikler teorisinde madde özellikleri matematiksel modeller esas alınarak hesaplandığından, testin uygulandığı gruba bağlı olmadığı iddia edilmektedir. Bu durum, bir testin örtük özellikler teorisine göre bir kez ölçeklendikten sonra bu maddelerin özellikleri değişmediğinden pek çok kez kullanılmasına olanak sağlar. Ancak bu değişmezliğin sağlanması madde parametrelerinin elde edilmesinde yapılan deneme uygulamasının ve bu uygulamanın yapıldığı grubun bazı şartları sağlamasına bağlıdır. Örtük özellikler teorisinde madde parametrelerinin gruptan bağımsız olması, testlerin geçerlik ve güvenirliklerinin daha kararlı olarak belirlenebilmesini sağlamaktadır. Ayrıca, istenen yetenek düzeyindeki bireylerin seçimi, klasik teoriye göre daha geçerli olarak yapılabilmektedir. Örtük özellikler teorisinin bu üstünlüklerinin yanında bazı sınırlılıkları da vardır. Bunlardan biri, teori belli bir matematiksel modele bağlı olduğundan, klasik teoriye göre daha güçlü ve yerine getirilmesi daha güç varsayımlarının olmasıdır. Bu teorinin varsayımları, testin tek boyutlu olması, yerel bağımsızlık ve test puanlarının normal dağılım göstermesidir, [8). Testin tek boyutlu olması, bu maddelerin tek bir özelliği ölçmesi gerektiğini ifade eder. Test maddelerinin birden fazla özelliği ölçmesi durumunda, ölçekleme boyutlara göre ayrı ayrı yapılmalıdır. Yerel bağımsızlık varsayımı, tek boyutluluğun bir sonucudur. Yerel bağımsızlık, bir maddeyi cevaplandırmak için gereken yeteneğin başka bir maddeyi cevaplandırıp cevaplandırmamaya bağlı olmaması, her maddenin tek başına cevaplandırılabilir olmasıdır [6]. Her iki teorinin ortak varsayımı ise test puanlarının normal dağılırri göstermesidir. Bu varsayım iki teorinin ortak yanını oluşturmaktadır ve normal dağılım şartının sağlanması durumunda örtük özellikler teorisindeki a ve b parametreleri ile klasik test teorisindeki madde güçlük indeksi (p) ve madde ayırıcılık gücü indeksi (r) arasında geçiş sağlanabilmektedir. Yani, dağılım normalolduğunda klasik teorideki madde istatistiklerinden örtük özellikler teorisindeki b ve a parametrelerini kestirmek mümkün olabilmektedir [3,8]. Klasik test teorisine dayalı madde analizinde i ve O ile puanlanan maddeler için madde güçlük indeksi, maddeyi doğru cevaplandıranların tüm cevaplayıcılara oranı olarak tanımlanır ve bu oran da O ve i arasında değer alır. Madde kolaylaştıkça güçlük indeksinin değeri büyür, yani l' e yaklaşır. Madde zorlaştıkça da madde güçlük indeksinindeğeri küçülür, yani O'a yaklaşır. Madde güçlük indeksi aynı zamanda o maddeden alınan puanların aritmetik ortalamasını ifade eder. Bu indeks, maddeyi cevaplandıranlardan tesadüfi olarak seçilen bir bireyin o maddeyi doğru cevaplandırma olasılığını da belirtir. Madde güçlük indeksi olarak p değerleri yerine standart z puanları da kullanılabilir. Bir maddeye cevap veren bireylerin yetenekleri. çok düşük ve çok yüksek düzeyler arasında değişen bir dağılım gösterir ve bu dağılımın aşağıdaki gibi normalolduğu kabul edilir [7].

Örtük Özellikler Teorisindeki b ve a Parametreleri ile Klasik Test Teorisindekip ve r İstatistikleri Arasındaki İlişki 106 ğılıma benzemektedir. Maddenin doğru cevaplandırılma olasılığı yükseldikçe, maddeyi doğru cevaplandırmak için gereken yetenek düzeyi düşmektedir. Bir başka deyişle, madde kolaylaştıkça yetenek seviyesi düşmekte, zorlaştıkça yetenek seviyesi yükselmektedir. Şekil 1: Bir Maddeye Cevap Veren Bireylerin Dağılımı Maddeye cevap veren bireylerin yeteneklerinin dağılımı yatayeksendeki yetenek boyutunda gösterilebilir. Ancak pratikte yetenek boyutu, sadece 1 ya da O değerini alır ve bu değerlerden p oranları hesaplanabilir. Şekil l'e göre, maddeye doğru cevap verenlerin oranı p ile gösterilen alan kadar, yanlış cevap verenlerin oranı ise (l-p) ile gösterilei1 alan kadardır. Bu kategorileri standart puan biçiminde ifade etmek için z puanları kullanılabilir. p değerlerinin standart z puanlarına çevrilmesi ise, madde güçlüğünü n yanısıra o maddeyi doğru cevaplandırmak için gerekli yetenek düzeyini de verir. Yani p değerlerinin z puanlarına dönüşümü, madde güçlüğü ile yetenek düzeylerini aynı ölçeğe yerleştirmektedir. z puanlarına dönüştürülmüş madde güçlüğü ve maddeye doğru cevap verıne oranları arasındaki ilişki Şekil 2' de görüldüğü gibidir [7]. 1.00 P 0.75 "" " " 0..50 " ", 0.25...,... 000-3 -2-1 O 2 3 Şekil 2: Madde güçlüğü (p) ile yetenek puanları (z) arasındaki ilişki Şekil 2' den de görüldüğü gibi p ile z arasındaki ilişki doğrusalolmayıp, yığmalı normal da- z Normal dağılım varsayımı altında yapılan bu dönüşüm, klasik teoriden örtük özellikler teorisine bir geçişi mümkün kılmaktadır. Örtük özellikler teorisinde yer alan ve madde güçlük indeksine karşılık gelen b parametresi de, b değerleri ile 9 aynı ölçekte olduğundan, örtük özelliğin düzeyini gösterir ve (_00, +00) aralığında değerler aldığı kabul edilir [2]. Bu parametre, maddenin doğru cevaplandırılma olas ılığının 0.50 olduğu noktadaki yetenek düzeyini belirtir. b değeri madde kolaylaştıkça düşer, madde zorlaştıkça yükselir. Klasik test teorisinde madde ayırıcılık gücü indeksi, maddenin, sorunun ölçtüğü özelliği kazanmış bireyleri diğerlerinden ayırma gücünü gösterir ve maddenin geçerliliğini ifade eder. Bu değer, madde puanları ile test puanlarının korelasyonudur. Örtük özellikler teorisinde buna karşılık gelen a parametresi de maddenin kalitesini, yani elde edilen 9 yetenek ölçüsünün gerçek 9 hakkında ne kadar bilgi vermekte olduğunu gösterir. Bu bakımdan bir tür geçerlik ölçüsüdür [3]. Ölçülen 9 yeteneğinin bireyler arasındaki dağılımının olan bir normal dağılım gösterdiği varsayımı altında klasik test teorisindeki madde güçlüğü ve madde ayırdedicilik gücü ile örtük özellikler teorisindeki b ve a parametreleri arasında bağıntı kurulabilmektedir. Madde güçlük indeksi p ile b parametresi ve madde ayırdedicilik gücü indeksi r ile a parametresi arasında aşağıdaki bağıntılar vardır [8]. (1)

107 Hülya Kelecioğlu J. of [ Ed 20 Burada Pg, klasik teorideki madde güçlük indeksini, <!>-I(Pg)normal dağılımda Pg' ye karşılık gelen z değerini, Pg madde puanları ile test puanları arasındaki çift serili korelasyon katsayısını göstermektedir. Üç parametreli modelde a parametresini kestirmede kuiianılan madde ayıncılık gücü indeksi için aşağıdaki eşitlik geliştirilmiştir [1] (2) (3) Bu formülde Pi8, madde puanları ile e yetenek puanları arasındaki çift serili korelasyon katsayısını, Ci de üç parametreli modelde yer alan, maddeyi cevaplamak için gerekli en düşük yetenek seviyesini göstermektedir. Y ukarıda verilen eşitliklerin çözümleri iteratif olmadığından ve kolaylıkla hesaplanabilen terimlerle ifade edildiğinden b ve a parametrele-.rinin diğer yöntemlerle kestirilmesinden daha kullanışlı olduğu belirtilmektedir [1]. Lord [9], 8'nın ortalaması O, standart sapması 1 olan normal bir dağıbm gösterdiğinde, şans başarısının etkili olmadığında, e ile test puanlarının ölçme hatalarının benzer olduğunda ve e dağılımı ile test puanları dağılımının aynı olduğunda a parametresi ile çift serili korelasyon katsayısı arasında yukarıdaki bağıntının tam olarak elde edilebileceğini belirtmiştir. Lord [9], bütün maddeler için a parametresinin ve çift serili korelasyon katsayılarının eşit olması durumunda b parametresi ile madde güçlük indeksi arasında monoton bir ilişki olacağını, p arttıkç~ b'nin düşeceğini, p düştükçe b'nin artacağını belirtmiştir. a parametresi tüm maddeler için eşit olmadığında ise b ve parasındaki ilişki a'ya bağlı olacaktır. Baker [1], bir madde.analizi çalışmasında, b ve a parametrelerini yukarıda verilen (1) ve (2) numaralı formüller yardımıyla kestirmiştir. Bu kestirimlerde test puanı olarak, doğru cevap sayıları yerine e yetenek puanları kullanıldığında, test karakteristik eğrisinin doğrusal bir görünüm aldığı belirtilmiştir. Jensema [5], bir simülasyon çalışması yaparak, geçiş formülleri yardımıyla üç parametreli modeldeki parametreleri kestirmiştir. Önce, üç parametreli modelin parametrelerini bilgisayar programı ile kestirmiştir. Geçiş formülleri yardımıyla, üç parametreli modeldeki aparametresini kestirmek için (3) numaralı formülden Pg değerini elde etmiş; daha sonra da (1) ve (2) numaralı formüllerle b ve a parametrelerini kestirmiştir. c parametresi tüm maddeler için 0.20 değerinde bir sabit alınmıştır. Çalışmanın sonunda, a parametreleri arasındaki korelasyon 0,789, b parametreleri arasındaki korelasyon da 0,963 bulunmuştur. Bu çalışmada, klasik teoriden elde edilen madde parametreleri ile örtük özellikler arasındaki geçiş formüllerinin bir test üzerinde uygulanması düşünülmüştür. Bu uygulama yapılırken, klasik test teorisindeki p ve r ile örtük özellikler teorisindeki b ve a parametreleri, boş bırakılan cevapların yanlış ve atlanmış olarak gözönüne alımasına göre iki biçimde hesaplanmıştır. Bu iki hesaplama biçiminin örtük özellikler teorisindeki madde parametrelerinin klasik test teoriden elde edilmesini etkileyip etkilemediğine bakılmıştır. 1.1. Problem Cümlesi Milli Eğitim Bakanlığı tarafından 1994 yılında yapılan Anadolu Liseleri Giriş Sınavı Matematik ve Türkçe alt testlerinin maddelerinin örtük özellikler teorisinden elde parametreleri ile geçiş formülleri ile elde edilen parametreleri boş bırakılan cevapların yanlış ya da adanmış olarak dikkate alınmasına göre nasıl bir değişim göstermektedir? 2.VÖNTEM Araştırmanın verileri Milli Eğitim Bakanlığı tarafından 1994 yılında uygulanmış olan Anado-

Örtük Özellikler Teorisindeki b ve a Parametreleri ile Kliisik Test Teorisindekip ve r İstatistikleri Arasmdaki İlişki 108 lu Liseleri Giriş Sınavının 30'ar maddelik Matematik ve Türkçe alt testleridir. Testi alan öğrenci sayısı 24701' dir. İki alt test için ayrı ayrı klasik test teorisine ve örtük özellikler teorisinin iki parametreli modeline göre madde analizi yapılmıştır. İki parametreli modele göre yapılan analizlerde Türkçe testinde 4. ve 21. maddelerin; Matematik testinde 3., 11. ve 16. maddelerin parametreleri kestirilemediğinden, bu maddeler testten çıkarılarak analizler tekrarlanmıştır. Klasik test teorisine göre ve iki parametreli lojistik modele göre yapılan madde parametresi kestirimleri, maddeyi boş bırakan cevaplayıcıların boş cevapları yanlış ve atlanmış olarak dikkate alınıp madde parametreleri iki biçimde de hesaplanmıştır. Türkçe ve Matematik testlerine ait bazı istatistikler Tablo l' de ve puan dağılımlarını grafikleri de Şekil 3 ve Şekil 4' te verilmiştir. Tablo 1. Türkçe ve Matematik Testi Puanlarına Ait ıstatistikler Türkçe Matematik N 24701 24701 -x 16,13 9,55 Sx 5,19 4,57 Çarpıklık 0:2.7 1,24 Basıklık -0,5 5 1,96 Normallik Testi 11,66** 22,47** **p<o.ol,000 $000..ıooo,000 ~OOO i"""" Şekil 4. Matematik Testi Puanları Dağılımının Grafiği Tablo 1 ile Şekil 3 ve 4 birlikte incelendiğinde, Türkçe ve Matematik testlerine ait puan dağılımlarının çarpıklıklarının sağa doğru 0,27 ve 1,24 olduğu görülmektedir. Test puanlarının basıklığına bakıldığında ise Türkçe testi puanlarının basıklığının -0,55 olduğu, yani dağılımın norınal dağılımdan biraz basık olduğu; matematik testi puanlarının basıklığının i,96 olduğu, yani norınal dağılımdan daha sivri olduğu görülmektedir. Bu bilgiler, test puanlarının normal dağılım şartını yerine getirınediğini ancak Türkçe testi puanlarının matematik testi puanlarına göre normale daha yakın olduğunu göstermektedir. Test puanlarının normal dağılım gösterip göstermediğini belirlemek için Kolmogorov Siminrov testi [11] uygulanmış ve her iki testin puanlarının normal dağılım gösterınediği görülmüştür. Test puanlarının analizinden sonra her iki testin maddelerinin klasik teoriye göre ve örtük özellikler teorisinin iki parametreli modeline göre parametreleri kestirilmiştir. İki parametreli modele göre yapılan analizlerde boş bırakanlar yanlış olarak ve atlanmış olarak ayrı ayrı analiz edilmiştir. Madde parametrelerinin kestirilmesinde B flog [10] programından yararlanılmıştır. 1000 1,.1 <4) 7) ID,", 13"J I6,J 19,J 11,J 1J,J 1I,J 3. BULGULAR VE YORUMLAR Şekil 3. Türkçe Testi Puanları Dağılımının Grafiği Türkçe ve matematik testinin iki parametreli lojistik modele göre a ve b parametreleri ile

ıo9 Hülya Kelecioğlu J. of [ Ed 20 klasik test teorisine p ve r değerleri boş cevapların atlanmış (A) ve yanlış (Y) olarak ele alınmasına göre kestirilmiştir. Klasik teoriden elde edilen p ve r değerleri geçiş formülleri yardımıyla b ve a parametrelerine dönüştürülmüş ve kestirilen parametrelerle geçiş "formülleri yoluyla hesaplanan parametreler arasında korelasyon katsayısı hesaplanmıştır. Korelasyonlar arasındaki fark z testiyle test edilmiştir. Tablo 2'de bu korelasyonlar verilmektedir. Tablo 2. Türkçe ve Matematik Testinina ve b ParametreleriileGeçiş FormüllerindenHesaplanan DeğerleriArasındaki Korelasyonlar Türkçe Matematik A y z A Y z ra 0,96 0,97-0,52 0,75 0,92-2,14* rb 0,99 0,99 0,00 0,96 0,99-2,48* *p<0.05 Tablo 2 puanlama fatkı gözetilmeden parametrelere göre incelendiğinde, b parametreleri arasındaki korelasyonların a parametreleri arasındaki korelasyonlardan daha yüksek olduğu; testlere göre incelendiğinde, Türkçe testinden elde edilen korelasyonların Matematik testinden elde edilen korelasyonlardan daha yüksek olduğu gözlenmektedir. Türkçe testinin boşların yanlış ve atlanmış olarak kestirilen a ve b parametreleri ile geçiş formüllerinden elde edilen değerleri arasındaki korelasyonlar farkı manidar bulunmazken, matematik testine ait bu farklar 0,05 düzeyinde manidar bulunmuştur. Her iki testin puanlarının normal dağılım göstermemesine karşın, gerek Türkçe testinin madde parametrelerine ait korelasyonların yüksekliği, gerekse atlanmış ve yanlış olarak dikkate alınan cevaplara göre hesaplanan parametrelerin korelasyonları arasındaki farkın manidar bulunmaması, bu teste ait puanların matematik testi puanlarına göre daha normale yakın bir dağılım göstermesinden kaynaklanabilif. Bu sonuçlar dağılım normale yaklaştıkça hem korelasyonların yükseldiğini hem de parametrelerin, boş cevapların atlanmış ya da yanlış olmasına göre kestirilmesinden kaynaklanan farklılığın etkisinin azaldığını göstermektedir. Ayrıca, yukarıda değinildiği gibi her iki testte de b parametreleri arasındaki korelasyonun a parametrelerinden daha yüksek gözlenmesi, puan dağılımın normalliğinden maddegüçlüğünün etkilenmediği, ancak madde ayıncılık gücünün daha fazla etkilendiği şeklinde yorumlanabilir. Gelbal [4], Rasch Modeli ile ve klasik test teorisi ile kestirilen madde ve yetenek parametrelerinin benzerliklerini incelediği çalışmasında, madde güçlük indeksini birim normal değerlere dönüştürerek, z ve b parametresi arasındaki ilişkiye bakmıştır. Bu çalışmada, test puanlarının normal dağıldığı ve normal dağılmadığı durumlardaki z ve b arasındaki ilişkiye bakılmış ve her iki durumdaki korelasyonların aynı olduğu görülmüştür. Bu araştırmanın bulguları da b parametresinin dağılımın normalliğinden etkilenmediğini destekler niteliktedir. 4. SONUÇ VE ÖNERiLER Bu araştırmanın bulguları klasik test teorisinin parametrelerinden yararlanarak örtük özellikler teorisine dayalı a ve b parametrelerini kestirmede puanların normal dağılım gösterip göstermemesinin sonuçları etkilediğini göstermiştir. Normal dağılım için yapılan hipotez testinde her iki testin puan dağılımının normalolmadığı görülmesine rağmen, korelasyon katsayıları oldukça yüksek bulunmuştur. Türkçe puanlarının dağılımı matematik puanlarına göre daha normal göründüğünden, bu testten elde edilen korelasyonlar daha yüksek bulunmuştur. Sonuç olarak puan dağılımı normale yaklaştıkça geçiş formülleriyle elde edilen değerler de kestirilen parametre değerine yaklaşmaktadır. Lord [9], geçiş formüllerinin pratikte bir yararı olmadığını belirtmektedir. Çünkü örtük özellikler teorisi sadece madde parametrelerini elde etmede değil bireylerin yetenek puanlarını da gruptan bağımsız olarak elde etmek için kullanılmaktadır. Ancak bu yöntem, bir testin kla-

Örtük Özellikler Teorisindeki b ve a Parametreleri ile Klasik Test Teorisindekip ve r İstatistikleri Arasındaki İlişki ııo sik teori ile elde edilmiş madde parametrelerinden yola çıkılarak örtük özellikler teorisinde dayalı bir test geliştirmeyi mümkün kılmaktadır. Yani bu yöntem, klasik test teorisine göre elde edilen p ve r istatistiklerinden yola çıkılarak, örtük özellikler teorisinin iki parametreli lojistik modeline göre bir test geliştirrnede kullanılabilir. Örtük özellikler teorisine göre test geliştirmek için uygulamanın klasik teoriye göre daha büyük bir grupta yapılması gerekli olduğundan, puan dağılımının gerekleri yerine getirildiğinde, geçiş formülleri ile test geliştirme daha pratik bir yololabilir. KAYNAKÇA [I] Baker, F.B. (1987). "Methodology Review: Item Parametre Estimation Under the One-, Two-, and Three-Parameter Logistic Models." Applied Psychological Measuement. Vol. ll, No.2. [2] Baykul, Y. (1979). Örtük. Özellikler ve Klasik Test Kuramları Üzerine Bir Karşılaştırma. Yayınlanmamış Doktora Tezi. H.Ü. Sosyal Bilimler Enstitüsü. Ankara [3] Craeker L. ve 1. Algina. (1986): Introduction to Classical And Modern Test Theory. CBS College Publishing, New York. [4] Geibal, S. (1994). "p Madde Güçlük İndeksi ile Rasch Modelinin b Parametresi ve Bunlara Dayalı Yetenek Ölçüleri Üzerine Bir Karşılaştırma." Eğitim Fakültesi Dergisi, sayı: 10. [5] Janesma, CJ. (1976). "A Simple Teenhnique for Estimating Latent Trait Mental Test Parameters." Educational and Psychological Measurement. No. 36. [6] Hambelton R. K. ve H. Swaminathan (1985): Item Response Theory: Principles and Application. MA: Ktuwer-Nijhoff, B9ston. [7] Henrysson, S. (1972): "Gathering, Analyzing, and Using Data on Test Items." R.L. Thorndike (Ed.) Educational Measurement. American Council on Education, Washington D.C. [8] Lord, F.M. ve Novick, M.R. (1968): StatisticalTtheories of Mental Test Scores. Addison-Wesley lishing Company. Pub- [9] Lord, F.M. (1980): Applications of Item Response Theory to Practical Testing Problems. Hillsdale NJ.: Earlbaum. [lo] Mislevy, RJ. ve RD. Bock (1990): BILOG 3: Item Analysis and Test Scoring with Binary Logistic Models. Second Ed. Scientific Software, Ine. [ll] SIEGEL, S. (1977). Davramş Bilimleri İçin Parametrik Olmayan İstatistikler. (Çev.: Yurdal Topsever) Ankara Üniversitesi Basımevi.