Çoktan Seçmeli Testlerde İki Kategorili ve Önsel Ağırlıklı Puanlamanın Diferansiyel Madde Fonksiyonuna Etkisi ile İlgili Bir Araştırma

Benzer belgeler
Değişen Madde Fonksiyonunu Belirlemede Mantel Haenszel ve Lojistik Regresyon Tekniklerinin Karşılaştırılması

PISA 2012 BİLİŞSEL MADDELERİNİN KÜLTÜRE GÖRE DEĞİŞEN MADDE FONKSİYONU BAKIMINDAN İNCELENMESİ

Sınıf Seviye Belirleme Sınavları Alt Testlerinin Çeşitli Yöntemlere Göre Değişen Madde Fonksiyonlarının İncelenmesi *

Volume: 11 Issue: 1 Year: 2014

Evaluation of attitude items in PISA 2006 student questionnaire in terms of differential item functioning *

IJOESS Year: 8, Vol:8, Issue: 26 MARCH 2017

Farklı programlarda okutulan matematik dersi sınavlarına yönelik değişen madde fonksiyonu analizi

Değişen Madde Fonksiyonunun Belirlenmesinde Kullanılan Yöntemlerde I. Tip Hata ve Güç Çalışması

Değişen Madde Fonksiyonunu Belirlemede Mantel-Haenszel ve Lojistik Regresyon Tekniklerinin Karşılaştırılması *

Seviye Belirleme Sınavındaki Türkçe Alt Testlerinin Madde Yanlılığının İncelenmesi

Anahtar Sözcükler: Değişen madde fonksiyonu, Lojistik regresyon, Madde yanlılığı, Mantel-Haenszel, Olabilirlik oranı

Investigation of Placement Test in terms of Item Biasness

2012 YILI SEVİYE BELİRLEME SINAVI MATEMATİK ALT TESTİNİN MADDE YANLILIĞI AÇISINDAN İNCELENMESİ HALİME YILDIRIM YÜKSEK LİSANS TEZİ

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

Değişen Madde Fonksiyonunu Belirlemede Mantel Haenszel, Ki Kare ve Lojistik Regresyon Tekniklerinin Karşılaştırılması *

MIMIC, SIBTEST, Lojistik Regresyon ve Mantel-Haenszel Yöntemleriyle Gerçekleştirilen DMF ve Yanlılık Çalışması *

Öğrenci Seçme Sınavı nın Madde Yanlılığı Açısından İncelenmesi. Item Bias Analysis of the University Entrance Examination

BÖLÜM 12 STUDENT T DAĞILIMI

Merkezi Ortak Sınav Matematik Alt Testinde Değişen Madde Fonksiyonunun Görme Engeli Durumuna Göre İncelenmesi *

DEĞİŞEN MADDE FONKSİYONUNUN BELİRLEMESİNDE KULLANILAN FARKLI YÖNTEMLERİN KARŞILAŞTIRILMASI: BİR SİMÜLASYON ÇALIŞMASI

LOJİSTİK REGRESYON ANALİZİ

T.C. Mersin Üniversitesi Eğitim Bilimleri Enstitüsü Eğitim Bilimleri Anabilim Dalı Eğitimde Ölçme Ve Değerlendirme Bilim Dalı

ORTAÖĞRETİM KURUMLARI ÖĞRENCİ SEÇME VE YERLEŞTİRME SINAVI NIN CİNSİYETE GÖRE MADDE YANLILIĞI AÇISINDAN İNCELENMESİ

ORTAÖĞRETİME GEÇİŞTE KULLANILAN ORTAK SINAVLARIN DEĞİŞEN MADDE FONKSİYONU AÇISINDAN KİTAPÇIK TÜRLERİNE GÖRE FARKLI YÖNTEMLERLE İNCELENMESİ

daha çok göz önünde bulundurulabilir. Öğrencilerin dile karşı daha olumlu bir tutum geliştirmeleri ve daha homojen gruplar ile dersler yürütülebilir.

BAŞKENT UNIVERSITY JOURNAL OF EDUCATION

Türkçe Öğretmenliği Programında Ders Değerlendirmelerinin Çok-Yüzeyli Rasch Ölçme Modeli ile Analizi

PISA2009 Öğrenci Anketi Tutum Maddelerinin Kültüre Göre Değişen Madde Fonksiyonu Açısından İncelenmesi

Nihan ARSAN b. Kübra ATALAY KABASAKAL a Hacettepe Üniversitesi. Bilge GÖK c Hacettepe Üniversitesi. Hülya KELECİOĞLU d Hacettepe Üniversitesi

Ölçme Araçlarında Bulunması Gereken Nitelikler. Geçerlik. Geçerlik Türleri. Geçerlik. Kapsam Geçerliği

COMPARISON OF IRT LIKELIHOOD RATIO TEST AND LOGISTIC REGRESSION DIF DETECTION PROCEDURES *

2. BASİT DOĞRUSAL REGRESYON 12

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

PISA Fen Başarı Testinin Madde Yanlılığının Kültür ve Dil Açısından İncelenmesi*

T.C. İSTANBUL AYDIN ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ BİREYSEL DEĞERLER İLE GİRİŞİMCİLİK EĞİLİMİ İLİŞKİSİ: İSTANBUL İLİNDE BİR ARAŞTIRMA

Maddenin Farklı Fonksiyonlaşmasını Belirleme Tekniklerinin Karşılaştırılması: GADM, LR ve MTK-OO *

İstatistikçiler Dergisi

The Study of Relationship Between the Variables Influencing The Success of the Students of Music Educational Department

QUANTILE REGRESYON * Quantile Regression

ANKARA ÜNİVERSİTESİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ

TEMEL EĞİTİMDEN ORTAÖĞRETİME GEÇİŞ ORTAK SINAV BAŞARISININ ÇEŞİTLİ DEĞİŞKENLER AÇISINDAN İNCELENMESİ

ÖRNEK BULGULAR. Tablo 1: Tanımlayıcı özelliklerin dağılımı

PISA 2009 OKUMA TESTİ MADDELERİNİN YANLILIĞI ÜZERİNE BİR ÇALIŞMA 1

Üniversite Öğrencilerinin Akademik Başarılarını Etkileyen Faktörler Bahman Alp RENÇBER 1

Derece Bölüm Üniversite Yıl Nisan. Bölümü. Değerlendirme Yüksek Lisans Ölçme ve Ankara Değerlendirme Üniversitesi Lisans Sınıf Öğretmenliği Ankara

Öğrenci Başarısının Öğretmen Yapımı Bir Testle Klasik Test Kuramı ve Madde Tepki Kuramı Yöntemleriyle Elde Edilen Puanlara Göre Karşılaştırılması

BÖLÜM 1 ÖLÇME VE DEĞERLENDİRMEDE TEMEL KAVRAMLAR

PISA 2015 ÖĞRENCİ ANKETİNİN (ST094Q01NA- ST094Q05NA) ÖLÇME DEĞİŞMEZLİĞİNİN FARKLI YÖNTEMLERLE İNCELENMESİ

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI. Sibel SELİM 1 Efe SARIBAY 2

2010 SEVİYE BELİRLEME SINAVI MATEMATİK ALT TESTİ İÇİN DEĞİŞEN MADDE FONKSİYONLARININ VE MADDE YANLILIĞININ İNCELENMESİ SİNEM ŞENFERAH

Seviye Belirleme Sınavındaki Fen ve Teknoloji ile Matematik Alt Testlerinin Madde Yanlılığı Açısından İncelenmesi

ANKARA ÜNİVERSİTESİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ ÖLÇME VE DEĞERLENDİRME ANABİLİM DALI KAMU PERSONELİ SEÇME SINAVI GENEL YETENEK TESTİNİN MADDE YANLILIĞI

ilkögretim ÖGRENCilERi için HAZıRLANMıŞ BiR BEDEN EGiTiMi DERSi TUTUM

DEĞİŞEN MADDE FONKSİYONUNUN TEST EŞİTLEMEYE ETKİSİ THE EFFECT OF DIFFERENTIAL ITEM FUNCTIONING ON TEST EQUATING

Klasik Test Teorisine ve Örtük Özellikler Teorisine Göre Kestirilen Madde Parametrelerinin Karşılaştırılması Üzerine Ampirik Bir Çalışma

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

İngilizce Öğretmen Adaylarının Öğretmenlik Mesleğine İlişkin Tutumları 1. İngilizce Öğretmen Adaylarının Öğretmenlik Mesleğine İlişkin Tutumları

SINIF ÖĞRETMENLİĞİ BÖLÜMÜ ÖĞRENCİLERİNİN MATEMATİĞE YÖNELİK TUTUMLARININ ÇEŞİTLİ DEĞİŞKENLERE GÖRE İNCELENMESİ

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

The International New Issues In SOcial Sciences

PROJE TABANLI ÖĞRENMEDE ÇOKLU ZEKÂ YAKLAŞIMININ MATEMATİK ÖĞRENME BAŞARISINA VE MATEMATİĞE KARŞI TUTUMA ETKİSİNİN KARŞILAŞTIRILMASI

Hacettepe Üniversitesi E itim Fakültesi Dergisi 26 : [2004] Devrim ÖZDEM R** 1. G R fi

FARKLI İŞLEYEN MADDELERİN BELİRLENMESİNDE SINIRLANDIRILMIŞ FAKTÖR ÇÖZÜMLEMESİNİN OLABİLİRLİK-ORANI VE MANTEL-HAENSZEL YÖNTEMLERİYLE KARŞILAŞTIRILMASI

RASCH MODELİ İLE ELDE EDİLEN YETENEK ÖLÇÜLERİNİN NİTELİKLERİ ÜZERİNDE BİR ÇALIŞMA

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Siirt Üniversitesi Eğitim Fakültesi. Halil Coşkun ÇELİK

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

ANKARA ÜNİVERSİTESİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ ÖLÇME VE DEĞERLENDİRME ANABİLİM DALI EĞİTİMDE ÖLÇME VE DEĞERLENDİRME BİLİM DALI

İstatistik ve Olasılık

GİRİŞ. Bilimsel Araştırma: Bilimsel bilgi elde etme süreci olarak tanımlanabilir.

İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications*

İçindekiler. Pazarlama Araştırmalarının Önemi

SAKARYA ÜNİVERSİTESİ EĞİTİM FAKÜLTESİ DÖRDÜNCÜ SINIF ÖĞRENCİLERİNİN ÖĞRETMENLİK MESLEĞİNE KARŞI TUTUMLARI

ANKARA ÜNİVERSİTESİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ

T.C. MERSİN ÜNİVERSİTESİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ EĞİTİM BİLİMLERİ ANABİLİM DALI

gelişmiş/olgunlaşmış

ĐST 474 Bayesci Đstatistik

Çoklu Zeka Kuramına Dayalı Etkinliklerin Erişi, Tutum ve Öğrenmelerin Kalıcılığına Etkisi

İstatistik Temel Kavramlar- Devam

Korelasyon, Korelasyon Türleri ve Regresyon

Olgu-kontrol araştırmalarının analizi ve değerlendirilmesi. Raika Durusoy

ÖNSÖZ. beni motive eden tez danışmanım sayın Doç. Dr. Zehra Özçınar a sonsuz

Tekrarlı Ölçümler ANOVA

M d a d dd e A l na i li i z

Bilimsel Araştırma Ödevlerinin Çok Yüzeyli Rasch Ölçme Modeli ile Değerlendirilmesi

Madde güçlük indeksi: Herbir maddenin zorluk derecesini, uygun güçlük düzeyine sahip olup olmadığını gösterir.

FEN BİLGİSİ ÖĞRETMEN ADAYLARININ ÖĞRENME STİLLERİ, CİNSİYET ÖĞRENME STİLİ İLİŞKİSİ VE ÖĞRENME STİLİNE GÖRE AKADEMİK BAŞARI 1

OLASILIK ve KURAMSAL DAĞILIMLAR

Ders 5: ÖLÇME VE DEĞERLENDİRME. Prof. Dr. Tevhide Kargın

ÖĞRETMENLER, ÖĞRETMEN ADAYLARI VE ÖĞRETMEN YETERLĠKLERĠ

EĞİTİM FAKÜLTESİ ÖĞRENCİLERİNİN ÖĞRETMENLİK MESLEK BİLGİSİ DERSLERİNE YÖNELİK TUTUMLARI Filiz ÇETİN 1

Bağımsız Örneklemler İçin Tek Faktörlü ANOVA

OKÖSYS MATEMATİK ALT TESTİNE AİT MADDELERİN YANLILIK ANALİZİ

HACETTEPE ÜNivERSiTESi SPOR BiLiMLERi VE TEKNOLOJiSi YÜKSEK OKULU'NA GiRişTE YAPILAN

BÖLÜM 13 HİPOTEZ TESTİ

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

ÖĞRETMEN ADAYLARININ PROBLEM ÇÖZME BECERİLERİ

ULUSLARARASI 9. BEDEN EĞİTİMİ VE SPOR ÖĞRETMENLİĞİ KONGRESİ

Transkript:

Eğilim ve Bilim 2003, Cilt 28, Sayı 129(37-43) Educalion and Science 2003, Vol. 28, No 129 (37-43) Çoktan Seçmeli Testlerde İki Kategorili ve Önsel Ağırlıklı Puanlamanın Diferansiyel Madde Fonksiyonuna Etkisi ile İlgili Bir Araştırma The Effects o f Binary and Priori Weighted Scoring on the Differential Item Functioning Multiple Choice Tests Devrim Özdemir Hacettepe Üniversitesi Öı Bu araştırmanın amacı, iki kategorili ve önsel ağırlıklı puanlama yöntemleri kullanılarak puanlanan bir testte, cinsiyet gruplan ve okul türüne göre diferansiyel madde fonksiyonunu ortaya koymaktır. Çeşitli illerdeki 7 si özel, 8 i devlet okulu olmak üzere 15 ilköğretim okulundan seçilen 780 i erkek, 698 i kız öğrenciden elde edilen madde puanlan, MH test istatistiği ile DMH katsayısına ve lojistik regresyon modeline göre analiz edilmiştir. Hem okul türü hem de cinsiyet bakımından maddelerin çoğunda göz ardı edilebilir düzeyde DMF olduğu, bir maddede ise okul türü bakımından özel okullarda okuyan öğrenciler lehine, cinsiyet bakımından da erkek öğrenciler lehine DMF ortaya çıktığı belirlenmiştir. Anahtar sözcükler: Diferansiyel madde fonksiyonu, madde yanlılığı, iki kategorili puanlama, önsel ağırlıklı puanlama. Abstracl The pıırposc of ıhis study is to determine the differential ilem functioning of a test scored via binary and priori weighlüıg scoring melhods in terms of gender and school type. The item scores collected from 780 male and G98 female students chosen from 15 clemenlary schools of 7 private and 8 public schools were analyzcd using DMH cocfficienl and MH test statistics and logislic regıession models. The research findings showed ıhal most of the items have ignorable DİF in terms of both gender and school type. Only in one item did DİF favor the students attending private schools in terms of school type and female stndents in terms of gender. Key words: Differential item functioning, item bias, binary scoring, priori weighted scoring. Giriş Bilindiği gibi, test uygulamalarının temel amacı, bireyler ya da eğitim programlan hakkında bilgi edinmektir. Bunun için hatalardan anmk ve geçerliği yüksek ölçme araçlarına/sonuçlarına ihtiyaç vardır. Ancak, geçerliği olumsuz yönde etkileyen faktörlerden biri de yaııh maddelerdir (biased iteni). Yatılılık, madde parametrelerinin kestirim değeri ile gerçek değeri arasındaki farkh- lık olarak ifade edilir ve ölçme sonuçlanna sistematik hata olarak kanşır. Bu dıınını ise ölçme aracının yapı ve yordama geçerliklerini düşürür (Osterlind, 1983). Dr. Devrim Özdemir, Hacettepe Üniversitesi, Eğilim Fakültesi, Eğitim Bilimleri Bölümü, e-posta: devrimo@hacettepe.edu.tr Eğitim alanındaki yanlılık genellikle, testlerin uygulandığı alt gruplardan kaynaklanmaktadır. Madde yanlılığı, aynı yetenek düzeyinde yer almasına karşın, farklı alt gruplara ait bireylerin bir test maddesini doğru yanıtlama olasılıklarındaki farklılık olarak tanımlanabilir (Zuıııbo 1999). Yanlılık kavramı genel bir kavramdn. Yanlılığın operasyonel olarak araştırılabilmesi için diferansiyel madde fonksiyonundan (DMF, differantial item funetion) yararlanılır. DMF, maddenin ölçmek istediği her bir yetenek düzeyindeki maddeyi doğru yanıtlama olasılıklarının alt gruplara göre farklılıkları gösteren bir bağıntıdır. Bir diğer ifade ile DMF, yanlılığın bir göstergesidir. Günümüze kadar DMF üzerine bir çok çalışma yapılmıştır. Bu çalışmaların temeli DMF yi ortaya çıkarma 37

38 ÖZDEMİR üzerinedir. Yapılan ilk çalışmalar, DMF ııin tanımı gereği, klasik test kuramında madde güçlük indekslerinin karşılaştırılması biçiminde olmuş; A ve B alt gruplarının i. madde üzerindeki farklılıkları istatistiksel olarak test edilmiştir (Osterlind, 1983): H0: P A - P B = 0 Benzer yaklaşımla, örtük özellikler kuramında madde güçlük parametrelerinin karşılaştırılması yapılmıştır (Hambleton, Swaminathan ve Rogers, 1991): H(): b]a-b[b = 0 Ancak bu çözümlemeler, DMF türlerini ve DMF ııin büyüklüğü nicel olarak ortaya koyamamaktadır. DMF Türleri DMF, öncelikle Tekbiçimli DMF (TB-DMF) ve Tck- biçimli Olmayan DMF (TBO-DMF) olmak üzere iki ayrı gnıpta ele abnmaktadır (Camilli ve Shepard, 1994). Alt grup olarak cinsiyet ele alındığında (kategoriler: kız-erkek) kategorilerden birinin diğerine göre üstünlüğü değişik yetenek düzeylerinde de devam ediyorsa, böylesi durumlar TB-DMF olarak adlandırılmaktadır (Camilli ve Shepard, 1994; Yu, 2001). Örneğin düşük yetenek düzeylerinde kızların performansı erkeklere göre daha yüksek iken, aynı durum yüksek yetenek düzeylerinde de geçerli ise, bu durumda TB-DMF den sözedilebilir. Tam tersi durumda -düşük yetenek düzeyinde kategorilerden birisi üstün, yüksek yetenek düzeyinde ise diğeri üstün- ise TBO-DMF olduğu ifade edilir (Şekil 1 ve 2). Bu DMF türleri dışında, simetrik ve asimetrik olarak adlandırılan farklı DMF türleri de vardır. DMF nin bu kadar çeşitli olması DMF nu ortaya çıkarma yöntemlerinin de çok sayıda olmasını beraberin- P(9) O 0 Erkek 0 0 Kız -----------------------------------------------b. Düşük Yüksek a Şekil 1. İki katcgorili alt gruplara ilişkin TB-DMF. (Kesişim yok) O,.0 O o ----------;----------------- Şekil 2. İki kategorili alt gruplara ilişkin TBO-DMF. (Kesişim var) de getirmiştir. Bu yöntemlerden bazıları, Mantel-Haens- zel (MH) test istatistiği, SİBTEST (simultaneous item bias test), log-linear ve lojistik regresyon modelleri olarak sıralanabilir. Bu yöntemlerden her birinin diğerlerine göre üstün ya da zayıf yönleri bulunmaktadır. Örneğin; MH yöntemi TB-DMF için duyarlı sonuçlar verirken (Hambleton ve Rogers, 1989), TBO-DMF için lojit yöntemler daha duyarlıdır (Fidalgo, Mellenberg ve Muniz, 2000). Mantel-Haenszel (MH) Yöntemi Bir test istatistiği olan MH, aynı zamanda da odds oranının (odds ratio) en çok olabilirlik kestiricisidir. MH test istatistiği, kategorik değişkenlerin sıklıklarının yer aldığı olumsallık çizelgeleri ile çalışmaktadır. 2x2 lik bir olumsallık çizelgesi için MH test istatistiği (Osterlind, 1983), N2IN12 şeklinde gösterilebilir. MH test istatistiği alt gruplar arasında bir karşılaştırma sonucu verir. Ele alınan her madde için, MH = 1 ise maddede DMF yoktur; MH > 1 ise madde referans olarak alınan grup lehine çalışmıştır; MH < 1 ise madde diğer grup lehine çalışmıştır. Bu sonucun daha iyi yorumlanabilmesi ve DMF nin nicel büyüklüğü hakkında bilgi vermesi için AMH dönüşümü yapılır. Amh= -(2,35).ln(MH) AMh dönüşümünden sonra elde edilen değerlere göre; Amh=0 ise, maddede DMF yoktur; AMH<0 ise madde

ÇOKTAN SEÇMELİ TESTLERDE İKİ KATEGORİLİ VE ÖNSEL AĞIRLIKLI PUANLMA 39 1. Gnıp 2. Gnıp Toplam + Nn n 2, N1+ N,2 n 22 n 2+ Toplam N+l N+2 N + - Toplam l.grup P.ı P 12 P + 1 2.Gnıp P2. p 22 P+2 Toplam P ı+ P 2+ 1 Şekil 3. 2X2 Olumsallık çizelgesi ve iki değişkenli olasılık dağılımları referans olarak alınan grup lehine çalışmıştır; AMH >0 ise madde diğer grup lehine çalışmıştır. I AMH I ise, DMF nin düzeyi hakkında bilgi vermektedir. IAMHI < 1 ise DMF yoktur ya da göz ardı edilebilecek bir DMF söz konusudur (A-level); 1 S I AMH I< 1,5 ise orta düzeyde bir DMF vardır (B-level); I A^h I - 1.5 ise yüksek düzeyde bir DMF olduğu ifade edilir (C-level) (Gierl, Jo- doin ve Akkerman, 2000). Lojistik Regresyon Yöntemi Bireylerin, herhangi bir maddeyi doğru yanıtlama olasılığı için geçerli bağmtı aşağıdaki gibidir (Whitmore ve Schumaker, 1999); ez Yukarıdaki bağıntıda Z, Z=P0+P,q+P2g şeklinde ifade edilir. Bu eşitlikte, Pj: Yetenek katsayısı ve P2: Grupların etki katsayısı olarak adlandırılır. G değişkeni, birincil grup için 1, ikincil grup için 0 şeklinde kodlanmış bir gösterge değişkendir, g değişkeni için P2 nin modele katkısı incelendiğinde, elde edilen sonuç anlamlı ise olası bir DMF nin varlığından söz edilebilir. Ancak bu şekildeki DMF için TB-DMF olduğu söylenebilir. TBO-DMF için tam regresyon modeline ihtiyaç vardır. Bu model, z=po+pı q+p2g+p30*g şeklinde gösterilebilir. Yukarıdaki eşitlikte P3: yetenek ve grup değişkenlerinin etkileşim katsayısıdır. P3 katsa yısının modele katkısı anlamlı bulunursa bu durumda TBO-DMF olduğu söylenebilir (Whitmore ve Schumaker, 1999). MH ve lojistik regresyon modelleri iki kategorili (0-1 puanlama) durumlarında kullanılacak yöntemlerdir. Maddelerin çoklu kategoriye göre puanlanmış biçimlerinde ise lojistik regresyonun özel bir hali kullanılabilmektedir (Zumbo, 1999). Zumbo (1999), iki kategorili puanlanmış testler için lojistik modeli; Pi In = (3q + Pl TP + p2 Grup + P3 Grup *TP ve çok kategorili puanlanmış testler için lojistik modeli; P(Y S j) log = Po + Pı TP + p2 Grup + p3 Grup *TP P (Y > j) şeklinde tanımlamıştır. Modeldeki test puanı TP ile gösterilmiştir. j ise, c kategori sayısını göstermek üzere j=l,2,.. (c-1) olarak verilmiştir. Araştırmanın Amacı Bu araştırmanın temel amacı, çoktan seçmeli testlerde iki kategorili ve önsel ağırlıklı puanlamanın DMF ye etkisini incelemektir. Problem Türkçe okuduğunu anlama yeteneğini ölçme amacı ile geliştirilmiş çoktan seçmeli bir testte, iki kategorili ve önsel ağırlıklı puanlama yöntemlerini kullanmanın DMF ye etkisi nasıldır? Alt Problemler 1. İki kategorili ve önsel ağırlıklı puanlama yöntemleri ile elde edilen madde puanlan, DMF bakımından okul türüne göre yanlılık göstermekte midir? 2. İki kategorili ve önsel ağırlıklı puanlama yöntemleri ile elde edilen madde puanlan, DMF bakımından cinsiyete göre yanlılık göstermekte midir?

40 ÖZDEMİR Suydular 1. Uygulamanın yapıldığı tüm sınıflarda test, yönergeye uygun bir biçimde uygulanmıştır. 2. Öğrenciler test maddelerini cevaplarken gerçek bilgilerini yansıtmışlardır. Sınırlılıklar 1. Araştırma, uygulamanın yapıldığı ilköğretim okullarının 4, 5, 6 ve 7. sınıflarında okuyan 1478 öğrenciyle sınırlıdır. 2. Araştırma, Türkçe okuduğunu anlama yeteneği ile sınırlıdır. 3. Araştırma, cinsiyet ve okul türü alt gruplan ile sınırlıdır. yöntemi ile elde edilen verilerin analizinde ise Zumbo (1999) ııun önerdiği lojistik regresyon modelinden yararlanılmıştır. Bulgular Araştırmaya katılan öğrencilerin okul türlerine göre dağılımları Tablo l de verilmiştir. Tablo l den görülebileceği gibi, öğrencilerin %45 i özel okullarda okumakta iken, %55 i ise devlet okullarında okumaktadır. Okul türüne göre iki kategorili puanlama ve önsel ağırlıklı puanlama yardımıyla elde edilen test istatistikleri ve model sonuçlan Tablo 2 de verilmiştir. Yöntem Araştırmanın verileri, 2001-2002 öğretim yılında çeşitli ilköğretim okullarının 4., 5.. 6. ve 7. smıflannda okuyan 1478 öğrenciye uygulanan ve Türkçe okuduğunu anlama yeteneğini ölçme amacı ile araştırmacı tarafından geliştirilen, her biri 4 seçenekli 20 maddelik çoktan seçmeli test yardımı ile elde edilmiştir. Araşurmada iki kategorili puanlama yöntemi ile önsel ağırlıklı puanlama yönteminden yararlanılmıştır. İki kategorili puanlamada her bir maddeye verilen cevaplar, doğru cevap için 1; yanlış, boş ya da birden fazla cevaplar için 0 puan verilmek suretiyle puanlanmaktadır. Önsel ağırlıklı puanlama yöntemi, her bir maddeye ilişkin seçeneklerin, doğru cevaba yakınlıklarına göre, bir ağırlık atanmak suretiyle puanlanmasını ifade eder. Bu yöntemde seçeneklere verilecek ağırlıkların belirlenmesi, testin uygulanmasından önce konu alanı uzmanlan tarafından yapılmaktadır. Bu yöntemde doğnı cevap dışındaki seçeneklere de puan atandığından, maddelerin yazılmasında en doğru cevabı gerektiren soru formatı kullanılmıştır. Testin uygulanması ile elde edilen veri, okul türüne (özel okullar ve devlet okullan) ve cinsiyete göre (erkek-kız) düzenlenmiştir. DMF nin araştınlması bu alt gruplar bazında gerçekleştirilmiştir. Madde yanlılığı ve DMF yi belirlemek için iki kategorili puanlama yöntemi ile elde edilen verilerin analizinde MH test istatistiği ile AMH katsayısından ve lojistik regresyon modellerinden; önsel ağırlıklı puanlama Tablo 1. Okul Tiiriine Göre Öğrenci Dağdımı Okul Türü Öğrenci Sayısı % Özel Okul 665 45 Devlet Okulu 813 55 Toplam 1478 100 Tablo 2 den de görülebileceği gibi, iki kategorili puanlama sonuçlanna ilişkin MH ve AMH sonuçlan ile lojistik regresyon modelinin kestirim sonuçlan incelendiğinde, MH sonuçlanna göre 19. madde dışında kalan maddelerde yanlılık miktan anlamlı bulunmamıştır. Tablo 2 den AMh sonuçlan incelendiğinde, 19. maddenin özel okullarda okuyan öğrenciler lehine çalıştığı gözlenmektedir. Özel okullarda okuyan öğrenciler lehine çalışan ancak anlamlı düzeyde yanlılık göstermeyen diğer maddeler sırasıyla; 1, 3, 6, 9, 10, 13, 15, 17 ve 18. maddelerdir. Bu maddeler dışındaki maddeler ise devlet okulunda okuyan öğrenciler lehine çalışmış ancak yine, yanlılık miktan anlamlı bulunmamıştır. Lojistik regresyon sonuçlan incelendiğinde, iki kategorili puanlama ile önsel ağırlıklı puanlama arasında model uyumu olarak önemli bir fark gözlenmemişür. Her iki puanlama yönteminin de modele tam uyum gösterdiği görülmektedir. MH den elde edilen sonuçlara göre maddelerin hangi alt grubun lehine çalıştığı belirlenebilmekle birlikte, bu durum ancak TB-DMF nin olduğu durumlar için geçerlidir. Maddelerin farklı yetenek düzeylerinde aynı grup

ÇOKTAN SEÇMELİ TESTLERDE İKİ KATEGORİLİ VE ÖNSEL AĞIRLIKLI PUANLMA 41 Tablo 2. İki KategorUi ve Önsel Ağırlıklı Puanlamanın Okul Türü Bakımından DMF'ye Etkisine İlişkin Sonuçlar Madde DMF İki Kategorili Puanlama Önsel Ağırlıklı Puanlama No Düzeyi MH Sonuçlan Lojistik Regresyon Sonuçlan Lojistik Regresyon Sonuçlan Model Grup Kesişim Model Grup Kesişim MH Amh Uyumu Etkisi (p) Etkisi (p) Uyumu Etkisi (p) Etkisi (p) 1 A 0,984 0,037 0,002 0,163 0,186 0,000 0,118 0,066 2 A 1,208-0,445 0,000 0,164 0,016 0,000 0,099 0,067 3 A 0,803 0,517 0,000 0,297 0,401 0,000 0,243 0,116 4 A 1,125-0,278 0,001 0,636 0,071 0,000 0,586 0,498 5 A 1,486 0,931 0,000 0,487 0,367 0,000 0,979 0,969 6 A 0,985 0,259 0,000 0,618 0,676 0,000 0,828 0,649 7 A 1,081-0,183 0.000 0,248 0,313 0,000 0,298 0,446 8 A 1,106-0,236 0,000 0,197 0,216 0,000 0,432 0,337 9 A 0,857 0,363 0,000 0,703 0,754 0,000 0,880 0,853 10 A 0,924 0,186 0,000 0,482 0,464 0,000 0,600 0,508 11 A 1,325-0,661 0,000 0,217 0,493 0,000 0,881 0,903 12 A 1,016-0,038 0,000 0,535 0,631 0,000 0,282 0,242 13 A 0,894 0,263 0,000 0,951 0,877 0,000 0,799 0,688 14 A 1,177-0,384 0,000 0,981 0,588 0,000 0,765 0,371 15 A 0,752 0,671 0,000 0,989 0,649 0,000 0,456 0,382 16 A 1,228-0,482 0,000 0,900 0,420 0,000 0,521 0,669 17 A 0,828 0,445 0,000 0,270 0,323 0,000 0,257 0,352 18 A 0,807 0,503 0,000 0,598 0,345 0,000 0,068 0,066 19* B 0,431 1,975 0,000 0,616 0,438 0,000 0,208 0,119 20 A 1,088-0,198 0,000 0,639 0,197 0,000 0,578 0,606 lehine yanlılık gösterip göstermediği lojistik regresyon sonuçlarına bakılarak yorumlanabilir. Tablo 2 de, lojistik regresyon analizinden elde edilen grup etkisi ve kesişim etkileri incelendiğinde, madde yanhhğı olmadığı gözlenmiştir. Bu bulgu, MH sonuçlan ile de paralellik göstermektedir. Buna karşın, 19. maddede ortaya çıkan orta düzeydeki (B-level) yanklık lojistik regresyon so- nuçlannda gözlenmemiştir. Bunun bir nedeni, MH test istatistiğinin DMF nin nicel büyüklüğünü de dikkate alması ile açıklanabilir. Araştırmaya katılan öğrencilerin cinsiyetlerine göre dağılımlan Tablo 3 te verilmiştir. Tablo 3 ten de görülebileceği gibi, araştırmaya katılanların %53 ü erkek, %47 si ise kız öğrencidir. Cinsiyete göre iki kategorili puanlama ve önsel ağırlıklı puanlama yardımıyla elde edilen test istatistikleri ve model sonuçları Tablo 4 te verilmiştir. Tablo 3. Cinsiyete Göre Öğrenci Dağılımı Cinsiyet Öğrenci Sayısı % Erkek 780 53 Kız 698 47 Toplam 1478 100 Tablo 4 te iki kategorili puanlama sonuçlarına ilişkin MH ve Amh sonuçlan ile lojistik regresyon modelinin kestirim sonuçlan incelendiğinde, okul türü bakımından elde edilen sonuçlarda olduğu gibi, MH sonuçlanna göre 19. madde dışında kalan maddelerde yanlılık miktarı önemli bulunmamıştır. Yine, AMH sonuçlan incelendiğinde, 19. maddenin erkek öğrenciler lehine çalıştığı gözlenmektedir. Erkek öğrenciler lehine çalışan diğer

42 ÖZDEMİR Tablo 4. iki Kategorin ve Önsel Ağırlıklı Puanlamanın Cinsiyet Bakımından DMF'ye Etkisine Ilişki/ı Sonuçlar Madde DMF İki Kalegorili Puanlama Önsel Ağırlıklı Puanlama No Dtlzeyi MH Sonuçlan Lojislik Regresyon Sonuçlan Lojistik Regresyon Sonuçlan Model Grup Kesişim Model Grup Kesişim MH Amh Uyumu Etkisi (p) Etkisi (p) Uyumu Etkisi (p) Etkisi (p) 1 A 0,848 0,388 0,006 0,932 0,808 0,000 0,665 0,721 2 A 0,855 0,367 0,000 0,685 0,388 0,000 0,775 0,755 3 A 1,526-0,994 0,000 0,966 0,397 0,000 0,540 0,629 4 A 1,071-0,161 0,005 0,539 0,424 0,000 0,264 0,247 5 A 1,021-0,049 0,000 0,245 0,212 0,000 0,142 0,148 6 A 0,838 0,415 0,000 0,585 0,329 0,000 0,325 0,284 7 A 1,222-0,471 0,000 0,391 0,169 0,000 0,459 0,479 8 A 0,983 0,041 0,000 0,173 0,137 0,000 0,333 0,290 9 A 0,988 0,029 0,000 0,310 0,344 0,000 0,866 0,882 10 A 0,873 0,318 0,000 0,214 0,350 0,000 0,598 0,607 11 A 0,944 0,135 0,000 0,106 0,062 0,000 0,610 0,609 12 A 1,053-0,122 0,000 0,594 0,566 0,000 0,864 0,843 13 A 0,954 0,110 0.000 0,382 0,246 0,000 0,275 0,271 14 A 1,192-0,413 0,000 0,470 0,423 0,000 0,360 0,310 15 A 0,902 0,242 0.000 0,578 0,398 0.000 0,393 0,285 16 A 1,182-0,393 0.000 0,651 0,370 0,000 0,291 0,236 17 A 1,076-0,173 0,000 0,444 0,475 0,000 0,684 0,742 13 A 0,935 0,159 0,000 0,168 0,110 0,0<X) 0,383 0,343 19* B 1,925-1,539 0,000 0,000 0,001 0,000 0,000 0,001 20 A 0,792 0,549 0,000 0,156 0,182 0,000 0,288 0,218 maddeler sırasıyla 3, 4,5,7, 12, 14, 16 ve 17. maddelerdir; ancak bu yanlılık göz ardı edilebilecek düzeyde bulunmuştur (A-level). 1, 2, 6, 8, 9, 10, 11, 13, 15, 18 ve 20. maddeler ise kız öğrenciler lehine çalışmakla birlikte yine yanlılık miktarı anlamlı bulunmamıştır. Tablo 4 te lojistik regresyon analizine dayalı sonuçlar incelendiğinde, iki kategorili puanlama ve önsel ağırlıklı puanlama yöntemlerinin modele tam uyum gösterdiği görülmektedir. İki kategorili ve önsel ağırlıklı puanlama için yapılan lojistik regresyon analizine dayalı grup etkisi ve kesişim etkileri incelendiğinde ise, 19. madde dışında madde yanlılığı bulunmadığı görülebilir. Lojistik regresyon analizi sonuçlan 19. maddedeki yanlılığın farklı yetenek düzeylerinde farklı gruplar lehine olduğu bilgisini verirken, MH test istatistiği bu yanlılığın erkekler lehine ancak göz ardı edilebilecek düzeyde olduğunu göstermektedir. Sonuç ve Öneriler Bu araştırmada, Türkçe okuduğunu anlama yeteneğini ölçme amacıyla geliştirilen bir test, cinsiyet gruplan ve okul türüne göre, diferansiyel madde fonksiyonu açısından incelenmiş, iki kategorili ve önsel ağırlıklı puanlama türlerinin DMF ye etkisi araştırılmıştır. Araştırma sonucunda, iki kategorili ve önsel ağırlıklı puanlama bakımından testte yer alan maddelerin büyük çoğunluğunun hem okul türüne hem de cinsiyete göre önemli düzeyde yanlılık göstermediği belirlenmiştir. Her iki alt grup için de yalnızca bir maddenin orta düzeyde (B-level) yanlılık gösterdiği ve bu yanlılığın okul türü bakımından özel okullarda okuyan öğrenciler lelıi- ne, cinsiyet bakımından da erkek öğrenciler lehine olduğu belirlenmiştir. Bu sonuca göre, testin uygulanmasıyla elde edilen verilerin yansız maddeler üzerinden elde edilen veriler olduğu söylenebilir. Bu durum,

ÇOKTAN SEÇMELİ TESTLERDE İKİ KATEGORİLİ VE ÖNSEL AĞIRLIKLI PUANLMA 43 geliştirilen testin, dikkate alınan alt gruplardan kaynaklanabilecek sistematik hatalardan arınık olduğunun bir göstergesi olarak kabul edilebilir. Test geliştirme çalışmalarında genellikle tesadüfi hatalar üzerinde durulmakta ve sistematik hatalar göz ardı edilmektedir. DMF yardımıyla sistematik hatanın varlığı hakkında bilgi elde etmek, geçerliği yüksek testler oluşturmada önemli bir çalışma olacaktır. Bu araştırmada okul türüne ve cinsiyete göre karşılaştırmalar yapılmıştır. Benzer çalışmalar farklı alt gruplar dikkate alınarak yapılabilir. Bu araştırmada iki kategorili ve önsel ağırlıklı puanlama türlerinin DMF ye etkisi belirlenmeye çalışılmıştır. Benzer çalışma, farklı puanlama yöntemleri dikkate alınarak yapılabilir. Kaynakça Camilli, G. & Shepard, LA. (1994). Methods fo r identifying biased test ilems. London: Sage Publications. Fiılalgo, A.M., Mellenberg, G J. & Muniz, J. (2000). Effects af amount of DIF, test lengtb, and pıırification type on robtıstness and povver of Mantel-Haenszcl procedures. Methods o f Psychologieai Research Online, 5 (3), Rctrieved on November 17, 2001 (de indirildi) from the World Wide Web: http:/avww.mpr-online.de Gierl, M.J., Jodoin, M.G. & Ackemıan, T.A. (24-27 Nisan 2000). Performancc of Mantel-Haenzsel, simultaneous item bias test, and logistic regression when the praportion of DIF items is large. Annual Meeting of the American Educationai Research Association (AERA). Hambleton, R.K. & Rogers, H J. (1989). Detecting potenlially biased test items: Comparison of IRT area and Mantel-Haenszel melhods. Applied Measurement in Education, 2 (4), 313-334. Hambleton, R.K., Swaminathan, H. & Rogers, HJ. (1991). Fundamentals o f item response llıeory. London: Sage Pnblications. Osterlind, J.S. (1983). Test item bias. London: Sage Publications. Whi(more, M.L & Schumacker, R.E. (1999). A comparison of logistic regression and analysis of variance differetial item functioning detection methods. Educationai and Psychologieai Measurement, 59 (6), 910-927. Yu, C.H. (May 2001). True score model and item response ıheory. Retrieved on May 25, 2001 (de indirildi) from the World Wide Web: http://seamonkev.ed.asu.edu/~alex. Zumbo, B.D. (1999). A handbook on the theory and methods o f differential item functioning (DIF): Logistic regression modeling as a unitary frametvork fo r binary and Likert type (ordinat) item scores. Oltawa, Cartada: Directorale of Humarı Resources Research and Evahıation, Department of National Def ense. Geliş 14 Ağustos 2002 İnceleme 12 Eylül 2002 Kabul 3 Şubat 2003