221 Eğtmde ve Pskolojde Ölçme ve Değerlendrme Dergs, Yaz 2012, 3(1), 221-229 Çok Boyutlu Madde Tepk Kuramı 1 İbrahm Alper KÖSE * Abant İzzet Baysal Ünverstes Özet Eğtm ve pskolojde test alanların verdğ tepklerden en doğru ve kullanışlı sonuçlar elde etmey amaçlamak bu alanlarda çalışanların temel noktası olmuştur. Bu amaca ulaşmak çn brçok kuram gelştrlmştr. Klask test kuramı, madde tepk kuramı.vb örnek olarak verleblr. Madde tepk kuramı breyn performansının altında yatan örtük özellğ açıklamak çn kullanılan güçlü br model olmasına rağmen, tek boyutluluk varsayımının karşılanmadığı durumlarda tek boyutlu model, çok boyutlu test versne uygulamak yetenek ve madde parametreler kestrmlernde geçerlk sorunlarını berabernde getrecek ve model-ver uyumunda öneml problemler ortaya çıkaracaktır. Bunun yanında ölçme araçlarına dayalı olarak verlen çeştl kararların (seçme, yerleştrme, akademk başarının değerlendrlmes vb.) sabetllğ açısından doğru modelleme son derece önemldr. Bu nedenlerle bu çalışmanın amacı, çok boyutlu madde tepk kuramının ayrıntılı olarak tanıtılması, tek boyutlu modeller karşısında alana getrdğ yenlkler ve avantajların tartışılmasıdır. Anahtar Sözcükler: Ölçme Kuramı, Madde Tepk Kuramı, Çok Boyutlu Madde Tepk Kuramı Abstract Provdng the most useful and vald nferences from examnee responses s the basc pont for researchers, who study at the educaton and psychology area. For ths am, many theores have been developed such as classc test theory, tem response theory ect. Item response theory s the robust theory to explan latent ablty on examnee performance but n the case of crcumstances n whch undmensonalty assumpton cannot be met, applcaton of undmensonal models to multdmensonal data matrx, brngs valdty problems on estmaton of ablty and tem parameters and also cause model-data ft problems. Furthermore, correct modelng as a bass for measurement tools s very fundemental for varous decsons (electon, placement, assessment of achevement). For these reasons, the purpose of ths study s to ntroduce multdmensonal tem response theory (MIRT) and to dscuss advantages and nnovatons of MIRT across undmensonal IRT models n the frame of lterature. Keywords: Measurement Theory, Item Response Theory, Multdmensonal Item Response Theory Eğtm ve pskolojde çeştl amaçlarla breyler hakkında kararlar verlmektedr. Bu kararların doğru ve güvenlr olmaları amacıyla eğtm ve pskoloj alanındak araştırmacılar, davranışların daha geçerl ve güvenlr ölçülmelern sağlayacak yen yaklaşımlar gelştrmektedrler. Bu yaklaşımlar gelştrlrken ölçülecek özellğ ncelleştrecek ve ortaya konan ncelğn anlamını yorumlayablecek güçlü ölçme kuramlarına htyaç duyulmuştur. Bu amaçla, araştırmacılar, geçerl ve güvenr sonuçlar veren güçlü ölçme kuramlarını gelştrmektedrler. Tek boyutlu Madde Tepk Kuramı (MTK) pratk test durumlarına Klask Test Kuramı (KTK) ndan daha y br çerçeve sunmasına rağmen, kuramsal ve görgül kanıtlar tepk verlernn çoğunun tek boyutluluk varsayımına tamamen uymadığını göstermektedr. Bunun yanında tek boyutlu MTK da tek br maddenn sadece br örtük özellğ ölçtüğünü varsaymak ver grubu le tek boyutlu modellern uyum sorunlarını da berabernde getrmektedr. Buna ek olarak çok boyutlu ver 1 Bu çalışma Madde Tepk Kuramına Dayalı Tek Boyutlu ve Çok Boyutlu Modellern Test Uzunluğu ve Örneklem Büyüklüğü Açısından Karşılaştırılması sml tez çalışmasından özetlenerek hazırlanmıştır. * Yrd. Doç. Dr., Abant İzzet Baysal Ünverstes Eğtm Fakültes Eğtm Blmler Bölümü,.alper.kose@gmal.com
Çok Boyutlu Madde Tepk Kuramı 222 grubu çn tek br özellk boyutunun olduğunun varsaymak, MTK nın değşmezlk özellğn de tehdt etmektedr (Ackerman, 1994). Tek br örtük özellğ ölçmek çn çok boyutlu maddeler kullanmak testn yapı geçerlğn düşürmektedr. Çünkü testn yapı geçerlğ kuramsal yapıya ve teste özgü ölçme aracına veya şlemne bağlıdır. Tek boyutlu modellern kullanılması le tek boyutluluk varsayımının hlal sonucu çok boyutlu örtük uzay le hedeflenen tek boyutlu örtük uzay arasında brebr eşleme yapılamayacaktır. Testn yapı geçerlğnde blşsel süreçlerde tek boyutlu modellemeden çok boyutlu modellemeye geçş le brlkte bu sorunlar ortadan kalkacaktır. Eğtm ve pskolojde test alanların verdğ tepklerden en doğru ve kullanışlı sonuçlar elde etmey amaçlamak bu alanlarda çalışanların temel odak noktası olmuştur. Bunun yanında ölçme araçlarına dayalı olarak verlen çeştl kararların (seçme, yerleştrme, akademk başarının değerlendrlmes vb.) sabetllğ açısından doğru modelleme son derece önemldr. Bu noktadan hareketle bu çalışmanın temel amacı çok boyutlu MTK nın ayrıntılı olarak tanıtılması, tek boyutlu modeller karşısında eğtm ve pskoloj alanına getrdğ yenlkler ve avantajları lgl alanyazın çerçevesnde tartışmaktır. Ölçme tarhnde, br test yanıtlayan breyn performansının altında yatan örtük özellğ açıklamak çn gelştrlen başlıca kuram KTK dır. KTK, testten alınan puanı, gerçek puan ve ölçme hatasının toplamı le açıklayan bast br modeldr. Buna karşın kuram, pratk test durumlarında stenmeyen özellkler de taşımaktadır. Test ve madde özellklernn gruba bağlı olması, breyn performansı hakkında blgnn sadece testn tümü üzernden verlmes ve madde bazında cevaplayıcı performansı hakkındak blgnn se kaybolması kuramın öneml sınırlılıklarındandır (Hambleton, Swamnathan ve Rogers, 1991). Pskolojk ölçme alanında son yüzyılın en öneml gelşmelernden brs MTK dır. MTK, kşnn ölçülen özellktek yern, test maddelerne verdğ yanıtları kullanarak KTK nın zayıf varsayımlarına karşı gelştrdğ güçlü varsayımlarla matematksel br model le açıklayan modern test kuramıdır (Bobcock, 2009). Kuramın öncek ölçme kuramlarına göre en öneml avantajları; madde güçlük değerlernn ve yetenek düzeylernn aynı ölçek düzeynde yer alması (Spencer, 2004), cevaplayıcının yeteneğn daha keskn (precson of measurement) ve daha küçük ölçme hataları le ortaya koyması, elde edlen madde parametrelernn aynı evrenden gelmş farklı örneklemlerde değşmezlk özellğn koruması ve tahmn edlen yetenek düzeylernn farklı alt test maddelernde de değşmez olarak kalmasıdır. Ayrıca MTK da cevaplayıcıların yetenek düzeylernn karşılaştırılması daha keskn ve daha kullanışlıdır. Bunun neden KTK dan farklı olarak, testn tümünden elde edlen ölçme hatasının bütün cevaplayıcılar çn aynı olmadığını varsaymasıdır (Lee, 2007). MTK, gelştrlmesnden günümüze kadar eğtm ve pskoloj alanındak ölçmelerde sıklıkla kullanılmıştır. Bunun yanında MTK, test gelştrme, test puanlarını eştleme, madde yanlılıklarını belrleme, blgsayar ortamında breyselleştrlmş 1 testlerde cevaplayıcının yeteneğnn kestrlmes gb brçok ölçme alanına yenlkler ve uygulanablr çözümler getrmştr. Buna karşın MTK, güçlü matematksel ve statstksel varsayımlara dayanması ve bu varsayımların karşılanması ve model ver uyumunun sağlanması durumunda şlerlk kazanablmektedr (Zhao, 2008). Kısa zaman öncesne kadar en çok kullanılan MTK model olan tek boyutlu MTK, cevaplayıcının br grup test maddes karşındak performansını, tek br yetenek veya özellk le açıklamaktaydı. Farklı türdek testler le yapılan araştırmalar kuramın bu varsayımının tamamen karşılanmasının oldukça güç olduğunu ortaya koymuştur. Özellkle başarı testlernn brden fazla boyutu ölçtüğü artık blnen br gerçektr. Böyle çok boyutlu testlern olması, kuramın tek boyutluluk varsayımının hlallern ortaya çıkarmaktadır (Pomplun, 1988). Tek boyutluluk varsayımının hlal le yapılan kestrmlerde sadece başat boyut kestrlmekte, dğer boyut hakkındak blg se kaybolmaktadır (Kreter, 1993). Bunun yanında Ackerman (1992, 1994a, 1994b), tek boyutluluk varsayımı hlal edldğnde test alanların tek br özellk üzernde sıralanamayacağını belrtmştr. Bunun neden olarak da çok boyutlu örtük uzay le cevaplayıcının tek br yeteneğ le bre br eşleme yapılamayacağını göstermştr. Tek br örtük özellğ ölçen br test gelştrmenn neredeyse mkânsız oluşu (Lee, 2007), blg kaybının en aza ndrlmes ve bunların sonucu olarak daha geçerl ve güvenlr ölçmeler yapablmek amacıyla k veya daha fazla yetenek gerektren testler çn çok boyutlu MTK modeller gelştrlmştr. Çok Boyutlu Madde Tepk Kuramı
Eğtmde ve Pskolojde Ölçme ve Değerlendrme Dergs 223 Bast statstksel modeller, karmaşık modellern temeln oluşturmaktadır. Bu durum MTK modeller çn de geçerldr. Tek boyutlu MTK modeller le çok boyutlu MTK modeller arasındak lşk tek boyutluluk varsayımının hlalne dayanır. Örnek olarak br matematk sorusunu alalım. Ayşe le ablasının cevzlernn toplamı 86 dır. Ayşe nn cevzlernn 2 katının 13 fazlası, ablasının cevzlernn 3 katına eşttr. Her brnn kaçar cevz vardır? Bu tür sorularda cevaplayıcıdan önce matematk problemn okuyup anlaması, daha sonra da matematksel şlemlerle bu problem çözmes beklenr. Bu tür problemler, hem okuduğunu anlama hem de şlem yeteneklern beraber gerektrmektedr. Bu gb durumlarda tek boyutluluk varsayımının karşılanması oldukça zordur. Bunun sonucu olarak test versn doğru br şeklde temsl edecek farklı modellere htyaç duyulmaktadır. Tek boyutlu MTK nın bu sınırlılığına karşı gelştrlmş modeller genel olarak çok boyutlu MTK modeller olarak adlandırılır (Smth, 2009). Çok boyutlu MTK, yapılar veya boyutlar olarak kavramsallaştırılan k veya daha fazla örtük değşken le test alanın belrl br test maddesn doğru olarak cevaplama olasılığı arasındak lşky matematksel br model le açıklayan modellerdr. Br başka fade le tek boyutlu MTK modellernn çok boyutluluğa uyarlanmasıdır (Ackerman, Gerl ve Walker, 2003). Çok boyutlu MTK, faktör analznn veya yapısal eştlk modellemesnn özel br durumu veya tek boyutlu madde tepk kuramının br uzantısı olarak da düşünüleblr. Faktör analznn br uzantısı olarak Chrstoffersson (1975, Aktaran; Ackerman, Gerl ve Walker, 2003; McDonald, 2000) br grup örtük değşken, v le, tanımlamış ve bu değşken; v ' f şeklnde fade etmştr. Eştlkte; ',..., 1, 2 n ortak faktör yükler matrsn (common factor loadngsmatrces), f.ortak faktör vektörünü (common factor vector), nc tekl faktörü (unque factor), fade etmektedr. Bu model her maddes çn, maddenn doğru cevaplanmasından sorumlu br örtük değşkenn varlığını varsaymaktadır. Bu örtük değşken sürekl ve normal dağılan br değşkendr. Cevaplayıcının yeterlğ bell br eşk değernn, t, üzernde veya eştse, madde doğru cevaplanır, aks durumlarda cevaplayıcı maddey yanlış yanıtlayacaktır. 1-0 şeklnde puanlanan her maddes çn cevaplayıcının tepks, U 1, eğer v t se veya U 0, eğer v < t şeklnde gösterlr. maddesn doğru yanıtlayan cevaplayıcıların oranı (p değer veya güçlük düzey) normal dağılım eğrsnde eşk değernn, t, üzernde kalan alanın oranı olarak, p N t fade edleblr. Eştlkte N normal ogve fonksyonunu temsl etmektedr. Bu sonuç k-boyutlu normal ogve fonksyonunun gelşmesne neden olmuştur. Fonksyon; ' P U... N N... şeklndedr. Eştlk 6 da; ve k ncı boyut çn; 1 1 k 0 0 1 1 2 2 t 0 madde güçlük parametresn, madde ayırıcılık parametresn göstermektedr. k k
Çok Boyutlu Madde Tepk Kuramı 224 Burada açıklanan madde varyansını veya ortak faktörün (communalty) 1 den çıkarılmasını fade eder. Eştlk 6 ncelendğnde Lord (1980; Aktaran; Ackerman, Gerl ve Walker, 2003) un tek boyutlu madde parametreler; P U 1 N a b N a a b le lşkl olduğu görülmektedr. Bu eştlkte 0, a b fadesne ve de madde ayırıcılık parametresne (a ) karşılık gelmektedr. Bu k yaklaşımın br uzantısı olarak k boyutlu normal ogve model 1 PU 1 1 2 1,7 a1 1 a22 d 1 e (d. Şekl 1. İk Boyutlu Br Maddenn Madde Karakterstk Yüzey (α 1 =2.0, α 2 =0, d=0. 5) Tek boyutlu MTK da madde karakterstk eğrlernn yern çok boyutlu MTK da madde karakterstk yüzeylernn alması, bazı termnolojlern de değşmes anlamına gelmektedr. Bu kavramları Reckase (1985, 1997) çok boyutlu madde güçlüğü-çmg (multdmensonal tem dffculty) ve çok boyutlu madde ayırıcılığı-çma (multdmensonal tem dscrmnaton) olarak fade etmştr. ÇMG ve ÇMA n her ks de çok boyutlu maddeler özetleyen değerlerdr. Şekl 2. Madde Vektör Grafğ ÇMA (Şekl 2.), maksmum ayırıcılık parametres olarak da blnen çok boyutlu madde ayırt edclğ, tek boyutlu MTK da madde ayırt edclğne karşılık gelmektedr. Tek boyutlu modellerdek
Eğtmde ve Pskolojde Ölçme ve Değerlendrme Dergs 225 madde ayırt edclğnden farklı olarak çok boyutlu MTK da madde ayırıcılığı vektör ( a ) olarak fade edlr. Bu vektör her k boyut çn ortak madde ayırt edclk gücü olarak tanımlanır (Smth, 2009). Matematksel fades; ÇMA= m a k k 1 veya ÇMA= a a dr. 2 2 1 2 Bu vektörel uzunluk maksmum ayırıcılığı temsl eder. İfadedek a 1 ve a 2 her k örtük özellk çn madde ayrıcılık değerlern fade etmektedr (Zhang, 2008). ÇMA, maddenn toplam ayırt edclğn fade eden br vektör olduğuna göre, bu vektörün br açısal yönünün (drecton) de olması gerekldr. Bu açı değer θ 1 eksenne yakın se brncl olarak θ 1 yeteneğn (Şekl 3.-madde 3), θ 2 eksenne yakın maddelern se θ 2 yeteneğn (Şekl 3.-madde 1), brncl olarak ölçtüğü söyleneblr. θ 1 ve θ 2 eksenler arasında 45 0 lk açı yapan maddeler se θ 1 ve θ 2 yeteneklernn her ksn de eşt olarak ölçen maddelerdr (Şekl 3-madde2). Şekl 3. Çok Boyutlu Farklı Örtük Özellk Kompozsyonundak Maddelern Grafksel Gösterm Reckase (1997) ve Zhang (2008), çok boyutlu madde ayırt edclğ vektörünün yönünü a 1 arccos olarak tanımlamıştır. ÇMA Örnek olarak k boyutlu br maddenn ayırıcılık parametreler; a 1 = 0.652 ve a 2 = 0.245 olarak hesaplanmış olsun. Hesaplanan a 1 değer brnc boyuta at ayırıcılık parametresn, a 2 se knc boyuta at ayırıcılık parametresn fade etmektedr. Bu maddey temsl eden toplam madde ayırt edclk parametres; ÇMA= se; a a dr ve ÇMA = 2 2 1 2 2 2 0.652 0.245 = 0.696 olarak hesaplanır. Bu vektörün yönü a 1 0,652 arccos = arccos = 20,4 bulunur. ÇMA 0,696 Hesaplanan bu değer maddey temsl eden madde ayırıcılık parametresnn brnc örtük özellk le 20, 4 derecelk br açı yaptığını göstermektedr. Yan madde büyük oranda brnc örtük özellğ ölçmektedr (Şekl 4).
Çok Boyutlu Madde Tepk Kuramı 226 Şekl 4. ÇMA nın Grafk Üzernde Gösterm ÇMG (Şekl 4), tek boyutlu MTK da madde güçlüğüne (b) karşılık gelen, en y ayırıcılık gücünü veren ve orjnden θ uzayına en dk eğm noktasına uzaklıktır. Parametrenn matematksel fades; d ÇMG= ÇMA şeklndedr. Formüldek d, maddesnn yer parametresn temsl etmektedr. Formülden elde edlen ve orjnden p=.50 noktasına olan uzaklığın fades olan ÇMG nün şaret maddenn bağıl güçlüğünü (relatve dffculty) fade eder. Negatf ÇMG değer maddenn bağıl olarak daha kolay olduğunu, poztf ÇMG değer maddenn bağıl olarak daha zor olduğunu fade etmektedr (Kao, 2007). Çok Boyutlu MTK da Blg Fonksyonu Çok boyutlu MTK da blg fonksyonu, tek boyutlu MTK dak blg fonksyonunun br uzantısı olup, fonksyonun matematksel göstermne blgnn doğrultusunun (drecton of nformaton) eklenmes le gösterlmektedr. Çok boyutlu blgnn matematksel fades; Çok Boyutlu Blg= P m 1 k cos k şeklndedr. Formülde; k1 P P(Θ) Θ yetenek düzeyndek cevaplayıcının maddesne doğru cevap verme olasılığını, α k.örtük özellk kompozsyonundak maddesn temsl eden vektördür. Bu vektör Θ 1 eksen le yapılan açı le temsl edlr (Ackerman, 2005). Çok Boyutlu Madde Tepk Kuramı Analzlernde Kullanılan Yazılımlar Artan htyaçlar doğrultusunda, MTK parametre tahmnler çn br çok blgsayar programı gelştrlmştr. Çok boyutlu MTK modellernde kullanılan programlar MIRTE, MAXLOG, TESTFACT ve NOHARM dır. Bu programlar hem tek boyutlu, hem de çok boyutlu modeller çn analz yapablme esneklğne sahptr. Bu programlar da kullandıkları tahmn yöntemler ve yetenek kestrm yapıp yapamamalarına bağlı olarak brbrnden farklılaşmaktadır (Lee, 2007). TESTFACT programı, marjnal en çok olablrlk algortmasını kullanarak tam blg madde faktör analz le madde parametrelern tahmn etmektedr. Program madde güçlük, ayırt edclk ve yetenek parametresn kestreblmekte fakat şans parametresn kestrememektedr. NOHARM programı en küçük kareler ve tetrakork korelasyon algortması le faktör analzne yaklaştırma teknğ le madde parametrelern kestreblmektedr. NOHARM programı sadece madde güçlük ve ayırt edclk parametresn kestreblmekte, şans ve yetenek parametresn se kestrememektedr (Bobcock, 2009). 2 Tek ve Çok Boyutlu MTK nın Karşılaştırmasını Temel Alan Araştırmalar Chang (1992) ın yaptığı araştırmada, Woodcock-Johnson Psycho-Educatonal Battery- Revsed testnn okuma becers ve matematk alt test verler le sun ver kullanılmış ve yetenek
Eğtmde ve Pskolojde Ölçme ve Değerlendrme Dergs 227 kestrmler tek ve çok boyutlu madde tepk kuramı modeller altında ncelenmştr. Araştırma sonucunda, çok boyutlu MTK le elde edlen sonuçların kuramsal ve amprk olarak daha büyük ölçme kesknlğne sahp olduğu belrlenmştr. Bunun yanında çok boyutlu kuram altında elde edlen yetenek kestrmlernn, tek boyutlu kuram altında elde edlen yetenek kestrmlerne kıyasla, daha düşük standart hatalarının olduğu ve daha keskn yetenek kestrmlernn elde edldğ vurgulanmıştır. Spencer (2004) sun ver üzernde yapmış olduğu çalışmada, tek ve çok boyutlu madde tepk kuramı modeller altında model ve yetenek parametre kestrmlernn karşılaştırmasını yapmıştır. Bu araştırmada ayrıca kullanılan yazılımlar da karşılaştırılmıştır. Araştırma sonucunda, cevaplayıcıların çok boyutlu örtük özellkler, çok boyutlu ölçme model le tek boyutlu ölçme modelne göre daha hassas ölçümlere ulaşıldığı belrlenmştr. Ayrıca çok boyutlu ver matrsne, çok boyutlu ölçme modelnn daha y uyum gösterdğ belrlenmştr. de la Tore ve Patz (2005), araştırmalarında telafsel tpte 3-parametrel çok boyutlu MTK modelnn, tek boyutlu MTK ya göre daha y kestrmlerde bulunup bulunamayacağını test etmşlerdr. Araştırma sonucunda, örtük özellkler arası lşk büyüklüğü 0.00 olduğunda çok boyutlu MTK nın daha y kestrmlerde bulunduğu, lşk büyüklüğü 1.00 a doğru yaklaştığında se tek boyutlu MTK nın terch edlmes gerektğ vurgulanmıştır. Seungho Yang (2007) yapmış olduğu araştırmada tek boyutluluk varsayımının hlalnn parametre tahmn ve model ver uyumuna olan etksn tek ve çok boyutlu modeller altında ncelemştr. Araştırma sonucunda, yetenek parametres kestrmnde en büyük etky test uzunluğunun yaptığı, örneklem büyüklüğünün se madde güçlük parametres kestrmnde etks olduğu gözlenmştr. Dğer araştırmalardan farklı olarak testlerde örtük özellkler arasındak lşk orta düzeyden yüksek düzeye kadar olan durumlarda çok boyutlu MTK modellernn daha kesn kestrmlerde bulunduğu, ancak örtük özellkler arası lşk 0.0 a yaklaştıkça tek boyutlu Rasch modelnn daha kesn kestrmlerde bulunduğu ortaya konmuştur. Yukarıda kısaca özetlenen araştırmalar ve lgl alanyazın göstermştr k, çok boyutlu MTK le lgl uygulamalar eğtm ve pskoloj alanındak yern gttkçe artırmaktadır. Bunun yanında testlern veya testlerde bulunan maddelern sadece tek br örtük özellğ ölçtüğünü varsaymak ve bu varsayım altında ölçmeler yaparak brey hakkında karar vermek artık daha tartışılır hale gelmştr. Buna karşın tek boyutlu MTK nın bu karşılanması oldukça güç olan varsayımına karşın çok boyutlu MTK modellernn kullanılması durumlarında daha keskn, geçerl ve güvenlr sonuçlar alındığı belrlenmştr. Ancak çok boyutlu MTK da cevaplayıcının maddeye doğru cevap verme olasılığını grafksel olarak gösteren yazılımların hala çalışma aşamasında olması ve araştırmacıların kullanımına hzmet edememes bu konudak çalışmaların temel eksklğ olmaya devam etmektedr. Tartışma Eğtm ve pskoloj alanında tek boyutlu MTK modeller yaygın olarak kullanılmasına rağmen, kuramın tek boyutluluk varsayımının özellkle başarı ve yetenek testlernde tamamıyla karşılanması oldukça güçtür (Hambleton, Swamnathan ve Rogers, 1991; Reckase, 1997). Tek boyutluluk varsayımının karşılanmadığı durumlarda tek boyutlu model, çok boyutlu test versne uygulamak yetenek ve madde parametreler kestrmlernde geçerlk sorunlarını berabernde getrecek ve model-ver uyumunda öneml problemler ortaya çıkaracaktır. Ackerman (1994a-b) ın belrttğ üzere cevaplayıcının performansını etkleyen brden fazla örtük özellk varsa, çok boyutlu MTK modeller kullanılmalıdır. MTK modeller çn yapılan çalışmalarda (Drasgow ve Parsons, 1983, Hambleton, 1969; Aktaran; Kreter, 1993) orta derecede çok boyutlu verlere (moderate degrees of multdmensonalty), tek boyutlu modellern uygulanması güçlü br yapı göstermesne rağmen, ver grubunda çok boyutluluk arttıkça blg kaybına ve yetenek kestrmlernn yanlış yorumlanmasına yol açmaktadır. Tek boyutluluk varsayımının hlal model ver uyumsuzluğunu da berabernde getrmektedr. Tek boyutlu modeller altında yapılan model ver uyumu testlernde ortaya çıkan uyumsuzlukların en büyük neden test versnn çok boyutluluğudur. Yukarıda alanyazında çok boyutlu modellern uygulanması hakkında özetlenen araştırmalar göstermştr k, testlern çok boyutlu olduğu durumlarda yetenek ve madde parametrelernn kestrm daha geçerl ve güvenlr sonuçlar vermştr
Çok Boyutlu Madde Tepk Kuramı 228 1987-2006 yılları arasında Amerka Brleşk Devletler Merkez Bankası Başkanı olarak çalışan Alan GREENSPAN 2007 yılında yazmış olduğu Türbülans Çağı (The Age of Turbulance) adlı ktabının br bölümünde, gelştrlen ekonomk modeller tartışmış, daha spesfk ve parametre sayısının fazla olduğu modellern daha geçerl çıkarsamalarda bulunduğunu belrtmştr. Paralel br düşünce le Walker ve Beretvas (2003) tek ve çok boyutlu madde tepk kuramı modellern karşılaştırmış ve daha kompleks modellern daha az hatalı, daha güvenlr ve model ver uyumu daha yüksek olduğunu ortaya koymuştur. Eğtm alanında araştırma yapanların amacı, breyn verdğ tepklerden yararlanarak, brey karakterze eden en geçerl ve en güvenlr sonuçlara ulaşmaktır. Breyn verdğ tepklern en doğru bçmde analz edlmemes, brey hakkında verlecek yanlış kararlara da temel hazırlayacaktır. Pskometr alanındak en büyük gelşmelerden br de MTK ya dayalı çalışmalardır. Kuramın tek boyutlu modeller eğtm araştırmacılarına uzun yıllar hzmet etmş ve etmeye devam etmektedr. Kuramın çok boyutlu uzantısı olan çok boyutlu MTK, elektronk yazılımların lerlemes le alanda hzmet etmeye başlamış, artan blg ve teknoloj le araştırmacıların beklentlern karşısında gelşmeye devam edecektr. Kaynaklar Ackerman, T.A. (1992). Assessng construct valdty usng multdmensonal tem response theory. Paper Presentedat the Annual Meetng of Amercan Educatonal Research Assocaton. San Franssco, CA, USA. Ackerman, T.A.(1994a). Graphcal Representaton of Multdmenson-al Item Response Theory Analyses. PaperPresented at the Annual Meetng of Amercan Educatonal Research Assocaton. New Orleans, LA. Ackerman, T.A. (1994b). Usng multdmensonal tem response theory to understand what tems and tests are measurng. Appled Measurement n Educaton, 7(4), 255-278. Web: http://www.dx.do.org/10.1207 adresnden 5 Eylül 2008 tarhnde alınmıştır. Ackerman, T.A., Gerl, M.J., Walker, C.M. (2003). Usng multdmensonal tem response theory to evaluate educatonal and psychologcal tests. Educatonal Measurement: Issues and Practce: MIRT Instructonal Module. Ackerman, T.A. (2005). Multdmensonal tem response theory modelng. In J.J. McArdle (Ed). Contemporary Psychometrcs (p.3-24). Web:http://www.questa.com/reader/prntPagnator/1580 adresnden 13 Mayıs 2009 da alınmştır. Antal, T. (2007). On multdmensonal tem response theory a coordnate free approach. Electronc Journal of Statstcs, 1, 290-306. Bobcock, B.G.E.(2009). Estmatng a Noncompensatory IRT Model Usng a modfed Metropols algorthm. Unpublshed Doctoral Dssertaton.The Unversty of Mnesota. Bock, R.D. (1997). A bref hstory of tem response theory. Educatonal Measurement: Issues and Practce. Wnter 1997. Bock, D.R., Thssen, D. ve Zmowsk, M.F. (1997). IRT estmaton of doman scores. Journal of Educatonal Measurement, 34 (3), 197-211. Bolt, D.M. ve Lall, V.F. (2003). Estmaton of compensatory and non-compensatory multdmensonal tem response models usng Markov Chan Monte Carlo. Appled Psychologcal Measuement, 27, 395. Web: http://apm.sagepub.com adresnden 3 Nsan 2008 de alınmıştır. Chang, Y.W. (1992). A comparson of undmensonal and multdmensonal IRT approaches to test nformaton n a test battery. Unpublshed Doctoral Dssertaton. Unversty of Mnnesota. de la Tore, J. ve Patz, R.J. (2005). Makng the most of what we have: A practcal applcaton of multdmensonal tem response theory n test ccorng. Journal of Educatonal and Behavoral Statstcs, 30(3), 295-311. Web: http://www.jstor.org/stable/3701380 adresnden 12 Ocak 2009 tarhnde alınmıştır. Drasgow ve Parsons (1983). Applcaton of undmensonal tem response theory models to multdmensonal data. Appled Psychologcal Measurement, 7, 189-199. Embretson, S.E. ve Rese, S.P. (2000). Item Response Theory For Psychologsts. Lawrence Erlbaum Assocate, Inc. Greenspan, A. (2007). The age of turbulance. The Pengun Pres. New York, 2007. Hambleton, R.K. ve Swamnathan, H. (1989). Item Response Theory. Prncples And Applcatons. Kluwer- Njhoff Publshng. Boston-USA. Hambleton, R.K. (1994). Item response theory: A broad psychometrc framework for measurement advances. Pscothema, 6, 535-536.
Eğtmde ve Pskolojde Ölçme ve Değerlendrme Dergs 229 Hambleton, R. K., Swamnathan, H. and Rogers, H. (1991). Fundamentals of Item Response Teory. Newbury Park CA: Sage. Kao, S.C. (2007). The new goodness of ft ndex multdmensonal tem response model. Unpublshed Doctoral Dssertaton. Mchgan State Unversty. Kreter, C.D. (1993). An emprcal Investgaton of compensatory and noncompensatory test tems n smulated and real data. Unpublshed Doctoral Dssertaton. The Unversty of Iowa. Lee, S. H. (2007). Multmensonal tem response theory: A SAS MDIRT MACRO and emprcal study of PIAT MATH Test Unpublshed Doctoral Dssertaton. The Unversty of Oklahoma. L, Y. H. ve Schafer, W.D (2005). Trat parameter recovery usng multdmensonal computerzed adaptve testng n readng and mathematcs. Appled Psychologcal Measurement, 29, 3-25. Web: http://www.sagepub.com adresnden 3 Nsan 2008 tarhnde alınmıştır. McDonald, R.P. (1982). Lnear versus models n tem response theory Appled Psychologcal Measurement, 6, 379-396. McDonald, R.P. (2000). A bass for multdmensonal tem response theory. Appled Psychologcal Measurement, 24, 99. http://www.sagepub.com adresnden 3 Nsan 2008 tarhnde alınmıştır. Pomplun, M.R. (1988). Effecets of local dependence n achevement tests on IRT ablty estmaton. Unpublshed Doctoral Dssertaton. The Florda State Unversty. Reckase, M.D. (1997). Models for multdmensonal tests and herarchcally structured tranng materals. Techncal Report. The Amercan Colage Tesng Program. Iowa Cty, Iowa. Seungho Yang, M. A. (2007). A Comparson of undmensonal and multdmensonal rasch models usng parametrer estmates and ft ndces when assumpton of undmensonalty s volated. Unpublshed Doctoral Dssertaton. The Oho State Unversty Sjtsma, K. ve Junker, B.W. (2006). Item response theory: past performance. Present developments and future expectatons. Behavormetrka, 1, 75-102. Smth, J. (2009). Some ssues n tem response theory: Dmensonalty assessment and models forgguessng. Unpublshed Doctoral Dssertaton. Unversty of South Calforna. Spencer, G.S. (2004). The strength of multdmensonal tem response theory n explorng consrtuct space that s multdmensonal and corralated. unpublshed doctoral dssertaton. Brgam Young Unversty. Walker, C.M. ve Beretvas, S.N. (2003). Comparng multdmensonal and undmensonal profcency classfcatons: multdmensonal IRT As a dagnostc ad. Journal od Educatonal Measurement, 40 (3), 255-275. Zhang, B. (2008). Applcaton of undmensonal tem response models to tests wth tems senstve to secondary dmenson. The Journal of Expermental Educaton, 77 (2), 147-166. Zhao, Y. (2008). Approaches for addressng the ft of Item response theory models to educatonal test data. UnpublshedDoctoral Dssertaton. Unversty of Massachusetts Amberst.