Çok Boyutlu Madde Tepki Kuramı 1



Benzer belgeler
Obtaining Classical Reliability Terms from Item Response Theory in Multiple Choice Tests

ÇOKLU REGRESYON MODELİ, ANOVA TABLOSU, MATRİSLERLE REGRESYON ÇÖZÜMLEMESİ,REGRES-YON KATSAYILARININ YORUMU

Comparing the Test Information Obtained through Multiple- Choice, Open-Ended and Mixed Item Tests Based on Item Response Theory

5.3. Tekne Yüzeylerinin Matematiksel Temsili

Obtaining Classical Reliability Terms from Item Response Theory in Multiple Choice Tests

Doğrusal Korelasyon ve Regresyon

dir. Bir başka deyişle bir olayın olasılığı, uygun sonuçların sayısının örnek uzaydaki tüm sonuçların sayısına oranıdır.

Korelasyon ve Regresyon

PARÇALI DOĞRUSAL REGRESYON

Sürekli Olasılık Dağılım (Birikimli- Kümülatif)Fonksiyonu. Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK

ENDÜSTRİNİN DEĞİŞİK İŞ KOLLARINDA İHTİYAÇ DUYULAN ELEMANLARIN YÜKSEK TEKNİK EĞİTİM MEZUNLARINDAN SAĞLANMASINDAKİ BEKLENTİLERİN SINANMASI

PÜRÜZLÜ AÇIK KANAL AKIMLARINDA DEBİ HESABI İÇİN ENTROPY YÖNTEMİNİN KULLANILMASI

HAFTA 13. kadın profesörlerin ortalama maaşı E( Y D 1) erkek profesörlerin ortalama maaşı. Kestirim denklemi D : t :

1. KEYNESÇİ PARA TALEBİ TEORİSİ

YÖNETİM VE EKONOMİ Yıl:2006 Cilt:13 Sayı:1 Celal Bayar Üniversitesi İ.İ.B.F. MANİSA

kadar ( i. kaynağın gölge fiyatı kadar) olmalıdır.

SEK Tahmincilerinin Arzulanan Özellikleri. SEK Tahmincilerinin Arzulanan Özellikleri. Ekonometri 1 Konu 9 Sürüm 2,0 (Ekim 2011)

ALGILANAN HİZMET KALİTESİ VE LOJİSTİK REGRESYON ANALİZİ İLE HİZMET TERCİHİNE ETKİSİNİN BELİRLENMESİ. Özet

Sistemde kullanılan baralar, klasik anlamda üç ana grupta toplanabilir :

Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ

BÖLÜM 1 1.GİRİŞ: İSTATİSTİKSEL DOĞRUSAL MODELLER

Kİ-KARE TESTLERİ. şeklinde karesi alındığında, Z i. değerlerinin dağılımı ki-kare dağılımına dönüşür.

TEKNOLOJİ, PİYASA REKABETİ VE REFAH

Bulanık Mantık ile Hesaplanan Geoid Yüksekliğine Nokta Yüksekliklerinin Etkisi

a IIR süzgeç katsayıları ve N ( M) de = s 1 (3) 3. GÜRÜLTÜ GİDERİMİ UYGULAMASI

Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi Pamukkale University Journal of Engineering Sciences

ADJUSTED DURBIN RANK TEST FOR SENSITIVITY ANALYSIS IN BALANCED INCOMPLETE BLOCK DESIGN

KIRMIZI, TAVUK VE BEYAZ ET TALEBİNİN TAM TALEP SİSTEMİ YAKLAŞIMIYLA ANALİZİ

Sıklık Tabloları ve Tek Değişkenli Grafikler

Tek Yönlü Varyans Analizi (ANOVA)

Kİ KARE ANALİZİ. Doç. Dr. Mehmet AKSARAYLI Ki-Kare Analizleri

NİTEL TERCİH MODELLERİ

Hasar sıklıkları için sıfır yığılmalı kesikli modeller

FARKLI REGRESYON YÖNTEMLERİ İLE BETA KATSAYISI ANALİZİ

VEKTÖRLER VE VEKTÖREL IŞLEMLER

DOĞRUSAL HEDEF PROGRAMLAMA İLE BÜTÇELEME. Hazırlayan: Ozan Kocadağlı Danışman: Prof. Dr. Nalan Cinemre

UYUM ĐYĐLĐĞĐ TESTĐ. 2 -n olup. nin dağılımı χ dir ve sd = (k-1-p) dir. Burada k = sınıf sayısı, p = tahmin edilen parametre sayısıdır.

Öğretim planındaki AKTS TASARIM STÜDYOSU IV

BÖLÜM 5 İKİ VEYA DAHA YÜKSEK BOYUTLU RASGELE DEĞİŞKENLER İki Boyutlu Rasgele Değişkenler

X, R, p, np, c, u ve diğer kontrol diyagramları istatistiksel kalite kontrol diyagramlarının

Pamukta Girdi Talebi: Menemen Örneği

ADIYAMAN ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MATEMATİK ANABİLİM DALI YÜKSEK LİSANS TEZİ SOFT KÜMELER VE BAZI SOFT CEBİRSEL YAPILAR.

Deney No: 2. Sıvı Seviye Kontrol Deneyi. SAKARYA ÜNİVERSİTESİ Dijital Kontrol Laboratuvar Deney Föyü Deneyin Amacı

Kİ-KARE VE KOLMOGOROV SMİRNOV UYGUNLUK TESTLERİNİN SİMULASYON İLE ELDE EDİLEN VERİLER ÜZERİNDE KARŞILAŞTIRILMASI

TEKNOLOJĐK ARAŞTIRMALAR

PARABOLİK YOĞUNLUK FONKSİYONUNU KULLANARAK SEDİMANTER TEMEL DERİNLİKLERİNİN KESTİRİMİ

Şiddet-Süre-Frekans Bağıntısının Genetik Algoritma ile Belirlenmesi: GAP Örneği *

ARAŞTIRMA MAKALESİ/RESEARCH ARTICLE TEK ÇARPIMSAL SİNİR HÜCRELİ YAPAY SİNİR AĞI MODELİNİN EĞİTİMİ İÇİN ABC VE BP YÖNTEMLERİNİN KARŞILAŞTIRILMASI ÖZ

ANTALYA DA OBEZİTE YAYGINLIĞI VE DÜZEYİNİ ETKİLEYEN SOSYO-EKONOMİK DEĞİŞKENLER

Sıfır Ağırlıklı Sayma ile Elde Edilen Veriler İçin Çok Seviyeli ZIP Regresyon * Multilevel ZIP Regression for Zero-Inflated Count Data

MIT Açık Ders Malzemeleri Bu materyallerden alıntı yapmak veya Kullanım Koşulları hakkında bilgi almak için

PROJE PLANLAMASINDA BULANIK HEDEF PROGRAMLAMA YAKLAŞIMI. Müh. Ramadan VATANSEVER

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ÇOKLU İÇ İLİŞKİ VE EKOLOJİK REGRESYON İSTATİSTİK ANABİLİM DALI

GM-220 MÜH. ÇALIŞ. İSTATİSTİKSEL. Frekans Dağılımı Oluşturma Adımları VERİLERİN SUNUMU. Verilerin Özetlenmesi ve Grafikle Gösterilmesi

REGRESYONDA ETKİLİ GÖZLEMLERİ BELİRLEME YÖNTEMLERİ VE KARŞILAŞTIRMALARI. Can DARICA YÜKSEK LİSANS TEZİ İSTATİSTİK

UYGULAMA 2. Bağımlı Kukla Değişkenli Modeller

DENEY 4: SERİ VE PARALEL DEVRELER,VOLTAJ VE AKIM BÖLÜCÜ KURALLARI, KIRCHOFF KANUNLARI

JFM316 Elektrik Yöntemler ( Doğru Akım Özdirenç Yöntemi)

PROJE SEÇİMİ VE KAYNAK PLANLAMASI İÇİN BİR ALGORİTMA AN ALGORITHM FOR PROJECT SELECTION AND RESOURCE PLANNING

Muhasebe ve Finansman Dergisi

ROBİNSON PROJEKSİYONU

PARAMETRİK OLMAYAN HİPOTEZ TESTLERİ Kİ-KARE TESTLERİ

Rasgele Değişken Üretme Teknikleri

YAYILI YÜK İLE YÜKLENMİŞ YAPI KİRİŞLERİNDE GÖÇME YÜKÜ HESABI. Perihan (Karakulak) EFE

İÇME SUYU ŞEBEKELERİNİN GÜVENİLİRLİĞİ

4.5. SOĞUTMA KULELERİNİN BOYUTLANDIRILMASI İÇİN BİR ANALIZ

Üç Boyutlu Yapı-Zemin Etkileşimi Problemlerinin Kuadratik Sonlu Elemanlar ve Sonsuz Elemanlar Kullanılarak Çözümü

SEK Yönteminin Güvenilirliği Sayısal Bir Örnek. Ekonometri 1 Konu 11 Sürüm 2,0 (Ekim 2011)

Calculating the Index of Refraction of Air

YARIPARAMETRİK KISMİ DOĞRUSAL PANEL VERİ MODELLERİYLE ULUSLAR ARASI GÖÇ

Sinirsel Bulanık Sistemler İle Trafik Gürültüsünün Tahmini

YÜKSEK LİsANS VE DOKTORA PROGRAMLARI

YAŞAM ÇÖZÜMLEMESİNDE AYKIRI DEĞERLER OUTLIERS IN SURVIVAL ANALYSIS

T.C. SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

TÜKETİCİ TATMİNİ VERİLERİNİN ANALİZİ: YAPAY SİNİR AĞLARI ve REGRESYON ANALİZİ KARŞILAŞTIRMASI

Tek Yönlü Varyans Analizi

TEKNOLOJĐK ARAŞTIRMALAR

EMG İşaretlerinin K-Ortalama Algoritması Kullanılarak Öbekleştirilmesi. EMG Signal Analysis Using K-Means Clustering

HİSSE SENETLERİNİN BEKLENEN GETİRİ VE RİSKLERİNİN TAHMİNİNDE ALTERNATİF MODELLER

FLYBACK DÖNÜŞTÜRÜCÜ TASARIMI VE ANALİZİ

Regresyon ve Korelasyon Analizi. Regresyon Analizi

( ) 3.1 Özet ve Motivasyon. v = G v v Operasyonel Amplifikatör (Op-Amp) Deneyin Amacı. deney 3

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ

Yapay Sinir Ağı ve Bulanık-Yapay Sinir Ağı Yöntemleri Kullanılarak Tava Buharlaşma Tahmini

Üniversite Öğrencilerinin Kredi Kartı Sahipliğini Belirleyen Faktörler

AKADEMİK YAKLAŞIMLAR DERGİSİ JOURNAL OF ACADEMIC APPROACHES

K-Ortalamalar Yöntemi ile Yıllık Yağışların Sınıflandırılması ve Homojen Bölgelerin Belirlenmesi *

KENTSEL ALANDA ET TALEP ANALİZİ: BATI AKDENİZ BÖLGESİ ÖRNEĞİ. Dr. Ali Rıza AKTAŞ 1 Dr. Selim Adem HATIRLI 2

Asimetri ve Basıklık Ölçüleri Ortalamalara dayanan (Pearson) Kartillere dayanan (Bowley) Momentlere dayanan asimetri ve basıklık ölçüleri

Tuğla Duvardaki ve Tesisattaki Isı Kaybının Yapay Sinir Ağları İle Belirlenmesi

İSTATİSTİK DERS NOTLARI

İTÜ LİSANSÜSTÜ DERS KATALOG FORMU (GRADUATE COURSE CATALOGUE FORM)

FARKLI VERİ YAPILARINDA KULLANILABİLECEK REGRESYON YÖNTEMLERİ

ELM201 ELEKTRONİK-I DERSİ LABORATUAR FÖYÜ

ANKARA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ BULANIK HEDONİK REGRESYON. Gökalp Kadri YENTÜR İSTATİSTİK ANABİLİM DALI ANKARA 2011

Türkiye deki Đşsizlik Oranının Bulanık Doğrusal Regresyon Analiziyle Tahmini

2005 Gazi Üniversitesi Endüstriyel Sanatlar Eğitim Fakültesi Dergisi Sayı:16, s31-46

Bilgisayarla Görüye Giriş

Communication Theory

Bitkisel Ürün Sigortası Yaptırma İsteğinin Belirlenmesi: Tokat İli Örneği

Transkript:

221 Eğtmde ve Pskolojde Ölçme ve Değerlendrme Dergs, Yaz 2012, 3(1), 221-229 Çok Boyutlu Madde Tepk Kuramı 1 İbrahm Alper KÖSE * Abant İzzet Baysal Ünverstes Özet Eğtm ve pskolojde test alanların verdğ tepklerden en doğru ve kullanışlı sonuçlar elde etmey amaçlamak bu alanlarda çalışanların temel noktası olmuştur. Bu amaca ulaşmak çn brçok kuram gelştrlmştr. Klask test kuramı, madde tepk kuramı.vb örnek olarak verleblr. Madde tepk kuramı breyn performansının altında yatan örtük özellğ açıklamak çn kullanılan güçlü br model olmasına rağmen, tek boyutluluk varsayımının karşılanmadığı durumlarda tek boyutlu model, çok boyutlu test versne uygulamak yetenek ve madde parametreler kestrmlernde geçerlk sorunlarını berabernde getrecek ve model-ver uyumunda öneml problemler ortaya çıkaracaktır. Bunun yanında ölçme araçlarına dayalı olarak verlen çeştl kararların (seçme, yerleştrme, akademk başarının değerlendrlmes vb.) sabetllğ açısından doğru modelleme son derece önemldr. Bu nedenlerle bu çalışmanın amacı, çok boyutlu madde tepk kuramının ayrıntılı olarak tanıtılması, tek boyutlu modeller karşısında alana getrdğ yenlkler ve avantajların tartışılmasıdır. Anahtar Sözcükler: Ölçme Kuramı, Madde Tepk Kuramı, Çok Boyutlu Madde Tepk Kuramı Abstract Provdng the most useful and vald nferences from examnee responses s the basc pont for researchers, who study at the educaton and psychology area. For ths am, many theores have been developed such as classc test theory, tem response theory ect. Item response theory s the robust theory to explan latent ablty on examnee performance but n the case of crcumstances n whch undmensonalty assumpton cannot be met, applcaton of undmensonal models to multdmensonal data matrx, brngs valdty problems on estmaton of ablty and tem parameters and also cause model-data ft problems. Furthermore, correct modelng as a bass for measurement tools s very fundemental for varous decsons (electon, placement, assessment of achevement). For these reasons, the purpose of ths study s to ntroduce multdmensonal tem response theory (MIRT) and to dscuss advantages and nnovatons of MIRT across undmensonal IRT models n the frame of lterature. Keywords: Measurement Theory, Item Response Theory, Multdmensonal Item Response Theory Eğtm ve pskolojde çeştl amaçlarla breyler hakkında kararlar verlmektedr. Bu kararların doğru ve güvenlr olmaları amacıyla eğtm ve pskoloj alanındak araştırmacılar, davranışların daha geçerl ve güvenlr ölçülmelern sağlayacak yen yaklaşımlar gelştrmektedrler. Bu yaklaşımlar gelştrlrken ölçülecek özellğ ncelleştrecek ve ortaya konan ncelğn anlamını yorumlayablecek güçlü ölçme kuramlarına htyaç duyulmuştur. Bu amaçla, araştırmacılar, geçerl ve güvenr sonuçlar veren güçlü ölçme kuramlarını gelştrmektedrler. Tek boyutlu Madde Tepk Kuramı (MTK) pratk test durumlarına Klask Test Kuramı (KTK) ndan daha y br çerçeve sunmasına rağmen, kuramsal ve görgül kanıtlar tepk verlernn çoğunun tek boyutluluk varsayımına tamamen uymadığını göstermektedr. Bunun yanında tek boyutlu MTK da tek br maddenn sadece br örtük özellğ ölçtüğünü varsaymak ver grubu le tek boyutlu modellern uyum sorunlarını da berabernde getrmektedr. Buna ek olarak çok boyutlu ver 1 Bu çalışma Madde Tepk Kuramına Dayalı Tek Boyutlu ve Çok Boyutlu Modellern Test Uzunluğu ve Örneklem Büyüklüğü Açısından Karşılaştırılması sml tez çalışmasından özetlenerek hazırlanmıştır. * Yrd. Doç. Dr., Abant İzzet Baysal Ünverstes Eğtm Fakültes Eğtm Blmler Bölümü,.alper.kose@gmal.com

Çok Boyutlu Madde Tepk Kuramı 222 grubu çn tek br özellk boyutunun olduğunun varsaymak, MTK nın değşmezlk özellğn de tehdt etmektedr (Ackerman, 1994). Tek br örtük özellğ ölçmek çn çok boyutlu maddeler kullanmak testn yapı geçerlğn düşürmektedr. Çünkü testn yapı geçerlğ kuramsal yapıya ve teste özgü ölçme aracına veya şlemne bağlıdır. Tek boyutlu modellern kullanılması le tek boyutluluk varsayımının hlal sonucu çok boyutlu örtük uzay le hedeflenen tek boyutlu örtük uzay arasında brebr eşleme yapılamayacaktır. Testn yapı geçerlğnde blşsel süreçlerde tek boyutlu modellemeden çok boyutlu modellemeye geçş le brlkte bu sorunlar ortadan kalkacaktır. Eğtm ve pskolojde test alanların verdğ tepklerden en doğru ve kullanışlı sonuçlar elde etmey amaçlamak bu alanlarda çalışanların temel odak noktası olmuştur. Bunun yanında ölçme araçlarına dayalı olarak verlen çeştl kararların (seçme, yerleştrme, akademk başarının değerlendrlmes vb.) sabetllğ açısından doğru modelleme son derece önemldr. Bu noktadan hareketle bu çalışmanın temel amacı çok boyutlu MTK nın ayrıntılı olarak tanıtılması, tek boyutlu modeller karşısında eğtm ve pskoloj alanına getrdğ yenlkler ve avantajları lgl alanyazın çerçevesnde tartışmaktır. Ölçme tarhnde, br test yanıtlayan breyn performansının altında yatan örtük özellğ açıklamak çn gelştrlen başlıca kuram KTK dır. KTK, testten alınan puanı, gerçek puan ve ölçme hatasının toplamı le açıklayan bast br modeldr. Buna karşın kuram, pratk test durumlarında stenmeyen özellkler de taşımaktadır. Test ve madde özellklernn gruba bağlı olması, breyn performansı hakkında blgnn sadece testn tümü üzernden verlmes ve madde bazında cevaplayıcı performansı hakkındak blgnn se kaybolması kuramın öneml sınırlılıklarındandır (Hambleton, Swamnathan ve Rogers, 1991). Pskolojk ölçme alanında son yüzyılın en öneml gelşmelernden brs MTK dır. MTK, kşnn ölçülen özellktek yern, test maddelerne verdğ yanıtları kullanarak KTK nın zayıf varsayımlarına karşı gelştrdğ güçlü varsayımlarla matematksel br model le açıklayan modern test kuramıdır (Bobcock, 2009). Kuramın öncek ölçme kuramlarına göre en öneml avantajları; madde güçlük değerlernn ve yetenek düzeylernn aynı ölçek düzeynde yer alması (Spencer, 2004), cevaplayıcının yeteneğn daha keskn (precson of measurement) ve daha küçük ölçme hataları le ortaya koyması, elde edlen madde parametrelernn aynı evrenden gelmş farklı örneklemlerde değşmezlk özellğn koruması ve tahmn edlen yetenek düzeylernn farklı alt test maddelernde de değşmez olarak kalmasıdır. Ayrıca MTK da cevaplayıcıların yetenek düzeylernn karşılaştırılması daha keskn ve daha kullanışlıdır. Bunun neden KTK dan farklı olarak, testn tümünden elde edlen ölçme hatasının bütün cevaplayıcılar çn aynı olmadığını varsaymasıdır (Lee, 2007). MTK, gelştrlmesnden günümüze kadar eğtm ve pskoloj alanındak ölçmelerde sıklıkla kullanılmıştır. Bunun yanında MTK, test gelştrme, test puanlarını eştleme, madde yanlılıklarını belrleme, blgsayar ortamında breyselleştrlmş 1 testlerde cevaplayıcının yeteneğnn kestrlmes gb brçok ölçme alanına yenlkler ve uygulanablr çözümler getrmştr. Buna karşın MTK, güçlü matematksel ve statstksel varsayımlara dayanması ve bu varsayımların karşılanması ve model ver uyumunun sağlanması durumunda şlerlk kazanablmektedr (Zhao, 2008). Kısa zaman öncesne kadar en çok kullanılan MTK model olan tek boyutlu MTK, cevaplayıcının br grup test maddes karşındak performansını, tek br yetenek veya özellk le açıklamaktaydı. Farklı türdek testler le yapılan araştırmalar kuramın bu varsayımının tamamen karşılanmasının oldukça güç olduğunu ortaya koymuştur. Özellkle başarı testlernn brden fazla boyutu ölçtüğü artık blnen br gerçektr. Böyle çok boyutlu testlern olması, kuramın tek boyutluluk varsayımının hlallern ortaya çıkarmaktadır (Pomplun, 1988). Tek boyutluluk varsayımının hlal le yapılan kestrmlerde sadece başat boyut kestrlmekte, dğer boyut hakkındak blg se kaybolmaktadır (Kreter, 1993). Bunun yanında Ackerman (1992, 1994a, 1994b), tek boyutluluk varsayımı hlal edldğnde test alanların tek br özellk üzernde sıralanamayacağını belrtmştr. Bunun neden olarak da çok boyutlu örtük uzay le cevaplayıcının tek br yeteneğ le bre br eşleme yapılamayacağını göstermştr. Tek br örtük özellğ ölçen br test gelştrmenn neredeyse mkânsız oluşu (Lee, 2007), blg kaybının en aza ndrlmes ve bunların sonucu olarak daha geçerl ve güvenlr ölçmeler yapablmek amacıyla k veya daha fazla yetenek gerektren testler çn çok boyutlu MTK modeller gelştrlmştr. Çok Boyutlu Madde Tepk Kuramı

Eğtmde ve Pskolojde Ölçme ve Değerlendrme Dergs 223 Bast statstksel modeller, karmaşık modellern temeln oluşturmaktadır. Bu durum MTK modeller çn de geçerldr. Tek boyutlu MTK modeller le çok boyutlu MTK modeller arasındak lşk tek boyutluluk varsayımının hlalne dayanır. Örnek olarak br matematk sorusunu alalım. Ayşe le ablasının cevzlernn toplamı 86 dır. Ayşe nn cevzlernn 2 katının 13 fazlası, ablasının cevzlernn 3 katına eşttr. Her brnn kaçar cevz vardır? Bu tür sorularda cevaplayıcıdan önce matematk problemn okuyup anlaması, daha sonra da matematksel şlemlerle bu problem çözmes beklenr. Bu tür problemler, hem okuduğunu anlama hem de şlem yeteneklern beraber gerektrmektedr. Bu gb durumlarda tek boyutluluk varsayımının karşılanması oldukça zordur. Bunun sonucu olarak test versn doğru br şeklde temsl edecek farklı modellere htyaç duyulmaktadır. Tek boyutlu MTK nın bu sınırlılığına karşı gelştrlmş modeller genel olarak çok boyutlu MTK modeller olarak adlandırılır (Smth, 2009). Çok boyutlu MTK, yapılar veya boyutlar olarak kavramsallaştırılan k veya daha fazla örtük değşken le test alanın belrl br test maddesn doğru olarak cevaplama olasılığı arasındak lşky matematksel br model le açıklayan modellerdr. Br başka fade le tek boyutlu MTK modellernn çok boyutluluğa uyarlanmasıdır (Ackerman, Gerl ve Walker, 2003). Çok boyutlu MTK, faktör analznn veya yapısal eştlk modellemesnn özel br durumu veya tek boyutlu madde tepk kuramının br uzantısı olarak da düşünüleblr. Faktör analznn br uzantısı olarak Chrstoffersson (1975, Aktaran; Ackerman, Gerl ve Walker, 2003; McDonald, 2000) br grup örtük değşken, v le, tanımlamış ve bu değşken; v ' f şeklnde fade etmştr. Eştlkte; ',..., 1, 2 n ortak faktör yükler matrsn (common factor loadngsmatrces), f.ortak faktör vektörünü (common factor vector), nc tekl faktörü (unque factor), fade etmektedr. Bu model her maddes çn, maddenn doğru cevaplanmasından sorumlu br örtük değşkenn varlığını varsaymaktadır. Bu örtük değşken sürekl ve normal dağılan br değşkendr. Cevaplayıcının yeterlğ bell br eşk değernn, t, üzernde veya eştse, madde doğru cevaplanır, aks durumlarda cevaplayıcı maddey yanlış yanıtlayacaktır. 1-0 şeklnde puanlanan her maddes çn cevaplayıcının tepks, U 1, eğer v t se veya U 0, eğer v < t şeklnde gösterlr. maddesn doğru yanıtlayan cevaplayıcıların oranı (p değer veya güçlük düzey) normal dağılım eğrsnde eşk değernn, t, üzernde kalan alanın oranı olarak, p N t fade edleblr. Eştlkte N normal ogve fonksyonunu temsl etmektedr. Bu sonuç k-boyutlu normal ogve fonksyonunun gelşmesne neden olmuştur. Fonksyon; ' P U... N N... şeklndedr. Eştlk 6 da; ve k ncı boyut çn; 1 1 k 0 0 1 1 2 2 t 0 madde güçlük parametresn, madde ayırıcılık parametresn göstermektedr. k k

Çok Boyutlu Madde Tepk Kuramı 224 Burada açıklanan madde varyansını veya ortak faktörün (communalty) 1 den çıkarılmasını fade eder. Eştlk 6 ncelendğnde Lord (1980; Aktaran; Ackerman, Gerl ve Walker, 2003) un tek boyutlu madde parametreler; P U 1 N a b N a a b le lşkl olduğu görülmektedr. Bu eştlkte 0, a b fadesne ve de madde ayırıcılık parametresne (a ) karşılık gelmektedr. Bu k yaklaşımın br uzantısı olarak k boyutlu normal ogve model 1 PU 1 1 2 1,7 a1 1 a22 d 1 e (d. Şekl 1. İk Boyutlu Br Maddenn Madde Karakterstk Yüzey (α 1 =2.0, α 2 =0, d=0. 5) Tek boyutlu MTK da madde karakterstk eğrlernn yern çok boyutlu MTK da madde karakterstk yüzeylernn alması, bazı termnolojlern de değşmes anlamına gelmektedr. Bu kavramları Reckase (1985, 1997) çok boyutlu madde güçlüğü-çmg (multdmensonal tem dffculty) ve çok boyutlu madde ayırıcılığı-çma (multdmensonal tem dscrmnaton) olarak fade etmştr. ÇMG ve ÇMA n her ks de çok boyutlu maddeler özetleyen değerlerdr. Şekl 2. Madde Vektör Grafğ ÇMA (Şekl 2.), maksmum ayırıcılık parametres olarak da blnen çok boyutlu madde ayırt edclğ, tek boyutlu MTK da madde ayırt edclğne karşılık gelmektedr. Tek boyutlu modellerdek

Eğtmde ve Pskolojde Ölçme ve Değerlendrme Dergs 225 madde ayırt edclğnden farklı olarak çok boyutlu MTK da madde ayırıcılığı vektör ( a ) olarak fade edlr. Bu vektör her k boyut çn ortak madde ayırt edclk gücü olarak tanımlanır (Smth, 2009). Matematksel fades; ÇMA= m a k k 1 veya ÇMA= a a dr. 2 2 1 2 Bu vektörel uzunluk maksmum ayırıcılığı temsl eder. İfadedek a 1 ve a 2 her k örtük özellk çn madde ayrıcılık değerlern fade etmektedr (Zhang, 2008). ÇMA, maddenn toplam ayırt edclğn fade eden br vektör olduğuna göre, bu vektörün br açısal yönünün (drecton) de olması gerekldr. Bu açı değer θ 1 eksenne yakın se brncl olarak θ 1 yeteneğn (Şekl 3.-madde 3), θ 2 eksenne yakın maddelern se θ 2 yeteneğn (Şekl 3.-madde 1), brncl olarak ölçtüğü söyleneblr. θ 1 ve θ 2 eksenler arasında 45 0 lk açı yapan maddeler se θ 1 ve θ 2 yeteneklernn her ksn de eşt olarak ölçen maddelerdr (Şekl 3-madde2). Şekl 3. Çok Boyutlu Farklı Örtük Özellk Kompozsyonundak Maddelern Grafksel Gösterm Reckase (1997) ve Zhang (2008), çok boyutlu madde ayırt edclğ vektörünün yönünü a 1 arccos olarak tanımlamıştır. ÇMA Örnek olarak k boyutlu br maddenn ayırıcılık parametreler; a 1 = 0.652 ve a 2 = 0.245 olarak hesaplanmış olsun. Hesaplanan a 1 değer brnc boyuta at ayırıcılık parametresn, a 2 se knc boyuta at ayırıcılık parametresn fade etmektedr. Bu maddey temsl eden toplam madde ayırt edclk parametres; ÇMA= se; a a dr ve ÇMA = 2 2 1 2 2 2 0.652 0.245 = 0.696 olarak hesaplanır. Bu vektörün yönü a 1 0,652 arccos = arccos = 20,4 bulunur. ÇMA 0,696 Hesaplanan bu değer maddey temsl eden madde ayırıcılık parametresnn brnc örtük özellk le 20, 4 derecelk br açı yaptığını göstermektedr. Yan madde büyük oranda brnc örtük özellğ ölçmektedr (Şekl 4).

Çok Boyutlu Madde Tepk Kuramı 226 Şekl 4. ÇMA nın Grafk Üzernde Gösterm ÇMG (Şekl 4), tek boyutlu MTK da madde güçlüğüne (b) karşılık gelen, en y ayırıcılık gücünü veren ve orjnden θ uzayına en dk eğm noktasına uzaklıktır. Parametrenn matematksel fades; d ÇMG= ÇMA şeklndedr. Formüldek d, maddesnn yer parametresn temsl etmektedr. Formülden elde edlen ve orjnden p=.50 noktasına olan uzaklığın fades olan ÇMG nün şaret maddenn bağıl güçlüğünü (relatve dffculty) fade eder. Negatf ÇMG değer maddenn bağıl olarak daha kolay olduğunu, poztf ÇMG değer maddenn bağıl olarak daha zor olduğunu fade etmektedr (Kao, 2007). Çok Boyutlu MTK da Blg Fonksyonu Çok boyutlu MTK da blg fonksyonu, tek boyutlu MTK dak blg fonksyonunun br uzantısı olup, fonksyonun matematksel göstermne blgnn doğrultusunun (drecton of nformaton) eklenmes le gösterlmektedr. Çok boyutlu blgnn matematksel fades; Çok Boyutlu Blg= P m 1 k cos k şeklndedr. Formülde; k1 P P(Θ) Θ yetenek düzeyndek cevaplayıcının maddesne doğru cevap verme olasılığını, α k.örtük özellk kompozsyonundak maddesn temsl eden vektördür. Bu vektör Θ 1 eksen le yapılan açı le temsl edlr (Ackerman, 2005). Çok Boyutlu Madde Tepk Kuramı Analzlernde Kullanılan Yazılımlar Artan htyaçlar doğrultusunda, MTK parametre tahmnler çn br çok blgsayar programı gelştrlmştr. Çok boyutlu MTK modellernde kullanılan programlar MIRTE, MAXLOG, TESTFACT ve NOHARM dır. Bu programlar hem tek boyutlu, hem de çok boyutlu modeller çn analz yapablme esneklğne sahptr. Bu programlar da kullandıkları tahmn yöntemler ve yetenek kestrm yapıp yapamamalarına bağlı olarak brbrnden farklılaşmaktadır (Lee, 2007). TESTFACT programı, marjnal en çok olablrlk algortmasını kullanarak tam blg madde faktör analz le madde parametrelern tahmn etmektedr. Program madde güçlük, ayırt edclk ve yetenek parametresn kestreblmekte fakat şans parametresn kestrememektedr. NOHARM programı en küçük kareler ve tetrakork korelasyon algortması le faktör analzne yaklaştırma teknğ le madde parametrelern kestreblmektedr. NOHARM programı sadece madde güçlük ve ayırt edclk parametresn kestreblmekte, şans ve yetenek parametresn se kestrememektedr (Bobcock, 2009). 2 Tek ve Çok Boyutlu MTK nın Karşılaştırmasını Temel Alan Araştırmalar Chang (1992) ın yaptığı araştırmada, Woodcock-Johnson Psycho-Educatonal Battery- Revsed testnn okuma becers ve matematk alt test verler le sun ver kullanılmış ve yetenek

Eğtmde ve Pskolojde Ölçme ve Değerlendrme Dergs 227 kestrmler tek ve çok boyutlu madde tepk kuramı modeller altında ncelenmştr. Araştırma sonucunda, çok boyutlu MTK le elde edlen sonuçların kuramsal ve amprk olarak daha büyük ölçme kesknlğne sahp olduğu belrlenmştr. Bunun yanında çok boyutlu kuram altında elde edlen yetenek kestrmlernn, tek boyutlu kuram altında elde edlen yetenek kestrmlerne kıyasla, daha düşük standart hatalarının olduğu ve daha keskn yetenek kestrmlernn elde edldğ vurgulanmıştır. Spencer (2004) sun ver üzernde yapmış olduğu çalışmada, tek ve çok boyutlu madde tepk kuramı modeller altında model ve yetenek parametre kestrmlernn karşılaştırmasını yapmıştır. Bu araştırmada ayrıca kullanılan yazılımlar da karşılaştırılmıştır. Araştırma sonucunda, cevaplayıcıların çok boyutlu örtük özellkler, çok boyutlu ölçme model le tek boyutlu ölçme modelne göre daha hassas ölçümlere ulaşıldığı belrlenmştr. Ayrıca çok boyutlu ver matrsne, çok boyutlu ölçme modelnn daha y uyum gösterdğ belrlenmştr. de la Tore ve Patz (2005), araştırmalarında telafsel tpte 3-parametrel çok boyutlu MTK modelnn, tek boyutlu MTK ya göre daha y kestrmlerde bulunup bulunamayacağını test etmşlerdr. Araştırma sonucunda, örtük özellkler arası lşk büyüklüğü 0.00 olduğunda çok boyutlu MTK nın daha y kestrmlerde bulunduğu, lşk büyüklüğü 1.00 a doğru yaklaştığında se tek boyutlu MTK nın terch edlmes gerektğ vurgulanmıştır. Seungho Yang (2007) yapmış olduğu araştırmada tek boyutluluk varsayımının hlalnn parametre tahmn ve model ver uyumuna olan etksn tek ve çok boyutlu modeller altında ncelemştr. Araştırma sonucunda, yetenek parametres kestrmnde en büyük etky test uzunluğunun yaptığı, örneklem büyüklüğünün se madde güçlük parametres kestrmnde etks olduğu gözlenmştr. Dğer araştırmalardan farklı olarak testlerde örtük özellkler arasındak lşk orta düzeyden yüksek düzeye kadar olan durumlarda çok boyutlu MTK modellernn daha kesn kestrmlerde bulunduğu, ancak örtük özellkler arası lşk 0.0 a yaklaştıkça tek boyutlu Rasch modelnn daha kesn kestrmlerde bulunduğu ortaya konmuştur. Yukarıda kısaca özetlenen araştırmalar ve lgl alanyazın göstermştr k, çok boyutlu MTK le lgl uygulamalar eğtm ve pskoloj alanındak yern gttkçe artırmaktadır. Bunun yanında testlern veya testlerde bulunan maddelern sadece tek br örtük özellğ ölçtüğünü varsaymak ve bu varsayım altında ölçmeler yaparak brey hakkında karar vermek artık daha tartışılır hale gelmştr. Buna karşın tek boyutlu MTK nın bu karşılanması oldukça güç olan varsayımına karşın çok boyutlu MTK modellernn kullanılması durumlarında daha keskn, geçerl ve güvenlr sonuçlar alındığı belrlenmştr. Ancak çok boyutlu MTK da cevaplayıcının maddeye doğru cevap verme olasılığını grafksel olarak gösteren yazılımların hala çalışma aşamasında olması ve araştırmacıların kullanımına hzmet edememes bu konudak çalışmaların temel eksklğ olmaya devam etmektedr. Tartışma Eğtm ve pskoloj alanında tek boyutlu MTK modeller yaygın olarak kullanılmasına rağmen, kuramın tek boyutluluk varsayımının özellkle başarı ve yetenek testlernde tamamıyla karşılanması oldukça güçtür (Hambleton, Swamnathan ve Rogers, 1991; Reckase, 1997). Tek boyutluluk varsayımının karşılanmadığı durumlarda tek boyutlu model, çok boyutlu test versne uygulamak yetenek ve madde parametreler kestrmlernde geçerlk sorunlarını berabernde getrecek ve model-ver uyumunda öneml problemler ortaya çıkaracaktır. Ackerman (1994a-b) ın belrttğ üzere cevaplayıcının performansını etkleyen brden fazla örtük özellk varsa, çok boyutlu MTK modeller kullanılmalıdır. MTK modeller çn yapılan çalışmalarda (Drasgow ve Parsons, 1983, Hambleton, 1969; Aktaran; Kreter, 1993) orta derecede çok boyutlu verlere (moderate degrees of multdmensonalty), tek boyutlu modellern uygulanması güçlü br yapı göstermesne rağmen, ver grubunda çok boyutluluk arttıkça blg kaybına ve yetenek kestrmlernn yanlış yorumlanmasına yol açmaktadır. Tek boyutluluk varsayımının hlal model ver uyumsuzluğunu da berabernde getrmektedr. Tek boyutlu modeller altında yapılan model ver uyumu testlernde ortaya çıkan uyumsuzlukların en büyük neden test versnn çok boyutluluğudur. Yukarıda alanyazında çok boyutlu modellern uygulanması hakkında özetlenen araştırmalar göstermştr k, testlern çok boyutlu olduğu durumlarda yetenek ve madde parametrelernn kestrm daha geçerl ve güvenlr sonuçlar vermştr

Çok Boyutlu Madde Tepk Kuramı 228 1987-2006 yılları arasında Amerka Brleşk Devletler Merkez Bankası Başkanı olarak çalışan Alan GREENSPAN 2007 yılında yazmış olduğu Türbülans Çağı (The Age of Turbulance) adlı ktabının br bölümünde, gelştrlen ekonomk modeller tartışmış, daha spesfk ve parametre sayısının fazla olduğu modellern daha geçerl çıkarsamalarda bulunduğunu belrtmştr. Paralel br düşünce le Walker ve Beretvas (2003) tek ve çok boyutlu madde tepk kuramı modellern karşılaştırmış ve daha kompleks modellern daha az hatalı, daha güvenlr ve model ver uyumu daha yüksek olduğunu ortaya koymuştur. Eğtm alanında araştırma yapanların amacı, breyn verdğ tepklerden yararlanarak, brey karakterze eden en geçerl ve en güvenlr sonuçlara ulaşmaktır. Breyn verdğ tepklern en doğru bçmde analz edlmemes, brey hakkında verlecek yanlış kararlara da temel hazırlayacaktır. Pskometr alanındak en büyük gelşmelerden br de MTK ya dayalı çalışmalardır. Kuramın tek boyutlu modeller eğtm araştırmacılarına uzun yıllar hzmet etmş ve etmeye devam etmektedr. Kuramın çok boyutlu uzantısı olan çok boyutlu MTK, elektronk yazılımların lerlemes le alanda hzmet etmeye başlamış, artan blg ve teknoloj le araştırmacıların beklentlern karşısında gelşmeye devam edecektr. Kaynaklar Ackerman, T.A. (1992). Assessng construct valdty usng multdmensonal tem response theory. Paper Presentedat the Annual Meetng of Amercan Educatonal Research Assocaton. San Franssco, CA, USA. Ackerman, T.A.(1994a). Graphcal Representaton of Multdmenson-al Item Response Theory Analyses. PaperPresented at the Annual Meetng of Amercan Educatonal Research Assocaton. New Orleans, LA. Ackerman, T.A. (1994b). Usng multdmensonal tem response theory to understand what tems and tests are measurng. Appled Measurement n Educaton, 7(4), 255-278. Web: http://www.dx.do.org/10.1207 adresnden 5 Eylül 2008 tarhnde alınmıştır. Ackerman, T.A., Gerl, M.J., Walker, C.M. (2003). Usng multdmensonal tem response theory to evaluate educatonal and psychologcal tests. Educatonal Measurement: Issues and Practce: MIRT Instructonal Module. Ackerman, T.A. (2005). Multdmensonal tem response theory modelng. In J.J. McArdle (Ed). Contemporary Psychometrcs (p.3-24). Web:http://www.questa.com/reader/prntPagnator/1580 adresnden 13 Mayıs 2009 da alınmştır. Antal, T. (2007). On multdmensonal tem response theory a coordnate free approach. Electronc Journal of Statstcs, 1, 290-306. Bobcock, B.G.E.(2009). Estmatng a Noncompensatory IRT Model Usng a modfed Metropols algorthm. Unpublshed Doctoral Dssertaton.The Unversty of Mnesota. Bock, R.D. (1997). A bref hstory of tem response theory. Educatonal Measurement: Issues and Practce. Wnter 1997. Bock, D.R., Thssen, D. ve Zmowsk, M.F. (1997). IRT estmaton of doman scores. Journal of Educatonal Measurement, 34 (3), 197-211. Bolt, D.M. ve Lall, V.F. (2003). Estmaton of compensatory and non-compensatory multdmensonal tem response models usng Markov Chan Monte Carlo. Appled Psychologcal Measuement, 27, 395. Web: http://apm.sagepub.com adresnden 3 Nsan 2008 de alınmıştır. Chang, Y.W. (1992). A comparson of undmensonal and multdmensonal IRT approaches to test nformaton n a test battery. Unpublshed Doctoral Dssertaton. Unversty of Mnnesota. de la Tore, J. ve Patz, R.J. (2005). Makng the most of what we have: A practcal applcaton of multdmensonal tem response theory n test ccorng. Journal of Educatonal and Behavoral Statstcs, 30(3), 295-311. Web: http://www.jstor.org/stable/3701380 adresnden 12 Ocak 2009 tarhnde alınmıştır. Drasgow ve Parsons (1983). Applcaton of undmensonal tem response theory models to multdmensonal data. Appled Psychologcal Measurement, 7, 189-199. Embretson, S.E. ve Rese, S.P. (2000). Item Response Theory For Psychologsts. Lawrence Erlbaum Assocate, Inc. Greenspan, A. (2007). The age of turbulance. The Pengun Pres. New York, 2007. Hambleton, R.K. ve Swamnathan, H. (1989). Item Response Theory. Prncples And Applcatons. Kluwer- Njhoff Publshng. Boston-USA. Hambleton, R.K. (1994). Item response theory: A broad psychometrc framework for measurement advances. Pscothema, 6, 535-536.

Eğtmde ve Pskolojde Ölçme ve Değerlendrme Dergs 229 Hambleton, R. K., Swamnathan, H. and Rogers, H. (1991). Fundamentals of Item Response Teory. Newbury Park CA: Sage. Kao, S.C. (2007). The new goodness of ft ndex multdmensonal tem response model. Unpublshed Doctoral Dssertaton. Mchgan State Unversty. Kreter, C.D. (1993). An emprcal Investgaton of compensatory and noncompensatory test tems n smulated and real data. Unpublshed Doctoral Dssertaton. The Unversty of Iowa. Lee, S. H. (2007). Multmensonal tem response theory: A SAS MDIRT MACRO and emprcal study of PIAT MATH Test Unpublshed Doctoral Dssertaton. The Unversty of Oklahoma. L, Y. H. ve Schafer, W.D (2005). Trat parameter recovery usng multdmensonal computerzed adaptve testng n readng and mathematcs. Appled Psychologcal Measurement, 29, 3-25. Web: http://www.sagepub.com adresnden 3 Nsan 2008 tarhnde alınmıştır. McDonald, R.P. (1982). Lnear versus models n tem response theory Appled Psychologcal Measurement, 6, 379-396. McDonald, R.P. (2000). A bass for multdmensonal tem response theory. Appled Psychologcal Measurement, 24, 99. http://www.sagepub.com adresnden 3 Nsan 2008 tarhnde alınmıştır. Pomplun, M.R. (1988). Effecets of local dependence n achevement tests on IRT ablty estmaton. Unpublshed Doctoral Dssertaton. The Florda State Unversty. Reckase, M.D. (1997). Models for multdmensonal tests and herarchcally structured tranng materals. Techncal Report. The Amercan Colage Tesng Program. Iowa Cty, Iowa. Seungho Yang, M. A. (2007). A Comparson of undmensonal and multdmensonal rasch models usng parametrer estmates and ft ndces when assumpton of undmensonalty s volated. Unpublshed Doctoral Dssertaton. The Oho State Unversty Sjtsma, K. ve Junker, B.W. (2006). Item response theory: past performance. Present developments and future expectatons. Behavormetrka, 1, 75-102. Smth, J. (2009). Some ssues n tem response theory: Dmensonalty assessment and models forgguessng. Unpublshed Doctoral Dssertaton. Unversty of South Calforna. Spencer, G.S. (2004). The strength of multdmensonal tem response theory n explorng consrtuct space that s multdmensonal and corralated. unpublshed doctoral dssertaton. Brgam Young Unversty. Walker, C.M. ve Beretvas, S.N. (2003). Comparng multdmensonal and undmensonal profcency classfcatons: multdmensonal IRT As a dagnostc ad. Journal od Educatonal Measurement, 40 (3), 255-275. Zhang, B. (2008). Applcaton of undmensonal tem response models to tests wth tems senstve to secondary dmenson. The Journal of Expermental Educaton, 77 (2), 147-166. Zhao, Y. (2008). Approaches for addressng the ft of Item response theory models to educatonal test data. UnpublshedDoctoral Dssertaton. Unversty of Massachusetts Amberst.