Hacettepe Üniversitesi E itim Fakültesi Dergisi 26 : [2004] Devrim ÖZDEM R** 1. G R fi

Benzer belgeler
KLAS K TEST KURAMI VE ÖRTÜK ÖZELL KLER KURAMININ ÖRNEKLEMLER BA LAMINDA KARfiILAfiTIRILMASI

Yabancı Dil Eğitiminde Aynı Davranışları Yoklayan Çoktan Seçmeli ve Kısa Cevaplı İki Testin Madde ve Test Özelliklerinin Karşılaştırılması

BÖLÜM 7 BİLGİSAYAR UYGULAMALARI - 1

4 STAT ST K-II. Amaçlar m z. Anahtar Kavramlar. çindekiler

Araflt rma modelinin oluflturulmas. Veri toplama

KORELASYON VE REGRESYON ANALİZİ

Ölçek Geli tirme Çal malarnda Kapsam Geçerlik ndeksinin Kullanm

Uluslararas De erleme K lavuz Notu, No.11 De erlemelerin Gözden Geçirilmesi

Türkçe Ö retmeni Adaylar n n Görüfllerine Göre Türkçe E itimi Lisans Program

Doç. Dr. Mehmet Durdu KARSLI Sakarya Üniversitesi E itim fakültesi Doç. Dr. I k ifa ÜSTÜNER Akdeniz Üniversitesi E itim Fakültesi

Tablo 2.1. Denetim Türleri. 2.1.Denetçilerin Statülerine Göre Denetim Türleri

AR-GE YETENE DE ERLEND R LMES ESASLARI (*)

Klasik Test Teorisine ve Örtük Özellikler Teorisine Göre Kestirilen Madde Parametrelerinin Karşılaştırılması Üzerine Ampirik Bir Çalışma

1.3. NİTEL ARAŞTIRMA YÖNTEMLERİ GİRİŞ NİTEL ARAŞTIRMALARDA GEÇERLİK VE GÜVENİRLİK SORUNLARI... 2

KDU (Kazanım Değerlendirme Uygulaması) nedir?

MURAT YÜKSEL. FEM N ST HUKUK KURAMI VE FEM N ST DÜfiÜNCE TEOR LER

İNOVASYON GÖSTERGELERİ VE KAYSERİ:KARŞILAŞTIRMALI BİR ANALİZ. Prof. Dr. Hayriye ATİK 16 Haziran 2015

3 STAT ST K-II. Amaçlar m z. Anahtar Kavramlar. çindekiler

tarih ve say l Resmi Gazetede yay mlanan 2007/13033

Tekrar ve Düzeltmenin Erişiye Etkisi Fusun G. Alacapınar

1 6/01/2004 tarihli say l Resmi Gazete de yay mlanan ve 01/05/2004

6. SINIF MATEMAT K DERS ÜN TELEND R LM fi YILLIK PLAN

Veri Toplama Yöntemleri. Prof.Dr.Besti Üstün

Likert Tipi Ölçeklere Madde Seçmede Geleneksel Madde Analizi Tekniklerinin Karfl laflt r lmas

NG L ZCE YETERL K SINAVI PUANLARININ ÜÇ FARKLI Efi TLEME YÖNTEM NE GÖRE KARfiILAfiTIRILMASI*

ÜN TE II L M T. Limit Sa dan ve Soldan Limit Özel Fonksiyonlarda Limit Limit Teoremleri Belirsizlik Durumlar Örnekler

Öğrenci Başarısının Öğretmen Yapımı Bir Testle Klasik Test Kuramı ve Madde Tepki Kuramı Yöntemleriyle Elde Edilen Puanlara Göre Karşılaştırılması

Tebriz (İran) Üniversitesi Fars Dili ve Edebiyatı Bölümü Öğrencilerinin Okuma Alışkanlıkları Üzerine Bir Çalışma

T.C. KAFKAS ÜNİVERSİTESİ EĞİTİM FAKÜLTESİ LİSANS EĞİTİM-ÖĞRETİM VE SINAV UYGULAMA ESASLARI

E-Ö RENMEN N VE B L fisel ST L N BAfiARI VE NTERNET ÖZ YETERL K ALGISI ÜZER NDEK ETK S

DÜNYA EKONOMİK FORUMU KÜRESEL CİNSİYET AYRIMI RAPORU, Hazırlayanlar. Ricardo Hausmann, Harvard Üniversitesi

Ortaö retim Alan Ö retmenli i Tezsiz Yüksek Lisans Programlar nda Akademik Ba ar n n Çe itli De i kenlere Göre ncelenmesi: Mersin Üniversitesi Örne i

BÖLÜM 3 FREKANS DAĞILIMLARI VE FREKANS TABLOLARININ HAZIRLANMASI

Examining the Effect of Content Balancing on Multidimensional Computerized Adaptive Testing Based on Between-Item Dimensionality Model

YEDİNCİ KISIM Kurullar, Komisyonlar ve Ekipler

Yay n No : 1700 flletme-ekonomi Dizisi : Bask Ocak STANBUL

TÜRK YE B L MSEL VE TEKNOLOJ K ARAfiTIRMA KURUMU DESTEK PROGRAMLARI BAfiKANLIKLARI KURULUfi, GÖREV, YETK VE ÇALIfiMA ESASLARINA L fik N YÖNETMEL K (*)

ÜNİVERSİTE ÖĞRENCİLERİNİN BİLGİSAYAR VE İNTERNET KULLANIMINA YÖNELİK TUTUMLARI

GÖRÜfiLER. Uzm. Dr. Özlem Erman

İZMİR KÂTİP ÇELEBİ ÜNİVERSİTESİ ENGELSİZ ÜNİVERSİTE KOORDİNATÖRLÜĞÜ VE ENGELLİ ÖĞRENCİ BİRİMİ ÇALIŞMA USUL VE ESASLARI BİRİNCİ BÖLÜM

ÜN TE KES RLERDEN ALANLARA. Kesirleri Tan yal m. Basit Kesirler

Merkezi Sterilizasyon Ünitesinde Hizmet çi E itim Uygulamalar

İlgili Kanun / Madde 506 S. SSK/61

MİLLİ EĞİTİM BAKANLIĞI ÖZEL OKULLAR SINAVI VERİLERİNİN MADDE TEPKİ KURAMI MODELLERİNE UYUMU

Gelece in Bilgi flçilerini Do ru Seçmek: Araflt rma Görevlisi Al m Süreci Örne i

AvivaSA Emeklilik ve Hayat. Fiyat Tespit Raporu Görüşü. Şirket Hakkında Özet Bilgi: Halka Arz Hakkında Özet Bilgi:

Animasyon Tabanl Uygulamalar n Yeri ve Önemi

BEBEK VE ÇOCUK ÖLÜMLÜLÜĞÜ 9

İSTANBUL KEMERBURGAZ ÜNİVERSİTESİ ÖNLİSANS VE LİSANS PROGRAMLARI ARASINDA YATAY GEÇİŞ YÖNERGESİ. BİRİNCİ BÖLÜM Amaç, Kapsam, Dayanak ve Tanımlar

4/A (SSK) S GORTALILARININ YAfiLILIK AYLI INA HAK KAZANMA KOfiULLARI

BÜRO YÖNETİMİ VE SEKRETERLİK ALANI HIZLI KLAVYE KULLANIMI (F KLAVYE) MODÜLER PROGRAMI (YETERLİĞE DAYALI)

Genel Yay n S ra No: /14 Cep Kitapl : XLV. Yay na Haz rlayan Av. Celal Ülgen - Av. Coflkun Ongun. Kapak Can Eren

LKÖ RET M Ö RENC LER Ç N MATEMAT K VE B LG SAYAR ÖZ-YETERL K ALGISI ÖLÇEKLER

İŞ SAĞLIĞI VE GÜVENLİĞİ UYGULAMALARI

ZİRVE ÜNİVERSİTESİ EĞİTİM FAKÜLTESİ EĞİTİM BİLİMLERİ BÖLÜMÜ PSİKOLOJİK DANIŞMANLIK VE REHBERLİK ABD

Araştırma Notu 15/177

VERG NCELEMELER NDE MAL YET TESP T ED LEMEYEN GAYR MENKUL SATIfiLARININ, MAL YET N N TESP T NDE ZLEN LEN YÖNTEM

KİŞİSEL GELİŞİM VE EĞİTİM İŞ GÜVENLİĞİ VE İŞÇİ SAĞLIĞI MODÜLER PROGRAMI (YETERLİĞE DAYALI)

Baflkanl n, Merkez : Türkiye Bilimsel ve Teknik Araflt rma Kurumu Baflkanl na ba l Marmara Araflt rma Merkezi ni (MAM),

YÖNTEM 1.1. ÖRNEKLEM Örneklem plan l seçim ölçütleri

Türkiye de Program Geliştirmenin Sorunları ve Çözüm Önerileri

CO RAFYA. DÜNYA NIN fiekl N N VE HAREKETLER N N SONUÇLARI ÖRNEK 1 :

F inansal piyasalar n küreselleflmesi, çokuluslu flirketlerin say lar nda yaflanan

9. Uluslararas Ceza Hukuku Kongresi (Lahey, A ustos 1964)

ÜNİTE 5 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

İKİNCİ BÖLÜM EKONOMİYE GÜVEN VE BEKLENTİLER ANKETİ

BÜTÇE HAZIRLIK ÇALIŞMALARINDA KULLANILACAK FORMLARA İLİŞKİN BİLGİLER

HAM PUAN: Üniversite Sınavlarına giren adayların sadece netler üzerinden hesaplanan puanlarına hem puan denir.

CO RAFYA SICAKLIK. Kavram Dersaneleri 6. ÖRNEK 1 : Afla daki haritada, Türkiye de y ll k günefllenme sürelerinin da l fl gösterilmifltir.

RİSK ANALİZİ VE. İşletme Doktorası

HAYALi ihracatln BOYUTLARI

Tablo 3.3. TAKV YES Z KANAL SAC KALINLIKLARI (mm)

SÜRES NASIL HESAP ED MEL D R?

T.C. ZİRAAT BANKASI PERSONELİ VAKFI SOSYAL GÜVENLİK YARDIMLARI BÖLÜMÜ ÜYELERİ VE HAK SAHİPLERİNİN KAZANILMIŞ HAKLARI VE TASFİYE PAYLARI RAPORU

ken Türkçe de ulaç kuran bir ektir. Bu çal ma konumuzu seçerken iki amac m z vard. Bunlardan birincisi bu konuyu seçmemize sebep olan yabanc ö

YEN DÖNEM DE DENET M MESLE NE HAZIRMIYIZ?

GENEL B YOLOJ DERSLER NDE B LG SAYAR KULLANIMININ Ö RENC BAfiARISI ÜZER NE ETK S

Erişi Testlerine Madde Seçiminde Klasik Test Kuramı ve Rasch Modelinin K arşılaştırılm ası

Yazar Ali Karakuş Pazartesi, 17 Kasım :03 - Son Güncelleme Perşembe, 25 Şubat :36

İSTANBUL KEMERBURGAZ ÜNİVERSİTESİ BURS YÖNERGESİ. BİRİNCİ BÖLÜM Amaç, Kapsam, Dayanak ve Tanımlar

Uluslararası Durum. rkiye nin Dikkate Alması Gereken. Prof.Dr.Giray. .Giray Berberoğlu Orta Doğu u Teknik Üniversitesi

Diyabette Öz-Yönetim Algısı Skalası nın (DÖYAS) Türkçe Versiyonu: Geçerlik ve Güvenirlik Değerlendirme

VOB-DOLAR/ONS ALTIN. VOB-DOLAR/ONS ALTIN VADEL filem SÖZLEfiMES

ÜN TE V SOSYAL TUR ZM

AMASYA ÜNĠVERSĠTESĠ AVRUPA KREDĠ TRANSFER SĠSTEMĠ (ECTS/AKTS) UYGULAMA YÖNERGESĠ. BĠRĠNCĠ BÖLÜM Amaç-Kapsam-Dayanak-Tanımlar

BİRİNCİ BÖLÜM Amaç, Kapsam, Dayanak ve Tanımlar

LİSE FİZİK I DERS KİTABININ OKUNABİLİRLİĞİ VE HEDEF YAŞ DÜZEYİNE UYGUNLUĞU

Hiçbir zaman Ara s ra Her zaman

TMS 19 ÇALIfiANLARA SA LANAN FAYDALAR. Yrd. Doç. Dr. Volkan DEM R Galatasaray Üniversitesi Muhasebe-Finansman Anabilim Dal Ö retim Üyesi

GEKA NİHAİ RAPOR TEKNİK BÖLÜM. 1. Açıklama

GAZİOSMANPAŞA ÜNİVERSİTESİ YAZ OKULU YÖNERGESİ BİRİNCİ BÖLÜM

2. Projelerle bütçe formatlar n bütünlefltirme

Lima Bildirgesi AKADEM K ÖZGÜRLÜK VE YÜKSEK Ö RET M KURUMLARININ ÖZERKL

KOMPOZ SYON T P SINAVLARDA KOMPOZ SYONUN B Ç MSEL ÖZELL KLER NDEN KEST R LEN PUANLARIN ANAHTARLA VE GENEL ZLEN MLE ELDE ED LEN PUANLARLA L fik S

ÖĞRENCİ SEÇME SINAVINA HAZIRLANAN ÖĞRENCİLERİN MATEMATİK DERSİNE YÖNELİK TUTUMLARININ BELİRLENMESİ

RİSKLİ YAPILAR ve GÜÇG

AN INVESTIGATION ON THE EFFECTS OF DIFFERENT ITEM- OPTION SCORING METHODS ON ITEM AND TEST PARAMETERS. 1. GiRiş

Uluslararas De erleme K lavuz Notu, No.9. Pazar De eri Esasl ve Pazar De eri D fl De er Esasl De erlemeler için ndirgenmifl Nakit Ak fl Analizi

YÖNETMELİK ANKARA ÜNİVERSİTESİ YABANCI DİL EĞİTİM VE ÖĞRETİM YÖNETMELİĞİ BİRİNCİ BÖLÜM. Amaç, Kapsam, Dayanak ve Tanımlar

L K Ö R E T M. temel1 kaynak MUTLU. Matematik Türkçe Hayat Bilgisi

Transkript:

Hacettepe Üniversitesi E itim Fakültesi Dergisi 26 : [2004] 117-123 ÇOKTAN SEÇMEL TESTLER N KLAS K TEST TEOR S VE ÖRTÜK ÖZELL KLER TEOR S NE GÖRE HESAPLANAN PS KOMETR K ÖZELL KLER N N K KATEGOR L VE A IRLIKLANDIRILMIfi PUANLANMASI YÖNÜNDEN KARfiILAfiTIRILMASI* A COMPARISON OF PSYCHOMETRIC CHARACTERISTICS OF MULTIPLE CHOICE TESTS BASED ON THE BINARY AND WEIGHTED SCORING IN RESPECT TO CLASSICAL TEST THEORY AND LATENT TRAIT THEORY Devrim ÖZDEM R** ÖZET: Bu araflt rmada, çoktan seçmeli test maddelerini iki kategorili (1,0) ve a rl kl (1,2,3,4) puanlama yöntemlerinin testin güvenirlik ve geçerli ine etkisi, klasik test teorisi ve örtük özellikler teorisine göre incelenmifltir. Araflt rma verileri, 2001-2002 ö retim y l nda çeflitli ilkö retim okullar n n 4., 5., 6. ve 7. s n flar nda okuyan 1608 ö renciye uygulanan çoktan seçmeli bir testle elde edilmifltir. Araflt rma bulgular na göre, test gelifltirme çal flmalar nda örtük özellikler teorisinin ve (1,0) puanlamadan yararlan lmas n n daha uygun olaca düflünülmektedir. Klasik test teorisiyle yap lacak çal flmalarda ise a rl kl puanlamadan yararlan lmas önerilebilir. Anahtar sözcükler: yöntemleri, iki kategorili puanlama, a rl kl puanlama, klasik test teorisi, örtük özellikler teorisi, derecelendirilmifl cevap modeli. ABSTRACT: In this research, the effects of binary scoring (1,0) and weighted scoring (1,2,3,4) methods to the reliability and validity of the test have been analysed regarding classical test theory and latent trait theory. The data were collected through the administration of a multiple choice test to 1608 students of 4., 5., 6. and 7. grades of various primary schools in 2001-2002. Regarding the results of the study, it has been concluded that the use of latent trait theory and binary scoring for the test development studies can be more suitable. It is also be recommended that the use of weighted scoring is suitable for the test development studies made through classical test theory. Keywords: Scoring methods, binary scoring, weighted scoring, classical test theory, latent trait theory, graded response model. 1. G R fi Test gelifltirmede kullan lan yöntemlerin hepsinde temel amaç, uygun maddeleri seçerek istenilen nitelikte testler meydana getirmektir. Bunu sa layabilmek amac yla, madde analizi çal flmalar ndan yararlan - l r (Baykul, 1979). Madde analizi çal flmalar nda en çok kullan lan teori, klasik test teorisidir. Klasik test teorisinde, bireyin bir testteki gözlenen puan, gerçek puan n ve hata puanlar n n toplam olarak gösterilir. Teori, ölçme hatalar n n tesadüfi oldu u varsay m na dayal d r. Bu hatalar, gerçek puanlarla ve farkl ölçmelerle korelasyon vermezler. Klasik test teorisinde sorunlar n ço u, elde edilen madde ve test istatistiklerinin gruba ba ml olmas ndan kaynaklanmaktad r. Bu sorunu ortadan kald rman n bir yolu olarak örtük özellikler teorisi ad alt nda bir baflka teori gelifltirilmifltir. Örtük özellikler teorisinin güçlü yanlar üç maddede s ralanabilir; (1) bir madde, o maddeyi cevapland rabilecek herhangi bir cevaplay c grubundan ba ms zd r; (2) bir bireyin yetene i, o bireye uygulanan herhangi bir madde grubundan ba ms zd r; (3) bir tes- * Hacettepe Üniversitesi Sosyal Bilimler Enstitüsü E itimde Ölçme ve De erlendirme Bilim Dal Yay nlanmam fl Doktora Tezi, 2002 ** Yrd. Doç. Dr., Mersin Üniversitesi E itim Fakültesi, devrimozdemir@mersin.edu.tr

118 D. Özdemir / H.Ü. E itim Fakültesi Dergisi 26 (2004) 117-123 tin özelliklerini, testi uygulamadan önce kestirmek mümkündür (Keeves, 1997). Teorinin bir s n rl l, parametrelerin kestirilmesi için büyük bir örneklem kullan lmas n gerektirmesidir. Her iki teoride de maddeye verilen cevaplar n puanlanmas birbirine benzemektedir. Bu teorilerde kullan lan puanlama yöntemleri, iki kategorili ve çok kategorili yöntemler olmak üzere iki grupta incelenebilir (Linden ve Hambleton, 1997). Bu araflt rmada, iki kategorili puanlama yöntemiyle birlikte, k smi bilgiyi de dikkate alan ve seçeneklerin farkl a rl kland r ld çok kategorili puanlama yöntemlerinden, klasik test teorisi için önsel a rl kland rma yöntemi ve örtük özellikler teorisi için derecelendirilmifl cevap modeli ile çal fl lm flt r. Önsel a rl kland rmada, her bir maddenin seçeneklerinin a rl kland r lmas nda uzman görüfllerine baflvurulur ve uzmanlar n seçeneklere verdikleri a rl klara göre puanlama cetveli gelifltirilir (Echternacht, 1976). A rl kl seçenekler için IRT modelleri ilk kez 1969 y l nda Samejima taraf ndan gelifltirilmifltir. Samejima n n gelifltirdi i bu modeller, derecelendirilmifl cevap modelleri olarak adland r l r ve sadece do ruluk derecesine göre s ralanabilen seçenekler için kullan labilmektedir (Frary, 1989). 1.1. Araflt rman n Önemi Klasik test teorisinde farkl gruplara ait sonuçlar n karfl laflt r lmas söz konusu olmazken, örtük özellikler teorisi buna imkân vermektedir, örtük özellikler teorisinin gücü, say lt lar n yerine getirilmesine ba l d r. Bu araflt rmada, yap lan karfl laflt rmalar sonucunda, sonuçlar aras nda farkl l k olmad belirlenirse, çoktan seçmeli testlerin, örtük özellikler teorisinin gerektirdi i güçlü say lt lara gitmeksizin, klasik test teorisi yard m yla puanlanmas ve test istatistiklerinin bu teoriye göre hesaplanmas yoluna gidilebilece i fleklinde bir yarg elde edilmifl olacakt r. 1.2. Araflt rma Problemi Bu araflt rmada flu alt sorulara cevap aranm flt r: 1. Testin iki kategorili (1,0) olarak puanlanmas durumunda, klasik test teorisi ve örtük özellikler teorisine göre elde edilen güvenirlikleri nas ld r? 2. Testin a rl kl (1,2,3,4) olarak puanlanmas durumunda, klasik test teorisi ve örtük özellikler teorisine göre elde edilen güvenirlikleri nas ld r? 3. Testin klasik test teorisine göre iki kategorili (1,0) ve a rl kl (1,2,3,4) olarak puanlanmas durumunda elde edilen güvenirlikleri nas ld r? 4. Testin örtük özellikler teorisine göre iki kategorili (1,0) ve a rl kl (1,2,3,4) olarak puanlanmas durumunda elde edilen güvenirlikleri nas ld r? 5. Testin örtük özellikler teorisine göre iki kategorili (1,0) ve a rl kl (1,2,3,4) olarak puanlanmas durumunda elde edilen geçerlikleri nas ld r? 6. Testin klasik test teorisine göre iki kategorili (1,0) ve a rl kl (1,2,3,4) olarak puanlanmas durumunda elde edilen geçerlikleri nas ld r? 1.3. Say lt lar 1. Uygulaman n yap ld tüm s n flarda test, yönergeye uygun bir biçimde uygulanm flt r. 2. Ö renciler test maddelerini cevaplarken gerçek bilgilerini yans tm fllard r. 1.4. S n rl l klar 1. Araflt rma, uygulaman n yap ld okullarla s n rl d r. 2. Araflt rma, uygulaman n yap ld ilkö retim 4, 5, 6 ve 7. s n flar yla s n rl d r. 3. Araflt rma, Türkçe okudu unu anlama yetene i ile s n rl d r.

D. Özdemir / H.Ü. E itim Fakültesi Dergisi 26 (2004) 117-123 119 2. YÖNTEM Bu bölümde, araflt rman n türü, verilerin elde edildi i grup, ölçme arac n n haz rlanmas, verilerin elde edilmesi ve analizi ile ilgili aç klamalara yer verilmifltir. 2.1.Araflt rman n Türü Bu araflt rmada, örneklem bilgilerinin evrene genellenmesi amac güdülmeyip, iki teoriye göre puanlama yöntemleri hakk ndaki temel özellikler üzerinde durulmufltur. Bu nedenle araflt rman n temel araflt rma niteli inde oldu u söylenebilir. 2.2. Verilerin Elde Edildi i Grup Araflt rman n verileri, 2001-2002 ö retim y l güz döneminde çeflitli ilkö retim okullar nda 4., 5., 6. ve 7. s n flarda okuyan 1608 ö renciye uygulanan ve Türkçe okudu unu anlama yetene ini ölçmeye yönelik olarak haz rlanan, her biri 4 seçenekli 20 maddelik bir çoktan seçmeli test yard m ile elde edilmifltir. 2.3. Ölçme Arac n n Haz rlanmas Testin deneme formunun gelifltirilmesi çal flmalar sonras nda, 55 maddelik bir test formu elde edilmifltir. Haz rlanan form, 9 Türkçe uzman na verilmifl ve bu uzmanlardan, her bir madde için seçenekleri a rl kland rmalar istenmifltir. Uzmanlardan al nan a rl kl puanlar n uyumlu olup olmad Kendall n W uyum istatisti i yard m yla incelenmifltir. Elde edilen sonuçlara göre, 5 maddede uzmanlar aras nda uyum olmad gözlenmifltir (a=0,05). Bu analizler sonucunda oluflturulan 50 maddelik deneme formu, iki ayr ilkö retim okulunda okuyan toplam 237 ö renciye uygulanm flt r. Deneme uygulamas na iliflkin madde analizi çal flmalar hem klasik test teorisi hem de örtük özellikler teorisi için yap lm flt r. Bu çal flmalar sonucunda, 20 maddenin nihai forma al nmas na karar verilmifltir. 2.4. Verilerin Çözümlenmesi Verilerin analizinden önce, örtük özellikler teorisinin say lt lar n n (normallik, yerel ba ms zl k, tek boyutluluk) karfl lan p karfl lanmad ve model-data uyumu incelenmifltir. Normallik Testi: Örtük özellikler teorisinde bireyin ölçülen özelli inin evrende normal da ld varsay m yer almaktad r. Da l m n normal olup olmad hakk nda karar verebilmek için Kolmogorov Smirnov tek örneklem testinden yararlan lm fl, ve test istatisti i d=0,039 bulunmufltur. Elde edilen bu sonuca göre, deneysel da l m ile kuramsal da l m aras nda manidar bir farkl l k olmad (a=0,05); Özde erler (elgenvalues) Egrisi deneme testine iliflkin veri kümesinin normal da ld söylenebilir. Tek Boyutluluk Testi: Testin tek boyutlu olup olmad n n belirlenmesinde, maddeleraras tetrakorik korelasyon katsay s hesaplanm flt r. Faktör analizinde tetrakorik korelasyon matrisinden yararlan lm flt r. fiekil 2.4.1. de 20 maddelik nihai forma iliflkin özde erler e risi yer almaktad r. Ölçülen özelli in tek boyutlu olmas n n bir göstergesi, birinci faktöre ait özde erin ikinci faktöre ait özde erden büyük olmas ve di er faktörlerin büyük farkl l klar gösterme- De er Özde erler fiekil 2.4.1. Testin 20 maddelik nihai formuna iliflkin özde erler e risi

120 D. Özdemir / H.Ü. E itim Fakültesi Dergisi 26 (2004) 117-123 yen özde erlere sahip olmas d r (Lord, 1980). Özde erler e risine göre, veri kümesinin tek bir boyutta ele al namayaca görülmektedir. Yerel Ba ms zl k Testi: Tek boyutluluk varsay m n n gerçekleflmesi, yerel ba ms zl k varsay m n n sa land n n da göstergesidir (Hambleton ve Swaminathan, 1992). Nihai forma iliflkin verilerin tek boyutlu olup olmad n n belirlenmesinde elde edilen faktör analizi sonuçlar yerel ba ms zl n test edilmesi için kullan ld nda, yerel ba ms zl k flart n n yerine getirilmedi i söylenebilir. Model-Data Uyumunun Belirlenmesi: Model ve verilerin uyumunun test edilmesinde yararlan lan istatistiklerden biri, c 2 da l m gösteren -2 log l istatisti idir (Tatl dil, 1996; Keeves, 1997). ki parametreli modele göre -2 log l istatisti i, 15806,9 olarak elde edilmifltir. Elde edilen bu sonuç, verinin iki parametreli modele uyumlu oldu unu göstermektedir (a=0,05). Her bir alt soruya iliflkin güvenirlik araflt rmas n n yap labilmesi amac yla klasik test teorisinde (1,0) puanlama için KR-20 ve a rl kl puanlama için Cronbach a güvenirlik katsay lar hesaplanm flt r. Örtük özellikler teorisinde (1,0) puanlama için Lord un önerdi i güvenirlik katsay s, a rl kl puanlama içinse marjinal güvenirlik katsay lar elde edilmifltir. ki puanlama yönteminin test geçerli ine etkisini ortaya koyabilmek amac yla, 4., 6. ve 7. s n flara uygulanan testlerden elde edilen puanlar ölçüt olarak kabul edilerek, klasik test teorisi için bu testlerden elde edilen puanlar n ortalamalar 5. s n flara uygulanan testten elde edilen puanlar n ortalamas ; örtük özellikler teorisi için farkl s n flardaki cevaplay c lar n q yetenekleri karfl laflt r lm flt r. Ortalamalar aras nda ve q yetenekleri aras nda manidar bir farkl l k olup olmad iliflkisiz örneklemler için t testi yard m yla test edilmifltir. 3. BULGULAR VE YORUMLAR Bu bölümde, araflt rma sonucunda elde edilen verilerin bulgular na yer verilmifl ve yorumlar yap lm flt r. Klasik test teorisi ve örtük özellikler teorisinde (1,0) puanlamaya dayal olarak elde edilen güvenirliklere iliflkin sonuçlar Tablo 3.1. de verilmifltir. Tablo 3.1. de, klasik test teorisi ve örtük özellikler teorisinde (1,0) puanlamaya göre elde edilen güvenirlikler incelendi inde, klasik test teorisinde grubun geneline ilifl- Edilen Güvenirlik Sonuçlar Tablo 3.1. KTT ve IRT de (1,0) ya Göre Elde kin elde edilen güvenirli in (0,49) örtük özellikler teorisinden elde edilen güvenirli e (0,78) göre düflük oldu u S n f N KR-20 Güv. Lord un Güv. Kats. 4. 222 0,44 0,76 görülmektedir. Yine, s n flar düzeyinde güvenirlikler incelendi inde, örtük özellikler teorisi ile elde edilen gü- 5. 887 0,45 0,75 6. 337 0,50 0,80 venirliklerin klasik test teorisinde elde edilen güvenirliklere göre yüksek oldu u görülmektedir. 7. 162 0,57 0,84 Genel 1608 0,49 0,78 Klasik test teorisi ve örtük özellikler teorisinde a rl kl puanlamaya dayal olarak elde edilen güvenirliklere iliflkin sonuçlar Tablo 3.2. de verilmifltir. Tablo 3.2. de klasik test teorisi ve örtük özellikler teorisinde a rl kl puanlamaya göre elde edilen güvenirlikler incelendi inde, örtük özellikler teorisinden grubun geneline iliflkin olarak elde edilen güvenirli in (0,68) klasik test teorisinde elde edilen güvenirli e (0,54) göre yüksek oldu u görülmektedir. Tablo 3.2. de, s n flar düzeyinde güvenirlikler incelendi inde de, örtük özellikler teorisi ile elde edilen güvenirliklerin klasik test teorisinde elde edilen güvenirliklere göre yüksek oldu u görülebilir. Her iki teoride de en yüksek güvenirliklerin 7. s n flara uygulanan test yard m yla elde edildi i söylenebilir (0,59 ve 0,73).

D. Özdemir / H.Ü. E itim Fakültesi Dergisi 26 (2004) 117-123 121 Klasik test teorisinde (1,0) ve a rl kl puanlamaya dayal olarak elde edilen güvenirliklere iliflkin bilgiler Tablo 3.3. de verilmifltir. Klasik test teorisinde (1,0) ve a rl kl puanlamaya göre elde edilen güvenirlikler karfl l kl olarak incelendi- inde, (1,0) puanlamada grubun geneline iliflkin olarak elde edilen güvenirli in (0,49) a rl kl puanlamadan elde edilen güvenirli e (0,54) göre yüksek oldu u görülmektedir. S n flar düzeyinde güvenirlikler incelendi inde de, a rl kl puanlanan testin (1,0) puanlamaya göre daha güvenilir sonuçlar verdi i gözlenmektedir. Örtük özellikler teorisinde (1,0) ve a rl kl puanlamaya dayal olarak elde edilen güvenirliklere iliflkin bilgiler Tablo 3.4. de verilmifltir. Tablo 3.3. IRT de (1,0) ve (1,2,3,4) ya Göre Elde Edilen Güvenirlik Sonuçlar (1,0) (1,2,3,4) S n f N Lord un Marjinal Güv. Kats. Güvenirlik 4. 222 0,76 0,69 5. 887 0,75 0,65 6. 337 0,80 0,72 7. 162 0,84 0,73 Örtük özellikler teorisinde (1,0) ve a rl kl puanlamaya göre elde edilen güvenirlikler karfl l kl olarak incelendi inde, (1,0) puanlamada grubun geneline iliflkin elde edilen güvenirli in (0,78) a rl kl puanlamadan elde edilen güvenirli e (0,68) göre yüksek oldu u Tablo 3.4. de görülmektedir. S n flar düzeyinde güvenirlikler incelendi inde de, (1,0) puanlama ile elde edilen güvenirliklerin a rl kl puanlama ile elde edilen güvenirliklere göre yüksek oldu u görülmektedir. Genel 1608 0,78 0,68 Örtük özellikler teorisinde iki puanlama yönteminin test geçerli ine etkisini ortaya koyabilmek amac yla, 4., 6. ve 7. s n flardaki ö rencilerin q yetenekleri ölçüt kabul edilmifl ve bu yeteneklerin ortalamalar ile 5. s n ftaki ö rencilerin q yeteneklerinin ortalamas aras ndaki fark test edilmifl ve elde edilen sonuçlar Tablo 3.5. de verilmifltir. Tablo 3.5. den görülebilece i gibi, hem (1,0) puanlama hem de a rl kl puanlama için 4-5. ve 5-7. s n flara uygulanan testlerin ortalamalar aras nda, 4-5. s n flara uygulanan testlerde 5. s n f ö rencilerinin q yetenek ortalamalar lehinde; 5-7. s n flara uygulanan testlerde ise 7. s n f ö rencilerinin q yetenek ortalamalar lehinde 0,05 düzeyinde manidar bir farkl l k elde edilmifltir. Buna göre, hem a rl kl hem de (1,0) puanlama yönteminin 6. s n flar d fl ndaki gruplar birbirinden ay rd, dolay s yla, her iki puanlama yönteminin geçerli oldu u söylenebilir. Klasik test teorisinde iki puanlama yönteminin test geçerli ine etkisini ortaya koyabil- Tablo 3.2. KTT de (1,0) ve (1,2,3,4) ya Göre Elde Edilen Güvenirlik Sonuçlar S n f N (1,0) (1,2,3,4) KR-20 Güv. α Güvenirli i 4. 222 0,44 0,50 5. 887 0,45 0,49 6. 337 0,50 0,57 7. 162 0,57 0,59 Genel 1608 0,49 0,54 Tablo 3.4. IRT de (1,0) ve (1,2,3,4) ya Göre q Yeteneklerinin Karfl laflt r lmas Puan Grp. N θ sd t p Ort. 4. 222-0,34 1107 4,92 0,00 * A rl kl 5. 887-0,12 5. 887-0,12 1222 1,55 0,12 6. 337-0,06 5. 887-0,12 1047 5,05 0,00 * 7. 162 0,14 4. 222 0,73 1107 5,44 0,00 * 5. 887 0,97 5. 887 0,97 1222 1,29 0,19 6. 337 1,02 5. 887 0,97 1047 4,91 0,00 * 7. 162 1,22 * p < 0,05 düzeyinde manidard r.

122 D. Özdemir / H.Ü. E itim Fakültesi Dergisi 26 (2004) 117-123 Tablo 3.5. KTT de (1,0) ve A rl kl ya Göre Aritmetik Ortalamalar n Karfl laflt r lmas Puan Grp. N Ort. sd t p (1,0) A rl kl 4. 222 8,41 1107 4,99 0,00* 5. 887 9,44 5. 887 9,44 1222-1,58 0,11 6. 337 9,72 5. 887 9,44 1047-4,91 0,00* 7. 162 10,61 4. 222 58,43 1107-5,48 0,00* 5. 887 61,02 5. 887 61,02 1222-1,01 0,31 6. 337 61,43 5. 887 61,02 1047-4,26 0,00* 7. 162 63,31 *p < 0,05 düzeyinde manidard r. mek amac yla, 4., 6. ve 7. s n flara uygulanmas ndan edilen puanlar ölçüt kabul edilerek bu testlerin ortalamalar ile 5. s n flara uygulanan testin ortalamas aras ndaki fark test edilmifl ve elde edilen sonuçlar Tablo 3.6. da verilmifltir. Tablo 3.6. dan görülebilece i gibi, hem (1,0) puanlama hem de a rl kl puanlama için, 4.-5. ve 5.-7. s n flara uygulanan testlerin ortalamalar aras nda, 4.-5. s n flara uygulanan testlerde 5. s n flara uygulanan testin ortalamas lehinde; 5.-7. s n flara uygulanan testlerde ise 7. s n flara uygulanan testin ortalamas lehinde 0,05 anlaml l k düzeyinde manidar bir farkl l k elde edilmifltir. Buna göre, hem a rl kl hem de (1,0) puanlama yönteminin 6. s - n flar d fl ndaki gruplar birbirinden ay rd, dolay s yla, her iki puanlama yönteminin geçerli oldu u söylenebilir. 4. ve 7. s n f düzeylerindeki ö rencilerin okudu unu anlama yetene i bak m ndan 5. s n f ö rencilerinden farkl olmas, buna karfl l k 6. s n f ö rencilerinin okudu unu anlama yetene i ile 5. s n f ö rencilerinin okudu unu anlama yetene i aras nda manidar bir farkl l k gözlenmemesi beklenen bir durumdur. 5.-6. s n flar n okudu unu anlama yetene ini ölçme amac yla gelifltirilen testten ald klar puanlar n ortalamalar aras nda farkl l k bulunmamas - n n nedeni, yafl ve geliflim düzeyi bak m ndan bu gruplar n birbirine yak n olmas nedeniyle aç klanabilir. 4. SONUÇLAR VE ÖNER LER Araflt rma sorular n n istatistiksel bulgular fl nda afla daki sonuçlar elde edilmifltir. Klasik test teorisinde a güvenirlik katsay s n n, KR-20 güvenirlik katsay s ndan yüksek sonuçlar verdi i; örtük özellikler teorisinde Lord un güvenirlik katsay s n n, marjinal güvenirlikten yüksek oldu u gözlenmifltir. Bu sonucun, Lord un katsay s n n hesaplanmas nda güvenirli in klasik tan m ndan hareketle elde edilmesi, marjinal güvenirli in ise de iflik yetenek düzeylerinden elde edilen güvenirliklerin ortalamas na dayan larak hesaplanmas nedeniyle gözlendi i düflünülmektedir. (1,0) ve a rl kl puanlama için yap lan güvenirlik çal flmalar incelendi inde, iki kategorili puanlamada Lord un katsay s n n KR-20 den yüksek oldu u gözlenmifltir. Klasik test teorisi ve örtük özellikler teorisinde a rl kl puanlama ile elde edilen güvenirlikler incelendi inde, örtük özellikler teorisinde marjinal güvenirlik hesaplamalar na dayal olarak elde edilen sonuçlar n klasik test teorisinde a katsay s yard m yla elde edilen sonuçlardan yüksek oldu u gözlenmifltir. Klasik test teorisinde a rl kl puanlama ve örtük özellikler teorisinde (1,0) puanlama ile elde edilen güvenirlikler incelendi inde, örtük özellikler teorisinde Lord un güvenirlik katsay s yard m yla elde edilen güvenirli in, klasik test teorisinde a katsay s yard m yla elde edilen güvenirlikten yüksek sonuçlar verdi i belirlenmifltir. Klasik test teorisinde (1,0) puanlama ve örtük özellikler teorisinde a rl kl puanlama ile elde edilen güvenirlikler incelendi inde, örtük özellikler teorisinde marjinal güvenirlik katsay s yard m yla elde edilen güvenirli in klasik test teorisinde KR-20 güvenirlik katsay s yard m yla elde edilen güvenirlikten yüksek sonuçlar verdi i görülmektedir.

D. Özdemir / H.Ü. E itim Fakültesi Dergisi 26 (2004) 117-123 123 Ölçüt grup geçerli i sonuçlar incelendi inde, (1,0) puanlama ve a rl kl puanlama ile elde edilen ölçme sonuçlar na iliflkin olarak klasik test teorisi için 4.-5. ve 5-7. s n flar n test puanlar ortalamalar ; örtük özellikler teorisi için de 4.-5. ve 5-7. s n flar n q yetenekleri ortalamalar aras nda manidar farkl l k oldu u belirlenmifltir. Araflt rma sonuçlar na dayal olarak afla da baz önerilere yer verilmifltir. Bu araflt rmada, örtük özellikler teorisinde Lord un güvenirlik katsay s yard m yla elde edilen güvenirliklerin en yüksek sonucu verdi i gözlenmifltir. Lord un güvenirlik katsay s n, örtük özellikler teorisinde a rl kl puanlama ile elde edilen marjinal güvenirlik izlemektedir. Bu durumda, örtük özellikler teorisinin klasik test teorisine göre yüksek güvenirlik verdi i; örtük özellikler teorisi kapsam nda da (1,0) ile puanlama yönteminin güvenirlik bak m ndan yüksek sonuçlar ortaya koydu u söylenebilir. Bu bak mdan, daha sonra yap labilecek test gelifltirme çal flmalar nda, örtük özellikler teorisi ve örtük özellikler teorisinde de (1,0) puanlaman n kullan lmas önerilebilir. Yine, klasik test teorisi ile yap lmas düflünülen test gelifltirme çal flmalar nda a rl kl puanlama yönteminden yararlanman n uygun olabilece i söylenebilir. Araflt rma sürecinde yap lan literatür çal flmalar nda, çoktan seçmeli testlerle ilgili olarak seçeneklerin ve test maddelerinin a rl kland r lmas na iliflkin çok say da puanlama yöntemi bulundu u belirlenmifltir. Hem klasik test teorisi hem örtük özellikler teorisi için çeflitli seçenek ve madde a rl kland rma yöntemlerinin test ve madde istatistiklerine etkisi, karfl laflt rmal olarak incelenebilir. Yine, kullan lan puanlama yöntemlerinde madde yanl l olup olmad, cinsiyet, farkl okul türleri (devlet okulu, özel okulu gibi) ve di er de iflkenler bak m ndan incelenebilir. KAYNAKLAR Baykul, Y. (1979). Örtük özellikler ve klasik test kuramlar üzerine bir karfl laflt rma. Yay mlanmam fl Doktora Tezi, Hacettepe Üniversitesi, Ankara. Ben-Simon, A., Budescu, D. V. ve Nevo, B. (1997). A comparative study of measures of partial knowledge in multiple-choice tests. Applied Psychological Measurement, 21(1), 65-88. Echternacht, G. (1976). Reliability and validity of item option weighting schemes. Educational and Pychological Measurement, 36, 301-309. Frary, R. B. (1989). Partial credit scoring methods for multiple choice Tests. Applied Measurement in Education, 2(1), 79-96. Hambleton, R. K. ve Swaminathan, H. (1992). Item response theory: Principles and application. Boston: Kluwer Academic Publishers Group. Jaradat, D. ve Tollefson, N. (1988). The Impact of alternative scoring procedures for multiple-choice items on t test Reliability, validity and grading. Educational and Psychological Measurement, 48, 627-635. Keeves, J. P. (1997). Educational research methodology and measurement: An international handbook (Second Edition). Cambridge: Cambridge University Pres. Linden, V.D. ve Hambleton, R.K. (1997). Handbook of modern item response theory. New York: Springer- Verlag Inc. Lord, F. (1980). Applications of item response theory to practical testing problems. New Jersey: Lawrence Erlbaum Associates Publishers. Tatl dil, H. (1996). Uygulamal çok de iflkenli istatistiksel yöntemler. Ankara.