BİLGİSAYAR ORTAMINDA BİREYSELLEŞTİRİLMİŞ TESTLERİN EĞİTİMDE KULLANIMI



Benzer belgeler
Başarı ve Yetenek Kestirimlerinde Yeni Bir Yaklaşım: Bilgisayar Ortamında Bireyselleştirilmiş Testler (Computerized Adaptive Tests - CAT)

MADDE DÜZEYİNDE BOYUTLULUK MODELLERİNİN BİLGİSAYAR ORTAMINDA BİREYSELLEŞTİRİLMİŞ TEST YÖNTEMLERİ ÜZERİNDEKİ ETKİSİNİN İNCELENMESİ

Uluslararası Standart Sınavlar. Sunan: M. Suna Coşkun POSITIVE ENGLISH

ÖZGEÇMİŞ. Derece Alan Üniversite Yıl. OrtaöğretimMatematikEğitimi BoğaziciÜniversitesi 2007

BİLGİSAYARLAŞTIRILMIŞ UYARLANABİLİR TEST SİSTEMLERİ VE EĞİTİM YAZILIMLARINA ENTEGRASYONLARI: TEORİDEN PRATİĞE BİR İNCELEME

Öğrenci Başarısının Öğretmen Yapımı Bir Testle Klasik Test Kuramı ve Madde Tepki Kuramı Yöntemleriyle Elde Edilen Puanlara Göre Karşılaştırılması

Klasik Test Teorisine ve Örtük Özellikler Teorisine Göre Kestirilen Madde Parametrelerinin Karşılaştırılması Üzerine Ampirik Bir Çalışma

Bireyselleştirilmiş Testler Üzerine Bir Çalışma 1

RASCH MODELİ İLE ELDE EDİLEN YETENEK ÖLÇÜLERİNİN NİTELİKLERİ ÜZERİNDE BİR ÇALIŞMA

MİLLİ EĞİTİM BAKANLIĞI ÖZEL OKULLAR SINAVI VERİLERİNİN MADDE TEPKİ KURAMI MODELLERİNE UYUMU

READING WRITING ORAL COMMUNICATIO N SKILLS BASIC INFORMATION TECHNOLOGIES INTRODUCTION TO EDUCATION

Available online at

YAZ OKULU TARİHLERİ. Yaz Okulu için yeni ders kayıtları Temmuz 2012 tarihlerinde OASIS sistemi üzerinden yapılacaktır.

BİREYE UYARLANMIŞ BİLGİSAYAR DESTEKLİ ÖLÇME VE DEĞERLENDİRME YAZILIMI GELİŞTİRİLMESİ

Erişi Testlerine Madde Seçiminde Klasik Test Kuramı ve Rasch Modelinin K arşılaştırılm ası

5. HAFTA PFS 107 EĞİTİMDE ÖLÇME VE DEĞERLENDİRME. Yrd. Doç Dr. Fatma Betül Kurnaz. KBUZEM. Karabük Üniversitesi

Sınavlı ve Sınavsız Geçiş İçin Akademik Bir Karşılaştırma

MATEMATİK BÖLÜMÜ BÖLÜM KODU:3201

Açıköğretimde kullanılan sınavlardan Klasik Test Kuramına ve Madde Tepki Kuramına göre elde edilen yetenek ölçülerinin karşılaştırılması

KAMU PERSONELÝ SEÇME SINAVI PUANLARI ÝLE LÝSANS DÝPLOMA NOTU ARASINDAKÝ ÝLÝÞKÝLERÝN ÇEÞÝTLÝ DEÐÝÞKENLERE GÖRE ÝNCELENMESÝ *

Öğrenciler analiz programları hakkında bilgi sahibi olurlar

ANKARA ÜNĐVERSĐTESĐ EĞĐTĐM BĐLĐMLERĐ ENSTĐTÜSÜ ÖLÇME VE DEĞERLENDĐRME ANABĐLĐM DALI

Derece Bölüm Üniversite Yıl Nisan. Bölümü. Değerlendirme Yüksek Lisans Ölçme ve Ankara Değerlendirme Üniversitesi Lisans Sınıf Öğretmenliği Ankara

BİLİŞİM TEKNOLOJİLERİ ALANI THE INFORMATION TECHNOLOGIES DEPARTMENT

DERS BİLGİLERİ. Dil Edinimi YDI208 IV.Yarıyıl Bu dersin ön koşulu ya da eş koşulu bulunmamaktadır.

DEVAM ETMEKTE OLAN ÖĞRENCİLERE UYGULANACAK PROGRAMLAR

ACT (American College Testing ) Sınavı Hakkında

YÜKSEKÖĞRETİM KURULU YARDIMCI DOÇENT

MÜFREDAT DERS LİSTESİ

Bilimsel Araştırma Ödevlerinin Çok Yüzeyli Rasch Ölçme Modeli ile Değerlendirilmesi

T.C. İZMİR KÂTİP ÇELEBİ UNIVERSITY FACULTY OF ENGINEERING AND ARCHITECTURE DEPARTMENT OF CIVIL ENGINEERING. Course Name T P L ECTS

EĞİTİM ÖĞRETİM YILINDAN İTİBAREN GEÇERLİ OLACAK NEVŞEHİR ÜNİVERSİTESİ İKTİSADİ VE İDARİ BİLİMLER FAKÜLTESİ İKTİSAT-İ.Ö

KIRIKKALE ÜNİVERSİTESİ FEN-EDEBIYAT FAKÜLTESİ İSTATİSTİK BÖLÜMÜ LİSANS PROGRAMI

Uluslararası Sınavlar

EĞİTİCİLERİN EĞİTİMİ PROGRAMI II.OTURUM

Prof. Dr. Selahattin GELBAL Araştırma Görevlisi Yardımcı Doçent Doçent Profesör

DEVAM ETMEKTE OLAN ÖĞRENCİLERE UYGULANACAK PROGRAMLAR VE DERSLERİN İNTİBAKLARI

2017 ÖNCESİ NEVŞEHİR HACI BEKTAŞ VELİ ÜNİVERSİTESİ İKTİSADİ VE İDARİ BİLİMLER FAKÜLTESİ İKTİSAT NÖ-İÖ BÖLÜMLERİ LİSANS ÖĞRETİM PLANI

Veritabanı Tasarım ve Yönetimi (COMPE 341) Ders Detayları

BAHÇEŞEHİR ÜNİVERSİTESİ

ENG ACADEMIC YEAR SPRING SEMESTER FRESHMAN PROGRAM EXEMPTION EXAM

BİREYSELLEŞTİRİLMİŞ BİLGİSAYARLI TEST UYGULAMALARINDA FARKLI SONLANDIRMA KURALLARININ ÖLÇME KESİNLİĞİ VE TEST UZUNLUĞU AÇISINDAN KARŞILAŞTIRILMASI

EĞİTİM ÖĞRETİM YILI GÜZ DÖNEMİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ

EĞİTİM ÖĞRETİM YILI GÜZ DÖNEMİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ

DEVAM ETMEKTE OLAN ÖĞRENCİLERE UYGULANACAK PROGRAMLAR VE DERSLERİN İNTİBAKLARI

Açık ve Uzaktan Öğretimde Farklılaştırılmış Öğretim. Hasan UÇAR, Bilecik Şeyh Edebali Üniversitesi Doç. Dr. Alper Tolga KUMTEPE, Anadolu Üniversitesi

BULANIK MANTIK VE SİSTEMLERİ BAHAR DÖNEMİ ÖDEV 1. Müslüm ÖZTÜRK Bilişim Teknolojileri Mühendisliği ABD Doktora Programı

BENİM DÜNYAM ÇOCUK OYUNU: BİR MOBİL UYGULAMA

Eğitim-Öğretim Yılında

ÖZGEÇMİŞ. Derece Alan Üniversite Yıl. Y. Lisans Matematik Eğitimi University of Warwick 2010 Y. Lisans Matematik Eğitimi University of Cambridge 2012

ORTAÖĞRETİM KURUMLARI ÖĞRENCİ SEÇME VE YERLEŞTİRME SINAVLARI NDA ÇIKAN BİYOLOJİ SORULARININ İÇERİK ANALİZİ

I.YIL HAFTALIK DERS AKTS

TÜRKİYE CUMHURİYET MERKEZ BANKASINA UZMAN YARDIMCISI ALINACAKTIR

BİR, İKİ, ÜÇ VE DÖRT PARAMETRELİ LOJİSTİK MADDE TEPKİ KURAMI MODELLERİNİN KARŞILAŞTIRILMASI AYŞENUR ERDEMİR YÜKSEK LİSANS TEZİ

Arş. Gör. Dr. Mücahit KÖSE

EĞİTİM-ÖĞRETİM YILI MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ (İNGİLİZCE) BÖLÜMÜ DERS PROGRAMINDA YAPILAN DEĞİŞİKLİKLER

English for Academic Reading & Speaking I İngilizce Akademik Okuma ve Konuşma I. Introduction to Civil Engineering İnşaat Mühendisliğine Giriş

KIRIKKALE ÜNİVERSİTESİEĞİTİM FAKÜLTESİ SINIF ÖĞRETMENLİĞİ PROGRAMI EĞİTİM-ÖĞRETİM YILI LİSANS PROGRAMI ÖĞRETİM PLANI.

Lise Göztepe Anadolu Kız Meslek Lisesi Bilgisayar Bölümü, İzmir,

Dijital Sinyal İşleme (COMPE 463) Ders Detayları

Ön şart D. Kodu Dersin Adı T U L AKTS MAT101. English for Academic Reading & Speaking I İngilizce Akademik Okuma ve Konuşma I

1. Semester 1. Semester CODE COURSE CREDIT CODE COURSE CREDIT. 2. Semester 2. Semester. 3. Semester 3. Semester

2011 Yılı Yükseköğretime Geçiş Sınavı Hakkında ODTÜ Eğitim Fakültesi Görüşü

Kanada Sertifika Programları. Marketing Research and Business Intelligence Eylül, Ocak, Mayıs 42 Hafta 15600

T.C. MEHMET AKİF ERSOY ÜNİVERSİTESİ Fen-Edebiyat Fakültesi

English for Academic Reading & Speaking I İngilizce Akademik Okuma ve Konuşma I. Introduction to Civil Engineering İnşaat Mühendisliğine Giriş

Sınıf Seviye Belirleme Sınavları Alt Testlerinin Çeşitli Yöntemlere Göre Değişen Madde Fonksiyonlarının İncelenmesi *

AKADEMİK YILI I. YARIYILI İÇİN LİSANSÜSTÜ PROGRAMLARA BAŞVURU BİLGİLERİ

Özel Koşullar Requirements & Explanations Eğitim Fakültesi Fen Bilgisi Öğretmenliği

EĞİTİM ÖĞRETİM YILI GÜZ DÖNEMİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ

BİLGİSAYAR ORTAMINDA BİREYE UYARLANMIŞ TEST YÖNTEMİ

MÜHENDİSLİK FAKÜLTESİ-ELEKTRIK-ELEKTRONIK MÜHENDİSLİĞİ BÖLÜMÜ DERS BİLGİLERİ. Adı Kodu Dili Türü Yarıyıl. Doç. Dr. Nedim Tutkun

DYNAMIC BUSINESS ENGLISH

English for Academic Reading & Speaking I İngilizce Akademik Okuma ve Konuşma I. Introduction to Civil Engineering İnşaat Mühendisliğine Giriş

YAŞAR ÜNİVERSİTESİ MESLEK YÜKSEKOKULU BİLGİSAYAR TEKNOLOJİLERİ BÖLÜMÜ BİLGİSAYAR PROGRAMCILIĞI PROGRAMI EĞİTİM ÖĞRETİM YILI MÜFREDATI

Olasılık ve İstatistik (IE 220) Ders Detayları

Adı Soyadı Geçerlilik Bölüm ve Görevi Eski Şirketi ve Görevi. Uluslar Arası Programlar Ofisi Öğrenci Değişim Uzmanı

1. YARIYIL / SEMESTER 1

Yrd.Doç.Dr. Kamil ÖZCAN Öğr. Gör. Gökhan TURAN

Endüstri Mühendisliği - 1. yarıyıl. Academic and Social Orientation Fizik I Physics I TR

Matematik Eğitimi ABD. Mesleki Deneyim: Indiana University, School of Education, Curriculum and

Examining the Effect of Content Balancing on Multidimensional Computerized Adaptive Testing Based on Between-Item Dimensionality Model

BİREYSELLEŞTİRİLMİŞ BİLGİSAYARLI TEST UYGULAMALARINDA KULLANILAN MADDE SEÇME YÖNTEMLERİNİN KARŞILAŞTIRILMASI

ÖZGEÇMİŞ VE ESERLER LİSTESİ

Bilgisayar Programlama (COMPE 102) Ders Detayları

AKTS Başvurumuz. Bologna Süreci Uzmanlarının Değerlendirmesi

DYNAMIC BUSINESS ENGLISH

Üniversitelerde Temel Bilişim Eğitimi Nereye Gidiyor? : Analizi

ĐST 474 Bayesci Đstatistik

ELEKTRONİK MÜHENDİSLİĞİ NDE KİMYA EĞİTİMİNİN GEREKLİLİĞİNİN İKİ DEĞİŞKENLİ KORELASYON YÖNTEMİ İLE İSTATİSTİKSEL OLARAK İNCELENMESİ

DERS BİLGİLERİ. Ders Kodu Yarıyıl T+U Saat Kredi AKTS İSTATİSTİKSEL KESTİRİM ESYE

ÖĞRETMEN ADAYLARININ PROBLEM ÇÖZME BECERİLERİ

Yönetim Bilişim Sistemleri (Karma) - 1. yarıyıl Hukukun Temelleri Fundamentals of Law TR

M d a d dd e A l na i li i z

All documents should be presented with an official English or Turkish translation (if the original language is not English or Turkish).

daha çok göz önünde bulundurulabilir. Öğrencilerin dile karşı daha olumlu bir tutum geliştirmeleri ve daha homojen gruplar ile dersler yürütülebilir.

Yrd. Doç. Dr. Mehmet Güçlü

YÖNETİM BİLİŞİM SİSTEMLERİ BÖLÜMÜ YENİ DERS MÜFREDATI (1) FAKÜLTESİ: İŞLETME FAKÜLTESİ / BUSINESS SCHOOL

THE IMPACT OF AUTONOMOUS LEARNING ON GRADUATE STUDENTS PROFICIENCY LEVEL IN FOREIGN LANGUAGE LEARNING ABSTRACT

English for Academic Reading & Speaking II İngilizce Akademik Okuma ve

Transkript:

XIII. Ulusal Eğitim Bilimleri Kurultayı, 6-9 Temmuz 2004 İnönü Üniversitesi, Eğitim Fakültesi, Malatya BİLGİSAYAR ORTAMINDA BİREYSELLEŞTİRİLMİŞ TESTLERİN EĞİTİMDE KULLANIMI İlker Kalender Orta Doğu Teknik Üniversitesi, Ortaöğretim Fen ve Matematik Alanları Eğitimi Bölümü kalenderilker@yahoo.com ÖZET Bu çalışmanın amacı bilgisayar ortamında bireyselleştirilmiş testlerin eğitimde ölçme çalışmalarında nasıl kullanılabileceği tartışmaktır. Ayrıca bu tür testlere neden ihtiyaç duyulduğu ve bu testlerin altında yatan matematiksel model de ele alınacaktır. Kağıt kalem testleriyle karşılaştırılmaları, üstünlükleri ve dezavantajları ile Türkiye'de bu testlerin kullanım imkanları, kısıtlamaları ve zorlukları değerlendirilecek, bu konuda yapılmış akademik çalışmalar ve sonuçları belirtilecektir. Bu uygulamalarda bilgisayar bir çokluortam arac ıolarak gelişmiş grafik, ses vs. gibi özellikler sunmaktan çok daha fazlasını yapmaktadır. Bilgisayar önceden belirlenmiş bir soru grubunu sırayla uygulamak yerine, soruları testin gidişine göre seçerek sormaktadır. Bu şekilde bireyin düzeyine en uygun sorular kullanılarak, birey hakkındaki kestirimler çok daha iyi yapılmaktadır. Günümüzde bu testler çoğunlukla yetenek ve başarı ölçümleri için kullanılmaktadır. Ülkemizde de üniversite ve lisans üstü giriş ya da dil yeterliliği sınavlarında kullanılmaması için tabi gerekli çalışmalar ve hazırlıktan sonra hiçbir neden yoktur. Anahtar Sözcükler Bilgisayar ortamında bireyselleştirilmiş testler, madde tepki kuramı, eğitimde ölçme ABSTRACT The purpose of this study is to discuss how computer adaptive testing can be used in educational measurement. Also reason that this kind of testing is necessery and the underlying mathematical model will be examined. Comparison with paper-and-pencil tests, advantages/disadvantages will be given. Application areas of these tests in Turkey, possible constraints and difficulties will be discused. Moreover, findings of academic studies will be presented. In a computer adaptive testing application, computer provides examinee with more features besides sophisticated multimedia applications. Item that examinee receives are taken from an item poll according to examine performance on the test up to this point. In this way, estimations for examinee are made better. At present, these tests are used in ability and achievement testing. Provided that required research and preparations are made, these tests can be used for largescale applicatios in Turkey, such as graduate study examination and language proficiency tests. Keywords Computer adaptive tests, item response theory, educational measurement GİRİŞ Bu çalışmada bilgisayar ortamında bireyselleştirilmiş test uygulamaları konu edilmektedir. Bu test uygulamasında sorular testi alan kişinin bir alandaki düzeyine (dil yeterliliği, IQ seviyesi vs.) göre uygun olacak şekilde eşzamanlı olarak ayarlanmaktadır. Bunun bildiğimiz kağıt kalem testleriyle başarılamayacağı söylenebilir. Çünkü kağıt-kalem testleri gruplara uygulanmak üzere hazırlanmışlardır. Böyle gruplara uygulanan testler testi her alan birey için aynı kesinlikte ölçme sağlayamazlar, çünkü testin zorluk derecesi testi alan herkese uymaz, her öğrenci kendisi için çok kolay ve çok zor olan soruları da yanıtlamak zorunda kalır. Bu tür sorular ölçülmek istenen olgu hakkında çok az bilgi sağlarlar. İdeal test uygulaması testi alan herkese kendi yetenek düzeyinde bir test vermektir. Fakat burada karşımıza şöyle bir ikilem çıkmaktadır: bireyin yetenek düzeyine en uygun testi vermek en uygunu olacaktır, ama bireyin yetenek düzeyini biliyorsak testi uygulamamıza gerek kalmaz. Bu ikileme (paradox of test

design) çözüm olarak sıradaki soruyu belirlemek için kişinin o soruya kadarki cevaplarını kullanarak uygun soruları bireye sırayla vermek önerilmiştir (Weiss, 1983). TARİHSEL GELİŞİM Bireyselleştirilmiş ilk test uygulamasının Alfred Binet tarafından Alfred-Binet IQ testi geliştirilmesi esnasında ortaya çıktığını görüyoruz. Binet'nin bu çalışması bireye uyarlanmış bir testin taşıması gereken tüm özellikleri taşımaktadır: önceden hazırlanmış bir madde havuzu, zorluk düzeylerine göre sınıflandırılmış sorular, başlangıç seçeneği, önceden tanımlı bir puanlama sistemi, sorulacak soruların havuzdan seçilmesi için bir kural ve önceden tanımlı bir sonlandırma kuralı. Bu ilk uygulama günümüzdeki uygulamalarla karşılaştırıldığında çok basit görünse de, günümüzdeki testler için bu ilk uygulamanın bir temel oluşturduğu söylenebilir. Daha sonra 1950 li yıllarda bazı çalışmalar olmuş fakat ilerletilmesi mümkün olmamıştır. 1960 larda, Educational Testing Service den Fred Lord'un bu konuda önemli çalışmaları olmuştur. Lord un (1980) temel düşüncesi şöyleydi: soru sayısı sabit olan bir test özellikle düşük ve yüksek yetenek düzeyindeki öğrenciler için uygun değildir. Eğer uygun sorular kullanılırsa aynı test hiçbir bilgi kaybı olmadan daha kısa sürede uygulanabilir. Bundan sonra da Amerikan Deniz Kuvvetlerin tarafından yapılan çalışmalarla gelişmiştir (Weiss, 1983). Bireye uyarlanmış test uygulamasının etkin olabilmesi için eşzamanlı hesaplamalar ve soruların hızlı bir biçimde havuzdan çekilip sorulmasını ve ardında sıradaki soruyu hızlıca seçmeyi gerektirdiğinden, böyle bir uygulamanın tam anlamıyla uygulamaya geçmesi 1970 lerle birlikte bilgisayar teknolojisindeki gelişmeler ve fiyatlarındaki düşüşle beraber olmuştur. Ve böylece Bilgisayar Ortamında Bireye Uyarlanmış Test Uygulaması (Computer Adaptive Testing CAT) kavramı ortaya çıkmıştır (Çıkrıkçı-Demirtaşlı, 1999). van der Linden (1995) aşağıdaki tabloda bilgisayar teknolojisi ile bireyselleştirilmiş testlerin gelişimi arasındaki parallelliği göstermektedir. Tablo 1. Bilgisayar teknolojisi ve bireyselleştirilmiş testlerin gelişimi Dönem Bilgisayar Teknolojisi Bireyselleştirilmiş Test 1950'ler İlk mainframe bilgisayar yapıldı Lord ve Rasch tarafından ilk yayınlar yapıldı 1960'lar Mainframe bilgisayarlar üniversiteler ve sanayide görülmeye başladı Psikometristler tarafından güçlü bir araç olarak kabul gördü 1970'ler Mainframe ve mini-bilgisayar kullanımı Yoğun araştırmalar yapıldı yaygınlık kazandı 1980'ler Mikro bilgisayarlar piyasaya çıktı Bilgisayarda ilk uygulamalar yapıldı 1990'lar Mikro bilgisayarlar gelişti ve ucuzladı Bilgisayarla yapılan testler büyük ölçekli uygulamalarda kullanıldı

BİLGİSAYAR ORTAMINDA BİREYSELLEŞTİRİLMİŞ TESTLERİN ÖZELLİKLERİ Günümüzde ise bilgisayar ortamında bireyselleştirilmiş testler esas olarak TOEFL, GRE gibi dünya çapında yapılan testlerde tanınmakla beraber bir çok başka alanda da kullanılmaktadır. Bu testleri alanlar bir bilgisayar karşısına geçmekteler ve soruları bilgisayar başında yanıtlamaktadırlar. Burada bilgisayar bir çokluortam aracı gelişmiş grafik, ses vs. gibi özellikler sunmaktan çok daha fazlasını yapmaktadır. Bilgisayar önceden belirlenmiş bir soru grubunu sırayla uygulamak yerine, soruları testin gidişine göre seçerek sormaktadır. Çünkü bir bireye kendi yetenek düzeyinin çok üstünde (çok zor) sorular sormak ya da yetenek düzeyinin çok altında sorular sormak (çok kolay) testi alanın yetenek düzeyi fazla bilgi sağlamamaktadır. Ayrıca kişinin yetenek düzeyine uygun olmayan sorular sormak kişinin sıkılmasına da neden olabilmektedir (Sands, Waters, McBride, 1997). Bilgisayar ortamında bireye uygulanmış testler şu adımları uygulamaktadır: bireyin düzeyine uygun zorluk derecesindeki soruları havuzdan çekip sormaktır. Test boyunca bireyin yetenek kestirimini en iyi biçimde yapabilmek için uygulama boyunca yetenek düzeyinde sürekli ayarlamalar yapılır. Bu ayarlamalar bireyin uygulamada o soruya kadar gelene gösterdiği performansa bağlıdır. Bir soru yanlış cevaplanırsa bir sonraki soru daha kolay (puan değeri daha düşük); doğru cevaplanırsa sıradaki soru daha zor (puan değeri daha yüksek) olmaktadır. Burada önemli nokta şudur: uygulanan sorular havuza eklenmeden önce yüzlerce hatta binlerce kişiye uygulandığından parametreleri (zorluk derecesi, ayırt edicilik indeksi ve sanş faktörü) bilinmektedir ve uygulanacak sorular bu parametrelere dayanarak seçilmektedir. Böyle bir test uygulamasının ilerleyişi şu adımlarla özetlenebilir (Hambleton & Swaminathan, (1984); Lord & Stocking, 1988; Rudner, 1998; Çıkrıkçı-Demirtaşlı, 1999): i. Bireyin yetenek düzeyi hakkında bir kestirimde bulunulur. Burada orta zorluk derecesinde bir soru seçmek iyi bir yaklaşımdır, çünkü ilk başka bireyin yetenek düzeyi hakkında bir şey bilmediğimiz için ortalama zorluk en iyi tahmin olacaktır. Madde havuzu konulara ve/veya zorluk derecelerine göre gruplanmış olan ve yüzlerce hatta binlerce kişiye uygulanıp parametreleri iyi belirlenmiş soruları içermektedir. İyi bir madde havuzunun çok sayıda soru içermesi beklenir böylece aynı soruların uygulanma ihtimali azaltılır. Zaman içinde havuza yeni sorular ekleyip, havuzdan soru çıkartmak mümkündür. ii. Madde havuzu içinde sorulardan bireyin yetenek düzeyine en uygun olanı seçilir. Bu soruya doğru yanıt verilirse daha zor, yanlış yanıt verilirse daha kolay bir sorulur. Sadece doğru ya da sadece yanlış cevaplar yetenek kestiriminde kullanılamazlar. iii. Birey hakkında yeni bir yetenek kesitirimi yapılır. Yetenek kestiriminde bulunmak için farklı matematiksel metotlar bulunmasına karşın başlıca iki metot kullanılmaktadır: Maximum Likelihood ve Bayesian. Maximum Likelihood metodu birey hakkında en fazla bilgi veren soruyu seçmeye dayanırken, Bayesian bireyin sonraki yetenek kestirim aralığını en aza indirecek soru seçer. iv. Önceden belirlenmiş bir durdurma ölçütü sağlanıncaya kadar 2. ve 3. adım tekrar edilir. Testi bitirmek için kullanılan ölçütler ise belirli bir standart hata miktarına altına inilmesi, uygulanacak belirli bir soyu sayısı ya da zaman sınırı olabilir. Soruların puanlanmasında bireye

sorulan soruların zorluk düzeyi etkilidir. Zor soruların puan değeri düşükken, kolay soruların puan değeri daha düşüktür. Aynı sayıda soru cevaplayan bireylerin puanları cevaplandırdıkları soru sayısına göre faklılık gösterir. Bireye uyarlanmış test uygulamasının önemli üstünlükleri şöyle sıralanabilir: i. Testin uygulanma süresini kısaltır, ii. Her öğrenci kendi seviyesine özgü bir test alır, iii. Güvenliği artırır, iv. Test sonuçları anında değerlendirilebilir, v. Test istenildiği an verilebilir, vi. Test kağıdı gereksinimlerini ortadan kaldırır, vii. Madde havuzundan istenmeyen sorunların çıkartılması kolaydır, viii. Test standardizasyonunu genişletir, ix. Test gözetim süresini kısaltır, x. Soru seçiminde esnekliği artırır. Bu üstünlüklerinin yanında bir takım dezavantajlar da mevcuttur: i. Her konu ya da yetenek için uygulanamaz, ii. Bilgisayar donanımındaki sınırlılıkları ve maliyeti sorun olabilir, iii. Bilgisayar korkusu bu tür uygulamalarda sorunlar doğurabilir, iv. Ölçülen yeteneğin tek boyutlu olma şartının genelde sağlanmaması, v. Madde havuzunun büyük olması gerekliliği. (Hambleton & Swaminathan, 1984; Lord & Stocking, 1988; Sands, Waters & McBride, 1997; Rudner, 1998; Çıkrıkçı-Demirtaşlı, 1999) MADDE TEPKİ KURAMI Bilgisayar ortamında bireye uyarlanmış testler için kullanılabilecek en uygun matematiksel kuram Madde Tepki Kuramı dır (Item Response Theory). Bu kuramın en önemli noktası yetenek kestirimlerini uygulanan sorulardan bağımsız olarak vermesidir. Bireyler farklı sorularla test edilseler bile Madde Tepki Kuramı farklı kişilerin yeteneklerinini kestirebilmemiz için standart bir çerçeve sunmaktadır (Hambleton; Swaminathan & Rogers, 1991). Aynı bireye farklı sorular içeren iki farklı test uygulansa bile kestirilen yetenek düzeyi farklı olmaz. Kuramın, her yeteneği açıklayan tek bir faktörün var olması şeklinde bir varsayımı vardır ama böyle bir varsayımın kolay kolay sağlanamayacağı açıktır (mesela bir İngilizce yeterliliğini ele alırsak, tek bir faktörden oluştuğunu söyleyemeyiz, çünkü okuduğunu anlama, kelime bilgisi, dinleme, yazma gibi faktörler içerir). Madde Tepki Kuramı Bir Parametreli, İki parametreleri ve Üç parametreli model adında üç farklı model öne sürmektedir. Bir parametreli model madde güçlüğü parametresi (b i ) ve bireyin yetenek düzeyi arasında ilişki kurmaktadır. İki parametreli modelde madde zorluk parametresinin yanına ayırt edicilik parametresi (belirli bir yetenek düzeyinde sorunun düşük ve yüksek yetenek grubundakileri ayırma gücü a i )

eklenmektedir. Üçüncü modelde ise İki parametreli modele şans faktörü parametresi (düşük yetenek düzeyindeki bireyleri maddeyi doğru yanıtlama olasılığı c i ) eklenmektedir (Hambleton & Swaminathan, 1984). Madde Tepki Kuramı nın üç parametreli lojistik modeli bilgisayar ortamında bireye uyarlanmış test uygulamalarında çoktan seçmeli madde türleri için en uygun olanıdır. Bu modelde her bir soru için üç parametre vardır: a i, b i, ve c i. a i soru ayırt edicilik (belirli bir yetenek düzeyinde sorunun düşük ve yüksek yetenek grubundakileri ayırma gücü) indeksidir, b i soru güçlük derecesini (maddenin en çok bilgi sağladığı yetenek düzeyi) ve c i ise tahmin indeksini temsil etmektedir. Bu parametreler her soru için farklıdır. Bu parametrelere dayanarak hesaplanan sorunun doğru yanıtlanma olasılığının yetenek düzeyine göre örnek bir grafiği aşağıda verilmiştir (madde karakteristik eğrisi / item characteristics curve Şekil 1). Şekil 1. Örnek madde karakteristik eğrisi Bu grafikte x ekseni (theta) yetenek düzeylerini y ekseni (prob) ise sorunun doğru cvevaplanma olasılığını temsil etmektedir. a i grafiğin büküm noktasının (prob=0.5) x eksenini kestiği noktanın eğimidir. a i nin değeri ne kadar büyükse grafik o kadar dik ve dolayısıyla da o kadar ayırt edici olacaktır. b i nin değeri grafiği sola ya da sağa taşıyacaktır (sorunun doğru yanıtlanma olasılığı yetenek düzeyleri için farklılaşacaktır, sola gittikçe soru kolay, sağa gittikçe soru zor demektir). c i grafiğin y eksenini kestiği noktadır ve çok düşük yetenek düzeyindekilerin bu soruyu yapabilme, yani rastgele bir cevap işaretlendiğinde, bu cevabın doğru çıkma olasılığını verır. Değeri yükseldikçe sorunun düşük yetenek düzeyindekiler tarafında çözülme olasılığı artar (Rudner, 1998). Test uygulamasındaki soruların seçimi ve puanlandırılması bu parametrelere göre yapılmaktadır. Madde tepki kuramındaki bir başka önemli grafik ise madde bilgi fonksiyonudur (item information function Şekil 2). Bu grafikte üç sorunun fonkisyonları verilmiştir. Mavi fonksiyon hemen hiçbir bilgi

sağlamazken, sarı ve pempe ayrı yetenek düzeylerinde bilgi sağlayan sorulardır. Bu grafik madde yanıt fonksiyonuna dayanarak belirli bir yetenek düzeyinde en fazla bilgiyi sağlayan soruları göstermektedir. Soru seçiminde bu grafikteki sorulardan genellikle en fazla bilgi sağlayanı seçilir. İyi bir madde havuzunda yüksek a i ve ve düşük c i değelerine sahip soruların bulunması beklenir (Rudner, 1998). Şekil 2 Örnek madde bilgi fonksiyonu Madde Tepki Kuramının zayıf yanları arasında büyük örneklem gruplara ihtiyaç duyması, kuramın karmaşık olması ve sonuçların yorumlanmasının zor olması, özel yazılımlar gerektirmesi, sağlanmalarının klasik test kuramına göre daha zor olduğu bir takım varsayımlar gerektirmesi sayılabilir (Hambleton, Swaminathan & Rogers, 1991; Hambleton & Swaminathan, 1984). Bireyselleştirilmiş testler için Madde Tepki Kuramı dışında başka yöntemler de vardır. Lawrence Rudner bireyleri sınıflandırmak için kullanılmak üzere Ölçüm Karar Kuramı'nı (Measurement Decision Theory) geliştirmiştir. Sequential Probability Ratio Test de bireyleri yetkinliklerine göre sınıflandırmak için kullanılan bir yaklaşımdır (Weiss, 2003). BİREYSELLEŞTİRİLMİŞ TESTLERİN EĞİTİMDE KULLANIMI Bilgisayar ortamında bireyselleştirilmiş testler günümüzde GMAT (Graduate Management Admission Test), GRE (Graduate Record Examination), TOEFL (Test of English as a Foreign Language) uygulamalarında kullanılmaktadır. Bu testlerde bireylere önceden hazırlanmış ve parametreleri bilinen sorulardan oluşan bir havuzdan sorular sorulmaktadır. Her soru bireyin önceki sorulardaki performansına göre belirlenmektedir. Bu testler belirli test merkezlerinde önceden randevu alınarak uygulanmaktadır. GRE'de sayısal (quantitative) ve sözel (verbal) kısımların uygulanması için 58 soru kullanılmakta ve uygulama toplam 75 dakika sürmektedir. TOEFL uygulası ise 165 ila 210 dakika almaktadır, ama bu süreye dinleme ve yazma kısımlarının uygulanması da dahildir. Benzer biçimde GMAT uygulaması da 210 dakika sürmektedir. Bu sınavlar çok daha az soru kullanarak kısa sürelerde ölçtükleri yetenek düzeyi hakkında yüksek güvenilirlik bilgiler sağlamaktadırlar (GRE & TOEFL Resmi web siteleri, 2004). Bilgisayar ortamında bireyselleştirilmiş testlerin kağıt kalem testleriyle geçerlilik ve güvenilirlik konularında karşılaştırılmasını içeren bir çalışmada (McBride & Martin, 1983) şu sonuçlara varılmıştır: bireyselleştirilmiş test kağıt kalem testlerinde kullanılan soru sayısının yarısından az soruyla yüksek seviyede güvenilir sonuçlar vermiş; büyük ölçekli örneklemlerde bireyselleştirilmiş testlerin geçerliliğinin daha iyi olduğu ortaya çıkmıştır. Bu çalışma özet olarak 15 soruluk bireyselleştirilmiş testlerde aynı uzunluktaki kağı kalem testleriyle karşılaştırıldığında güvenilirliği yüksek olan sözel yetenek kestirimleri sağlamaktadır. Yurtdışında bilgisayar ortamında bireyselleştirilmiş test uygulamaları konusunda çok geniş bir literatür bulunmaktadır. Dünyada önde gelen bilgisayar ortamında bireyselleştirilmiş test uygulamaları arasında şunlar sayılabilir (Weiss, 2003): Adaptive Matrices Test (AMT), ASCP (American Society of Clinical Pathologists-Board of Registry Certification Examinations), ASVAB (the Armed Services Vocational Aptitude Test Battery), CAT of

Written English for Spanish Speakers, BULATS (Business Language Testing Service) Computer Test, CATE (Computerized Adaptive Test of English), COMPASS series of tests from ACT, GMAT (Graduate Management Admission Test, GRE (Graduate Record Examination), LPCAT (Learning Potential CAT), MAP (Measures of Academic Progress), Microsoft Certified Professional exams, NAPLEX (North American Pharmacist Licensure Examination), NCLEX (National Council Licensure Examinations) ve STAR Math, Reading, and Early Literacy tests Ülkemizde bireyselleştirilmiş test uygulamaları hakkında yapılmış çalışmalara bakılırsa. İşeri (2002) Ortaöğretim Kurumları Seçme Yerleştirme Sınavı ve Özel Okullar Sınavının matematik kısımlarından oluşturduğu soru bankasını kullanarak matematik başarısının bilgisayar ortamında bireyselleştirilmiş test uygulamasıyla ölçülmesi konusundaki çalışmasında şu sonuçlara varmıştır: bilgisayar ortamında bireyselleştirilmiş testler yetenek düzeyini daha az soru kullanarak güvenilir biçimde ölçmektedir; öğrencilerin cevaplarını kontrol edebilmelerine izin verildiği takdirde, yüksek yetenek düzeyindeki öğrenciler düüşük yetenek düzeyinde olarak kestirildi; Bayesian metodu daha iyi kestirim sağladı ve sabit sayılı durma ve sabit hatalı durma yöntemlerinin her ikisi de iyi sonuçlar sağladı. Kaptan (1993) çalışmasında kağıt kalem testleriyle bilgisayar ortamında bireyselleştirilmiş testleri karşılaştırmıştır. Bu çalışmada geçmiş ÖSS sorularından oluşan bir test geliştirmiş ve uygulamıştır. Bireylere kağıt kalem testindeki 50 soruya karşılık bilgisayar ortamında 14 soru uygulanmıştır. Çalışma sonucunda test uygulama zamanında ve uygulanan soru sayısında belirgin düşüşler ortaya koymuştur. Yetenek kestirimleri arasında anlamlı fark bulunmamıştır. Yıldırım, Çömlekoğlu & Berberoğlu (2003) Özel Okullar Sınavı verilerinin Madde Tepki Kuramı'na uygunluğunu inceledikleri çalışmada tek boyutluluk, yerel bağımsızlık, düşük şans başarısı sayıltılarının sağlandığını ortaya koymuşlar ve Madde Tepki Kuramı'nın söz konusu sınavı değerlendirmek için uygun olduğunu belirtmişlerdir. Bu çalışmalar dışında Berberoğlu (1988); Ertkin (1993); Yenal (1995); Kılıç (1999); Çelik (2001) ve Çalışkan'ın (2000) çalışmaları da bulunmaktadır. Bu çalışmalarda Madde Tepki Kuramı konusu farklı boyutlarıyla (farklı modellerin kullanımları, büyük ölçekli veri kümelerinin farklı modellere uyumu vs.) incelenmiştir. SONUÇ Yukarıdaki çalışmalar genel olarak testlerin bilgisayar ortamında uygulanmasının ve Madde Tepki Kuramı'nın kullanılmasının mümkün olduğunu göstermektedir. Farklı Madde Tepki Kuramı modellerin denenmesi, madde havuzu geliştirilmesi, başlatma ve sonlandırma kuralları seçimi, madde seçimi kuralları, kestirim metotları, geçerlilik ve güvenilirlik konuları, ülkemizdeki büyük ölçekde uygulanan sınavların verilerinin Madde Tepki Kuramı'na uygunluğu, Madde Tepki Kuramı varsayımlarının ihlali durumunda sonuçların ne yönde etkilendiği gibi teknik noktaların yanında bireysel farklılıkların (cinsiyet, sosyoekonomik durum vs.) ve bilgisayar okuryazarlığının performansa etkisi vs. konularında yapılacak ayrıntılı çalışmalar önemli bilgiler sağlayacaktır (Kaptan, 1993; Çıkrıkçı-Demirtaşlı, 1999; İşeri, 2002; Yıldırım, Çömlekoğlu & Berberoğlu, 2003). Ayrıca bu tür büyük ölçekli sınavlar için gerekli olan sistemin geliştirilmesi hakkında bilgisayar donanımının seçimi, uygun bir ağ yapısının oluşturulması, test merkezlerin

seçimi, testleri uygulayanların eğitimi ve uygulama için uygun yazılımın geliştirilmesi gibi konularda da çalışmalar yapılması gerekmektedir (Sands, Waters, McBride, 1997). Bilgisayar ortamında bireye uyarlanmış testlerin kullanımı ve kullanım alanları gün geçtikçe artmaktadır. Günümüzde çoğunlukla yetenek ve başarı ölçümleri için kullanılmakta olsalar da çok daha farklı alanlarda uygulanmaya başlamasının çok uzakta olmadığı söylenebilir. Yeteri kadar araştırma yapıldığı takdirde ülkemizde bilgisayar ortamında bireyselleştirilmiş testlerin üniversite ve lisans üstü giriş ya da dil yeterliliği sınavlarında kullanılması söz konusu olabilir. Bu testlerin uygun şekilde ve mevcut yapı dikkate alınarak uygulanması halinde ülkemizdeki büyük ölçekli sınavlarda başarılı sonuçlar vereceği düşünülmektedir. KAYNAKLAR Berberoğlu, G. (1988). Seçme amacıyla kullanılan testlerd Rasch modelinin katkıları. Yayımlanmamış Doktora Tezi. Hacettepe Üniversitesi, Eğitimde Ölçme ve Değerlendirme Bölümü, Ankara. Çelik, D.(2001). The Fit of One-, Two- and Three-Parameter Models of Item Response Theory to the Ministry of National Education Secondary Education Institutions Student Selection and Placement Test Data. Yayımlanmamış Yüksek Lisans Tezi. ODTÜ, Eğitim Bilimleri Bölümü, Ankara Çalışkan, M. (2000). The Fit of One-, Two- and Three-Parameter Models of Item Response Theory to the Ministry of National Education-Educational Research and Development Directorate's Science Achievement Data. Yayımlanmamış Yüksek Lisans Tezi. ODTÜ, Eğitim Bilimleri Bölümü. Crocker, L, Algina, J. (1986). Introduction to Classical and Modern Test Theory. CBS College, New York Çıkrıkçı-Demirtaşlı, N. (1999). Psikometride Yeni Ufuklar: Bilgisayar Ortamında Bireye Uyarlanmış Test. Türk Psikoloji Bülteni. 5 (13), 31-36 Ertkin, E. (1993). Geleneksel Ölçme Kuramına Alternatif İki Yöntemin Tanıtılması ve Personel Seçimini Yönelik Uygulama Çalışması. Yayımlanmamış Doktora Tezi, İstanbul Üniversitesi, İşletme Fakültesi, İstanbul. GRE Resmi Web Sitesi. (2004). Frequently Asked Questions. [Online]. http://www.gre.org/faq.html#aboutcbt adresinden Nisan 2004 tarihinde alınmıştır. Hambleton, R.K; Swaminathan, H. and Rogers, H. Jane (1991). Fundamentals of Item Response Theory (2nd Ed.) California: Sage Publications, Inc. Hambleton, R.K; Swaminathan, H (1984). Item Response Theory: Principles and Applications. Boston: Kluwer-Nijhoff Publishing. Kaptan, F. (1993). Yetenek Kestiriminde Adaptive (Bireysellestirilmis) Test Uygulamasi ile Geleneksel Kağıt-Kalem Testi Uygulamasının Karşılaştırılması. Hacettpe Üniversitesi, Ankara. Kılıç, İ (1999). The Fit of One-, Two- and Three-Parameter Models of Item Response Theory to the Studetns Selection Test of the Student Selection and Placement Center. Yayımlanmamış Yüksek Lisans Tezi. ODTÜ, Eğitim Bilimleri Bölümü. Iseri, A. I. (2002). Assessment of Students' Mathematics Achievement Through Computer Adaptive Testing Procedures. Middle East Technical University, Ankara. Lord, F. M. (1980) Applications of Item Response Theory to Practical Testing Problems. Hilsdale, N J: Lawrebce Erlbaum Associates.

Muprhy, K. R, Davidshofer, C. O. (1998). Psychological Testing: Principles & Applications (4 th Ed.).Upper Saddle River, N.J. Prentice Hall, USA. Rudner, L. M. (1998). An on-line, Interactive Computer Adaptive Testing Mini Tutorial [Online]. Available: http://edres.org/scripts/cat/catdemo.htm adresinden Ocak 2004 tarihinde alınmıştır. Sands, W. A., Waters, B. K., McBride, J. R (Eds) (1997). Computerized Adaptive Testing: From Inquiry to Oeration. American Psychological Association, USA. TOEFL Resmi Web Sitesi. (2004). FAQs About the Computer-Based TOEFL Test [Online]. http://www.ets.org/toefl/learners/cbt/faq.html adresinden Nisan 2004 tarihinde alınmıştır. van der Linden, W. J. (1995). Advances in Computer Applications. In Thomas Oakland & Ronald, K, Hambleton (Eds), International Perspectives on Academic Assessment. (pp. 105-123). Kluwer Academic Publishes, USA. Weiss, D. J. (Ed.). (1983). New Horizons in Testing: Latent Test Theory and Computerized Adaptive Testing. Academic Press., USA. Weiss, D. J. (2003) CAT Central: A global resource for Computerized Adaptive Testing Research and Applications [Online].http://www.psych.umn.edu/psylabs/CATCentral adresinden Nisan 2004 tarihinde alınmıştır. Yenal, E. (1995). Differential Item Functioning Analysis of the Qunatiative Ability Section of the First Stage of the University Entrance Examination in Turkey. Yayımlanmamış Yüksek Lisans Tezi. ODTÜ, Eğitim Bilimleri Bölümü. Yıldırım, H.H., Çömlekoğlu. G. Berberoğlu, G. (2003). Milli eğitim bakanlığı özel okullar sınavı verilerinin madde tepki kuramı modellerine uyumu. Hacettepe Üniversitesi Eğitim Fakültesi Dergisi. 23: 159-168.