ölçme ve değerlendirme

Benzer belgeler

5. HAFTA PFS 107 EĞİTİMDE ÖLÇME VE DEĞERLENDİRME. Yrd. Doç Dr. Fatma Betül Kurnaz. KBUZEM. Karabük Üniversitesi

DEĞERLENDİRME ARASINDAKİ İLİŞKİLER... 1

EĞĠTĠMDE ÖLÇME ve DEĞERLENDĠRME

KPSS/1-EB-CÖ/ Bir öğretim programında hedefler ve kazanımlara yer verilmesinin en önemli amacı aşağıdakilerden hangisidir?

BÖLÜM 1 ÖLÇME VE DEĞERLENDİRMEDE TEMEL KAVRAMLAR

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Merkezi Yığılma ve Dağılım Ölçüleri

Test Analizi. Test analizi iki şekilde yapılır; 1. Testin tamamı analiz edilir (test analizi), 2. Her bir test maddesi analiz edilir (madde analizi).

Ölçme Araçlarında Bulunması Gereken Nitelikler. Geçerlik. Geçerlik Türleri. Geçerlik. Kapsam Geçerliği

Merkezi Eğilim ve Dağılım Ölçüleri

TEMEL İSTATİSTİK BİLGİSİ. İstatistiksel verileri tasnif etme Verilerin grafiklerle ifade edilmesi Vasat ölçüleri Standart puanlar

ÖLÇME VE DEĞERLENDİRME

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

Medde İstatistikleri, Test İstatiskleri

TEST VE MADDE ANALİZLERİ

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

M d a d dd e A l na i li i z

ÖLÇME VE DEĞERLENDĠRME (3)

EĞĠTĠMDE ÖLÇME VE DEĞERLENDĠRME BÖLÜM V Test ve Madde Ġstatistikleri

ÖLÇME DEĞERLENDİRME ÜNİTE BAŞLIKLARI

EĞİTİM ÖĞRETİM YILI II. DÖNEM ORTAK SINAV TEST VE MADDE İSTATİSTİKLERİ

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

Korelasyon Ölçme aracında bulunması gereken özellikler. Korelasyon katsayısının yorumlanması-1

Testlerin/Sınavların Sınıflandırılması

Ders 5: ÖLÇME VE DEĞERLENDİRME. Prof. Dr. Tevhide Kargın

MADDE VE TEST ANALİZİ. instagram: sevimasiroglu

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

17/01/2015. PowerPoint Template. Dr. S.Nihat ŞAD LOGO. İnönü University. Company Logo

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Merkezi Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Yrd. Doç. Dr. Sedat ŞEN

RECEP TAYYİP ERDOĞAN ÜNİVERSİTESİ YABANCI ÖĞRENCİ SINAVI 2016 RAPORU

Test İstatistikleri AHMET SALİH ŞİMŞEK

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

KPSS-EB-CÖ/ Öğrenciyi merkeze alan sınıf içi öğretim etkinlikleri düzenlenirken aşağıdakilerden öncelikle hangisi dikkate alınmalıdır?

BİLİMSEL ARAŞTIRMA YÖNTEMLERİ

TANIMLAYICI İSTATİSTİKLER

Yrd. Doç. Dr. Sedat ŞEN

Madde güçlük indeksi: Herbir maddenin zorluk derecesini, uygun güçlük düzeyine sahip olup olmadığını gösterir.

Parametrik Olmayan Testler. İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi

A 11. A) Olayın karışık ve anlaşılması zor bir ifadeyle yazılmış. Bu ön koşul işlemiyle ilgili olarak,

İstatistik ve Olasılık

Test İstatistikleri. Test İstatistikleri Madde İstatistikleri Madde Güçlük İndeksi. Madde Ayırt Edicilik İndeksi Madde Varyansı Madde Güvenirliği

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

uzman yaklaşımı ölçme ve değerlendirme Branş Analizi Doç. Dr. Nuri DOĞAN

İ.Ü. Cerrahpaşa Tıp Fakültesi, Çok Disiplinli Ders Kurulları, Sınav Uygulama, Ölçme ve Değerlendirme Esasları

EĞĠTĠMDE ÖLÇME VE DEĞERLENDĠRME BÖLÜM IV Ölçme Sonuçları Üzerinde Ġstatistiksel ĠĢlemler VERİLERİN DÜZENLENMESİ VERİLERİN DÜZENLENMESİ

İÇİNDEKİLER BÖLÜM 1 ÖLÇMENİN TEMEL KAVRAMLARI / 1

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

EĞİTİMDE SÜREÇ VE ÜRÜN ODAKLI DEĞERLENDİRME

MAK 210 SAYISAL ANALİZ

İstatistik ve Olasılık

BİLİMSEL ARAŞTIRMALARDA ÖLÇME ARAÇLARI VE ÖZELLİKLERİ

Ölçme Sonuçları Üzerinde İstatistiksel İşlemler

EĞİTİMDE ÖLÇME VE DEĞERLENDİRME

Korelasyon, Korelasyon Türleri ve Regresyon

Öğrenim Kazanımları Bu programı başarı ile tamamlayan öğrenci;

GİRİŞ. Bilimsel Araştırma: Bilimsel bilgi elde etme süreci olarak tanımlanabilir.

Okullarda Kullanılan Sınavlar ve Özellikleri

Projenin Adı: İstatistik yardımıyla YGS ye hazırlık için soru çözme planlaması

Ortalamaların karşılaştırılması

EĞİTİM ÖĞRETİM YILI I. DÖNEM ORTAK SINAVI TEST VE MADDE İSTATİSTİKLERİ

Yrd.Doç.Dr.Ahmet HAKYEMEZ (Bu sunum Yrd. Doç. Dr. Serap EMİR ve Doç. Dr. Sevinç HATİPOĞLU nun sunumlarına dayanılarak hazırlanmıştır)

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

İstatistik Temel Kavramlar- Devam

Verilerin Özetlenmesinde Kullanılan Sayısal Yöntemler

Sınav ve Başarı Değerlendirme Yönergesi

EĞİTİMDE ÖLÇME VE DEĞERLENDİRME UĞUR YILMAZER 1

Prof.Dr.İhsan HALİFEOĞLU

uzman yaklaşımı ölçme ve değerlendirme Branş Analizi Doç. Dr. Nuri DOĞAN

Pedagojik Formasyon Eğitimi ÖLÇME VE DEĞERLENDİRME

İLKÖĞRETİM ÖĞRENCİLERİNİN MÜZİK DERSİNE İLİŞKİN TUTUMLARI

Pedagojik Formasyon Eğitimi

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

BÖLÜM 14 BİLGİSAYAR UYGULAMALARI - 3 (ORTALAMALARIN KARŞILAŞTIRILMASI)

ÖÖY II Yrd.Doç.Dr.M.Betül YILMAZ

VERİ SETİNE GENEL BAKIŞ

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

VERİ KÜMELERİNİ BETİMLEME

Veri nedir? Bir öğrenci kümesine uygulanan bir sınavdan elde edilen puanların herhangi bir işlem yapılmamış haline ham veri denir (ham puanlar) denir.

EĞİTİMDE KULLANILAN ÖLÇME ARAÇ VE YÖNTEMLERİ

Mühendislikte İstatistiksel Yöntemler

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

KONU2 MERKEZİ EĞİLİM ÖLÇÜLERİ EĞİLİM ÖLÇÜLERİ ANALİTİK ORTALAMALAR ANALİTİK OLMAYAN MERKEZİ. Aritmetik ortalama **Medyan(median)

Öğrenim Kazanımları Bu programı başarı ile tamamlayan öğrenci;

ÖLÇME VE DEĞERLENDİRME

NİCEL (Quantitative) VERİ TOPLAMA ARAÇLARI

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

Prof.Dr.İhsan HALİFEOĞLU

İÇİNDEKİLER ÖN SÖZ...

BÖLÜM 10 PUAN DÖNÜŞÜMLERİ

Ölçme ve Değerlendirmenin. Eğitim Sistemi Açısından. Ölçme ve Değerlendirme. TESOY-Hafta Yrd. Doç. Dr.

BİYOİSTATİSTİK Merkezi Eğilim ve Değişim Ölçüleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

6. Staja Giriş Sınavı

7. HAFTA. Verilerin düzenlenmesi Verilerin gruplandırılması Merkezi eğilim ölçüleri Merkezi dağılım ölçüleri Standart puanlar. Yrd. Doç. Dr.

Olasılık ve Normal Dağılım

Bölüm 3. Tanımlayıcı İstatistikler

Transkript:

ÖLÇME VE DEĞERLENDİRME SORU KAMPI YANIT ANAHTARI adım 1 adım 2 adım 3 adım 4 adım 5 adım 6 1. C 1. A 1. E 1. C 1. C 1. B 2. C 2. C 2. C 2. B 2. A 2. A 3. B 3. B 3. B 3. D 3. D 3. D 4. C 4. B 4. C 4. A 4. A 4. A 5. D 5. C 5. A 5. A 5. C 5. A 6. B 6. E 6. D 6. B 6. A 6. E 7. C 7. D 7. E 7. C 7. B 7. D 8. C 8. C 8. B 8. D 8. B 8. A 9. E 9. C 9. E 9. A 9. A 9. D 10. E 10. A 10. C 10. C 10. C 10. A 11. D 11. C 11. E 11. A 11. C 11. B 12. C 12. A 12. D 12. A 12. D 12. E 13. E 13. E 13. B 13. A 13. E 13. D 14. C 14. E 14. D 14. B 14. C 14. A 15. D 15. C 15. A 15. C 15. C 15. B 16. A 16. B 16. B 16. B 16. D 16. D 17. C 17. D 17. A 17. C 17. E 17. D 18. D 18. C 18. D 18. C 18. D 18. B 19. C 19. D 19. B 19. B 19. B 19. D 20. E 20. A 20. B 20. C 20. D 20. A Tekrar Edilmesi Gereken Konular 1

ölçme ve değerlendirme adım 1 1. Değerlendirme ölçme sonuçlarının bir ölçütle karşılaştırılarak bir karara/yargıya varma sürecidir. Demek ki değerlendirme yapmak için hem ölçme hem de ölçüte ihtiyaç vardır. Bu durumda A, B ve D seçeneğinde verilen ifadeler doğrudur. Ölçme sürecinde değişkenlerin gözlenip gözlem sonuçlarının sayı veya sembollerle ifade edilmesi söz konusudur. Bu tanıma göre E seçeneğinde verilen ölçme işleminin değerlendirmeye göre nispeten daha nesnel olduğu ifadesi de doğrudur. Çünkü ölçme bir gözlem sonucu iken değerlendirme bu sonucun yorumlanması sürecidir. C seçeneğinde verilen ölçme sonucunun doğru olabilmesi için uygun ölçütler kullanılması gerektiği ifadesi ise yanlıştır. Çünkü ölçüt değerlendirme sürecinde kullanılmaktadır. Dolayısıyla ölçme sürecini etkilemez. 2. Deneysel araştırmalarda bir değişkenin diğer değişken üzerindeki etkisine bakılır. Deneyde etkisi araştırılan yani neden konumunda olan değişkenler bağımsız değişken olarak adlandırılırken sonuç konumunda olan değişkenler ise bağımlı değişkendir. Soru kökünde verilen araştırmada öğretmen tutumunun öz güven düzeyine etkisi 2 araştırılmaktadır. Bir araştırmada sonuç konumunda olan, etkilenen konumunda olan bağımlı değişken olduğuna göre, soruda verilen araştırmada öz güven bağımlı değişkendir. Çünkü öz güven öğretmen tutumundan etkilenmektedir ve sonuç konumundadır. 3. Eğer bir değişken iki değeri arasında başka değerler alabiliyorsa ya da kesirli olarak ifade edilebiliyorsa sürekli değişkendir. Öğrencilerin aylık geliri sürekli değişkendir çünkü iki değer arası sınırsız küçüklükte ölçülebilir ve bu nedenle kesirli olarak ifade edilebilmektedir. Kursa devam eden öğrenci sayısı süreksiz değişkendir. Çünkü sadece 1,2 gibi tam sayı değerleri alır, ara değerler alamaz. Öğrencilerin branşı da sürekli değişkendir çünkü sadece kategorik değerler alabilir. Bu durumda sadece III nolu öncülde verilen sürekli değişkene örnek olur. 4. Bir değişken sayısal değerler alıyorsa nicel değişkendir. Öğrencilerin aylık geliri ve kursa devam eden öğrenci sayısı nicel değişkenlerdir. Öğrencilerin branşı nitel bir değişkendir çünkü sadece kategorik değerler alabilir, sayısal olarak ifade edilemez. 5. Ölçütüne göre iki tür değerlendirme vardır: Mutlak ve bağıl değerlendirme. Bağıl değerlendirme yapılırken bağıl ölçütler kullanılır. Bağıl ölçüt, ölçme işleminden sonra gruba veya ölçme sonuçlarına bağlı olarak ortaya çıkmaktadır. Buna göre Sınavda ilk üçe giren öğrencilere kitap hediye edilmesi, Sınavda en düşük puanı alan öğrenciye ceza verilmesi, Sınıfın genel başarı düzeyi altında kalanların başarısız sayılması ve Grubun %50 sinden daha iyi olanların başarılı sayılması bağıl ölçüte örnektir. Çünkü bu örneklerdeki koşulu sağlamak için kaç alınması gerektiği belli değildir. Mutlak değerlendirme yapılırken mutlak ölçütler kullanılır. Mutlak ölçütte ise sınır ölçme işleminden önce kesin olarak bellidir. D seçeneğinde verilen Soruların %50 sini doğru yapanların geçer not alması mutlak ölçüte örnektir çünkü kaç soru yapılması gerektiği (%50) kesin olarak bellidir.

6. Güvenirlik bir ölçme aracının hatalardan özellikle de tesadüfi hatalardan arınık olarak ölçme yapma derecesi olarak tanımlanmaktadır. İç tutarlılık, kararlılık, objektifl ik ve duyarlılık güvenirlik göstergeleri olarak kabul edilir. A ve D seçeneğinde verilen çalışmalar testin iç tutarlılığı dolayısıyla güvenirliği hakkında bilgi verir. C seçeneğinde verilen çalışmanın ise test-tekrar test yöntemi olduğu görülür ki bu yöntemle testin kararlı olup olmadığı yani güvenirliği ortaya konur. E seçeneğinde verilen çalışmada farklı puanlayıcıların puanlarının ne kadar yakın olduğu araştırılmaktadır. Puanlar birbirine ne kadar yakınsa test o kadar objektiftir, bu da testin güvenirliğinin yüksek olduğunu gösterir. B seçeneğindeki Aynı özelliği ölçen önceden geliştirilmiş geçerli testlerle korelasyona bakmak ise güvenirlik değil, geçerlik hakkında bilgi verir. 7. KR-20 katsayısı testin içindeki soruların birbiriyle tutarlı olduğunu gösterir. Bu durum testin güvenirliğinin yüksek olduğu şeklinde yorumlanır. Eğer testte bazı önemli konulardan soru olmadığı saptandıysa test kapsamı iyi bir şekilde örnekleyemiyor demektir. Bu durumda testin kapsam geçerliği düşüktür dolayısıyla testin geçerliğinin düşük olacağı söylenebilir. 8. Düzey belirlemek amacıyla yapılacak olan bir başarı testi ilgili konu alanındaki hedef davranışları yeterince içermelidir. Her testte olduğu gibi bu tip testlerde iç tutarlılık, kararlılık, yapı geçerliği gibi özellikler aranır ancak öncelikle kapsam geçerliği sağlanmalıdır. Çünkü eğer testin kapsamı yeterli olmazsa diğer bütün özellikleri iyi olsa da bilgi düzeylerini açığa çıkarmada yetersiz kalacaktır. Bu nedenle böyle testler hazırlanırken öncelikle hangi hedef davranışların yoklanacağı belirlenir yani kapsam geçerliği sağlanır. 9. Testin güvenirliğini belirlemek için çeşitli yöntemler kullanılır. Bunlardan test-tekrar test yönteminden elde edilen katsayı kararlılık katsayısı olup iç tutarlılık hakkında bilgi vermez. Paralel formlar yöntemi kullanıldığında elde edilen katsayı ise eşdeğerlik katsayısıdır. Paralel form yöntemi kullanılan paralel formların tutarlılığı hakkında bilgi verir ama iç tutarlılığı göstermez. İç tutarlılık testin içindeki soruların birbiriyle uyumlu olmasıdır. Eğer bir testin iç tutarlılığı hakkında bilgi edinmek isteniyorsa yarıya bölme, KR veya Alfa yöntemleri kullanılır. Burada önemli nokta soru kökünde olduğu gibi likert tipi ölçekler söz konusuysa yani testin içindeki sorular dereceli puanlanıyorsa KR yönteminin kullanılamayacağını hatırlamaktır. Çünkü soruların dereceli puanladığı başarı testlerinde KR yöntemi kullanılmaz, yarıya bölme ve alfa yöntemleri kullanılır. 10. Tabloda dört farklı dersten elde edilen puanlar arasındaki korelasyonları gösteren korelasyon matrisi verilmiştir. Korelasyon iki değişken arasındaki ilişkinin yönünü ve miktarını gösteren bir istatistiktir. Tablo incelendiğinde sıfıra en yakın katsayının ölçme ve gelişim puanları arasında olduğu görülmektedir. Bu durumda B seçeneğinde verilen En düşük ilişki ölçme ve değerlendirme ve gelişim dersleri arasındadır. ifadesi doğrudur. Öğrenme puanları yükseldikçe gelişim puanları da yükselmektedir çünkü aralarındaki korelasyon katsayısı 0.84 dür. Aynı zamanda bu katsayı tablodaki en yüksek pozitif ilişkiyi göstermektedir. Bu durumda E seçeneğindeki ifade yanlıştır. Ölçme ve değerlendirme ve öğrenme dersleri arasındaki korelasyon 0.25 tir demek ki aralarında benzerlik vardır (A seçeneği doğrudur). Ölçme dersinin en yüksek korelasyonu gösterdiği ders ÖYT dir. Dolayısıyla D seçeneği de doğrudur. 3

11. Boşluk doldurma tipi sorularda verilen bir cümle veya paragrafın içinden bir veya birkaç kelime çekilir ve öğrencinin boşluğa uygun kelimeyi, tarihi vs. yazması istenir. Uygulanması ve puanlaması kolaydır. Puanlaması subjektif ve zaman alıcıdır., Cevaplaması zaman aldığından çok soru sorulamaz., Kalabalık gruplarda uygulaması uzun sürer. ifadeleri bu tip testlerin özelliklerine uygun değildir. Dolayısıyla B, C ve E seçenekleri doğru değildir. Bu tip sorularda cevabı öğrenci düşünüp verdiğinden yani seçenek bulunmadığından şans başarısının da olmadığı kabul edilir. Bu nedenle A seçeneğinde söylendiği gibi Şans başarısı güvenirliğin düşmesine neden olur. gibi bir olumsuzluğu yoktur. Bu tip sorularla özellikle bilgi ve kavrama düzeyinde davranışlar rahatlıkla yoklanır ancak sentez, değerlendirme gibi davranışlar yoklanamaz dolayısıyla bu madde tipi tüm bilişsel davranışları yoklamaya imkân vermez. 12. Sözlü yoklamalar bilişsel alanın her düzeyini yoklamaya uygundur. Bu nedenle özellikle sentez, değerlendirme gibi üstü düzey davranışlar yoklanmak istendiğinde seçme gerektiren testler yerine tercih edilir. Oysa C seçeneğinde verilen Bir kavrama yeni örnek verme davranışını yoklamak için çoktan seçmeli test de kullanılabilir. Çoktan seçmeli testlerde öğrencinin gidiş yolu tahmin edilse bile nerde hata yaptığı, hangi zihinsel işlemleri 4 yaptığı tam olarak görülemez. Bu nedenle gidiş yolu veya zihinsel işlemler görülmek istendiğinde sözlü yoklama kullanılabilir. Gidiş yolunu görmenin bir faydası da verilen cevabın her parçasını ayrı ayrı puanlayabilmektir. Çoktan seçmeli testte ise sadece cevap doğru ise puan alınabilir. Ayrıca sözlü yoklama kullanıldığında hemen dönüt verilmesi de mümkündür. 13. Rubrikler performansın veya ürünün değerlendirilmesi sürecinde puanlamanın objektifl iği arttırmak ve bir standart sağlamak için kullanılan derecelendirilmiş puanlama yönergeleridir. Ürün veya performansı oluşturan parçaları puanlamayı sağlayan rubrikler puanlamanın neye göre yapılacağını gösteren puanlama kriterleri içerir. Rubrikler hazırlanırken hedefl er ve öğrencinin gelişim düzeyi dikkate alınarak açık ve net puanlama kriterleri belirlemek gerekir. Böylece objektif ve doğru puanlamalar yapılabilir. E seçeneğinde verilen Puanlama kriterlerine bağlı kalarak puanlama yapmak ise rubriklerin hazırlama aşaması ile ilgili değildir. 14. Yapılandırılmış grid tekniğinde bireylere 8, 12 veya 16 kutucuk içinde soruların cevapları verilir. Bireyler sorulan bir dizi sorunun cevabını kutucukları seçerek bulmaya çalışırlar. Seçme gerektiren bir teknik olduğundan kavrama düzeyinde davranışlar yoklamaya uygundur. Puanlaması objektiftir ve düşük kademelerde de kullanılabilir. A, B, D ve E seçenekleri doğrudur. Ancak C seçeneğinde söylendiği gibi düzeltme formülü uygulanamaz. 15. Bir test maddesinin güvenirliğe katkısının yüksek olması için ayırt ediciliğinin yüksek olması ve orta güçlükte olması gerekir. Tablo incelendiğinde 4 ve 5 nolu soruların orta güçlükte olduğu görülür. Bunlardan 5 nolu maddenin ayırt ediciliği düşükken 4 nolu maddeninki yüksektir. Bu durumda hem ayırt edici olan hem de orta güçlükte olan 4 nolu maddenin güvenirliğe katkısı en yüksek maddedir. 16. Üst düzey öğrenciler seçilmek istendiğinde zor maddelerin kullanılması gerekir. Tablo incelendiğinde 1 ve 3 nolu soruların zor olduğu görülür. Bunlardan 3 nolu maddenin ayırt ediciliği düşükken 1 nolu maddeninki yüksektir. Bu durumda hem ayırt edici olan hem de zor olan 1 nolu madde üst düzey öğrencileri seçmek için en uygun madde olacaktır.

17. Puan frekans dağılımı incelendiğinde aritmetik ortalama, mod ve medyan değerinin eşit olduğu görülmektedir. Üç merkezî eğilim ölçüsünün birbirine eşit olduğu puan dağılımları simetrik özellik gösterir. Seçenekler incelendiğinde hem C hem de D seçeneğinde verilen dağılımların simetrik, D seçeneğindeki dağılımın ranjının oldukça dar ve C seçeneğindeki dağılımın ranjının ise geniş olduğu görülür. Tabloda verilen dağılım, ranjı geniş olan C seçeneğine benzemektedir. 18. Ranj = En büyük puan En düşük puan formülü ile hesaplanır. Tabloda puan aralıkları verildiğinden istatistiksel hesaplamalar yapılırken puan aralıklarının orta değeri kullanılır. Puan Aralığı Orta Değer 1-7 4 8-14 11 15-21 18 22-28 25 29-35 32 Ranj = 32 4 = 28 19. Madde güçlük katsayısı (pj) = Doğru cevaplayan birey sayısı / N Sorunun güçlüğü pj = 0,80 olarak hesaplanmıştır. Soruyu doğru cevaplayanların sayısı 48 olduğuna göre 48 / N = 0,80 olmalıdır. Bu eşitlikten hareketle N = 60 olarak hesaplanır. 20. Bir dağılımda yüksek puanlar etrafında bir yığılma varsa ve çok küçük puanlar da gözlenmişse sola çarpık (negatif kayışlı) bir dağılım ortaya çıkacaktır. Bu tip dağılımlarda mod değerinin aritmetik ortalamadan yüksek olması beklenir. Genel eğilimin tersine alınan uç puanlar aritmetik ortalamanın çarpılmasına neden olur ve bu durumda dağılımı yorumlarken medyanı da mutlaka kullanmak gerekmektedir. Bu açıklamalara göre A, B, C ve D seçenekleri doğrudur. E seçeneğinde verilen Dağılımın ranjı küçük bir değer çıkar. ifadesi ise doğru olamaz çünkü dağılımda hem yüksek hem de çok düşük puanlar olduğu söylenmektedir. Çok düşük ve çok yüksek puanlar olduğunda ranj büyük çıkar. ölçme ve değerlendirme adım 2 1. Ölçme sürecinde değişkenlerin gözlenip gözlem sonuçlarının sayı veya sembollerle ifade edilmesi söz konusudur. Bir ürünün puanlanması ve ürünün hangi özelliğine kaç puan verileceğinin belirlenmesi ölçme süreci içinde yer alır. Bu durumda I ve II nolu öncüllerde verilenler ölçme süreci içinde yer aldığından ölçme sonucuna karışan hatalar üzerinde etkilidir. Dersten geçmek için kaç puanın yeterli olacağının belirlenmesi ise ölçüt olup ölçme sürecinden bağımsızdır. Ölçüt, değerlendirme sürecinde kullanılmaktadır. Hangi öğrencilerin geçtiğinin belirlenmesi ise değerlendirme olup ölçme sürecinden sonra yapılır. Bu durumda III ve IV nolu öncüllerde verilenler ölçme süreci dışında yer aldığından ölçme sonucuna karışan hatalar üzerinde etkili değildir. 2. Ölçüt, değerlendirme sonucunda verilecek yargılara ve kararlara dayanak oluşturan koşullar veya sınır değerlerdir. Bu durumda I ve IV nolu öncüllerde verilen;...ilk üçe girenler ödül alacaktır. ve...yüksek lisans mezunu olmak gerekmektedir. ifadeleri birer değerlendirme ölçütü olarak kabul edilebilir. Ölçme yaparken kullanılan kurallar yani ölçülen özelliğin sayı ve sembollere nasıl dönüştürüleceğini gösteren kurallar ölçme kuralı olarak 5

adlandırılır. II nolu öncüldeki Soruların en az dört tanesine doğru cevap veremeyenler sıfır puan alacaktır. ifadesi ve III nolu öncüldeki Hazırladığı resimli albüme isim veremeyenlerden 5 puan kırılacaktır. ifadeleri ölçme yaparken kullanılan ölçme kurallarıdır. 3. Mutlak ölçütler ölçme işlemi yapılmadan önce, ölçme işleminin yapıldığı gruptan bağımsız, kesin olarak belirlenmiş olan ölçüttür. Mutlak değerlendirme ölçütleri sınavdan önce kesin olarak bellidir ve mutlak değerlendirmede bireyin başarısı diğerlerinden etkilenmez. Öğrencilerin hazırbulunuşlukları belirlenirken önceden belirlenmiş kesin sınırlar yani mutlak ölçütler kullanılmalıdır. Çünkü bireyin bir alanda hazırbulunuşluluğunun yeterli olması için ön koşul yeterliliklere sahip olması gerekir ve ön koşul yeterliliklerin neler olduğu bellidir. Öğrenme eksikliklerinin belirlenip dönüt verilmesi, hedefl ere ulaşma düzeyinin yeterli olup olmadığının belirlenmesi ve bir alanda uzmanlık verilip verilmeyeceğine karar verilmesi durumlarında da mutlak ölçüt kullanmak uygundur. Çünkü bu durumlarda bireyin belli sayıda hedefe ulaşması gerekmektedir. Bu durumda A, C, D ve E seçeneklerindeki durumlarda mutlak ölçüt kullanmak duygundur. B seçeneğinde verilen öğrencilerin yeteneklerine uygun programlara yerleştirilmesi durumunda çoğunlukla fazla sayıda yeterli birey başvuru yapar. Böyle durumlarda bağıl ölçüt kullanmak doğru olur. 6 4. Aritmetik ortalama, standart sapma gibi istatistikleri hesaplayabilmek için elde edilen verilerin nicel yani sayısal büyüklük gösteren cinsten olması gerekir. Aralık ve oran ölçeklerinden elde edilen veriler bu türdendir. Sıralama ve sınıflama ölçeğinden elde edilen veriler ise nicel değildir. Bu nedenle aralık ve oran ölçeklerinden elde edilen verilerle tüm istatistikler hesaplanabilir. 5. Ölçme işlemi yapılmadan önce, ölçme işleminin yapıldığı gruptan bağımsız, kesin olarak belirlenmiş olan ölçütler mutlak ölçüttür. İhaleye katılabilmek için en az 40 kamyona sahip olmak gerekir. ve Her bir kamyonun en az 5 tonluk taşıma kapasitesi olması gerekir. dendiğinde kesin olarak belirlenmiş ve ölçme sonucuna göre değişmeyecek mutlak ölçütler kullanılmaktadır. En düşük teklifi veren fi rma ihaleyi alacaktır. dendiğinde ise kaç liralık teklif vermek gerektiği yapılacak sıralamadan sonra belli olacaktır. Dolayısıyla bu ifade bağıl ölçüte örnektir. I ve II nolu öncüllerde verilenler ise mutlak ölçüttür. 6. Cronbach alfa katsayısı dereceli puanlanan ölçeklerde testin iç tutarlılığını ortaya koymak için hesaplanan bir güvenirlik katsayısıdır. Güvenirliği yüksek bir testin alfa katsayısının 1 e yakın ve yüksek olması testin iç tutarlılığının yüksek olduğu, soruların birbiriyle uyumlu olduğu, test puanlarına az hata karıştığı, ölçülen özelliğin tek boyutlu olduğu vb. şeklinde yorumlanır. Soru kökünde verilen testin alfa katsayısı 0,25 olup oldukça düşüktür. Bu durum soruların uyumlu olmadığı ve test puanlarına çok hata karıştığı şeklinde yorumlanır. Soruların ayırt edici olmaması ve testle ölçülen özelliğin çok boyutlu olması soruların uyumunu azaltan faktörlerdir. Testi alan bireylerin güdülenme düzeylerinin ve testin uygulandığı ortamda dikkat dağıtıcı unsurların bulunması da hataları arttırır. Dolayısıyla A, B, C ve D seçeneklerinde verilenler katsayının düşmesine neden olmuş olabilir. E seçeneğinde verilen Maddelerin çoğunun zorluk düzeyinin yüksek olması ise doğru cevabın bulunması istenen başarı, yetenek vs. gibi testlerde hata kaynağı olup bir ilgi testi için hata kaynağı değildir.

7. Öğretmenin puanlama yaparken öğrenciyle ilgili daha önceki olumlu veya olumsuz fi kirlerinden etkilenmesi puanlamaya yanlılık karışmasına yol açar. Puanlamadan gelen yanlılıklar sistematik hata olarak kabul edilir. Dolayısıyla I nolu öncülde verilen öğrencilerin isimlerinin kapatılması durumunda tesadüfi değil, sistematik hatalar önlenir. Diğer öncüllerde verilen Bir başka öğretmene daha puanlatma ve Önce birinci sonra ikinci soruların tamamını okuma işlemleri ise tesadüfi hataların azalmasını sağlayabilir. 9. Puanlara karışan hatalar üç tiptir: Sabit, sistematik ve tesadüfi. Sabit hatalar tüm ölçme sonuçlarına aynı miktarda karışır. A seçeneğinde verilen Bir sorunun iptal edilip o soru için herkese tam puan verilmesi sabit hataya örnektir. Tesadüfi hata sonuçlara ne yönde ne miktarda karışacağı kestirilemeyen hatalardır. B, D ve E seçeneklerinde verilen Kökü iyi anlaşılmayan bir sorunun kimi öğrenciler tarafından yanlış cevaplanması, Kimi öğrencilerin doğru cevap vermelerine rağmen yanlış kodlamaları ve Öğretmenin sınav kâğıtlarını puanlarken toplama hatası yapması tesadüfi hatalardır. Sistematik hatalar ise bir kısmına belli bir yönde karışan yanlılık türü hatalardır. Buna göre C seçeneğinde verilen Soruların bazılarının kitaptaki soruların aynısı olması sistematik hataya yol açacaktır. Çünkü bu soruyu önceden bilenlere yanlı puanlama yapılmış olacaktır. 10. Yapı geçerliği bir testteki soruların testle ölçülmek istenen psikolojik yapıyı (özelliği) açığa çıkartabilmesidir. Eğer bir testin içindeki sorular ölçülmek istenen özellik dışında özellikler gerektiriyorsa yapı geçerliği düşük olur. Eğer A seçeneğinde söylendiği gibi Farklı saldırganlık düzeylerinde olan bireyleri birbirinden ayırabiliyorsa yapı geçerliği için kanıt olur çünkü bu durumda test ilgili özelliği açığa çıkartıyor demektir. Testin tekrar uygulandığında da benzer sonuçları vermesi kararlılık, test puanlarına dayanarak hesaplanan alfa katsayısının yüksek çıkması iç tutarlılık, testin puanlamasının objektif olması genel olarak güvenirlik hakkında bilgi verir ancak geçerlik için kanıt sunamaz. Psikologların soru sayısının yeterli olduğunu söylemeleri de yapı geçerliğinin kanıtı olarak kullanılamaz. 8. Testin iki yarısının korelasyonundan elde edilen katsayıdan hareketle tamamının güvenirliği hesaplanmak istendiğinde aşağıdaki formül kullanılır; 2r / (1 +r) Buna göre yarılar arası korelasyon 0.50 ise tamamının güvenirliği = 2 x 0,50 / (1 +0.50) = 0.66 olarak hesaplanır. 7

11. Portfolyolar öğrencilerin dönem içinde ortaya koymuş oldukları çeşitli ürünleri, öğrencilerin öz değerlendirme ve akran değerlendirme formlarını içeren ve öğrencinin ders boyunca gösterdiği gelişimi görmeyi sağlayan bireysel ürün dosyalarıdır. Bu nedenle öğrencilerde sorumluluk duygusunun gelişmesini sağlaması; öğrencilerin bilişsel, duyuşsal ve psikomotor özelliklerini bir arada ölçmeye imkân vermesi; sonuç değil, süreç odaklı değerlendirmeye olanak tanıması ve öğrenme ve ölçme süreçlerini birleştirmesi portfolyonun üstün yanları olarak görülebilir. Ancak puanlamanın objektifliği düşünüldüğünde çoktan seçmeli testler portfolyolara üstündür. Çünkü portfolyolar tamamen objektif puanlanamazlar. 12. Her ikisinde de öğrenci cevabı kendisi bulup verdiğinden yani seçenek olmadığından şans başarısı yoktur. Yazılı yoklamada açık uçlu cevaplar verildiğinden puanlarken puanlayıcının görüşü etki eder dolayısıyla puanlaması oldukça subjektiftir. Kısa cevaplı testlerde ise cevap daha net olduğundan kısmen objektif puanlanabilir. Yazılı yoklama ancak okuma-yazma öğrendikten sonra uygulanabilir. Bu durumda II, III ve IV nolu öncüllerde ve- 8 rilenler yazılı yoklamaların üstünlüğü olarak görülemezler. Yazılı yoklamalarla üst düzey bilişsel davranışlar yoklanabilirken kısa cevaplı sorularla sentez, değerlendirme gibi üst düzey davranışlar yoklanamaz. I nolu öncülde verilen durum yazılının üstün yanı olarak görülebilir. 14. Bir test hazırlanırken sırasıyla yapılması gerekenler aşağıdaki gibi özetlenebilir: 1. Testin amacı belirlenir. 2. Testle ölçülecek özellik belirlenir. 3. Belirtke tablosu hazırlanır. 4. Madde tipi belirlenir. 5. Maddeler yazılır. 6. Maddeler gözden geçirilir. 7. Test formu hâline getirilir. 8. Uygulama yapılır. 9. Puanlar hesaplanır. 10. Madde ve test istatistikleri hesaplanır. 11. sınıf fi zik dersinde öğretilen davranışları yoklamaya karar veren öğretmen testle ölçülecek özelliği belirlemiştir. Bu aşamadan sonra yapması gereken belirtke tablosu hazırlamaktır. 13. Çoktan seçmeli sorular objektif puanlanmaktadır. Dolayısıyla sözlü yoklama tercih etmenin nedeni III nolu öncülde söylendiği gibi Puanlamasının objektif olması olamaz. Çoktan seçmeli testlerle bilgi, kavrama, uygulama, analiz rahatlıkla yoklanabilirken sentez ve değerlendirme yoklanamaz; şans başarısı vardır ve okuma bilen gruplarda uygulamak daha doğru olur. Sözlü yoklamalar ise her yaşta uygun olup şans başarısı içermeden her düzeyde davranış yoklanabilir. Buna göre I, II ve IV nolu öncüllerde verilenler sözlü yoklama tercih etmenin nedeni olabilir. 15. Kaliteli bir sorunun bilenler tarafından doğru bilmeyenler tarafından yanlış cevaplanması beklenir. İyi bir sorunun doğru cevabını daha çok üst gruptakiler, çeldiricileri ise daha çok alt gruptakiler yani bilmeyenler işaretlerse sorunun beklenen yönde çalıştığı kabul edilir. Tablo incelendiğinde çeldirici olan C seçeneğinin beklenenin tersine daha çok üst grubu çektiği görülmektedir. C seçeneğine üst gruptan 17 alt gruptan 15 kişi gitmiştir. Oysa kaliteli bir çeldirici bilmeyenleri yani alt grubu daha çok çekmelidir. Bu nedenle C seçeneği ters yönde çalışmaktadır denilebilir.

16. Güçlük = (30+10)/160 = 0,25 zor bir maddedir. Buna göre B seçeneği yanlıştır. Ayırt edicilik = (30-10)/80 = 0,25 olup mutlaka düzeltilmesi gerekmektedir. A seçeneği hem üst hem alt gruptan 15 er adayı çekmiştir ve bireyleri ayıramamıştır. İyi çeldirici alt grubu daha çok çekmelidir. Çeldiriciler incelendiğinde D seçeneğinde alt gruptan işaretleyenler ile üst gruptan işaretleyenlerin farkının (22-9) diğer seçeneklerden daha yüksek olduğu görülmektedir. Buna göre en kaliteli çeldirici olduğu söylenebilir. Toplam 27 kişiyi çeken B seçeneği diğerlerine göre en zayıf çeldiricidir. Bu bilgilere göre A, C, D ve E seçeklerinde verilenler doğrudur. İncelendiğinde İngilizce testindeki Z puanının en düşük olduğu görülür dolayısıyla A seçeneği doğrudur. Türkçe Z = 0 T = 10 x Z +50; T = 50 +10 x 0 = 50. B seçeneği doğrudur. Matematik Z = +1. C seçeneği doğrudur. Coğrafya Z puanı = +1 Türkçe Z = 0 Coğrafyada gruba göre daha başarılı. E seçeneği doğrudur. Bireyin mutlak başarısı (Doğru sayısı/soru sayısı) x 100 şeklinde hesaplanır. Tarih 60 Coğrafya 75 Türkçe 40 İngilizce 62,5 Matematik 84 19. Tablo incelendiğinde Türkçe testinde dağılımın simetrik olduğu görülür. Buna göre Türkçe testinde grubun yarısı ortalamayı geçerken yarısı ortalamanın altında kalır. Tarih, matematik ve fi zik derslerinde ise sağa çarpık bir dağılım ortaya çıkmıştır. Sağa çarpık dağılımlarda bireylerin yarısından çoğu ortalamanın altında puan alır. Kimya testinde ise sola çarpık bir dağılım gözlenmiştir. Bu durumda Kimya testinde bireyleri yarısından çoğu ortalamanın üzerinde puan alırlar. 84 olan matematik dersindeki mutlak başarı en yüksektir. D seçeneği yanlıştır. 17. Bireyin mutlak başarısı (Doğru sayısı/ Soru sayısı) x 100 şeklinde hesaplanır. Gruba göre başarı değerlendirilirken Z puanına bakılır. Z puanları; Tarih 2,5 Coğrafya 1 Türkçe 0 İngilizce -2 Matematik 1 18. Ortalama güçlük = Aritmetik ortalama / Soru sayısı Bu formül uygulandığında Tarih 25/50 0,50 Coğrafya 12/20 0,60 Türkçe 16/40 0,40 İngilizce 60/80 0,75 Matematik 40/50 0,80 olarak bulunur. En düşük ortalama güçlük değeri Türkçe testininkidir. 20. Bir testin ortalama güçlüğü arit. ort. / soru sayısı formülü ile hesaplanır. Bu formülden elde edilen sonuç küçüldükçe test zorlaşıyor demektir. Tabloda verilen testlerin hepsi 100 soruluk olduğuna göre ortalaması en küçük olan Türkçe testi bireylere en zor gelen test olmuştur. Buna göre Türkçe testinin ortalama güçlük katsayısı diğerlerinden daha küçük çıkar. 9

ölçme ve değerlendirme adım 3 1. Ölçütüne göre iki tür değerlendirme vardır: Mutlak ve bağıl değerlendirme. Bağıl değerlendirme yapılırken bağıl ölçütler kullanılır. Bağıl ölçüt, ölçme işleminden sonra gruba veya ölçme sonuçlarına bağlı olarak ortaya çıkmaktadır. Buna göre not ortalaması en yüksek üç öğrenciye burs ve Z puanı 0 ve üzeri olanların başarılı sayılması durumları bağıl ölçüte örnektir. Çünkü her iki şartı sağlamak için de kaç alınması gerektiği belli değildir. Mutlak değerlendirme yapılırken mutlak ölçütler kullanılır. Mutlak ölçütte ise sınır ölçme işleminden önce kesin olarak bellidir. Soruların en az yarısını yapamayanların başarısız sayılması ise mutlak ölçüte örnektir çünkü kaç soru yapılması gerektiği kesin olarak bellidir. 2. Birinci öncülde verilen Sınav kâğıdını ilk teslim eden öğrenci Ali dir. ifadesinden diğerlerinden daha çabuk teslim ettiği bilgisini ediniriz ancak aradaki süre farkını bilemeyiz. Bu durumda sıralama ölçeği düzeyinde bir ölçme sonucu olduğu görülür. Ali üç soruyu boş bırakmıştır. sonucuna ulaşılırken mutlak bir sıfır noktasından başlayarak ölçme yapılır ve eşit birimler kullanılır. Dolayısıyla II nolu öncülde verilen ölçme sonucu hesaplanırken kul- 10 lanılan ölçek türü eşit oranlıdır. Test puanları bireyler arasındaki farkların sayısal miktarlarını gösterebilir ancak bağıl sıfır noktasından başlayarak ölçme yapıldığı için oranları gösteremez. III nolu öncüldeki test puanının 100 üzerinden 68 olarak hesaplanması eşit aralıklı ölçekle elde edilmiştir. 3. Yazılı yoklamalar ve sözlü yoklamalar açık uçlu sorular içerdiğinden sentez ve değerlendirme gibi üst düzey davranışlar yoklanması için uygundur. Bilgilerin gerçek hayata uygulanma düzeyini görmek için bireylere bir iş yaptırmak, bir problem çözdürmek gibi uygulamalar gerekir. Bu tip davranışlar uygulama düzeyinde davranışlardır. Performans ödevleri bu tip davranışları yoklamada elverişlidir. Projeler sayesinde analiz, sentez, değerlendirme gibi tüm üst düzey davranışları yoklamak uygundur. Yapılandırılmış grid tekniği bilgi ve kavrama düzeyinde davranışları yoklamaya uygunken değerlendirme düzeyinde davranışları yoklamaya uygun değildir. Çünkü yapılandırılmış grid tekniğinde birey cevabı verilenler arasından seçer. Bir tür seçme gerektiren test tipi olan gridlerle sentez, değerlendirme gibi davranışlar geçerli şekilde yoklanamaz. 4. Soruda bilgi yarışmasına öğrenci seçmek amacıyla öğrencilere genel kültür genel yetenek testi uygulamanın amacına göre ne tür değerlendirmeye örnek olduğu sorulmaktadır. Bu uygulamada amaç öğrencilerin bir konudaki düzeyini saptamak değil, en yetenekli öğrencileri seçerek takım oluşturmaktır. Öğrencilerin tutum, kişilik, yetenek, ön bilgi gibi özelliklerini belirlenerek elde edilen verilere göre seçme ve yöneltme için yapılan çalışmalar tanıma ve yerleştirmeye dönük değerlendirme kapsamında yer alır. 5. Üç tür ölçmeden söz edilebilir: Özellik doğrudan gözlenerek ölçülüyorsa doğrudan ölçme, özelliğin kendisi değilde onunla ilişkili başka bir özellik gözlenerek ölçülüyorsa dolaylı ölçme, bir formüldeki bağıntının hesaplanması şeklinde ölçülüyorsa türetilmiş ölçme söz konusudur. Bu durumda soru kökünde verilen eleme sınavı puanının hesaplanması türetilmiş ölçmeye örnektir. Çünkü eleme sınavı puanı hesaplanırken genel kültür testi puanının %40 ı ve genel yetenek testi puanının %60 ı alınacaktır.

6. Bir iş için eleman seçmek demek ileriye dönük bir tahminde bulunmak yani yordama yapmak demektir. Çünkü bu tip ölçmelerde bireylerin iş performansı kestirilmeye çalışılır. Soru kökünde Birkaç ay sonra fi rma sahibinin araştırma fi rmasını arayarak seçtikleri elemanların istedikleri performansı sergileyemediğini söylediği belirtilmiştir. Bu durumda yapılan testlerin iş performansını kestirmekte yetersiz kaldığı dolayısıyla yordama geçerliğinin düşük olduğu söylenebilir. 7. İç tutarlılık bir testte yar alan soruların birbiriyle uyumlu olması, benzer sonuçlar vermesi olarak tanımlanır. Buna göre testin kapsamı daraltılırsa soruların birbiriyle olan uyumu artacağından, anlaşılmayan ifadeler düzeltilirse tesadüfi hata azalıp uyumsuzluklar azalacağından, ayırt ediciliği yüksek maddeler eklendiğinde soruların birbiriyle uyumu artacağından testin iç tutarlılığının yükselmesi beklenir. Buna göre I, II ve III nolu öncüllerde verilenlerin hepsi iç tutarlılığın yükselmesini sağlar. 8. Selda Hanım en yüksek notu 100 e tamamlamak için gerekli olan puanı tüm puanlara eklemiştir. Bu durumda Selda Hanım tüm puanlara aynı miktarda ekleme yaptığı için puanlara sabit hata karışmıştır. Puanlara sabit, sistematik veya tesadüfi hata karıştığı durumlarda aracın geçerliği düşer. Bu durumda II nolu öncülde verilen ifade doğrudur. Sabit hatalar testin güvenirliğini olumsuz etkilemez çünkü hep aynı miktarda karışır. Bu nedenle III nolu öncülde verilen ifade yanlıştır. 9. Gönül Hanım öfke ölçeğini önceden geliştirilmiş ve geçerli olan bir stres ölçeğiyle karşılaştırmaktadır. Öfke ve stres, aralarında pozitif korelasyon olduğu bilinen özelliklerdir. Dolayısıyla bu iki testin sonuçlarının pozitif ve yüksek korelasyon göstermesi öfke ölçeğinin uygunluk geçerliğinin yüksek olduğu şeklinde yorumlanabilir. Yapılan çalışma bir tür uygunluk geçerliği çalışmasıdır. Yordama geçerliği testten elde edilen puanlarla yapılan ileriye dönük tahminlerin doğru çıkmasıdır ki soru kökünde bununla ilgili bir bilgi verilmemiştir. Objektifl ik puanlamayla ilgili olup yapılan çalışmanın puanlamayla ilgisi yoktur. Kapsam geçerliği testteki soruların dağılımıyla ilgili olup yapılan çalışmanın bununla da ilgisi yoktur. İç tutarlılık testteki soruların birbiriyle uyumu anlamına gelir ve yapılan çalışma bu konuda bilgi veremez. 10. Yapı geçerliği bir testteki soruların testle ölçülmek istenen psikolojik özelliği açığa çıkartabilmesidir. Bir yetenek testi farklı yetenek düzeylerinde olduğu bilinen bireyleri birbirinden ayırabiliyorsa yapı geçerliği için kanıt olur çünkü bu durumda test ilgili özelliği açığa çıkartıyor demektir. Soru kökünde verilen çalışmada yetenek testi yüksek yetenekli ve normal olduğu bilinen gruplara uygulanmış ve arada anlamlı fark olduğu görülmüştür. Bu durumda testin yapı geçerliğinin yüksek olduğu söylenebilir. Yordama geçerliği testten elde edilen puanlarla yapılan ileriye dönük tahminlerin doğru çıkmasıdır ki soru kökünde bununla ilgili bir bilgi verilmemiştir. Objektiflik puanlamayla, kullanışlılık ise testin hazırlama, uygulama ve puanlama gibi özelliklerinin ne kadar kolay yapıldığıyla ilgilidir. 11. Öğrenciyi de değerlendirme sürecinin bir parçası yapmak için en sık kullanılan yollar öz değerlendirme ve akran değerlendirme uygulamalarıdır. Bu uygulamalar sayesinde öğrenciler de eleştirel düşünme becerileri, sorumluluk alma gibi özellikler geliştirilmeye çalışılır. Bu uygulamaların sağlıklı olarak yapılabilmesi için puanlama kriterleri hazırlanırken öğrencilerin görüşleri de alınır ve değerlendirme kriterleri öğrencilere önceden bildirilir. Buna göre A, B, C ve D seçeneğinde veri- 11

lenler öğrencileri değerlendirme sürecine katmada kullanılan uygun yöntemlerdir. Ancak E seçeneğinde verilen Ders geçme notunu öğrencinin vermesini sağlamak uygun bir etkinlik olmaz. Çünkü öğrencilerin verdiği notlar geçerli ve güvenilir olamaz. 13. Çoktan seçmeli maddelerde doğru cevabın seçenekler arasında bulunmasından dolayı kimi matematik sorularında seçeneklerdeki değerler kullanılarak sorunun cevabı bulunmaktadır. Ortak köklü, ortak seçenekli, öncüllü ve cevabı en doğru soru tiplerinin hepsinde bu olumsuzluk vardır. Ancak cevabı gizleyerek bu olumsuzluk önlenebilir. Örneğin bir matematik sorusunun cevabı 345 ise seçeneklerde bunu vermemek gerekir. Soru kökü cevabın onlar basamağı kaçtır diye yazılırsa seçeneklere asıl doğru cevap koyulmaz ve deneme yanılma ile cevabın bulunmasının önüne geçilmiş olur. Fizik testinde doğru sayısı 65, kimya testinde doğru sayısı 60 olduğu için fi - zik testindeki mutlak başarı daha yüksektir. A seçeneği doğru. Fizik testi T puanı 55, kimya testi T puanı 60 olduğu için B seçeneği doğru. Kimya Z puanı +1 olduğu için C ve E seçenekleri doğru. Fizik testi Z puanı düşük olduğu için başarı sırasında da daha geride olmalıdır. D seçeneği yanlış. 15. Tabloda yığılmalı frekanslar verilmiştir. Öncelikle puanların frekanslarını belirlemek gerekir. 12. Üç tür ölçmeden söz edilebilir. Eğer özellik doğrudan gözlenerek ölçülüyorsa doğrudan ölçme, özelliğin kendisi değil onunla ilişkili başka bir özellik gözlenerek ölçülüyorsa dolaylı ölçme, eğer bir formüldeki bağıntının hesaplanması şeklinde ölçülüyorsa türetilmiş ölçme söz konusudur. Bu durumda soru kökünde verilen sene sonu notunun hesaplanması türetilmiş ölçmeye örnektir. Çünkü sene sonu notu hesaplanırken ara sınav ve sene sonu sınavının ağırlıklı ortalaması alınacaktır. 12 14. Bir öğrencinin her biri 100 er sorudan oluşan üç farklı testten elde ettiği puanlar aşağıdaki gibidir. - Fizik testi doğru sayısı 65, Z puanı = 0.5 - Kimya testi doğru sayısı 60, T puanı = 60 T puanı = 50 + 10*Z olduğuna göre Testler Soru sayısı Z puanı T puanı Fizik 65 0.5 55 Kimya 60 1 60 Puan (X) Frekans Yığılmalı Frekans 1-5 1 1 6-10 7 8 11-15 4 12 16-20 3 15 21-25 1 16 Tablo incelendiğinde en çok alınan puanın 6-10 aralığı olduğu görülmektedir. Öğrenciler düşük bir puanda yığılmışlardır ama yüksek puanlar alanların da olduğu bir dağılım olduğu görülmektedir. Bu tip puan dağılımlarına sağa çarpık veya pozitif kayışlı dağılım denir. Uygulanan testin gruba zor geldiği şeklinde yorum yapılır.

16. Mutlak başarı için yapılan doğru cevap sayısına bakmak yeterlidir. Çünkü testlerdeki soru sayıları eşittir. Ancak seçeneklerin hepsini yorumlayabilmek için verilen doğru cevap sayıları, aritmetik ortalama ve standart sapma değerlerinden hareketle Z ve T puanlarına ihtiyaç vardır. Z = (Puan Ort) / Ss, T = 50 + 10xZ Dersler A Testi B Testi Ali nin Doğru 20 12 Cevap Sayısı Aritmetik 30 12 Ortalama Sx 5 2 Z -2 0 T 30 50 Tablo incelendiğine B seçeneğinde verilen ifadenin yanlış olduğu görülür. Ali nin B testi T puanı 30 değil, 50 olarak hesaplanır. 17. pj = (dü+da) / N, rjx = (dü-da) / n dü: Üst gruptan soruyu doğru cevaplayanların sayısı da: Alt gruptan soruyu doğru cevaplayanların sayısı N= 60, n=30 pj ve rjx değerleri hesaplandığında pj rjx M1 0,5 0 M2 0,5 0,33 M3 0,58 0,5 M4 0,5-0,33 M5 0,5 0,66 Tabloya göre rjx değeri 0 olan M1 maddesi bilenle bilmeyeni ayırmada hiç etkili olmamıştır. 18. pj rjx M1 0,5 0 M2 0,5 0,33 M3 0,58 0,5 M4 0,5-0,33 M5 0,5 0,66 pj katsayılarına göre M1, M2, M4 ve M5 tam orta güçlükte, M3 ise orta güçlüğe yakın ama diğer maddeler göre kolay bir maddedir. rjx katsayılarına göre M3, M5 ve M2 kaliteli maddelerdir, M1 ve M4 ise testten çıkartılması gereken ayırt ediciliği yetersiz maddelerdir. Hatta M4 ters yönde çalışmaktadır. Ayırt ediciliği en yüksek madde M5 tir, en düşük madde ise M4 tür. Bu bilgilere göre D seçeneğinde söylenen M4 ün oldukça zor bir madde olduğu bilgisi yanlıştır. 19. Bir sınıfın mutlak başarı düzeyi grubun ortalamasının testten alınabilecek maksimum puana bölünmesiyle elde edilen sonuçların 100 ile çarpımıdır (Mutlak başarı = (ortalama/soru sayısı) *100). Bu formül uygulandığında (10/25)*100= 40 elde edilecektir. 20. Soru kökünde verilen bilgilere dayanarak testin sadece grup için orta güçlük düzeyinde olduğu söylenebilir. ölçme ve değerlendirme adım 4 1. Soruda bir kursa başlamadan önce öğrencilerin seviyesini belirleyerek uygun kurlara yerleştirmek amacıyla öğrencilere başarı testi uygulamanın amacına göre ne tür değerlendirmeye örnek olduğu sorulmaktadır. Bu uygulamada amaç öğrencilerin verilen bir eğitim konusundakini düzeyini saptamak değil, öğrencileri kendilerine uygun olan kurdan eğitime başlatmaktır. Eğitimin başında öğrencilerin ön bilgilerini belirlemek ve elde edilen verilere göre eğitim uygulamalarına yön vermek için yapılan çalışmalar 13

tanıma ve yerleştirmeye dönük değerlendirme kapsamında yer alır. Gruplar oluşturulurken kullanılan değerlendirme ölçütü 1-25 arası doğrusu olanlar en alt seviye, 25-50 arası doğrusu olanlar 3. seviye Bu durumda mutlak ölçüt kullanıldığı söylenebilir. Çünkü geçilmesi gereken sınır puan sınavdan önce kesin olarak bellidir. 2. Birinci, üçüncü ve dördüncü öncüllerdeki ifadeler gözlem sonucu bildirdiklerinden ölçme işlemi için örnek kabul edilebilir. İkinci ve beşinci ifadelerde ise değerlendirme söz konusudur. 3. Mutlak ölçütler ölçme işlemi yapılmadan önce, ölçme işleminin yapıldığı gruptan bağımsız, kesin olarak belirlenmiş olan ölçüttür. I, II ve III nolu öncüllerde verilen 40 yaşını aşmamış olmak, eğitim fakültesi mezunu olmak ve 100 sorunun 80 ini yapmak dendiğinde kesin olarak belirlenmiş ve ölçme sonucuna göre değişmeyecek mutlak ölçütler kullanılmaktadır. IV nolu öncülde verilen Mülakat puanı en yüksek 2 kişinin içinde olmak dendiğinde ise kaç puan almak gerektiği yapılacak sıralamadan sonra belli olacaktır. Buna göre I, II ve III nolu öncüllerde verilenler mutlak ölçüttür. 14 4. Deneysel araştırmalarda bir değişkenin diğer değişken üzerindeki etkisine bakılır. Deneyde etkisi araştırılan yani neden konumunda olan değişkenler bağımsız değişken olarak adlandırılırken sonuç konumunda olan değişken ise bağımlı değişkendir. Soru kökünde verilen araştırmada öğrencilerin okumaya duyduğu ilgi ve okumaya ayırdıkları zaman değişkenlerinin öğrencilerin SBS, YGS gibi sınavlardaki puanları üzerindeki etkisini araştırılmaktadır. Bir araştırmada sonuç konumunda olan, etkilenen konumunda olan bağımlı değişken olduğuna göre, soruda verilen araştırmada sınav puanları bağımlı değişkendir. Çünkü okumaya duyulan ilgi ve okumaya ayrılan zamandan etkilenmektedir ve sonuç konumundadır. 5. Yapı geçerliği bir testteki soruların testle ölçülmek istenen psikolojik özelliği açığa çıkartabilmesidir. Eğer öğrenciler testin içinde yer alan maddelerin doğru cevabını bilmedikleri hâlde seçenekleri eleyerek bulabiliyorlarsa sorular ilgili özelliği ölçme gücünü kaybeder ve yapı geçerliği düşer. Yordama geçerliği testten elde edilen puanlarla yapılan ileriye dönük tahminlerin doğru çıkmasıdır ki soru kökünde bununla ilgili bir bilgi verilmemiştir. İç tutarlılık soruların birbiriyle uyumlu olması olup kökte verilen durumun iç tutarlık üzerinde olumsuz bir etki yaratması beklenmez. Objektifl ik puanlamayla ilgili olup öğrencilerin cevabı nasıl bulduğundan etkilenmez. Kullanışlılık ise testin hazırlama, uygulama ve puanlama gibi özelliklerinin ne kadar kolay yapıldığıyla ilgilidir. 6. I nolu öncülde verilen Testin tekrarlı uygulamalarından elde edilen puanların karşılaştırmak kararlılık hakkında bilgi verirken, III nolu öncülde verilen Alfa katsayısını hesaplamak iç tutarlılık hakkında bilgi verir. Her iki katsayı da testin güvenirliğini gösterir fakat geçerlik hakkında bilgi vermez. II nolu öncülde verilen Farklı tutumlara sahip olan bireylerin test puanlarını inceleme ve IV nolu öncüldeki Soruların faktör yüklerini hesaplama testin yapı geçerliğinin kanıtı olarak kullanılabilir. 7. KR-20 katsayısı testin iç tutarlılığını ortaya koymak için hesaplanan bir güvenirlik katsayısıdır. Güvenirliği yüksek bir testin KR-20 katsayısının 1 e yakın ve yüksek olması testin iç tutarlılığının yüksek olduğu, soruların birbiriyle uyumlu olduğu, test puanları-

na az hata karıştığı, testin kapsamının dar olduğu vb. şeklinde yorumlanır. Soru kökünde verilen testin KR-20 katsayısı 0,45 olup oldukça düşüktür. Bu durum soruların uyumlu olmadığı ve test puanlarına çok hata karıştığı şeklinde yorumlanır. Soruların ayırt edici olmaması, testin kapsamının oldukça geniş olması, testte yer alan maddelerin hepsinin çok zor olması ve testin süresinin adaylara yeterli gelmemesi hataların çoğalmasına veya soruların uyumunun azalmasına yol açmış olabilir. Oysa C seçeneğinde verilen Aynı hedefl er; ölçen birden çok madde olması KR katsayısının düşmesine değil, yükselmesine neden olur. Çünkü aynı hedefl eri ölçen sorular birbiriyle tutarlı sonuçlar verir. 8. Yordama geçerliğinin yüksek olması demek bir testle yapılan ileriye dönük tahminin doğru çıkması demektir. Dershaneye öğretmen seçerken kullanılan bir testin yordama geçerliğinin yüksek olması test puanları yüksek olan öğretmenlerin performanslarının yüksek olması demektir. D seçeneğinde verilen ifade yordama geçerliğinin kanıtı olabilir. A seçeneği kapsam geçerliği, B seçeneği uygunluk geçerliği, E seçeneği görünüş geçerliği anlamına gelir. 9. Performans değerlendirme yaklaşımının bir özelliği de otantik değerlendirmeler yapılmasıdır. Bir değerlendirmenin otantik olması demek bilgilerin gerçek hayata yakın durumlarda kullanılmasıdır. Otantik görevler verildiğinde yapılan uygulamalar öğrenilen bilgilerin o alana özgü durumlarda kullanılmasını gerektirir. 10. Doğru yanlış tipi maddeler yazarken maddelerdeki önermelerin ya kesinlikle doğru ya da kesinlikle yanlış olmasına dikkate etmek gerekir. Çünkü kısmen doğru kısmen yanlış ifadelere ne cevap verileceği bilinemez ve hatalı sonuçlara yol açabilir. Madde köklerinde olumsuz ifadeler kullanmamakda yapılması gerekenler arasındadır. Çünkü olumsuz kökler kullanıldığın da cevabı yanlış olan önermeler yanlış anlaşılmakta ve tesadüfi hatalara yol açmaktadır. Bu durumda I ve II nolu öncüllerde yapılanlar soru yazma ilkelerine uygundur. III nolu öncülde verilen Yanlış önermeler yanlış öğrenmelere yol açabileceğinden soruların çoğunluğunu doğru önermelerden oluşturmak ise yanlış bir uygulamadır. Çünkü doğru yanlış testlerinde soruların cevapları yarısı doğru yarısı yanlış olacak şekilde orantılamak gerekir. 11. Z puanı 0 ve üzeri olmak ölçüt olursa aritmetik ortalamayı geçenler başarılı olur. Çünkü Z = (Puan Ort.) / ss olduğundan ortalamadan yüksek alanların Z puanı 0 ve üzeri olur. Tablo incelendiğinde 1.testin sola çarpık olduğu görülür. Sola çarpık dağılımlarda grubun yarısından çoğu ortalamayı geçer ve dolayısıyla Z puanı 0 ve üzeri olur. Buna göre 1.testte grubun yarıdan çoğu dersten geçer. Sağa çarpık olan 2, 3 ve 4 nolu testlerde grubun çoğu başarısız olurken, simetrik dağılım gözlenen 5 nolu testte yarısı başarılı yarısı başarısız olur. 12. Ortalama güçlük = Aritmetik ortalama / Soru sayısı Bu formüle göre ortalama güçlük katsayısı düşük olan test daha zor, öğrenci başarısının daha düşük olduğu bir testtir. 1.test 0,40 2.test 0,50 3.test 0,80 4.test 0,75 5.test 0,60 Tabloya göre ortalama güçlük değeri en düşük olan 1.testtir. Demek ki öğrencilere en zor gelen ve başarının en düşük olduğu test 1.testtir. 15

13. Çok sayıda başvuran arasından az kişi seçmek için zor olan bir test kullanmak gerekir. Tabloda maddelerin güçlükleri verilmiştir. Madde güçlükleri toplandığında testin aritmetik ortalaması bulunabilir. Aritmetik ortalaması en düşük test en zor testtir ve üst düzey öğrencileri seçmede en uygun olandır. Test 1 Ortalama = 0,20+0,30+0,15+0,55+0,40=1,6 Test 2 Ortalama = 0,80+0,85+0,50+0,65+0,80=3,6 Test 3 Ortalama = 0,40+0,40+0,55+0,50+0,40=2,25 Test 4 Ortalama = 0,55+0,65+0,65+0,55+0,60=3 Test 5 Ortalama = 0,30+0,50+0,60+0,40+0,10=1,9 Test 1 en zor testtir. 15. Aritmetik ortalama 25, tepe değer 38, medyan 34 olduğuna göre mod>medyan>aritmetik ortalama, bu durumda testin sola çarpık ya da negatif kayışlı olduğu söylenebilir. Soru sayısı 50, ranj 40 olduğuna ve ortalama mod değerine göre çok küçük bir değer olduğuna göre ortalamayı çarpıtan uç ve küçük puanlar olması gerekir. Bu bilgilere göre III ve IV nolu öncüllerde verilenler doğru, II nolu öncülde verilen ifade yanlıştır. Geçme notu 30 dur. Medyan yani grubu tam ortadan bölen değer 34 olduğuna göre sınıfın yarısı 30 un üstündedir. Demek ki grubun yarıdan çok daha fazlası 30 puanı geçer. Bu durumda I nolu öncülde verilen grubun yarısı başarısız olur ifadesi yanlıştır. 17. Soruları cevaplayabilmek için sorulara verilen cevaplardan hareketle puanları ve sorulara kaç kişinin doğru cevap verdiğini hesaplamak gerekir. 1 2 3 4 5 Puanlar A 1 1 1 1 1 5 B 1 0 0 1 0 2 C 1 0 1 1 0 3 D 1 0 0 0 1 2 E 0 0 1 0 0 1 F 1 0 0 1 1 3 G 0 0 0 1 0 1 H 1 0 1 1 0 3 İ 1 0 1 0 0 2 J 1 0 0 1 0 2 Doğru cevap 8 1 5 7 3 sayısı En yüksek puan 5, en düşük puan 1, Ranj = 5-1= 4 14. Orta güçlüğe en yakın olan madde güvenirliğe katkısı en yüksek olan maddedir. Test 5 teki soruların güçlükleri incelendiğinde Madde 2 nin güçlük katsayısının 0,50 olduğu görülür. Diğer maddeler bu maddeden daha kolay veya daha zordur. Buna göre güvenirliğe katkısı en yüksek olması beklenen madde 2 nolu maddedir. 16 16. %68 olasılıkla gerçek puan hesaplanmak istendiğinde Puan standart hata formülü uygulanır. Standart hata = Standart Sapma * 1- r (r: güvenirlik katsayısı) Standart Hata = 5x 1-0.84= 5 x 4 / 10 = 2, Mehmet in puanı 54 54 2 % 68 olasılıkla gerçek puan aralığı 52 ile 56 arasındadır. I nolu öncül yanlıştır. Mehmet in Z puanı = (54-60) / 5 = - 6/5. III nolu öncül doğrudur. Z puanı negatif değer alır dolayısıyla grubun % 50 sini geride bırakamaz. Çünkü % 50 yi geçebilmek için Z puanının 0 olması gerekir. II nolu öncül yanlıştır. 18. Varyansı en yüksek olan maddeler orta güçlükte olan maddelerdir. Tablodan sorulara kaç kişinin doğru cevap verdiği incelendiğinde 3. sorunun 10 kişinin 5 i tarafından doğru cevaplandığı görülür. Bu durumda 3 nolu soru orta güçlüktedir. Varyansı en yüksek madde de 3 nolu maddedir.

19. Aritmetik ortalamayı bulmak için testten alınan puanları kişi sayısına bölmek gerekir. Tablodan hareketle teste giren 10 kişinin puanlarının toplamı 24 olarak bulunur. 1 2 3 4 5 Puanlar A 1 1 1 1 1 5 B 1 0 0 1 0 2 C 1 0 1 1 0 3 D 1 0 0 0 1 2 E 0 0 1 0 0 1 F 1 0 0 1 1 3 G 0 0 0 1 0 1 H 1 0 1 1 0 3 İ 1 0 1 0 0 2 J 1 0 0 1 0 2 24 Bu formüle göre orta güçlükte bir maddenin varyansı 0,25 çıkar ve bir madde için ortaya çıkabilecek en yüksek varyans budur. Buna göre çok zor veya çok kolay maddelerin varyansı 0 a yakın olur. 3 nolu maddenin varyansı 0,08 dir. III nolu maddenin çok zor veya çok kolay olması gerekir. 3 nolu madde aynı zamanda ayırt ediciliği düşük bir maddedir. Bu durumda Çok zor veya çok kolay maddelerin ayırt ediciliğinin düşük olması beklenir. görüşünü destekleyen türden bir maddedir. 3. Birinci, ikinci ve üçüncü öncüldeki ifadeler doğrudan gözlenebilir. Ancak dördüncü ifadedeki tutum ve beşinci ifadedeki yetenek doğrudan ölçülemez. Ortalama = 24 / 10 = 2,4 ölçme ve değerlendirme adım 5 20. Soru Numarası Ayırıcılık indeksi (rjx) Madde Varyansı 1 0,40 0,16 2 0,50 0,25 3 0,10 0,08 4 0,35 0,21 5 0,10 0,25 Tablo incelendiğinde 1, 2 ve 4 nolu soruların ayırt ediciliğinin yüksek olduğu görülür. 3 ve 5 nolu maddelerin ayırt ediciliği düşüktür. Madde Varyansı = pj x qj pj : Güçlük katsayısı qj = 1 - pj 1. Yapılan uygulama ile daha sonraki yıllarda test hazırlama zorunluluğu kalmayacak, kâğıt ve zaman yönünden maliyet düşecektir. 2. Dikkat edilirse en büyük puan düzeltilmiş ve daha da büyük bir değerle değiştirilmiştir. Elde edilen değerden başka bulunmadığına ve dağılım modsuz olmadığına göre moda etkisi olmayacaktır. Diğer yandan yapılan değişiklikte bireyin sırası değişmediğinden ortanca da bu durumda etkilenmeyecektir. Değer değiştiği için ortalama ve ranj değişir. Ortalama değiştiği için standart sapma da değişir. 4. Bir ölçme işlemi üzerinde yapılacak oran işlemlerinin anlamlı olabilmesi için oran ölçeğinde elde edilmiş olması gerekir. Son iki seçenekteki ölçme sonucunun zihinsel özellikler olması nedeniyle oran ölçeği düzeyinde ölçülmesine imkân yoktur. Üçüncü öncüldeki oyuncu sırt numarası ise sınıflama (adlandırma) ölçeğindedir. Geriye kalan birinci ve ikinci öncüldeki ifadeler oran ölçeğinde ölçme sonuçları verir. Bunu da başlangıç noktalarının gerçek sıfır olmasına dayandırabiliriz. 17

5. C seçeneğindeki ifade hatırlama düzeyi davranışlara gönderme yaptığına göre bu tür davranışları kısa cevaplı, doğru yanlış ya da çoktan seçmeli sınavlar ile yoklamak daha uygun olacaktır. Dolayısıyla üst düzey davranışları ölçmek için uygun olan projeleri kavramların ölçülmesinde kullanmak pek uygun olmayacaktır. 7. Grafi k yığılmalı frekans grafi ğidir. Grafi k incelendiğinde ranjın 50 5 = 45 olduğu açıktır. Sadece bunu çözmek bile doğru yanıtı bulmaya yetmektedir. Yine grafi k bilgilerine göre frekansı en yüksek olan 25 değeri mod olacaktır. Diğer yandan ortancanın da aynı değere (8.sıradaki veriye) karşılık geldiği hesaplanınca görülecektir. Grafi - ğin tabloya dönüştürülmüş hâli aşağıdaki gibidir. Puan Frekans Yf 5 1 1 10 0 1 15 3 4 20 1 5 25 5 10 30 1 11 35 1 12 40 0 12 45 0 12 50 3 15 9. Öğrencilerin sayısalcı ve sözelci olarak gruplanması sınıflama/adlandırma ölçeğinde bir ölçme işlemine işaret etmektedir. 10. Sayısal bakımdan düzeyi yüksek öğrencileri belirleyip sayısal alana yönlendirmek, sözel bakımdan düzeyi yüksek öğrencileri belirleyip sözel alana yönlendirmek amaç bakımından tanımaya dönük değerlendirme kapsamında ele alınmalıdır. 6. Kısa cevaplı testlerin tanımlamayı gerektiren soruları yapılandırılmadıklarından şans başarısı yoktur. Diğer seçeneklerde verilen ifadeler ise yapılandırılmış testlerdir ve şans başarısı vardır. 18 8. Kullanılan sınavdaki soru sayıları ölçüt olarak kullanıldığına göre ölçüt mutlaktır. Mutlak ölçütlere göre yapılan değerlendirme ise mutlak değerlendirme olacaktır. 11. Derslerde 7 bölgeyi tamamlayıp, 7 bölgeye ilişkin kazanımları işleyip sınavda sadece Orta Karadeniz ile ilgili soruların yöneltilmesi aracın kapsam geçerliğini olumsuz yönde etkiler. Bu da geçerliğin düşmesi demektir.

12. Elde edilen korelasyon ölçütle yordayıcı arasındaki korelasyon olduğundan ölçüt geçerliğini verir. İki test puanları eş zamanlı elde edildiği için bu ölçüt geçerliği de uyum ya da uygunluk geçerliğini verecektir. 15. Ortalama güçlük testin ortalamasının soru sayısına bölümü olduğuna göre ve ortalama güçlük üçüncü test için 0,50 olarak bulunduğu için soru sayısı 50 olmalıdır. 18. Bir maddenin değişim ölçüsü olarak varyans veya standart sapma değerinin büyümesi için güçlüğün tam orta değerde (0,50) olması gerekmektedir. 13. Seçenekler incelendiğinde ilk 4 seçenekteki test türlerinin duyuşsal alanı ölçtüğü, son seçeneğin ise daha çok psikomotor ve bazen bilişsel becerileri ölçtüğü söylenebilir. Doğru yanıt E seçeneiğidir. 16. Ortalama güçlük formülünden testin ortalaması 21 çıkmalıdır. Çünkü 21/30 = 0,70 olmaktadır. Doğru yanıt D seçeneiğidir. 19. Seçenekler incelendiğinde B seçeneği dışındaki seçeneklerde verilen özelliklerin insanların duyuşsal özellikleri olduğu görülebilir. B seçeneği ise saymaya dayandığından doğrudan ölçülebilir. 14. Verilen ifadeler tek tek ele alınırsa birinci ve dördüncü ifadenin geçerliği artırırken ikinci ve üçüncü ifadenin geçerliği düşürdüğü söylenebilir. 17. Sınıfın mutlak başarı düzeyi ortalama güçlüğü en yüksek test için en yüksek olacaktır. 20. Bağımsız değişken bir araştırmada etkisi araştırılan, bağımlı değişken de etkilenme düzeyi araştırılan değişken olduğuna göre öğretim yaklaşımı etkileyen yani bağımsız değişken, fen bilgisi dersi başarısı ise bağımlı değişken olarak belirlenecektir. 19

ölçme ve değerlendirme adım 6 1. En güçlü ilişki mutlak değeri 1 e en yakın olan korelasyona ait olmalıdır. Buna göre matematik ve fen dersi için en yüksek ilişkinin hesaplandığı söylenebilir. 2. A seçeneğindeki ifadenin doğru olabilmesi için sosyal bilgiler ve Türkçe puanları arasındaki ilişkinin negatif olması gerekir. Fakat tabloya bakıldığında ilişkinin pozitif olduğu görülür. Diğer seçeneklerde verilen ifadeler ise doğrudur. 3. Şirin Hanım ın test uygulamadaki amacı kişilik profilini ortaya çıkarıp buna uygun danışma yapmak olduğuna göre bu testi tanımaya yönelik değerlendirme amacıyla kullandığı söylenebilir. 20 4. Ölçme işlemi özelliklerin gözlenip gözlem sonuçlarının sayı ve sembollerle ifade edilme sürecidir. Sayı ve semboller belirlenirken ölçme kuralları kullanılır. Bu durumda I. öncül doğrudur. Değerlendirme, ölçme sonuçlarının bir ölçütle karşılaştırılıp bir yargıya varma sürecidir. Değerlendirme sürecinde ölçme kuralları değil, ölçütler kullanılır. Bu durumda II. öncül doğru, III. ve IV. öncüller yanlıştır. 5. Soru kökündeki ifadeye göre seçme yapmaya uygun sorular sorulmadıysa araç amaca hizmet edememiş demektir. Aracın amaca hizmet etme düzeyi düştükçe öncelikle geçerliği zayıflayacaktır. 6. Öncüller incelendiğinde ikinci öncüldeki öğrenci seçilmesi ve dördüncü öncüldeki farklı bireylere farklı sorular sorulması sözlü sınavlara gönderme yapmaktadır. 7. D seçeneği dışındaki seçeneklerde verilen ifadeler uyulması gereken kuralları göstermektedir. D seçeneğinde ise uyulması gereken kuralın tersinin yapılması önerilmektedir. 8. Standart sapma değeri tüm değişim ölçüleri gibi grubun homojen olup olmadığı, dağılımın basık mı sivri mi olduğu, gruptaki bireylerin puan bakımından birbirine benzeyip benzemediğini belirlemek için kullanılır. Varyansın karakökü alınarak bulunur. Verilerin ortalamadan uzaklıklarının ortalaması olarak da değerlendirilebilir. Bu bilgiler çerçevesinde sadece A seçeneği standart sapma için uygun bir ifade olmamıştır. 9. Öykü nün en başarılı ve en başarısız olduğu dersleri belirlerken standart puan Z den yararlanmak gerekir. Z puanlarını hesapladığımızda; Zö = (71 60) / 11 =1 Zeg = (70 40) / 15 =2 Zg = (80-50) / 20 = 1,5 Zöğ = (55 45) / 10 = 1 Zs = (55 55) / 17 =0 En büyük Z puanında başarı en büyük ve en küçük Z puanında başarı en küçük olacağına göre eğitime girişte en başarılı sınıf yönetiminde en başarısız olacaktır.

10. Öykü nün puanı ölçüt alınsaydı sınıfta başarılı olan öğrencilerin sınıf toplamına oranı ancak Öykü nün puanı ortancaya eşit olduğunda söz konusudur. Bu durum da ölçme dersi için sağlanmıştır. Ancak puanların normal dağılım varsayımını sağlasaydı bu durumda sınıf yönetiminde de sınıfın yüzde ellisi başarılı olabilirdi. Ancak sınıf yönetimi için ortanca incelendiğinde dağılımın simetriklik özelliğini sağlayamadığı görülmektedir. Doğru yanıt A seçeneğidır. 11. Öykünün başarı düzeylerinin eşit olduğunu söyleyebilmek için derslere ilişkin Z standart puanları eşit olmalıdır. Bu durumu sağlayan dersler ise ölçme ve öğrenme dersleridir. 13. Soru kökünde verilen ifadelerden özellikle bir dönem ya da yıl boyunca yapılan çalışmaları kapsayan ifadesi bizi doğrudan portfolyoya götürmelidir. 14. Standart hata ile güvenirlik arasında ters, standart hata ile standart sapma arasında aynı yönde bir ilişki vardır. Güvenirlik düştükçe hata artacak, standart sapma yükseldikçe hata artacaktır. Bu açıklamalar çerçevesinde coğrafya testinin en yüksek standart hataya, felsefe testinin en az standart hataya sahip olduğu söylenebilir. (Çözümü formülle gerçekleştirmek isteyenler ise Standart hata = standart sapma x denklemini kullanabilir.) 16. Aritmetik ortalama testteki madde güçlüklerinin toplamına eşittir. Bunu vurgulayan ifade ise D seçeneğinde verilmiştir. Doğru yanıt D seçenğidir. 17. Testin ortalama güçlük değeri madde güçlüklerinin ortalamasına eşittir. 12. A, B, C ve D seçeneklerinde verilen ölçütlerin gruptan bağımsız olduğu; yani ölçme sonuçlarından bağımsız olarak elde edildiği açıktır. Buna karşılık belli bir ölçeğin yaşlara ilişkin norm değerleri bağıl ölçüttür. Ayrıca norm dayanaklı değerlendirmenin bağıl değerlendirme olduğu da hatırlanırsa sorunun çözümü oldukça kolaylaşacaktır. Doğru yanıt E seçeenğidir. 15. Hangi maddelerin teste alınmayacağına karar verilecekse öncelikle madde ayırıcılık gücü indekslerine bakılmalıdır. Eksi ve 0,20 değerinden küçük ayırıcılık gücüne sahip maddeler testten atılmalıdır. Verilen değerlere göre birinci ve üçüncü madde testten atılırsa uygun olur. Doğru yanıt B seçenğidir. 18. İlk dört öncülde karar ifadeleri olduğu açıkça görülmektedir. Beşinci öncülün ise sendikalı işçilerine her ay on lira ücret ödenmesi ölçme olarak ele alınması gerekir. 21

19. Mutlak değerlendirme ölçme yapılan grup veya ölçme sonuçlarından elde edilen ölçütlere göre yapılan değerlendirmedir. Beşinci öncülün ölçme olduğu göz önüne alınmalıdır. I. ve III. öncülde verilen ölçütlerin grupla ilişkili olduğu II ve IV. öncülün ise gruba göre belirlenmeyen ölçütler olduğu açıktır. 20. Bireylerin medeni durumu sınıflama ölçeğinde ölçme sonuçları verir. 22