Ölçme
Ölçme Kavramsallaştırma İşletimselleştirme Ölçme
Ölçme Bir ya da daha çok kişiye ilişkin bir değişken niteliğin niceliğini ya da derecesini saptama ve sayısal olarak belirtme işi. Bir ölçme aracıyla nesneler ve özellikler arasında nitel ve nicel ayrımlar yapma.
Kavramların Ölçümü Sosyal bilimciler demokrasi, madde bağımlılığı, yabancılaşma, yoksulluk, aşk, nefret, önyargı, köktendincilik gibi kavramları ve var olan her şeyi ölçebilir mi? Örneğin: aşk ı ölçebilir miyiz?
Ölçme Türleri 1. Doğrudan gözlenebilenler (gözlem ya da görüşme yoluyla) 2. Dolaylı olarak gözlenebilenler (anket soruları yoluyla) 3. Yapı lar aracılığıyla gözlenebilenler (doğrudan/dolaylı olarak gözlenemeyen, ancak gözlemlere dayanan kuramsal yapı/yaratı, örneğin IQ testleri) (LATENT DEĞİŞKENLER)
Ölçme Düzeyleri Özellik: Bir şeyin özelliği, niteliği (kadın, yaşlı, vs.) Değişken: İncelenen karakter ya da faktör. Bireysel özelliklerin mantıksal seti (örneğin cinsiyet: Erkek --- Kadın, yaş, medeni durum) Kavramsallaştırma ve İşletimselleştirme süreçleri değişkenlerin ve bu değişkenleri oluşturan değerlerin belirlenmesidir Değişkenlerin değerleri tam olmalı ve her gözlem bir değer altında sınıflanmalıdır
İstatistikte değişken terimi, deneklere ait özellikler anlamında kullanılır. Pratik anlamda düşünürsek, bireye ait veri giriş formundaki her bilgi bir değişkendir.
VERİ Bir olayı aydınlatmak, bir gerçeği ortaya çıkarmak, bir kavrama ulaşmak, bir yargıya varabilmek için gerekli olan materyal (bilgi, belge, madde vb) Üzerinde inceleme yapılan materyal
VERİLERİN SINIFLANMASI VERİ KATEGORİK (Niteliksel = Kalitatif) NUMERİK (Niceliksel = Kantitatif) DİKOTOM *var-yok *kadın-erkek *hasta-sağlıklı NOMİNAL İKİDEN ÇOK KATEGORİ *aile tipi *Medeni Durum * Ruhsal hastalıklar ORDİNAL (Sıralı) * Zeka düzeyi kategorileri *Psikolojik ölçek skor. *Kanser aşamaları (Komşu kategoriler arası fark eşit değil) SÜREKLİ *Yaş *Akademik test sonuçları SÜREKSİZ *Çocuk sayısı *Aday sayısı *Kaza sayısı Komşu kategoriler arasında fark eşit
NOMİNAL ÖLÇÜM: Nominal bir değişkende ölçüm düzeyleri arasında bir sıralama ya da uzaklık-yakınlık gibi belirli bir mesafe yoktur. Ölçüm düzeyleri, değişkenin alabileceği değerler anlamındadır. Örneğin tip I diyabetes mellitus (DM), tip II DM ve normal sağlıklı deneklerin alındığı bir çalışmayı ele alalım.
Normaller 0, ya da 9, NOR tip I DM 1 ya da 7, BİR tip II DM 2 ya da 4, İKİ diye de kodlayabiliriz.
Başka bir çalışmada Grup değişkeni sırasıyla; Normal 1, NOR Kronik aktif hepatit 2, KAH Siroz 3, SİR Hepatoselüler Kanser 4, CA Bilier siroz 5, BİL
Nominal değişken değerleri, rakam olarak değil, ad olarak anlam ifade ederler. Ama pratik amaçlar için bu tip nominal değişkenlerin alabileceği tüm değerleri kodlayarak, rakama dönüştürmekte yarar vardır (özellikle bilgisayar ortamında istatistiksel ölçümler ve analizler yapabilmek için).
İki düzeyli, yani yalnız iki değer alabilen nominal değişkenlere ikili değişkenler (Dikotom) adı verilir. Örneğin cinsiyet erkek ve kadın olarak iki düzeyi olan bir ikili değişkendir. Aynı şekilde evet-hayır varyok iki değer alabilen bir değişkendir.
ORDİNAL ÖLÇÜM: Ordinal bir değişkende ölçüm düzeyleri arasında bir sıralama vardır, ama düzeyler arasındaki mesafe belirli değildir. Örneğin, tümörlü hastaların tanımlandığı evre adını verdiğimiz bir değişkenimiz olsun. Bunu: Evre 1 Evre 2 Evre 3 Evre 4 şeklinde sınıflandırabiliriz.
Bu değerler belirli bir sırayı ifade etmektedir. Örneğin, evre 3, evre 2 den daha ileri bir safhayı ifade eder. Evre 1 en iyi, evre 4 en kötü evredir. Ama değişkenin düzeyleri arasındaki mesafeler belirli değildir. Örneğin 4-3=1 matematiksel olarak doğrudur ama kanser evreleri için mantıksal olarak doğrulamak mümkün değildir.
Ordinal değişken değerleri yalnızca > ve < işlemleri için sayı gibi değerlendirilir, bunların dışında matematiksel işlemler uygulanamaz. Ordinal değişken değerlerini kodlarken büyüklük ve küçüklük farkını gözetecek şekilde, yani sıralamayı korumak koşuluyla istenilen rakamlarla kodlanabilir. Örneğin; 1,2,3,4,5 (doğru) ----- 1,3,5,6,9 (doğru) -------- 9,6,5,4,1 (doğru) ----------- -- 1,4,2,8,9 (yanlış) kodlama şekilleridir.
Nominal ve ordinal ölçümle belirtilen değişkenlere Kategorik Değişkenler adı verilmektedir.
SAYISAL (NÜMERİK) ÖLÇÜM: Bir değişkenin aldığı değerler, nominal ya da ordinal değişkenlerde olduğu gibi araştırıcı tarafından belirlenmiş kodlar değilde gerçek rakamlarsa, o değişkenin sayısal ölçüm skalasında ölçüldüğü söylenebilir. Sayısal ölçümle belirlenen değişkende, değişken düzeyleri arasında hem sıralama, hem de belirli bir mesafe vardır. Sayısal değişken değerlerine reel sayılara uygulanan her türlü matematik işlem uygulanabilir.
Sayısal (nümerik) değişkenlerde iki şekilde olabilir. Kesikli ya da sayımla belirtilen sayısal değişken: Eğer bir sayısal değişken her değeri alamıyor, ancak belirli değerleri alabiliyorsa, o değişkene kesikli değişken adı verilir. Sayımla belirtilen değerleri alabilen değişkenler kesiklidir. Örneğin bir ailedeki çocuk sayısı 1, 2, 3,... gibi yalnızca tam sayı şeklindeki değerleri alabilir. Bu nedenle çocuk sayısı kesikli ya da sayımla belirtilen bir değişkendir.
Sürekli ya da ölçümle belirtilen sayısal değişken: her türlü değeri alabilen değişkenler ise sürekli ya da ölçümle belirtilen değişkenlerdir. Örneğin, bir insanın yaşı genellikle tam sayılarla belirtilse bile, teorik olarak 24.5 yıl, 34.56 gün gibi her türlü değeri alabilir, bu nedenle yaş sürekli bir değişkendir. Yine biyokimyasal testler sonucu elde edilen değerler sürekli niteliktedir. Çünkü hem aralarında belirli bir sıralama hem de belirli bir mesafe vardır.
Sayısal değişkenleri, sınıflayarak ordinal değişkenlere dönüştürebiliriz. Örneğin BMI değerini ele alacak olursak; 18,5 BMI düşük değerdekiler >>> zayıf 18,6-25 BMI arası >>> normal 25,1-30 BMI arası >>> kilolu 30,1-35 arası >>> şişman 35,1 ve üzeri >>> aşırı şişman şeklinde sınıflandırılabilir.
Ölçme Düzeyleri Sınıflandırma Cinsiyet, doğum yeri, saç rengi, vs. Sıralama Mantıksal olarak sıralanabilen değerler (azdan-çoğa, sertten yumuşağa, uzundan kısaya vs., manga) Eşit aralıklı (interval scale) Değerleri ayıran mesafe birbirine eşit ve anlamlı Sıfır yokluk anlamına gelmiyor (IQ, sıcaklık) 20 derece 10 dereceden iki kat sıcak değil Oransal Sıfır değerinin anlamı var Yaş, üye sayısı, kütüphaneye gitme sıklığı vs. Ayda 1000TL geliri olan 2000TL geliri olanın yarısı kadar kazanıyor
Veriyi nasıl anlatalım, kullanalım? Yaş (oranlı) Ortalaması, standart sapması alınabilir Cinsiyet (sınıflama) Erkek-kadın (sayı, % verilebilir. ort./ss olmaz) Dindarlık (sıralama) Likert ölçeği (dağılım verilebilir)
Ölçümler en ayrıntılı düzeyde yapılmalı Nümerikler istenildiğinde sınıflandırılabilir Örneğin yaş (genç, orta yaşlı, yaşlı ya da 35 yaş üstü/altı) Kategorik Nümerik yapılamaz Değişkenlerin ölçüm biçimi analizi belirler.
Veri toplamada genel prensipler Veri toplama planlı bir işlemdir. Hangi amaçla, neyin, ne şekilde, nasıl, hangi sürede, nerede ve kimler tarafından toplanacağı önceden belirlenir. Bunun için:
Amaç saptanır: niçin toplanacaktır, hangi kavram, kuram, öneriler ve sonuçlara varılacaktır. Hangi veriler toplanacaktır: Gerekli olan veri nedir? Hangi veriler amaca ulaşmayı sağlayacaktır? Gereksiz verileri toplamaktan nasıl sakınmalıyız?
Veri toplama tekniği nedir? Anket, gözlem, ölçüm, tarama testleri vb. yöntemler kimler tarafından, nerede, ne zaman ve hangi koşullar altında toplanacak, kaydedilecektir.
Değerlendirme nasıl ve kim tarafından yapılacaktır? Ölçüm materyalinin değerlendiriciler tarafından incelenmesi ve karar varılması nasıl olacak (tek veya çift taraflı farkına vardırmama, tek değerlendirici-iki veya daha fazla değerlendirici uzman vb.) Elde edilen bulgular nasıl incelenecek (tablo, grafik, tanımlayıcı ölçütler, analiz yöntemleri neler olacak)
Veriler nasıl saklanacak ve kullanıcıların nasıl kullanacağının önceden belirlenir. Kullanıcılar verileri nasıl saklayacak Değerlendirme sonuçları nasıl kullanılacak Veriler yeniden nasıl kullanılabilecek
Verinin Özellikleri Veri doğru olmalıdır Yan tutmadan, doğru bir veri toplanmalıdır Veri geçerli olmalıdır Elde edilen veri ölçülmek istenen özelliği, diğer farklı bir durum ile karıştırmadan ölçebilmelidir
Veri güvenilir olmalıdır. Aynı durumu değişik zaman dilimlerinde aynı şekilde yanıtlayabilmelidir. Tutarlı yanıtlar verebilmelidir.
Veri kullanılabilir olmalıdır Veriler herkes tarafından kullanılabilir ve denetlenebilir olmalıdır Veri yararlı olmalıdır Toplanan veri belirli bir konuyu aydınlatabiliyor veya çözüm sağlayabiliyor ise yararlıdır.
Veri eksiksiz olmalıdır Soruyu yanıtlayabilecek her türlü veri eksiksiz bir şekilde toplanabilmelidir.
Verinin özelliklerini etkileyen etmenler Veri kaynağı ile ilgili etmenler: Veri kayıtlardan toplanıyor ise: kayıtlar düzenli, doğru ve gerekli bilgiyi içermelidir Anket ile toplanıyor ise, doğru, gerçek, dürüst yanıtlar olmalıdır Gözlem ile toplanıyor ise, gözlemcinin yan tutmaması, farkına vardırmama gibi ilkelere uyması
Form ile ilgili etmenler Yanıtlayıcının özelliklerine uygun Bilgi toplama akışı yanıtlayıcıya uygun bir düzende Anlaşılır sorular barındıran Yanıt seçenekleri açık ve uygun Gerektiğinde açıklama yapmaya uygun
Veri toplayan kişiye ait özellikler Tarafsız, gayretli, titiz, yan tutmayan Yönlendirici olmayan Veriyi doğru toplayıp kaydedebilecek özellikte Toplanacak veri ile ilgili eğitimli olmalıdır
Kişi, kurum ve kuruluşların izni Verinin toplanacağı kişiden öncelikle bir onam formu doldurması istenmelidir. Ayrıca bir kurum ya da kuruluşta yapılacak ise önceden izin alınmış olması gerekir Yanıtlayıcıların kimliğinin gizliliği doğru yanıt elde edebilmek için önemlidir.
Verinin denetimi Veri toplama aşamasında denetim Toplanan verilerin denetimi Hata kontrolü Özel ölçütlerin hesaplanması yoluyla denetim.
Ölçüm Kalitesi Geçerlilik ve Güvenirlilik (psikometrik özellikler)
Güvenilirlik Güvenilirlik tutarlılığın bir fonksiyonudur Güvenilirlik Farklı ölçümlerin tutarlı bir biçimde aynı sonucu vermesi Güvenilirlik doğruluk anlamına gelmez (ölçümler tutarlı olsa da yanlış olabilir) Güvenilir ölçümler yapma yöntemleri Test yeniden test (test-retest) Yarıya bölme yöntemi (split-half) Bilinen ölçüleri kullanma (known groups) Araştırmacıların güvenilirliği
Geçerlik Ölçülmek istenen özelliğin herhangi bir başka özellikle karıştırmadan ölçebilmesidir. Ölçüm geçerliği: Kavramsal ve işletimsel tanımların birbirine uygun olması Ölçümün araştırılan kavramın gerçek anlamını yansıtması Ör: zeka ölçümü için IQ testi Sağlıkla İlgili Yaşam kalitesi: Fiziksel yeti yitimi + mental iyilik skoru + sosyal işlevsellik
Geçerlilik Türleri Yüz geçerliği (face validity) İlk bakış geçerliliği de denir. Bir ölçümün görünüşte bir kavramı ölçüp ölçmediğine karar verilmesidir. (ör: depresyon ölçümünde onu oluşturan bileşenleri içeriyor mu? Sosyal işlevsellikte gündelik yaşamda karşılıklı etkileşime ilişkin sorular yer alıyor mu?) Genellikle istatistiksel bir değerlendirme yapılmadan kavramın uzman kişiler tarafından değerlendirilmesi ile yapılır.
Geçerlilik Türleri Ölçüt geçerliği (criterion validity) Kestirim geçerliği (ör: akademik başarısı yüksek olanların üniversite sınavlarından elde ettiği başarının yüksek olması, IQ testi yüksek olanların daha fazla üniversiteye yerleşmesi, çocuklukta şiddetle karşılaşanların gelecekte şiddete meyilli olması vb.) Gruplar arasındaki farkı ayırt edici mi? (ör: depresyonda olan ile olmayanı ayırt ediyor mu? Sosyoekonomik düzeyi yüksek olan ile düşük olan arasındaki farkı belirleyebiliyor mu?)
Geçerlilik Türleri Yapı geçerliği (constract validity) Değişkenler arasındaki mantıksal ilişkilere dayanır. Genellikle değişkenler arasındaki birliktelikten (korelasyon) hareketle hesaplanır. Birlikte değişimden de (covaryasyon) yararlanılarak bakılabilir. Faktör analizi sık kullanılır. Açıklayıcı ve doğrulayıcı şekillerde yapılabilir. Depresyon intihar Depresyon iştahsızlık
Component 1 2 3 4 5 6 cks11 0,464 0,235 0,331 0,058 0,129 0,062 cks12 0,658 0,229 0,297 0,134 0,212 0,161 cks13 0,780 0,066 0,067 0,166 0,116 0,067 cks14 0,766 0,166-0,029 0,067 0,070 0,033 cks15 0,688 0,140 0,281 0,184 0,164 0,117 cks21 0,404 0,305 0,492 0,273 0,188 0,077 cks24 0,347 0,184 0,424 0,284 0,191 0,030 cks26 0,351 0,235 0,384 0,404 0,337 0,030 cks32 0,132 0,092 0,809 0,008 0,030 0,067 cks33 0,072 0,185 0,772 0,017 0,024 0,116 cks36 0,100 0,059 0,679 0,201 0,179 0,175 cks41 0,337 0,371 0,433 0,177 0,244 0,089 cks51 0,217-0,057 0,032 0,177 0,741-0,001 cks52 0,325 0,137 0,217 0,157 0,615 0,082 cks64 0,061 0,410 0,198 0,127 0,535 0,311 cks65 0,035 0,329 0,112 0,079 0,509 0,287 cks66 0,074 0,400 0,100 0,169 0,456 0,320
Geçerlilik Türleri Kapsam geçerliği (content validity) Ölçülmek istenen kavramın tamamını ölçecek bir içeriğin oluşturulması. Diğer bir deyiş ile kavramı oluşturan tüm bileşenler yer almalıdır. Ör: bireyin sağlığını değerlendirmede yalnızca fiziksel özelliklerin dışında psikolojik ve sosyal bileşenlerinde ölçülmesi. Bir IQ testinde hem sayısal hem de sözel içeriklerin yer alması
Geçerlik - Güvenilirlik Güvenilir Ama geçerli değil Geçerli ama güvenilir değil Geçerli ve güvenilir Ölçülmek istenen özellik Ölçüm sonucu
Nasıl Ölçelim?
Soru Sorarak Ölçme Soru sorma teknikleri (anket, görüşme, deney, alan araştırması vd.) Açık uçlu kapalı uçlu soru Seçenekler açık ve anlaşılır Kısa ve yalın Yönlendirmeden kaçınan Eğitime uygun Halkın dilinden Pozitif yaklaşan Tekrarlamayan
Kavramları Nasıl Ölçeriz? Somut gözlenen durumları ölçmek nispeten kolay Ör: yaş, cinsiyet, eğitim durumu, medeni durum, işi, geliri, vb. Sosyal bilim kavramları ya da gözlenemeyen durumları ölçmek daha zor Ör: mutluluk, bağlılık, yabancılaşma, depresyon, sosyal işlevsellik, sosyal statü, vb.
Kavramların ölçümü için bir örnek: İş stresi İnsanlar iş stresi hakkında ne hissediyorlar? Selye fiziksel, kimyasal, psikolojik etmenlerin özgül olmayan bir reaksiyona (iş stresi) neden olduğunu ileri sürmüş ve bu özgül olmayan stres yanıtını genel adaptasyon sendromu olarak isimlendirmiştir. İlerleyen yıllarda stresin sosyal, ekonomik ve psikolojik yönlerini bütünsel bir yaklaşımla ele alma çabaları oluşmuştur.
Stresin fiziksel, kimyasal vb etkenlerden farklı olarak doğrudan ölçümü yapılamaz. Bu nedenle farklı iş kollarında uygulanabilecek, işin doğasını açıklayabilen kuramsal soyutlamalara gereksinim vardır. psikolojik yaklaşım sosyolojik yaklaşım
İş çevresinden kaynaklanan stres ve bunun sağlık üzerindeki olumsuz etkilerini değerlendirmeye yönelik olarak iki model oldukça yaygın olarak bilinenleridir. İlki istem-kontrol modeli olarak bilinen ve Karasek ve Theorell in geliştirdikleri model olup, aşırı iş yükü ve buna karşılık olarak iş üzerindeki düşük kontrolün sonuçları üzerinde durulmuştur. Diğer model ise Siegrist tarafından geliştirilen çaba-ödül dengesizliği modelidir.
Şekil 1. İstem Kontrol Modeli.
İş Yükü Düşük Yüksek Kontrol Düşük Yüksek
İş Yükü Kontrol
Şekil 2. İstem-kontrol-sosyal destek.
Bileşik Ölçümler Nicel araştırmalarda kullanılır Kavramları tanımlayan gözlemlerden oluşur (ör: iş stresi, depresyon, anksiyete, IQ testi, SES) Örnek: Sosyo Ekonomik Statüyü belirleyen temel etmenlerden birisi elde edilen gelirdir. Tek başına gelir bize kısmen bir bilgi verebilir. Oysa kavramın tam olarak içerdiği durum gelirden daha fazla değişkenle açıklanabilir. örneğin: gelir + eğitim + meslek + sahip olunan mülk +
Bileşik Ölçüm Türleri İndeksler Ölçekler Yetenek, yeti ölçenler Likert tipi ağırlık ölçenler Tipolojiler
İndeksler Bir kavramı tanımlamak için kullanılan nicel ölçümdür Kavramı ölçebilmek için onu tanımlayan göstergelerden yararlanılır. Nicel bir sıra yaratır. Değişkenler genellikle eşit ağırlıklıdır ve bir toplam skoru vardır Tek boyutludur. Örnek: BM İnsani Gelişme Endeksi, yaşam kalitesi indeksi, Hastane anksiyete ve depresyon ölçeğinden elde edilen anksiyete ya da depresyon durumunu belirtir düzey.
İndeks Oluşturma Maddelere ilişkin özellikler Maddelerin Korelasyonu Müddelerin eşit ağırlığı Yanıtların değişkenliği Maddelerin birbiriyle aşırı korelasyonundan kaçınılmalı Maddelerin birbirine bağımlı olması sorundur. (ör: yürümek-merdiven çıkmak) (dependency) Maddeler geçerli bir ölçüm yapabilir mi? Maddeler (items) Yüz geçerliliği Tek boyutluluk İndekse özgü olma Çeşitli bileşenlerden oluşmalı
İndeks Çözümleme Ayırt edebiliyor mu? Derecelendirebiliyor mu? (iyi-kötü, sağlam-hasta, az-orta-çok, ) Madde analizi (yapı geçerliliği, madde başarısı, iç tutarlılık katsayısı, ) [genellikle IRT, Rasch gibi modern test teorileri ile çözümlenir. Geleneksel test teorisi yöntemleri de kullanılabilir] Dış geçerlilik (kriter geçerliliği, yordama geçerliliği, benzer ölçek geçerliliği, birleşimayrışım geçerliliği, )
Ölçekler (yetenek, yeti ölçenler) Nicel bir derecelendirme vardır. Her bir gözlem farklı ağırlıklıdır Yetenek ya da yetiyi soruların ağırlık düzeyine göre sıralamak söz konusudur. Ör: yürümek-merdiven çıkmak-koşmak (en sonuncuyu yapan diğerlerini de muhtemelen yapabilecek yetidedir). Dini kurallara özen gösteririm ibadetlere katılırım dini toplantılara ve etkinliklere katılırım???
Likert Tipi Ölçekler Sık kullanılan bir türdür. Ordinal bir dizgi mevcuttur (Tamamen Katılıyorum, Katılıyorum, kararsızım, katılmıyorum, tamamen katılmıyorum) (hiçbir zaman, bazen, ara sıra, çoğunlukla, her zaman) Üçlü, dörtlü, beşli, ya da iki uç arasında dağılım bir doğru gibi alternatifleri vardır. Skor hesaplamada toplam puan, ortalama puan ya da maddelerin ağırlıklarına göre belirlenmiş bir sonuç kullanılabilir. Bazen belirlenmiş bir kesme noktasına göre elde edilen sonuçlar kategorize edilir.
Anlamsal Fark Bireyler iki zıt sıfattan hangisini hangi düzeyde benimsediklerini seçerler. Bazen ifadeler, bazen VAS (visual analog scale, görsel eş değerlilik ölçeği) şeklinde olabilir. Çok Biraz Nötr Biraz Çok İlginç Sıkıcı Basit Zor Yararlı Yararsız
Tipolojiler Sınıflandırılmış bileşik ölçüm biçimi Bireyler çeşitli şekillerde sınıflandırılarak (kategorize edilerek) değerlendirilirler. Örneğin; depresif, borderline, normal kişilik tipleri iş stresi düzeyleri vb.