ÜNİTE 12 TANI TESTLERİ

ÜNİTE 12 TANI TESTLERİ Prof. Dr. Şennur Dabak Hastalıkların teşhisinde, tarama programlarında hastalarla sağlamların ayırt edilmesinde çeşitli testler kullanılır. Bu tarama ve tanı testleri standart görüşme, fizik muayene ya da laboratuar testlerine veya radyografi, elektrokardiyografi, gözdibi muayenesi, ultrasonografi ve histopatoloji gibi çok daha karmaşık ölçümlere dayalı olarak yapılabilir. Bu yöntemlerin kişiye doğru tanı koymada ne kadar geçerli oldukları ve bu yöntemleri kullanan kişilerden kaynaklanan gözlem-ölçüm hatalarının boyutunun ne olduğu incelenmeli ve gözlem ve ölçümlerin kalitesi belirlenmelidir. Ayrıca bu testler aynı amaç için kullanılan değişik ölçüm araçlarını karşılaştırmak, ya da araçların değişik kişiler ve değişik yollarla kullanımının etkisini göstermek amacıyla da kullanılabilir. Sağlık alanında çalışan araştırmacılar tanı koymada yeni bir yöntemin ya da bir tarama testinin eski, bilinen, kabul edilen bir yöntem kadar iyi sonuç verip vermediğini tespit etmek isteyebilirler. Bu yöntemlerin hepsi kesin tanı koymada aynı düzeyde başarılı değildir. Ayrıca tanı yöntemlerini kullanan kişilerden kaynaklanan farklılıklar da olabilir. Bu nedenle tanı yöntemlerinin doğru ölçme derecesi ve bu ölçümleri kullananların farklılıklarını saptamak amacıyla çalışmalar yapılmalıdır. 1

12.1. GEÇERLİLİK Gözlem veya ölçüm yapılırken kullanılacak test-yöntem, kimin gerçekten hasta, kimin gerçekten sağ lam olduğunu ayırabilmeli, saptayabilmelidir. Diğer bir deyişle ölçme yöntemi, ölçtüğümüz değişkenin değerini ne kadar doğru ölçtüğümüzü vermelidir. Örneğin, atrial fibrilasyonu olan bir hastada radial nabzın gerçek kalp atım hızını verip vermediğinden kuşkulanılabilir. Çünkü fıbrilasyon nedeniyle zayıf olan bazı kalp atımları bilekten hissedilemeyebilir. Bu du rumda radial nabız gerçek kalp atımı sayısı ile karşılaştırıldığında, sayının gerçek atım sayısının altında olduğu gö rülebilir. İşte burada radial nabzın geçerliliğinin, doğruluğunun, yani gerçek kalp atım sayısına ne kadar yakın olduğunun saptanması gerekir. Geçerlilik (Validite), araştırmada kullanılan yöntem ve tekniklerin, kesin doğru olduğu varsayılan bir ölçümün sonuçları ile kıyaslandığında saptanan belirleyiciliğidir. Kabaca tanı değeri olarak belirtilebilir. Geçerlilik, bir ölçme yönteminin incelenen olayı/ hastalığı hangi gerçeklikte ölçtüğüdür. Araştırmacı, yaptığı araştırma sonuçlarının başka araştırmalara göre ne denli geçerli olduğunu; ya da kullandığı testin tanı değerinin ne denli yüksek olduğunu merak eder. Sonuçların geçerliliğini saptamak için kıyaslama yapmak gerekir, kıyaslanacak en güvenilir veri ise daha önce geçerliliği saptanmış olandır. Hiçbir kavramın tam olarak geçerli ya da yüzde yüz doğru olduğunu söylemek olası değildir. Bunun için gözlem, cerrahi, otopsi gibi çoğunlukla araştırma dışı ulaşılan ve elde edildiğinde kesin kabul edilebilecek veri temel alınır. Bu veri geçerli (referans) test, kaynak test ya da altın standart olarak değerlendirilir. Bir tanı yönteminin altın standart olarak kabul edilmesi için tüm disiplin içinde ve evrensel olarak en doğru tanı koyan yöntem olduğu konusunda görüş birliği olması gerekir. Sağlık bilimlerinde en güvenilir kabul edilen ve altın standart olarak en çok başvurulan tanı yöntemi Patoloji biliminin incelediği örneklerdir. Standardın ya da en doğru tanı yönteminin en ileri teknolojiye dayanması gerekmez. Gastrointestinal kanama için endoskopi, koroner darlık için anjiyografi, altı parmaklılık için doğan bebeğin gözlenmesi, metastaz için lenf nodu biyopsisi raporu altın standart kabul edilen tekniklerdir ve diğer ölçüm ve tanı yöntemlerinin geçerliliği onlara göre değerlendirilir. Tanı amacıyla kullanılan bir testin geçerliliğini ya da tanı değerini saptamak için aynı bireylerde kaynak testin de uygulanmış olması zorunludur. Geçerlilik, yalnızca ilgili disiplinde altın standart olduğu kabul edilmiş bir tanı yöntemi bulunduğunda uygulanabilir. Altın standart yoksa geçerlilik ölçülemez. Geçerlilik ölçümü için en doğru yaklaşım dört gözlü düzenek oluşturmaktır. Dört gözlü düzenek, veriyi en basit konuma indirgediği ve karıştırıcı etmenlerden arındıracak yalınlıkta olduğu için en güvenilir yapıdır. Düzenekte ilke olarak geçerliliğin ölçüleceği kaynak test kolonlara, onunla kıyaslanacak diğer yöntem ya da tanı testi satırlara yerleştirilir (Şekil 1). 2

Şekil 12.1. Geçerlilik değerlendirme düzeneği Şekil 1 de görülen düzenekte kolonlar dayanak alınacaktır, çünkü -sonuçları doğru olsun olmasın- altın standart olan kaynak testin olumlu dedikleri kesinlikle olumlu, olumsuz dedikleri kesinlikle olumsuz kabul edilir. Bu nedenle a+c olumluları, b+d olumsuzları göstermektedir. Olumlular içinde a gözünde yer alan değerler kullanılan testle de olumlu bulunan, başka deyişle kullanılan testle olumlu bulunan ve dayanak testle olumluluğu kanıtlanan veridir, c gözünde yer alanlar ise gerçekte olumludur, ancak kullanılan test tarafından yanlış olarak olumsuz değerlendirilmiştir. Olumsuzlar içinde yer alan b gözündekiler kullanılan test tarafından yanlışlıkla olumlu gösterilmişler; d gözünde yer alanlar ise kullanılan test tarafından olumsuz bulunmuş, olumsuz oldukları kaynak test tarafından da onaylanmıştır. Bu durumda a ve d gözleri uyumlu ve tutarlıdır, her iki yöntemle elde edilen sonuç aynıdır. b ve c gözleri uyumsuz ve tutarsızdır, iki yöntemle alınan sonuç farklı olmuştur. b dekiler yalancı olumlu, c dekiler yalancı olumsuz kabul edilir. Geçerliliğin iki bileşeni vardır: Duyarlık ve Seçicilik Kaynak teste, yani mutlak doğru olduğu varsayılan sonuçlara göre doğru olumlu ve doğru olumsuz gözlerde bulunan birey sayıları ne denli fazlaysa, kullanılan testin o denli geçerli olduğu kabul edilir. Bunun için de yalın bir orantı ve yüzdeleme uygulanır. Duyarlık (Sensitivite): Geçerliliği belirlenecek olan ölçüm yönteminin gerçekten hasta olanlardan ne kadarını hasta olarak saptayabildiğini gösterir. Yeni test ile hasta olarak saptananların (doğru olumlular), kaynak teste göre saptanan toplam hasta kişilere oranı yeni testin duyarlılığını verir. Bir testin duyarlılığı, o testin hastaları yakalama gücüdür. 3

Seçicilik (Spesifite) : Geçerliliği saptanacak olan yeni ölçüm yönteminin, sağlam olanlardan ne kada rını doğru olarak (sağlam) saptayabildiğini gösterir. Yani, yeni test ile sağlam bulunanların (doğru olumsuzlar) kaynak teste göre sağlam olduğu bilinen kişilere oranı, yeni testin seçiciliğini verir. Bir testin seçiciliği, o testin sağlamları ayırma gücüdür. Geçerlilik temel olarak bu iki gösterge ile belirtilir. Örnek 1: Bir bölgedeki 600 kadına serviks kanseri taraması yapılarak hem biyopsi yapılmış, hem de smear alınmıştır. Burada kaynak test servikal biyopsi sonucu olarak alınmış olup; kolay, pratik ve ekonomik bir yöntem olan Papanicolau Smear tekniğinin geçerliliği aşağıdaki şekilde belirlenmiştir (Şekil 2). Şekil 12.2. Papanicolau Smear tekniğinin (servikal biyopsi sonucuna göre)geçerlilik değerlendirme düzeneği 4

Yorum: Papanicolau smear yöntemi servikal kanser vakalarının %96 sını saptayabilmekte, ancak kanser olmayan sağlam kadınların % 40 ına da yanlış olarak kanser tanısı koymaktadır; sağlamların ancak %60 ını ayırabilmektedir. Yani duyarlığı yük sek, fakat seçiciliği düşük bir testtir. Örnek 2: Öksürük, halsizlik, ateş yakınmaları ile başvuran 246 kişide yapılan oskültasyon değerlendirmesinde 141 kişide çeşitli raller saptanarak pnömoni ön tanısı konmuştur. Kesin tanı konması amacıyla çekilen akciğer grafilerinde lezyon aranmış, akciğer grafisi ile bu 141 kişiden 128 inde lezyon görülerek tanı doğrulanmış, ral saptanmayan 105 kişiden de 17 sinde lezyon bulunarak pnömoni tanısı konmuştur. Oskültasyonun akciğer grafisine göre geçerliliği (tanı değeri) aranacaktır (Şekil 3). Şekil 12.3. Oskültasyonun (akciğer grafisine göre) geçerlilik değerlendirme düzeneği Örnekte işlem uygulandığı sırayla özetlenmiş, önce kullanılan teknik olan oskültasyondan öncelikle söz edilmiştir. Bu işlem aynı zamanda tabloda satırla gösterilen uygulamadır. İşlemin ikinci aşaması olan ve kaynak test olarak uygulanan akciğer grafisi tabloda kolon olarak gösterilmiştir. Tablo özetle şöyle okunabilir: Kaynak test olan akciğer grafisi ile 145 pnömoni tanısı konmuş, ön tanı işleminde oskültasyonla bu hastaların 128 i doğru olarak tanınabilmiştir. Akciğer grafisi 101 kişinin hasta olmadığını saptamış, oskultasyonla bunların 88 i doğru olarak yakalanmıştır. 5

Oskultasyonla pnömoni, kesin tanı yöntemi olan radyolojiye göre %88.3 oranında doğru olarak tanınmış, sağlam kişiler de yine radyolojiye göre %87.1 oranında doğru olarak ayrılabilmiştir. Oskültasyonun hem duyarlığı, hem seçiciliği oldukça yüksek bulunmuştur. Ülkenin ya da sağlık biriminin hizmet olanaklarına göre radyolojik incelemeye gerek olmadan tanı ve sağaltıma salt oskültasyon sonucu gidilip gidilemeyeceği bu veriyle kararlaştırılabilir. Duyarlık ve seçicilik yüzde kırk-ellilerde bulunsaydı, oskültasyona güvenme olanağı kalmayacaktı; her ikisi de yüzde yüze yakın bulunsalardı, doğrudan pnömoni tanısında radyoloji gereksizdir denebilecekti. Duyarlık yüksek, seçicilik düşük bulunsaydı salt hastaları; duyarlık düşük, seçicilik yüksek bulunsaydı salt sağlamları ayırmak için kullanılması gerektiği söylenecekti. Duyarlık ve seçiciliğin her ikisi de yükseldikçe, geçerliliğin arttığı kabul edilir. Salt duyarlık yüksekse geçerliliğin patolojik olanları ayırma amacıyla kullanılması, salt seçicilik yüksekse geçerliliğin sağlam olanları ayırmakta kullanılmasının uygun olacağı düşünülür. Ancak bir test ya da uygulamanın geçerli sayılması için hem duyarlı hem de seçici olması, yani her iki öğenin de yüksek olması beklenir. İdeal bir tarama testinin %100 duyarlı ve seçici olması istenirse de bu pratikte ulaşılması güç olan bir orandır. Genellikle sürekli değişken türündeki ölçümlerde seçicilik ve duyarlılık birbiriyle ters, negatif yönde ilişkilidirler. Yani bir testin duyarlılığı yükseldikçe seçiciliği, seçiciliği yükseldikçe duyarlılığı azal maktadır. Sürekli nitelikte olup, normal dağılım gösteren değişkenler arasında hemoglobin düzeyi, kan ba sıncı, serum kolesterolü, intraoküler basınç, kan şeker düzeyi gibi ölçümler sayılabilir. Sürekli değişkenlerle ilgili ölçümlerde elde edilen hasta ve sağlamlara ait alt ve üst sınırdaki değerlerin dağılımlarında sıklıkla üst üste gelme, çakışma durumu söz konusudur. Diğer bir deyişle sağ lamlara ait dağılımın sağ ucundaki normalin yüksek değerleri ile hastalara ait dağılımın sol ucundaki pato lojiklerin yüksek değerleri çoğu kez birbirleri ile çakışırlar. Kan şekerinin ölçüldüğü bir araştırmada Şekil 4 deki çeşitli durumlar (A,B,C,D,E) ile karşılaşılabilir: 6

Şekil 12.4.. Bir tanı testinde çeşitli sınır noktalarının testin duyarlık ve seçiciliğine etkileri 7

A.Teorik olarak tanı yöntemi, normal ve yüksek değerleri kesin olarak birbirinden ayırt etmektedir ve dağılımlarda herhangi bir çakışma yoktur. B.Normal ve diyabetiklerin kan şekeri değerlerinin dağılımı belirli noktalarda çakışma göstermektedir. Hasta ve sağlamların birbirinden ayırt edilmesinde sınır noktanın belirlenmesi testin duyarlığını ve seçiciliğini yakından etkiler: C.Sınır noktanın düşük seçildiği durumlarda çok sayıda normal (sağlam) kişi de hasta tanısı alacaktır, yani yalancı olumluların oranı yüksek olacaktır. Buna karşılık, tüm hastalar (diyabetliler) saptanmış olacaktır. Bu testin duyarlığı yüksek, seçiciliği düşük olacaktır. D. Burada patolojik ve normal bulguları ayırt eden sınır nokta, iki dağılımın çakıştığı bölgenin tam ortasında seçilmiştir. Buna göre hem hasta, hem de sağlam bireylerde birbirine yakın oranda yanlış tanı (yalancı olumlu, yalancı olumsuz) konulmaktadır. Her iki tip hata payı eşit olduğu için duyarlık ve seçicilik de aynı boyutta etkilenmektedir. E.Sınır nokta yüksek seçildiğinde ise tüm normaller tanınacak, ancak gerçekten hasta olanların bir bölümüne de normal tanısı konulacaktır; yani yalancı olumsuzların oranı yüksek olacaktır. Bu testin seçiciliği yüksek, duyarlığı ise düşük olacaktır. İyi bir tarama testi hem duyarlı hem de seçici olmalıdır. Ancak yukarıda da değinildiği gibi bu türde bir tanı testi her zaman bulunmayabilir. Bu durumda tanı testi seçimi ve hasta-sağlam sınırının belirlenmesi duyarlık ve seçiciliğin önemli olabileceği bazı kriterlere göre yapılır. Duyarlığın önemli olduğu, yüksek olması istenen durumlar şunlardır: a)toplumda taranan hastalık erken teşhis edildiğinde yeterli tedavisi varsa veya ilerlemesi durduru labiliyor, komplikasyonları önlenebiliyorsa, b)yanlış olarak hasta tanısı konulanların (yalancı olumlular) kesin tanıları için gerekli ileri tetkikleri sağlık kuruluşları için bir yük değilse, onların işlerini aksatmıyorsa ve tetkikler çok pahalı değil se, c)toplumda sık sık tarama yapma olanakları yok veya çok sınırlı ise taramada kullanılacak tanı tes tinin duyarlığının yüksek olması istenir. Seçiciliğin önemli olduğu, yüksek olması istenen durumlar şunlardır: a)taranan hastalığın tedavi olanakları sınırlı ise veya tedavisi yoksa, b)şüpheli vakaların ileri tetkikleri için uygun yöntemler yoksa ve ayrıntılı tetkikleri sağlık kuruluşları için büyük yük olarak onların işlerini aksatacaksa veya bu testler çok pahalı ise, c)yanlış olarak hasta tanısı konulması (yalancı olumlu) kişiyi ve çevresini sosyal yönden rahatsız, huzursuz edecekse (Örneğin sifilis, tüberküloz, lepra, AIDS gibi sosyal hastalıklarda bu nokta çok önemlidir), d)hastalığa erken tanı konulmasının, tedavi ve prognoz üzerinde olumlu bir etkisi yoksa, e)tanı ve tedavi izlemelerini yapacak yeterli sayıda/nitelikte personel ve kuruluşlar yoksa taramada kullanılan testin seçiciliğinin yüksek olması istenir. 8

Uygulamada amaç daha çok patolojik olanları yakalamaksa duyarlığı yüksek bir test, amaç sağlamları ayırmaksa seçiciliği yüksek bir test yeğlenmelidir. Öngörü Değeri (Prediktif Değer) Duyarlık ve seçicilik araştırmacı için güçlü dayanak noktalarıdır, ancak her zaman araştırmacının gözü önünde değildir. Araştırmacı önce kendi değerlendirmesini ya da testini yapar, doğrulara uygunluğunu bilemediği için doğruya ne denli ulaşabildiğini merak eder. Öngörü, bir testin bulguları içinde gerçeğin yansıtılma gücünü belirtir. Uygulanan testin olumlu ve olumsuz dedikleri içinde gerçek olumlu ve olumsuzların oranını gösterir. Son yıllarda Amerika Birleşik Devletleri literatüründe özellikle kar amacıyla yeni teknik ve ilaçların reklamını yapmak için kullanılmasıyla gözde olmasına karşın, değişken ve yanıltıcı olması nedeniyle duyarlık ve seçicilik denli güvenilir kabul edilmemelidir. Duyarlık ve seçicilik, gerçek olumlu ve olumsuzlar içinde yöntemin olumlu ve olumsuzları belirleme gücünü saptar. Öngörü ise tekniğin olumlu ve olumsuz olarak saptadıklarının içinde ne oranda gerçek bulunduğunu ölçer (Şekil 1). Şekil 12.5. Oskültasyonun (akciğer grafisine göre) geçerlilik değerlendirme düzeneği 9

Oskültasyon ile konan pnömoni tanıları %90.8 oranında radyolojik inceleme ile de doğrulanmıştır, öngörülen pnömoniler bu oranda doğrudur. Oskültasyon ile sağlam denen kişilerden %83.8 i radyolojik inceleme ile de doğrulanmıştır, öngörülen sağlamlar bu oranda doğrudur. Duyarlılık ve seçiciliğin ölçülmesinde radyoloji tanısı altın standart olarak ele alınmış, dolayısıyla tam ve gerçek olduğu kabul edilmişti. Kullanılan tanı yönteminin geçerliliği, tam ve gerçek doğru olduğu kabul edilen bir yöntemle kıyaslanarak kararlaştırılmıştı. Öngörü de ise oskültasyon temel alındığı, yani zaten kesinliği tartışma götüren ve geçerliliği araştırılan bir yöntem doğruymuş gibi kabul edildiği için, öngörünün geçerliliğine güvenmek doğru olmaz. Öngörünün ikinci bir zayıf yönü değişkenliğidir. Öngörü prevalans ile değişir, b ve d gözlerindeki değerler 10 ile çarpılarak prevalans düşürüldükten sonra yapılan Şekil 5 te duyarlık, seçicilik ve öngörü değeri yeniden hesaplandığında değişkenlik belirgin olarak ortaya çıkar: 10

Şekil 3 te pnömoni prevalansı (a+c/a+b+c+d = 145/246 =) %58.9 bulunmuştu. Bu kez Şekil 5 te prevalans düşürülmüş ve (145/1155 =) %12.6 ya indirilmiştir. Hesaplanan yeni veri aşağıdadır: Şekil 3 Şekil 5 Prevalans %58.9 % 12.6 Duyarlık %88.3 % 88.3 Seçicilik %87.1 % 87.1 Olumlu öngörü %90.8 % 49.6 Olumsuz öngörü %83.8 % 98.1 Görüldüğü gibi aynı toplumda prevalans önemli ölçüde düştüğünde duyarlık ve seçicilikte hiçbir fark görülmemesine karşın, olumlu ve olumsuz öngörü değerleri çok büyük oranda değişmektedir. Bu da öngörü değerinin özellikle kanser gibi seyrek görülen olgularda duyarlık ve seçiciliğe göre çok daha az güvenilir olduğunu göstermektedir. Prevalans arttıkça olumlu testin öngörü değeri de artar. Bu nedenle taramalar, genellikle tüm toplumda değil, yüksek risk gösteren gruplarda yapılır. Gerek duyarlık ve seçicilik, gerekse öngörü değerleri yüzde yüz doğru ve kesin değerler değildir. Bunun temel nedeni, bir ölçümün geçerliliğinin, daha güvenilir olduğu için kaynak kabul edilen bir başka değer kıstas alınarak sınanmasıdır. Kıstas alınan ölçüt kesin olmadığı gibi, kıyaslamalar da değişken ve görelidir. Yine de duyarlık ve seçiciliğin, öngörü değerlerine göre çok daha geçerli ve güvenli olduğu kabul edilmelidir. GÜVENİLİRLİK (TUTARLILIK) Güvenilirlik, tekrarlandığında ölçme yönteminin aynı sonucu verme boyutudur. Aynı süreçlerin izlenmesi ve aynı ölçütlerin kullanılması ile aynı sonuçların alınmasıdır; ölçmenin, tesadüfi yanılgılardan arınık olmasıdır. Araştırmalarda, aynı süreçlerin izlenmesi ile aynı sonuçların alına bilmesi istenir. Aksi halde, hangi sonucun güvenilir olduğuna karar verile mez. Bu, bir bakıma, araştırmalarda alınan bir sonucun, başka araştırmacı lar tarafından da test edilebilmesidir. Bilim, ancak, bu tür doğrulama larla güvenilirlik ve saygınlık kazanır. Herhangi bir araştırmada veya kurumda yapılan gözlem ve ölçümlerin aynı kişiler üzerinde aynı koşullarda tekrar edildiklerinde aynı sonuçları elde etme boyutu saptanır. Böylece aynı zaman kesitinde yapılan gözlemlerin bulguları arasında fark olup olmadığı, varsa bu farkın boyutu, diğer bir deyişle gözlem ve ölçümlerin güvenilirliği belirlenmiş olur. 11

Bu konuda çeşitli örnekler verilebilir: Aynı kişiden, aynı anda alınan iki serum örneğinde aynı yön temle yapılan incelemelerde kan kolesterolü, total lipid, trigliserid sonuçlarının, teorik olarak aynı veya çok yakın olması beklenir. Aynı kişilerin kan basıncı, aynı koşullarda farklı hekimler ta rafından ölçüldüğünde de teorik olarak aynı sonuçlar elde edilmelidir. Bir araştırmada aynı anket aynı kişilere çok kısa zaman aralığı ile tekrar uygulandığında da kısa sürede değişmeyecek konularda aynı yanıtlar alınmalıdır. Çeşitli değişkenlere ilişkin gözlem ve ölçümler aynı koşullarda tekrar edildiğinde aynı sonuçların alın masını etkileyen bazı faktörler vardır: a)ölçme için kullanılan araç-gereçlerin doğruluğu (tıbbi alet ve solüsyonların, vb. bozuk olmaması, anket, vb. veri toplama araçlarının iyi hazırlanması). b)gözlenen/ölçülen değişkenin biyolojik olarak veya fizik koşullara göre değişiklik gösterip göster memesi, aynı hastalığın farklı şekillerde klinik seyir göstermesi ve bilgi veren kişilerden kaynak lanan hatalar. c)gözlem ve ölçümleri yapan kişilerden (gözlemci) kaynaklanan değişiklik. a) Rutin hizmetleri sunarken veya bir araştırma yaparken çeşitli ölçümleri yapmak için gerekli araç-gereçlerin önceden kontrol edilmesi, varsa bozuklukların giderilmesi gerekir. Ayrıca yöntemlerin standardizasyonu da bu tür hata payını ortadan kaldırır veya en az düzeye indirir. b) Gözlem ve ölçümlerdeki tutarsızlığın bir kaynağı da bazı değişkenlerin biyolojik olarak değişiklik göstermesidir. O nedenle tutarlılık kontrollerinde bu noktanın da dikkate alınması gerekir. Örneğin ölçülen değişkenin değerleri yemeklerle, dinlenme durumu ile, kişinin pozisyonu ile (yatarken ve otururken kan ba sıncının değişmesi gibi) veya gece-gündüz arasında farklılık gösterebilir. Ayrıca aynı hastalık farklı klinik şekillerde seyredebilir; ağır ve tipik vakaların tanınması kolay iken, hafif ve atipik va kaların tanısı güçlük yaratabilir. Anketle bilgi toplanması gereken durumlarda ise anket formundaki bazı soruları kişi anlamayabilir veya bazı hassas konularda bilinçli olarak yanıltıcı, gerçek olmayan bilgiler ve rebilir. Dolayısı ile her değişkenin biyolojik, fizik ve diğer koşullarla ilgili değişim gösterip göstermediği de saptanarak, tutarlılık denetimlerinde değerlendirmeye katılmalıdır. c) Gözlem ve ölçümleri yapan kişilerden, yani gözlemcilerden kaynaklanan hatalar ise iki şekilde ölçülebilir: 1)Gözlemciler arası tutarlılık: Aynı kişiler üzerinde, aynı koşullarda farklı gözlemciler tarafından tekrar edilen gözlem ve ölçümlerin sonuçları arasındaki uyuma gözlemciler arası tutarlılık denir. Örneğin aynı hastaya ait EKG iki ayrı hekim (gözlemci) tarafından birbirinden habersiz olarak değerlendirildiğinde, eğer gözlemciler (hekimler) aynı sonuçlara varmışsa gözlemciler arası tutarlılık vardır. 12

2)Gözlemci içi tutarlılık: Aynı kişiler üzerinde, aynı koşullarda, aynı gözlemci tarafından tekrar edilen gözlem ve ölçümlerin sonuçları arasındaki uyum gözlemci içi tutarlılıktır. Örneğin aynı patoloji preparatını farklı zamanlarda değerlendiren bir patolog (gözlemci) aynı sonuçlara varıyorsa kendi kendisiyle tutarlıdır, yani gözlemci içi tutarlılık tamdır. Burada dikkat edilmesi gereken nokta gözlemcinin aynı preparatı değerlendirdiğini bilmemesi, yani farkına varmamasıdır. Buna çeşitli kaynaklarda kör çalışma adı da verilir. Bunun amacı gözlemcilerin birbirlerinden etkilenmesini önlemektir. Bu tür yaklaşımın en kritik yönü, iki ölçme arasında bırakılması gere ken zaman aralığının iyi ayarlanabilmesidir. Zamanın çok kısa olması, yeni den hatırlamayı kolaylaştıracağından, yapay (suni) olarak yükselmiş bir gü venilirlik ölçütü çıkmasına; zamanın uzaması ise, ölçülen özellikte bazı değişmelerin meydana gelmesi sonucu, iki ölçme için aynı koşullar ın sağ lanmasını olanaksızlaştırabileceğinden güvenilirlik ölçütünün yorumunun güçleşmesine neden olur. Yeniden sınama için ayrılan sürenin, bellek etkisini kaldıracak kadar uzun, denek değişikliğine neden olmayacak kadar kısa, örneğin iki haftadan bir aya kadar bir süre şeklinde belirlenmesi önerilmektedir. Örnek: Bir saha çalışmasında ebelere jinekolojik muayene yapma ve değerlendirme öğretiliyor, muayenelerinin geçerliliği saptanan ebeler arasında gözlemciler arası muayene tutarlı lığı saptanmak isteniyor. Bu amaçla 50 yaşından küçük 70 evli kadın her ebe tarafından ayrı ayrı muayene ediliyor ve saptanan pelvik muayene bulguları birbirine gösterilmiyor. Çalışmanın sonunda her ebenin her kadına koyduğu tanılar birbiriyle tek tek karşılaştırılıyor ve aşağıdaki tablo elde ediliyor. Burada aynı tanı ların bulunduğu gözlerdeki rakamlar toplanarak toplam sayıya bölününce, iki ebenin muayenelerinin birbi riyle %75.7 tutarlı olduğu saptanmıştır. 13

Gözlem ve ölçümlerin tutarlılığını, güvenilirliğini artırmak, yani gözlemciler arası veya gözlemci içi değişikliği azaltmak için yapılması gerekenler şunlardır: Kullanılan araç-gereçler bozuk olmamalıdır. Bunun için kullanılan araçlar (tansiyon aleti, mikroskop, EKG cihazı, vb.) sık sık kontrol edilmeli, ayrıca kullanılan kimyasal solüsyonlar da taze hazırlanmalı, usulüne uygun şekilde saklanmalı, bozulmamaları için gereken tüm önlemler alın malıdır. Kullanılan muayene ve ölçme yöntemleri standart olmalı, yani aynı teknikler kullanılmalıdır. Örneğin iki gözlemci de bir hastanın hemoglobin düzeylerini aynı yöntemle ölçmelidir ve kullanılan malzeme, araç aynı olmalı ve ölçüm aynı gün yapılmalıdır. Kullanılacak araç gereçlerin ön denemesi yapılmalıdır. Örneğin bir araştırmada kullanılacak anket ve muayene formları genel uygulamaya geçmeden önce denenmeli, anlaşılmayan yanları düzeltilmeli, eksik yönleri tamamlanmalı, fazla-gereksiz bilgiler çıkarılarak tekrar ön-denemesi yapılmalı ve son şekli verilerek yaygın uygulamaya geçilmelidir. Gözlemcilerin (hekim, teknisyen, ebe, hemşire, anketör, vb.) çalışma öncesi eğitimi ve ön dene meleri yapılmalıdır. Böylece gözlemciler arası yöntem, uygulama farklılıkları varsa, bu giderilir ve hepsinin gözlem ve ölçümlerini standart yapmaları sağlanır. Bu tür ön eğitimler hem teorik, hem pratik olarak yapılmalıdır. Önce konu ile ilgili gereksiz ayrıntıya girmeden gerekli olan bilgi ler verilir ve sonra uygulamaya yönelik çalışmalar yaptırılır. Bu ön-eğitimden sonra gözlemcilere teorik ve uygulamalı testler verilir, yetersiz yönleri için tekrar eğitime alınırlar ve böylece hata payı en az düzeye indirilmeye çalışılır. Gözlemcilerin uygulama sırasında denetimleri yapılmalıdır: Gözlemcilerin eğitim ve ön-denemeleri ile yöntemlerin ön-denemeleri tamamlandıktan sonra yaygın uygulamaya geçilir. Ancak bu dönemde de her şeyin yolunda gideceğini varsaymak doğru değildir. Uygulama sırasın da yapılacak denetimlerle öğretilenlerin eksiksiz, kurallara uygun yapılıp yapılmadığı saptanır ve eğer varsa, yanlış uygulamalar geçersiz kabul edilerek bu tür gözlem ve ölçümler tekrar ettirilir. Eğer bazı gözlemciler sürekli hata yapıyorsa bunlar tekrar eğitime alınır ve daha yakından denetlenirler. 14

KAYNAKLAR 1. Tezcan S. Epidemiyoloji, Tıbbi Araştırmaların Yöntem Bilimi Hacettepe Halk Sağlığı Vakfı. Yayın No:92/1 Ankara 1992. 2. Vaughan JP, Morrow RH (Ed)- Bertan M, Enünlü T (Çeviri Ed). Bölge Sağlık Yönetiminde Epidemiyoloji El Kitabı, Can Ofset, Ankara, 1990. 3. Beaglehole R, Bonita R, Kjellström T. (Çev:Bilgel N) Temel Epidemiyoloji, Nobel Güneş Tıp Kitabevi, 1998. 4. Friedman GD. Primer of Epidemiology, McGraw-Hill, Inc., Fourth Edition, USA, 1994. 5. Erefe İ (Ed), Hemşirelikte Araştırma İlke Süreç ve Yöntemleri, Odak Ofset, Ankara, 2004. 6. Maxcy-Rosenau-Last Public Health Preventive Medicine, Last JM, Wallace RB, Prentice- Hall International Inc, Appleton Lange, 13th Edition, Connecticut, 1992. 7. Akbulut T, Sabuncu HH. Sağlık Bilimlerinde Araştırma Yöntemi Epidemiyoloji -Prensip ve Uygulamalar, Sistem Yayıncılık ve Mat.San.Tic. AŞ., İstanbul, 1993. 8. Karasar N. Bilimsel Araştırma Yöntemi Kavramlar, İlkeler, Teknikler, Nobel Yayın Dağıtım Tic.Ltd.Şti., 19. Baskı, Ankara, 2009. 9. Akdur R, Çöl M, Işık A, İdil A, Durmuşoğlu M, Tunçbilek A. Halk Sağlığı, Antıp A.Ş.Tıp Kitapları ve Bilimsel Yayınlar, No:26, Ankara, 1998. 10. Aksakoğlu G. Sağlıkta Araştırma ve Çözümleme. Dokuz Eylül Üniversitesi Rektörlük Basımevi, İkinci Yazım, İzmir, 2006. 11. Güler Ç, Akın L (Ed.ler) Halk Sağlığı Temel Bilgiler, Hacettepe Üniversitesi Hastaneleri Basımevi, Ankara, 2006. 15