VERİLERİN VE İSTATİSTİKSEL NETİCELERİN YORUMLANMASINDA TEMEL PRENSİPLER

VERİLERİN VE İSTATİSTİKSEL NETİCELERİN YORUMLANMASINDA TEMEL PRENSİPLER Dr. T. Şener, Dr. K. Özdamar Obstetrik vejinekoloji'de son yıllarda özellikle Perinatoloji ağırlıklı olarak gittikçe artan sayıda tanısal testler geliştirilmiş olup, bunlara her geçen gün yenileri eklenmektedir. Bu testler, çoğunlukla, optimal medikal prognozu elde etmek için kullanılan, son derece kıymetli yöntemlerdir. Örneğin; pulmoner matürite tayini için Fosfatidil Gliserol (PG), nöral tüp defektleri için alfa-fetoprotein, fetal distress için ~lektronik fetal monitörizasyon gibi çeşitli tetkikler mevcuttur. Ancak bu testler, klinikte çok faydalanılmasına rağmen, henüz istenilen mükemelliğe ulaşmış durumda değildir. Bunun nedeni, testleri değerlendirirken birçok problem ile karşılaşılmakta olmasıdır. Mevcut problemler, testin yan~ lış pozitif ve yanlış negatif sonuçlar vermesi, literatürde istatistiksel bilgilerin tam, doğru ve açık biçimde verilmemesi ve mevcut bilgilerin hekimler tarafından eksik ve" ya yanlış değerlendirilmesi şeklinde özetlenebilir. Örneğin 1978 yılında yapılan bir çalışmada ( 1 ), hekimlerin laboratuar '~estlerini ne oranda değerlendirebildikleri a,aştırılmıştır. Hekimlere; prevalansı 1000 d~ 1 olan bir hastalığın tanısı için yapılan testlerin %5'inin yalancı pozitif sonuçlandığı varsayıldığında, test neticesi anorma. olah bir kişinin gerçekten hasta olma olası. lığının ne olduğu sorulmuştur (Duyarlılık % 100 kabul edilmiştir). Neticede hekimlerin ancak % lb'i doğru cevap olan % 1.96 oranını bile bilmiştir. Belirtildiği gibi, bazı araştırmalarda yazar tarafından verilerin sadece bir kısmının bildirilmiş olması da okuyucuyu yanıltıcı olabilmektedir. Örneğin PG, seviyesi ile Respiratuar Distress Sendromu (RDS) arasındaki ilişkiyi araştıran bir makalede, yazarların RDS gelişmeyen fetüslerde amniotik sıvı PG seviyelerinin % 98 oranında normal olduğunu ve düşük PG seviyesi tesbit edilen hastaların %91 'inde RDS geliıtiğini bildirdiklerini varsayalım. Bu oranlarda, PG testi ile bakışta oldukça iyi bir test olarak gözükmektedir. Fakat bu veriler daha iyi incelendiğinde bu testin tüm RDS'li fetüzslerin ancak %33'ünü tesbit edebildiği ortaya çıkmaktadır. Bu nedenlerden dolayı testin özgüllüğü (Spesifisite) ve Pozitif Prediktif Değeri (PPD) oldukça iyi iken (sırasıyla %98.ve %91), Duyarlılığın (Sensitivite) düşük olduğu (%33) söylene: bilir (Tablo 1). (')Anadplu Üniv. Tıp Fak. Kadın Hast. ve Dogum Anabilim Dalı, Eskiıehir 1049

ZEYNEP KAMiL TIP BÜLTENi Tablo I: Amniotik sıvı PG seviyesi ile RDS görülmesi arasındaki ilişki RDS geliıenler Düıük PG seviyesi 22 Normal PG seviyesi 66 88 Duyarlılık... %33 Özgüllük ""' % 98 RDS gelişmeyenler 2 24 110 176 112 200 ppn... %91 NPD= %64 Bu konunun daha iyi değerlendirilebilmesi için bazı temel tanımların üzerinde durmak gerekmektedir. Normalde, herhan gi bir test uygulanan populasyonda 4 ayrı durum söz konusudur (Şekil 1). Görüldü- ğü gibi bunlardan sadece "a" ve "d,, grupları doğru (referans klinik ~ablo ile uyumlu) sonuçlanan test ve neticeleri iken, "b" ve "c" yanlış (referans klinik durum ile uyumsuz) sonuçlanan test neticeleridir. TOPLUM HASTALIK( +) HASTALIK (-) ANORMAL TEST NORMAL TEST ANORMAL TEST NORMAL TEST (gerçek +) a (yalancı -) b (yalancı +) c (gerçek-) d Şekil I:. Hastalık test neticeleri arasındaki ilişki Şekilde belirtilmiı olan ''Yalancı Pozitif ve 'Yalancı Negatiflik''. tanımlan ilk bakışta kolay anlaıılır olarak gözükse bile bazı du ru~arda kanııklıklara yol açmaktadır. Ör;. neğin, fetüsün iyi durumda olduğunun.tesbit edilmesi pozitif bir netice mi yoksa negatif bir netice midir? sorusuna cevap vermek ilk anda kolay olmayabilmektedir. Bunun gibi durumlarda kanşıklığa meydan vermemek açısından ''Yalancı Anormal'' ve ''Yalancı Normal'' terimlerini kullanmak daha açıklayıcı, olacak gibi görünmektedir. Öte yandan "Yalancı Normal" ve "Yalancı Anormal'' oranlar belirtilirken ortaya çıkan bir başka problem ise bu oranların nasıl hesaplanacağıdır. Şekil I' de görüldüğü gibi "b'' ve "c" yalancı negatif ve yalancı pozitif test neticeleridir. Ancak bunlara ait oranlar hesaplanırken oranın paydasına neyin yazılacağı tartıım.a konusu olmaktadır. Bir grup yazar (4, 5, 6) "Yalancı anormallik'' oranını c/(c + d) olarak hesaplarken, bir diğer grup (7) bunu c/(a + c) olarak hesaplamaktadır. BJJ durumda, 1050,

ŞENER ÔZDAMAR araştırma neticelerininin karşılaştırılmasında güçlükler doğması da kaçınılmaz olmaktadır. Bu nedenle de oranlar bildirilirken bunun hangi.ıekilde hesaplandığının belirtilmesi uygun olacaktır. Bu ilişkiler 2 x 2 tabloda düzende özetlendiğinde (Tablo il), (a + b) gerçek hastalık durumunu ( a + c) bir patolojiyi işaret eden test sonuçlarının, (b + d) ise normal neticelenen test sonuçlarını göstermektedir (2, 3). koyma değeridir. Bu oran bize, testin hasta bireye hasta, sağlam bireye sağlam diyebilme oranını vermektedir. Bu oranların hesaplanmasında Şekil 2'deki gibi hareket edilmektedir. Bunların içerisinde, bir test neticesinin ne anlama geldiğini yorumlamada bir klinisyen için daha değerli olanlar PPD ve NPD dir. Çünkü bir testin neticesi anormal sınırlarda bulunduğunda, bunun yüzde kaç oranında hastalık anlamına geldiği klinisyeni daha çok ilgilendiren bir konudur. Tablo il: Test sonuçları ile klinik tanı sonuçlarının 2 x 2 Tablo biçimindeki gösterimi Teste göre hastalık ( + ) Teste göre hastalık (-) Hastalık(+) a d a+b Duyarlılık"" a/(a + b) özgüllük"" d/(d + c) Pozitif Prediktif Değer - a/(a + c) Negatif Prediktif Değer ""' d/(b + d) Diagnostik (Tanısal) Değer - a + d/n Prevalans "" a + b/n Hastalık (-) c b+d c+d a+c a+b+c+d-n Buradaki tanımlardan duyarlılık hasta olanların yüzde kaçının test ile doğru olarak tanındığını, özgüllük ise sağlıklı olanların yüzde kaçının test ile doğru tesbit edildiğini ifade etmektedir. Diğer taraftan pozitif prediktif değer (PPD), test neticelerenini hastlığı işaret ettiği olguların yüzde kaçında gerçekten klinik hastalık olduğunu, negatif prediktif değer (NPD) ise test netic'elerinin normal olduğunu olguların yüzde kaçında gerçekten hastalık olmadığını göstermektedir. Diagnostik değer ise, testin tanı Eşik değerin tayini; Bir testin hangi değerden sonra pozitif kabul edileceği de problem yaratan birdiğer konudur. Çünkü bu değer, hesaplanan tüm oranları etkilemektedir. Normal ve patoloji' arasındaki sınır ( eıik) değerin değişmesi, duyarlılık ve özgüllüğü ters yönde d~ğiımektedir (Şekil 3). Eşik değer düşürüldükçe duyarlılık artmakta (hastaların daha çoğu tesbit edilme~te), fakat özgüllük azalmaktadır (daha çok sayıda sağlıklı. kişi hasta olarak değerlendirijmektedir).. 1051

ZEYNEP KAMiL TIP BÜLTENi Hastalık ( + ) Hastalık ( -) Test neticesi ( + ) Test neticesi (-) D u y ı PPD NPD ö z g ı > > Tablo il: Test sonuçları ile klinik tanı sonuçlarının 2 x 2 Tablo biçimindeki gösterimi H t a y l. 1 ~ 100 Duyarlılık % 50 ~ 50 öaullük ~ 100 TEST SONUÇ DEGERLERİ Şekil 3: Eşik değeri değiştirmenin Duyarlılık ve Özgüllük üzerindeki etkisi Yapılan bir çalışmada (8), Fetal Biparietal Diametr'in (BPD), ultrasonografik olarak ölçülmesinin düşük doğum ağırlıklı fetüsleri tesbit etmedeki değeri araştırılmış ve farklılığın X-1.5 veya X-1 Standart sapma olarak kabul edilmesine bağlı olarak duyarlılık, özgüllük, PPD ve NPD'de belirgin değişiklikler olduğu gösterilmiştir (Tablo 111). Buradanda anlaşıldığı gibi eşik değerin deği!ltirilmesi ile ~estin duyarlılık ve özgüllüğünü arttırmak mümkün olabilmektedir. Fakat ne yazık ki her ikisini birden artırmak mümkün olmamakta, biri artarken diğeri.. azalmaktadır. Bu nedenlerden dolayı, genellikle ikisinin arasında bir denge kurmak gerekmektedir. Bu noktada hangisinin önemli olduğuna karar verirken göz önüne alınması 1052

ŞENER ÖZDAMAR Tablo III: BPD'nin düşük doğum ağırlıklı çocukları belirlemedeki etkinliği Duyarlılık(%) Özgüllük(%) PPD(%) NPD(%) X-1.5 SD 26.9 96.9 X-1.0 SD 50.6 90.3 30.9 96.3 21.1 97.3 gereken en önemli nokta klinik durumdur. Örneğin, bir gebede aktif Genital Herpes'i tesbit edecek bir testin Duyarlılığının yüksek olması tercih edilmeli, bunun içinde eşik değer düşük tutulmalıdır. Çünkü bunun tesbit edilmemesi, obstetrik bir başka endikasyon olmadıkça vagina! doğum yaptırılmasına ve neticesinde fetal komplikas _ y onl ara ze mi n - h az ırl aya -- b'i- ı ece - -k- tır. - B una - - karşılık, hastalık olmadığı halde test anor- --ınaı aeğefverirse, bu durumda bu gebelerde birkaç fazladan sezaryen yapılmış olacaktır ki, bu da günümüz koşullarında daha az oranda ciddi bir komplikasyon görülme ihtimali demektir. Diğer taraftan, fetal konjenital anomali tesbitinde ise özgüllük daha önem kazanmalı, yani eşik değer yüksek tutulmalıdır. Çünkü, eğer normal bir fetüs anomalili bir fetüs olarak değerlendirilirse, erken müdahale ile, anomalisi olmayan, prematür bir bebek doğurtulmasına neden olunacaktır. Prematürite ise bugün için obstetriktc en önemli postnatal morbidite ve mortalite nedenidi~. Tersine, anomalili bir fetüsün normal olarak değerlendirilmesi ise, en kötü ihtimalle, anormal bir fetüsün terme kadar taıınması demek olacaktır ki bu da morbidite açısından çok önemli bir sorun yarat ~21;yacaktır. Neticede, Duyarlılık ve özgüllükten hangisinin daha önemli olduğuna klinik, sosyal, psikolojik durum ve yanlış test neticelerin maliyeti göz önüne alınarak karar verilmelidir. '' Y anhş anormal'' neticelerin ciddi sonuçlara yol açmayacağı, tedavinin mümkün ve rtisbeten güvenli olduğu hastalıklarda duyarlılığın; "yanlış anormal" neticelerin ciddi komplikasyonlara yol açacağı, tedavisi mümkün olmayan veya tehlike arz eden ciddi hastalıklarda ise özgüllüğün yüksek olması tercih edilmelidir. Hastalık prevalansının önemi; Bir testin duyarlılık ve özgüllüğü üzerine etki eden bir diğer faktör, tanısı amaçlanan hastalığın toplumdaki prevalansıdır. Bu etki her zaman çok önemli düzeylerde olmayıp, bazende herhangi bir etki söz konusu olmamaktadır. Örneğin, amniotik sıvıdaki Asetilkolinester;ız seviyesinin, hastanın nöral tüp defekti açısından yüksek veya düşük riskli olmasından etkilenmesi beklenmez. Bu nedenle bu test için tesbit edilmiş bir eşik değer mevcudiyetinde, Duyarlılık ve Ozgüllük, yüksek ve düşük riskli gruplarda bir farklılık göstermemektedir. Buna karqılık_ Y, kronik _ hipert ansıyo --- - -nl- _ u ge -- -b e -- ler Intrauterin gelişme geriliği (IUGG) açısından yüksek riskli bir grup oluşturmaktadırlar. J?,üşük riskli bir toplumda gelişme geriliği olan fetüslerin ağırlığı genellikle 5. ve 10. perseritil arasında toplanmakta iken, yüksek riskli gruptaki fetüsler 3. persentilin altındaki ağırlıkta ol- 1053

ZEYNEP KAMİL TIP BÜLTENi maktadırlar. Bundan dolayıdır ki, IUGG tanısı için uygulanan aynı testler, yüksek riskli toplumda, düıük riskli topluma nisbe ten dah~ yüksek duyarlılık göstermektedir. Diğer taraftan, prediktif değerler, hastalık prevalansı ile çok yakından ilgilidir. Bir patolojinin toplumdaki prevalansı arttıkça patolojik test neticesinin prediktif değeri (Pozitif Prediktif Değer) artarken, nor~al test neticelerinin prediktif değeri (Negatif Pre diktifdeğer) hafifçe azalmaktadır. Örneğin, gebelerd~ perinatal morbidite ve mortalite oranlarının 42. haftadan sora belirgin olarak artı gösterdiği hekesçe bilinen bir ger çektir. Uygulanan bir Nonreaktif Non-Stress Test'in (NR-NST) Pozitif Pre- diktif Değeri, son adet tarihi kesin olarak bi.. linen postterm gebelerde,, SAT'i kesin\ olmayıp da 42. haftanın üzerinde olduğu tahmin edilen gebelere oranla daha yüksek olmaktadır. ReaktifNon-Stress Test'in Negatif Prediktif Değeri ise SAT' i kesin olarak bilinenlerde diğer gruba nazaran daha az olacaktır. Bunun sebebi, 2. grupta gerçekten postterm olmayan gebelerin olmasıdır. B~ nedenle bir testin prediktif değeri hakkında karar verirken hastalığın toplumdaki prevalansının bilinmesi büyük önem ta.. şımaktadır. Prevalansın bu direkt etkisinden dolayı, herhangi bir testin, seçilmiş yüksek riskli kişilerde yapılması tercih edilecek bir husus olmaktadır. Tablo IV'de prevalansının bu belirgin etkisi görülmektedir. (A-Prevelans =- % 10) Teste göre hastalık { + ) Teste göre hast~ık {-) PPD- %60 (B- Prevelan - % 4) Hastalık( + ) 125 25 150 Hastalık { ) 85 765 850 NPD-%97 210 790 1000 Hastalık( + ) Hastalık (-) Teste göre hastalık ( + ) Teste göre hastalık ( ) 25 5 97 873 122 878 30 970 1000 PPD= %20 NPD= %99 1054,

ŞENER-ÖZDAMAR SONUÇ Literatürde mevcut olan çalışmaların birçoğunda, testlerin doğru değerlendirilmesini sağlayacak veriler verilmekte iken, bazılarında bu bilgiler hiç verilmemekte veya eksik verilmektedir. Bu durum ise bir klinisyeni, söz konusu tanı yönteminin ne derece efektif olduğu konusunda şüpheye düşürmekte ve hatta yanlış yöne sevketmektedir. Diğer taraftan, çalışma grubununun veya test eşik değerinin değiştirilerek, bir testin duyarlılık, özgüllük, pozitif ve negatif prediktif değerinin arttırılması da mümkündür. Yüksek riskli toplumlarda (yüksek hastalık prevalansı), patolojik test neticesinin prediktif değeri (PPD) yüksek iken, bu testin tarama testi olarak yapıldığı düşük riskli toplumlarda, normal test neticesinin prediktif değeri (NPD) yüksek çıkacaktır. Bu nedenlerden dolayı çalışma grubunun ve eşik değerin nasıl seçildiğinin belirtilmesi önem kazanmak.tadır. Ozellikle tarama testi olarak kullanılan testlerin duyarlılığının ve pozitif prediktif değerinin düşük olacağı hesaplanmalı, bu değerlerin arttırılması arzu ediliyorsa, yüksek riskli grupların tesbit edilerek testlerin özellikle bu gruplara uygulanması sağlanmalıdır. Aynı şekilde, bir hastalığın toplumlardaki prevalansı farklı olaqileceğinden, araştıncılann literatürü değerlendirirken veya kendi araştırmalarıyla karşılaştırırken, o hastalığın toplumlardaki prevalansları arasındaki farkı göz önüne al~ maları uygundur. Sonuç olarak, belirtilen nedenlerden dolayı, verilerin doğru değerlendirilmesi ve araştırmalardan maksimum faydanın sağlanabilmesi için üzerinde durulan noktalara dikkat etmek gerekmektedir. Aksi takdirde, bildirilen istatiksel veriler yanıltıcı ve hekim~ leri yanlış yönlere sevk edici olacaktır. KAYNAKLAR l. Casscells W., Schoenberger A., Graboys TB.: in terpretation by physidans of clinical laboratory re suhs, N.Engl. J. Med. 299:999, 1978. 2. Ozdamar K: Bioistatistik, (2. Baskı), Bilim Teknik Yayınevi, Iııtanbul 187-190, 1989. 3. Duncan RC., Knapp RG., Miller CM.: Introduc tory Biostatistics for the health sdences, John Wi ley and Sons, New York, 44-50, 1983. 4. McNeil BJ., Keeler E., Adelstein SJ.: Primer on cer tain elements of decision making, N.Engl. J.Med. 293:211, 1975. 5. Lusted LB.: Decision making studies in patient ma nagement, N.Eng.J.Med. 248:416, 1971. 6. Griner PF., Mayewski RJ., Mushlin AI., Green land P.: Selection and interpretation of diagnoııtic test and procedures, Ann.lntem.Med., 94:553, 1981. 7. Galen RS., Gambino SR.: Beyond nomıality: The Predictive V alue and Efficiency of Medical Diagnoses, New York, John Wiley and Sons, 17-54, 1975. 8. Rosendahl H., Kıvınen S.: Routine ultrasound sere ening for early detectiol! of small for gestational age fetuses, Obstet. Gynecol. 71 :518, 1988. 1055