BİYOİSTATİSTİK
Üretim Süreci: Girdi İşlem Ürün (Sonuç) Araştırma Süreci: Hangi alanda olursa olsun araştırma bir BİLGİ ye ulaşma sürecidir. Veri Analiz Bilgi El ile ya da birtakım bilgisayar programları yardımıyla istatistiksel yöntemler kullanılır.
Biyoistatistik, insan ve toplum sağlığı için, bilgi edinme amacıyla Verilerin toplanması, Analiz edilmesi, ve Yorumlanmasına yönelik istatistiksel yöntemler topluluğudur.
Tıbbi Araştırmalarda Biyoistatistik İşlevleri Alanla ilgili yayınlarda, uluslar arası ortak bir dil sağlar ve objektif bir araç olarak kullanılır. Alanla ilgili yayınlarda, verilen bilgilerin geçerliliği ve güvenirliği değerlendirilebilmesi, bu hekimin bilgilenmesinde süreklilik sağlar. Hekimin araştırma projelerine katılımı (plan bitim), araştırma sonuçlarının hasta tedavisi ve toplum sağlığına yönelik olarak pratiğe geçirilebilmesi. Tüm bunlar, belirli düzeyde hatta bazı durumlarda ileri düzeyde biyoistatistik bilgisi gerektirmektedir.
BİYOİSTATİSTİK Tanımlayıcı yöntemler (Descriptive) Tablo Grafik Sayısal yöntemler (Tanımlayıcı Örnek İstatistikleri) Çıkarsamaya (inference) yönelik yöntemler Tahminleme Hipotez testi Olasılık teorisi yardımı ile
Veri Tipleri ve Tanımsal Veri Analizi Değişken: Araştırma konusuna göre deneysel üniteler (birey, rat, film) üzerinde ölçülmesi (incelenmesi) gereken özelliklerin her biridir. Örnek: Belirli bir hasta grubunda gerçekleştirilen klinik bir araştırmada İlaç(A-B-Kontrol), cinsiyet, hipotansiyon(var/yok), bulantı-kusma(var/yok) Tedavi memnuniyeti Yaş, boy, ağırlık, OKB, KAH gibi ölçülen özelliklerin her biri birer değişkendir.
Ölçüm Skalaları Değişkenlerin ne şekilde (tablografik-sayısal) özetleneceği ve hangi yöntemler kullanılarak analiz edilebileceği, hangi ölçüm SKALASINDA elde edildiği ile yakından ilişkilidir.
Sınıflayıcı (Nominal) Skala Deneysel üniteler üzerinde ölçülen değerlerin sadece kategorileri/sınıfları gösterdiği değişkenler bu skalada elde edilir. Farklı iki değer arasında sadece =/ ayrımı yapılabilir. Örnek: İlaç-tipi, cinsiyet, kusma-bulantı, hipotansiyon Eğer ölçülen değişken sadece iki farklı değer alabiliyor ise bunlara Dikatom ya da Binary değişkenler de denir. (cinsiyet, hipotansiyon, bulantı-kusma) Bu ölçüm skalasında elde edilen gözlemler kalitatif ya da kategorik gözlemler olarak da adlandırılmaktadır.
Sıralayıcı (Ordinal) Skala Ölçülen değerlerin kategorileri göstermesinin yanında, farklı kategoriler arasında büyüklük küçüklük gibi bir bilginin bulunduğu değişkenler bu skalada elde edilir. =/ yanında farklı iki değer arasında </> ilişkisi bulunmaktadır. Örnek: tedavi memnuniyeti, VKİ ye göre beden yapısı (zayıf, normal, hafif şişman, şişman) Verilerin nasıl kodlandığı önemlidir; sınıflar arasında, incelenen özellik bakımından, artan ve azalan yapıyı korumak gerekir.
Nümerik Skala Ölçülen değerlerin sayılarak ya da bir metrik sistemde elde edildiği değişkenler bu skalada elde edilirler. =/, </> yanında farklı iki değer arasındaki uzaklıklar anlam taşımaktadır. Bu skalada elde edilen gözlemlere, kantitatif gözlemler de denir. Sürekli ve Kesikli olmak üzere iki tipi vardır. Gözlemler sadece tam sayısal değerler alabiliyor ise (gebelik sayısı, diş sayısı gibi) kesikli, iki tam sayı arasında her türlü değeri alabiliyor ise (yaşboy gibi) sürekli skalada elde edilmiş olurlar.
Sınıflayıcı ve Sıralayıcı Veriler İçin Tablo ve Grafikler Tek bir değişken için Frekans tablosu-örnek1 Pasta (pie)-örnek2 ve çubuk (bar) grafikleri-örnek3 İki değişken için Kros (contingency) tablosu-örnek4 Çubuk grafikleri-örnek5
İlaç A B Kontrol Toplam ÖRNEK-1(Sınıflayıcı) Tablo 1. Kullanılan ilaçlara göre dağılım Frekans 25 25 25 75 Yüzde(%) 33.3 33.3 33.3 100
ÖRNEK-1(Sınıflayıcı) Tablo 2. VKI ye göre hastaların beden yapısı dağılımı Beden yapısı Frekans Oran Eklemeli Oran Zayıf 3 0.04 0.04 Normal 31 0.41 0.45 H. Şişman 34 0.45 0.90 Şişman 7 0.10 1.00 Toplam 75 1
Sınıflayıcı ve Sıralayıcı Veriler İçin Tablo ve Grafikler Tek bir değişken için Frekans tablosu-örnek1 Pasta (pie)-örnek2 ve çubuk (bar) grafikleri-örnek3 İki değişken için Kros (contingency) tablosu-örnek4 Çubuk grafikleri-örnek5
ÖRNEK-2 Şekil 1. VKİ ye göre vücut yapısı dağılımı Beden Yapısı Zayıf Normal Hafif şişman Şişman 7 3 34 31
Sınıflayıcı ve Sıralayıcı Veriler İçin Tablo ve Grafikler Tek bir değişken için Frekans tablosu-örnek1 Pasta (pie)-örnek2 ve çubuk (bar) grafikleri-örnek3 İki değişken için Kros (contingency) tablosu-örnek4 Çubuk grafikleri-örnek5
ÖRNEK-3 Şekil 2. VKİ ye göre vücut yapısı dağılımı
Sınıflayıcı ve Sıralayıcı Veriler İçin Tablo ve Grafikler Tek bir değişken için Frekans tablosu-örnek1 Pasta (pie)-örnek2 ve çubuk (bar) grafikleri-örnek3 İki değişken için Kros (contingency) tablosu-örnek4 Çubuk grafikleri-örnek5
ÖRNEK-4 Tablo 3. Cinsiyete göre beden yapısı dağılım Erkek Kadın Beden yapısı Frekans (%) Frekans (%) Toplam Zayıf 2 3.7 1 4.8 3 Normal 24 44.4 7 33.3 31 H. Şişman 25 46.3 9 42.9 34 Şişman 3 5.6 4 19 7 Toplam 54 100 21 100 75
Örnek-4 (SPSS Tablosu)
Sınıflayıcı ve Sıralayıcı Veriler İçin Tablo ve Grafikler Tek bir değişken için Frekans tablosu-örnek1 Pasta (pie)-örnek2 ve çubuk (bar) grafikleri-örnek3 İki değişken için Kros (contingency) tablosu-örnek4 Çubuk grafikleri-örnek5
ÖRNEK-5 Şekil 3. Cinsiyete göre beden yapısı dağılımı
Sınıflayıcı ve Sıralayıcı Veriler İçin Tablo ve Grafikler Tek bir değişken için Frekans tablosu-örnek1 Pasta (pie)-örnek2 ve çubuk (bar) grafikleri-örnek3 İki değişken için Kros (contingency) tablosu-örnek4 Çubuk grafikleri-örnek5
Nümerik Veriler için Tablo ve Grafikler Tek bir değişken için Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.örnek6 Gövde ve Yaprak Tablosu. Örnek7 Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 İki değişken için Frekans tablosu, gövde ve yaprak tablosu Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
ÖRNEK-6 Tablo 4. Hastaların yaşlara göre dağılımı Yaş Frekans Yüzde(%) Ekleme Yüzde 21-25 3 6.7 6.7 26-30 8 10.7 17.3 31-35 5 6.7 24.0 36-40 8 10.7 34.7 41-45 16 21.3 56.0 46-50 12 16.0 72.0 51-55 11 14.7 86.7 56-60 6 8.0 94.7 61-65 2 2.7 97.3 66-70 2 2.7 100 Toplam 75 100.0
Örnek-6 (SPSS tablosu)
Nümerik Veriler için Tablo ve Grafikler Tek bir değişken için Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.örnek6 Gövde ve Yaprak Tablosu. Örnek7 Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 İki değişken için Frekans tablosu, gövde ve yaprak tablosu Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
ÖRNEK-7(Hasta-yaş dağılımı) A 42 43 41 27 28 60 48 53 43 25 58 27 70 48 44 51 37 35 41 53 45 44 50 44 38 Yaş (yıl) B Kont. 60 68 42 23 59 54 55 57 49 35 46 49 47 36 42 50 30 43 46 48 34 52 25 43 41 40 32 53 21 51 52 40 62 54 47 27 58 39 30 39 44 29 28 50 33 64 36 55 43 21 Gövde Yaprak 2 7 8 5 7 5 1 8 3 7 9 1 3 7 5 0 4 2 0 3 6 5 6 8 9 9 4 2 3 1 8 3 8 4 1 5 4 4 2 9 6 7 2 6 1 7 4 3 9 3 8 3 0 0 5 3 8 1 3 0 9 5 2 8 4 7 0 2 3 1 4 0 5 6 0 0 2 8 4 7 0 Yaş (yıl) Stem-and-Leaf Plot Frequency Stem & Leaf 11,00 2. 11355777889 13,00 3. 0023455667899 27,00 4. 001112223333344445667788899 18,00 5. 000112233344557889 5,00 6. 00248 1,00 7. 0 Stem width: 10,00 Each leaf: 1 case(s)
Nümerik Veriler için Tablo ve Grafikler Tek bir değişken için Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.örnek6 Gövde ve Yaprak Tablosu. Örnek7 Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 İki değişken için Frekans tablosu, gövde ve yaprak tablosu Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
ÖRNEK-8 (Hastaların yaş dağılımı) Yaş (yıl)
Nümerik Veriler için Tablo ve Grafikler Tek bir değişken için Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.örnek6 Gövde ve Yaprak Tablosu. Örnek7 Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 İki değişken için Frekans tablosu, gövde ve yaprak tablosu Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
ÖRNEK-9 (Hastaların yaş dağılımı) Yaş (yıl)
Nümerik Veriler için Tablo ve Grafikler Tek bir değişken için Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.örnek6 Gövde ve Yaprak Tablosu. Örnek7 Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 İki değişken için Frekans tablosu, gövde ve yaprak tablosu Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
ÖRNEK-10 Box grafiği
Nümerik Veriler için Tablo ve Grafikler Tek bir değişken için Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.örnek6 Gövde ve Yaprak Tablosu. Örnek7 Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 İki değişken için Frekans tablosu, gövde ve yaprak tablosu Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Örnek-11 (cinsiyete göre yaş dağılımı) Yüzde (%) Yaş (yıl)
Nümerik Veriler için Tablo ve Grafikler Tek bir değişken için Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.örnek6 Gövde ve Yaprak Tablosu. Örnek7 Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 İki değişken için Frekans tablosu, gövde ve yaprak tablosu Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Örnek-12 (ilaç gruplarına göre VKİ dağılımı)
Nümerik Veriler için Tablo ve Grafikler Tek bir değişken için Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.örnek6 Gövde ve Yaprak Tablosu. Örnek7 Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 İki değişken için Frekans tablosu, gövde ve yaprak tablosu Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Örnek-13
Nümerik Veriler için Tablo ve Grafikler Tek bir değişken için Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.örnek6 Gövde ve Yaprak Tablosu. Örnek7 Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 İki değişken için Frekans tablosu, gövde ve yaprak tablosu Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Örnek-14
Nümerik Veriler için Tablo ve Grafikler Tek bir değişken için Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.örnek6 Gövde ve Yaprak Tablosu. Örnek7 Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 İki değişken için Frekans tablosu, gövde ve yaprak tablosu Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Sayısal Özetleme Bu bölümde, bir veri setinin bazı sayısal değerler kullanarak özetlenmesine yarayan Tanımlayıcı Örnek İstatistikleri incelenecektir. Yer Ölçüleri n Aritmetik ortalama : x = x i n i= 1 Geometrik ortalama : GOx = anti log( log(x i ) / n) Harmonik ortalama : x > GO > HO x x HO x n = n i= 1 1 x i
Örnek Tablo 1 X: Yaş (yıl) x i Log(x i ) 1/x i x 1 6 0,778 0,167 x 2 2 0,301 0,500 x 3 3 0,477 0,333 x 4 5 0,699 0,200 x 5 5 0,699 0,200 x 6 7 0,845 0,143 x 7 10 1,000 0,100 x 8 9 0,954 0,111 x 9 7 0,845 0,143 x 10 3 0,477 0,333 x 11 5 0,699 0,200 x 12 8 0,903 0,125 x 13 7 0,845 0,143 x 14 5 0,699 0,200 x 15 5 0,699 0,200 Toplam 87 10,921 3,098 X= 87/15= 5.8 GO = antilog (10.921/15) = 5.35 HO = 15/3.098 = 4.84
Sayısal Özetleme-II Ortanca (Medyan):»Sıralanmış verilerin ortasında yer alan değerdir.» Denek sayısı tek ise (n+1)/2 inci» Denek sayısı çift ise (n/2) ve (n+2)/2 inci değerlerin ortalaması» Hangi durumda ortanca tercih edilmelidir? Tepe Değeri (mod):» Bir veri setinde en çok tekrar eden değer(ler)» Tepe değeri olmayan durumlar olabilir.
Örnek Tablo 1 deki sıralanmış veriler 2 3 3 5 5 5 5 5 6 7 7 7 8 9 10 Ortanca: n =15 (tek) (n+1)/2 = 8. gözlem değeri 5 ortanca olur. M = 5 Tepe Değeri: Bu veri setinde 5 değeri en çok tekrar eden (5 kez tekrar etmiştir) değerdir. TD = 5
Merkez belirten ölçüler arasındaki ilişki
Sayısal Özetleme - III Ortalama, ortanca ve tepe değeri Merkez belirten yer ölçüleridir. Bunların dışında kullanılan Konum belirten yer ölçüleri vardır: Kartil (%25)(Q1,Q2,Q3) Desil (%10) Persentil (%1)
Örnek Tablo 1 deki sıralanmış veriler 2 3 3 5 5 5 5 5 6 7 7 7 8 9 10 Q1 Q2 = M Q3 Q1, Q2, Q3 bir veri setini dört eşit parçaya bölen üç noktadır.
Sayısal Özetleme - IV Değişim Ölçüleri
Sayısal Özetleme Değişim Ölçüleri Değişim aralığı DA = x max x min IQR=Q3-Q1 ( x x) 2 Standart sapma S = (ortalama) n 1 Varyans (S 2 ) Varyasyon katsayısı (değişimi karşılaştırmak için) S CV = 100 x
Örnek Tablo 2 X: Yaş (yıl) x i x-ort (x-ort) 2 x 1 6 0,200 0,040 x 2 2-3,800 14,440 x 3 3-2,800 7,840 x 4 5-0,800 0,640 x 5 5-0,800 0,640 x 6 7 1,200 1,440 x 7 10 4,200 17,640 x 8 9 3,200 10,240 x 9 7 1,200 1,440 x 10 3-2,800 7,840 x 11 5-0,800 0,640 x 12 8 2,200 4,840 x 13 7 1,200 1,440 x 14 5-0,800 0,640 x 15 5-0,800 0,640 Toplam 87 70,4 DA = 10-2 = 8 yıl IQR = Q3-Q1 = 7-5 = 2 yıl S= 70.4/14 = 2.242 yıl