Biyoistatistiğe Giriş: Temel Tanımlar ve Kavramlar DERS I VE II
İstatistik Nedir? İstatistik kelimesi farklı anlamlar taşımaktadır. Bunlar; Genel anlamda; üretim, tüketim, nüfus, sağlık, eğitim, tarım, trafik vb. konularda, olguları gösteren veri topluluklarına ve bu verilerin değerlendirilmesine istatistik denir. Bilimsel anlamda; araştırmalardan elde edilen verilerin değerlendirilmesi, özetlenmesi, sunumu, bazı analiz ve tahminlerin yapılması ile ilgili prensipleri açıklayan metot bilimine istatistik denir. Örnek verilerden hesaplanan ortalama ( ), varyans (S 2 ) vb. ölçülere de istatistik denir.
Tanımlayıcı İstatistikler Bir veri setini tanımak veya birden fazla veri setini karşılaştırmak için kullanılan ve ayrıca örnek verilerinden hareket ile frekans dağılışlarını sayısal olarak özetleyen değerlere tanımlayıcı istatistikler denir. Analizlerde kullanılan veri tiplerine (basit, gruplanmış, sınıflanmış) göre hesaplamalarda kullanılacak formüller değişmektedir. 3
Tanımlayıcı İstatistikler Yer Ölçüleri 1)Aritmetik ort. 2)Geometrik ort. 3)Harmonik ort. 4)Mod 5)Medyan 6)Kartiller Değişkenlik Ölçüleri 1) Range (Değişim Aralığı) 2) Ort. Mutlak sapma 3) Varyans 4) Standart Sapma 5) Değişkenlik(Varyasyon) Katsayısı Çarpıklık Ölçüleri 1)Pearson Asimetri Ölçüsü 2)Bowley Asimetri Ölçüsü Basıklık Ölçüleri 4
1) Aritmetik Ortalama Üzerinde inceleme yapılan veri setindeki elemanların toplanıp incelenen eleman sayısına bölünmesiyle elde edilen yer ölçüsüne aritmetik ortalama denir. Örnek: Sınıftaki öğrencilerin yaşlarının ortalaması, Kış aylarında m 2 ye düşen ortalama kar miktarı 5
Mod Mod, büyük veri setlerinde verinin daha çok nerede toplandığını bulmak için kullanılır. Örneğin hastanelerde ameliyathanelerde kullanılan eldivenleri alan bir yönetici, potansiyel sağlık personelinin eldiven ihtiyacını belirlemek için eldiven boyları ölçüsüyle ilgilenebilir. Nicel veri seti çok büyük olmadığı zaman mod anlamlı olmayabilir. Sınıflandırılmış veriler için kullanılabilecek tek merkezi eğilim ölçüsüdür. 6
Örnekler 1) 5,30 1,30 0,42 0,73 0,45 1,30 Modu 1,30 2) 21 21 21 58 58 58 88 88 99 3) 1 2 3 6 7 8 9 10 12 13 14 1 den fazla moda sahip, 21 ve 58 Modu yok 7
5) Medyan Bir veri setini büyükten küçüğe veya küçükten büyüğe sıraladığımızda tam orta noktadan veri setini iki eşit parçaya ayıran değere medyan adı verilir. Veri setinde aşırı uçlu elemanlar olduğunda aritmetik ortalamaya göre daha güvenilirdir. Medyan, veri setindeki tüm elemanlardan etkilenmez. 8
Basit Veriler İçin Medyan Veri Setinin Hacmi Tek Sayı İse; n 1 2 nci gözlem değeri medyandır. Veri Setinin Hacmi Çift Sayı İse; n 2 ve n 2 1 nci gözlem değerinin aritmetik ortalaması medyandır. 9
0.42 0.48 0.76 1.40 1.10 5.40 Medyan bu iki noktanın arasına düşmektedir 0.76 + 1.40 2 MEDYAN 1.08 0.43 0.48 0.66 0.81 1.20 1.20 5.50 Tam ortadaki değer medyandır. MEDYAN 0.81 10
Gruplanmış Veriler İçin Medyan Gruplanmış verilerde medyan değeri hesaplanırken veri setinin tam orta noktasının hangi gruba ait olduğunu belirlemek için birikimli frekans sütunu oluşturulur. Sıra numarası belirlendikten sonra o sıra numarasına ait grup medyan değeri olarak ifade edilir. 11
Dağılım ölçütleri B NORMAL DAĞILIM A SOLA KAYMIŞ C SAĞA KAYMIŞ
DAĞILIM 13
Simetrik Dağılım A.O = Med = Mod Sağa çarpık dağılım A.O > Med > Mod Sola çarpık dağılım A.O < Med < Mod İki modlu simetrik dağılım Modu olmayan dağılım Tekdüzen dağılım 14
Verilerin Değerlendirilmesi, özetlenmesi, sunumu, bazı analiz ve tahminlerin yapılması ile ilgili prensipleri açıklayan metot bilimine istatistik denir.
İstatistik ve Biyoistatistik Kavramı İstatistik; Herhangi bir konu hakkında bilgi toplamak, toplanan bilgileri düzenlemek, çözümlemek ve yorumlamak için gerekli yöntemler topluluğudur. Biyoistatistik; Biyoloji, Tıp ve diğer sağlık bilimlerinde araştırma düzeni oluşturulması, verilerin elde edilmesi ve değerlendirilmesi ile uğraşan bilim dalıdır.
Populasyon (Anakütle) Populasyon (Anakütle): Üzerinde durulan karakterle bütün elemanları içine alan elemanlar topluluğuna populasyon denir. Türkçede populasyon teriminin eş anlamlısı olarak anakütle, anakitle, evren, nüfus ve toplum kelimeleri de kullanılmaktadır.
DEĞİŞKEN Gözlem, sayım ve ölçüm sonucu elde edilen rakam, harf, sembol, işaret vb. değerlere veri, veriler birden fazla değere atanıyorsa bu çokluklara değişken denir.
İSTATİSTİK VE KULLANIM AMACI Tanımlayıcı İstatistik İstatistik Hipoteze ve Örnekeleme Dayalı Çıkarımsal İstatistik
İstatistiğin Kullanım Amacına Göre Sınıflandırılması Kullanım amacına göre istatistik; tanımlayıcı istatistik ve çözümleyici istatistik olarak iki ana sınıfa ayrılır. Tanımlayıcı (Deskriptif) İstatistik: Ham veri yığınlarının özetlenerek sonuçların kolay anlaşılır bir konuma getirilmesindeki metotları içerir. Genelde mantık bilimindeki tümden gelim metodunu kullanır. Çözümleyici (Analitik) İstatistik: Örnekten elde edilen veriler üzerinden yapılacak bazı tahmin ve analizlerle ilgili prensipleri ortaya koyan istatistik dalıdır. Bu istatistik dalı mantıktaki tüme varım metodunu kullanır.
Tanımlar Tanımlayıcı istatistik: Verilerin özetlenmesi, sınıflandırılması, tablo ve grafiklerle sunulmasını içerir Çıkarımsal istatistik: Örneklemden elde edilen bulgular yardımıyla evren hakkında kestirimde bulunma, hipotezleri test etme ve karar verme süreçlerini içerir
Tanımlar Evren: Belirli bir özelliğe sahip tüm bireylerin oluşturduğu topluluktur Örneklem: Çekildiği evreni temsil ettiği düşünülen ve evrene göre daha az sayıda birey yada gözlemden oluşan alt kümedir Örnekleme: Evrenden örnek seçmek amacıyla geliştirilen yöntemler bütünü
Tanımlar Parametre: Evreni tanımlamak için kullanılan ölçülere denir İstatistik: Örneklemi tanımlamak için kullanılan ölçülere denir
Tanımlar Veri: İncelenen konuya açıklık getirmek amacıyla toplanan bilgi ve ölçümler bütünüdür Denek: Üzerinden veri toplanan her türlü canlı/cansız varlık Değişken: Deneklerin herhangi bir özelliğine ilişkin ölçümler bütünü
Veri Veri Niteliksel veri (Kategorik) Niceliksel veri (Sayısal) Niteliksel veri: Sayımla elde edilen verilere denir Niceliksel veri: Ölçümle elde edilen verilere denir
Niteliksel Veri Niteliksel veri (Kategorik) Sıralanabilir niteliksel Sınıflanabilir niteliksel (sırasız) Sınıflanabilir (Sırasız) Niteliksel veri: Niteliksel verilerin kategorilerinde herhangi bir sıra yok ise bu tür verilere sınıflanabilir niteliksel veri denir. (Örn: Cinsiyet, Kan grubu, Medeni Durum...vb.) Sıralanabilir Niteliksel veri: Niteliksel verilerin kategorilerinde herhangi bir sıra var ise bu tür verilere sıralanabilir niteliksel veri denir. (Örn: Hastalık Evresi, Eğitim Düzeyi, Askeri rütbeler...vb.)
Niceliksel Veri Niceliksel (Sayısal) Kesikli Sürekli Aralık ölçekli Oran Ölçekli Kesikli sayısal veri: Belirli bir aralıktaki tam sayıları alan veri türüdür. (Örn: Çocuk Sayısı, Hastane yatak sayısı...vb.) Sürekli sayısal veri: Belirli bir aralıktaki tüm değerleri alan veri türüdür. (Örn: Ağırlık, Boy, Zeka puanı, Sıcaklık...vb.)
İstatistik ile yalan da doğru da söylemek mümkündür.
Değişken tipleri Değişkenler genel olarak iki ana grup altında toplanarak sınıflandırılırlar. Bunlar; Kesikli değişkenler ve Sürekli değişkenler.
KESİKLİ DEĞİŞKEN CİNSİYET 1-2 SAÇ RENGİ 1-2-3
SÜREKLİ DEĞİŞKEN Sürekli Değişken: Ölçülen karakter kantitatif ise ve değerler sayı doğrusu üzerinde belirli bir aralıktaki bütün noktalara atanabiliyorsa bu tip değişkenlere sürekli değişken denir.
SÜREKLİ DEĞİŞKEN Boy uzunluğu; Yaş vücut ağırlığı; kan kolesterol değeri, Kan Şekeri vb gibi değişkenlerin her biri sürekli değişkenlere örnektir.
Değişkenler; Kesikli ve sürekli değişkenler, bağımlı, bağımsız, kontrol ve ara değişkenleri olarak sınıflandırılmıştır
Değişkenler bir diğer boyuta göre; 1. Bağımlı değişken, 2. Bağımsız değişken, 3. Kontrol değişkeni ve 4. Ara değişken olarak da sınıflandırılmaktadır. Ayrıca; bağımsız değişken sebep değişkeni, bağımlı değişken sonuç değişkeni olarak da adlandırılmaktadır. Sigara içip içmeme ve kronik akciğer hastası ( KAH) olup olmama olayında değişken tipi kesiklidir. Bu olayda sigara içip, içmeme bağımsız değişken (sebep), KAH olup olmama bağımlı (sonuç) değişkenidir.
İSTATİSTİK VE BİYOİSTATİSTİK Bir araştırmanın her aşamasında istatistik metotlar kullanılır. Bu nedenle araştırma ve istatistik birbirinden ayrılmaz bir bütünü oluşturur. SAĞLIK ALANINDA İSTATİSTİK HER AN BAŞVURULAN SAĞLIK YÖNETİCİSİNİN AYRILMAZ BİR PARÇASIDIR.
BİR SAĞLIK YÖNETİCİSİNİN Olaylar olgular hakkında karar verme sürecinde istatistiğin kullanılmasının dört temel amacı vardır. Bunlar; Durum tespiti yapmak, Karşılaştırma yapmak, Tahmin etmek, İlişki kurmaktır.
SAĞLIK YÖNETİCİSİ NEDEN ARAŞTIRMA YAPAR Araştırma yapmanın amacı yeni bilgilere ulaşmaktır. Bu süreçte elde edilen veriler günümüzde istatistik metotlarla değerlendirilmektedir. İstatistik yöntemler uygulanmayan araştırma sonuçları tartışmalıdır ve günümüz bilim anlayışında kabul görmez. Araştırma yöntemleri ile elde edilen değişken nitelikli verilere istatistik metotlar uygulanarak bilgi üretilmesi, ham maddenin fabrikada işlenerek ürün elde edilmesi süreç ve yöntemi ile benzeştirilebilir. Diğer bir ifade ile ham maddeler fabrikada işlenerek ürün elde edildiği gibi, değişken nitelikli veriler istatistik metotlarla değerlendirilerek bilgi elde edilir.
Biyoistatistik SAĞLIK ile ilgili verilerin toplanması, verilerin özetlenmesi ve yorumlanması, biyolojik değişkenler için test ve tahminlerin yapılması ve nedensellik ilişkilerini inceleyen istatistiğe biyoistatistik denir.
Biyoistatistiksel veri kaynakları; Kayıtlar, Sayımlar, Anketler, Planlı araştırma verileri olarak sınıflandırılmaktadır.
Verilerin Doğruluk Derecesi İstatistik değerlendirmeye alınacak veriler doğru ve yeterli hassasiyette ölçülmüş olmaları gerekir. Bunun için; Araştırmayı yürütecek elemanlar, konunun anlam ve önemini bilen iyi eğitilmiş, dikkatli kimseler olmalıdır Ölçüm yapacak araştırıcı veya eleman ölçüm tekniği ve ölçüm aleti konusunda bilgili olmalıdır. Ölçüm yapılacak alet doğru ve gerekli hassasiyette ölçüm yapabilir özellikte olmalıdır.
Verilerde Aranan Özellikler Veriler en az maliyetle elde edilmelidir. Bilim ve bilgi için maliyet hesabı yapılmamalıdır. Ancak imkânların sınırlı olduğu dikkate alındığında, verilerden sağlanan fayda, veriler elde edilirken yapılan maliyetten yüksek olmalıdır. Verilerin doğruluk derecesi yüksek olmalıdır. Veriler; doğru, güvenilir, yeterli ve gerekli duyarlıkta ölçülmüş veya belirlenmiş olmalıdır. Veriler kısa sürede elde edilmelidir. Veriler mümkün olan en kısa sürede ve kullanılacağı zaman elde edilmiş olmalıdır.
SORMAK İSTEDİĞİNİZ BİR ŞEY VAR MI?