Değişken Türleri, Tanımlayıcı İstatistikler ve Normal Dağılım. Dr. Deniz Özel Erkan

Benzer belgeler
Sık kullanılan istatistiksel yöntemler ve yorumlama. Doç. Dr. Seval KUL Gaziantep Üniversitesi Tıp Fakültesi

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

Üretim Süreci: Girdi İşlem Ürün (Sonuç) Araştırma Süreci: Hangi alanda olursa olsun araştırma bir BİLGİ ye ulaşma sürecidir.

BİYOİSTATİSTİK. Genel Uygulama 1. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

BİYOİSTATİSTİK Merkezi Eğilim ve Değişim Ölçüleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

Test İstatistikleri AHMET SALİH ŞİMŞEK

Evren (Popülasyon) Araştırma kapsamına giren tüm elemanların oluşturduğu grup. Araştırma sonuçlarının genelleneceği grup

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

Biyoistatistiğe Giriş: Temel Tanımlar ve Kavramlar DERS I VE II

BÖLÜM 9 NORMAL DAĞILIM

BİYOİSTATİSTİK. Ödev Çözümleri. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Ders 8: Verilerin Düzenlenmesi ve Analizi

ALKÜ EKONOMİ ve FİNANS BÖLÜMÜ ISL 207 İSTATİSTİK I ALIŞTIRMALAR

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5

TANIMLAYICI İSTATİSTİKLER

İSTATİSTİKTE TEMEL KAVRAMLAR

IİSTATIİSTIİK. Mustafa Sezer PEHLI VAN

Su Ürünlerinde Temel İstatistik. Ders 2: Tanımlar

İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

İstatistik Giriş ve Temel Kavramlar. BBY606 Araştırma Yöntemleri Güleda Doğan

İstatistik ve Olasılığa Giriş. İstatistik ve Olasılığa Giriş. Ders 3 Verileri Sayısal Ölçütlerle İfade Etme. Verileri Sayısal Ölçütlerle İfade Etme

Biyoistatistiğin Tanımı Biyoistatistikte Kullanılan Terimler Değişken Tipleri Parametre ve İstatistik Tanımlayıcı İstatistikler

NORMAL DAĞILIM VE ÖNEMLİLİK TESTLERİ İLE İLGİLİ PROBLEMLER

Hastane Yönetimi-Ders 8 Hastanelerde İstatistiksel Karar Verme

Verilerin Özetlenmesinde Kullanılan Sayısal Yöntemler

Biyoistatistik. Uygulama 1

Projede istatistik analiz planı

İSTATİSTİKSEL TAHMİNLEME. Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir.

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

İSTATİSTİK MHN3120 Malzeme Mühendisliği

BÖLÜM 13 HİPOTEZ TESTİ

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir

GÜVEN ARALIKLARI ve İSTATİSTİKSEL ANLAMLILIK. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı


Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

İÇİNDEKİLER ÖN SÖZ...

Merkezi Yığılma ve Dağılım Ölçüleri

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Merkezi Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Örneklem Dağılımları & Hipotez Testleri Örneklem Dağılımı

Copyright 2004 Pearson Education, Inc. Slide 1

AKSARAYLI TEMEL İSTATİSTİK YÖNTEMLER

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

EĞĠTĠMDE ÖLÇME VE DEĞERLENDĠRME BÖLÜM IV Ölçme Sonuçları Üzerinde Ġstatistiksel ĠĢlemler VERİLERİN DÜZENLENMESİ VERİLERİN DÜZENLENMESİ

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

İstatistik Nedir? İstatistiğin Önemi Nedir? Tanımlayıcı ve Çıkarımcı İstatistik ttitik Tanımlayıcı İstatistik Türleri Çıkarımcı İstatistiğin i iği

İSTATİSTİK ÖRNEK SORULARI

Örnek...4 : İlk iki sınavında 75 ve 82 alan bir öğrencinin bu dersin ortalamasını 5 yapabilmek için son sınavdan kaç alması gerekmektedir?

UYGUN HİPOTEZ TESTİNİN SEÇİMİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

objektif değerlendirilmesini sağlayan bilim - veri arasındaki farkın olup olmadığını tespit

Prof.Dr.İhsan HALİFEOĞLU

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ TELAFĐ SINAVI SORULARI

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ DÖNEM SONU SINAV SORULARI

PARAMETRİK OLMAYAN TESTLER

Bölüm 3. Tanımlayıcı İstatistikler

Prof.Dr.İhsan HALİFEOĞLU

Tablo ve Grafikler. Dr.Önder Ergönül Koç Üniversitesi Tıp Fakültesi Enfeksiyon Hastalıkları ve Klinik Mikrobiyoloji Bölümü

Sürekli Rastsal Değişkenler

Ortalamaların karşılaştırılması

İSTATİSTİK I. Giriş. Bölüm 1 Temel Terimler ve Tanımlar İSTATİSTİKLER

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

KİMYASAL ANALİZ KALİTATİF ANALİZ (NİTEL) (NİCEL) KANTİTATİF ANALİZ

KANTİTATİF TEKNİKLER - Temel İstatistik -

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ BÜTÜNLEME SINAVI SORULARI

Ölçme. BBY606 Araştırma Yöntemleri Güleda Doğan

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

İSTATİSTİK HAFTA. ÖRNEKLEME METOTLARI ve ÖRNEKLEM BÜYÜKLÜĞÜNÜN TESPİTİ

SPSS UYGULAMALARI-II Dr. Seher Yalçın 1

Parametrik Olmayan İstatistiksel Yöntemler IST

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

Unite 5. İstatistik. İstatistik nedir? İstatistik İki Gruba ayrılır. Öğr. Gör Ali Onur Cerrah. Verinin Ölçüm Biçimi (Veri Tipi)

LOJİSTİK REGRESYON ANALİZİ

Toplum ve Örnek. Temel Araştırma Düzenleri. Doç. Dr. Ertuğrul ÇOLAK. Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Popülasyon Ortalamasının Tahmin Edilmesi

BİYOİSTATİSTİK. Uygulama 4. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

T TESTİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ. Yrd. Doç. Dr. C. Deha DOĞAN

ANADOLU ÜNİVERSİTESİ. ENM 317 MÜHENDİSLİK İSTATİSTİĞİ PARAMETRİK OLMAYAN TESTLER Prof. Dr. Nihal ERGİNEL

Olasılık ve Normal Dağılım

SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER. Abdullah Can

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5

ÖRNEK BULGULAR. Tablo 1: Tanımlayıcı özelliklerin dağılımı

13. Olasılık Dağılımlar

VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN

İstatistik 1 BÖLÜM 2

Bir Üniversite Hastanesinin Yoğun Bakım Ünitesi Hemşirelerinde Yaşam Kalitesi, İş Kazaları ve Vardiyalı Çalışmanın Etkileri

SÜREKLİ ŞANS DEĞİŞKENLERİ. Üstel Dağılım Normal Dağılım

İÇİNDEKİLER. Birinci Bölüm UYGULAMA VERİLERİ

OLASILIK VE İSTATİSTİK

Transkript:

Değişken Türleri, Tanımlayıcı İstatistikler ve Normal Dağılım Dr. Deniz Özel Erkan

Evren Parametre Örneklem Çıkarım Veri İstatistik

İstatistik Tanımlayıcı (Descriptive) Çıkarımsal (Inferential) Özetleme Sınıflama Görselleştirme Evrenden örnekleme genelleme Hipotez testi İlişki belirleme Tahminde bulunma

Değişken Farklı değerler alabilen veya değişen özellikler veya durumlardır. Çoğu araştırma iki değişken arasındaki ilişki veya iki/daha fazla grup arasındaki farkla ilgili genel bir soru ile başlar.

Değişken türleri Nicel Kategorik (nominal, ordinal) Time-to-event

Nicel değişkenler Sayısal sürekli: Belirli bir aralıkta her değeri alabilir (ör: boy 168,88) Sayısal kesikli: Belirli değerler alabilir (ör: çocuk sayısı)

Sayısal değişken Ölçme yapılarak ya da sayma yoluyla elde edilen değişkenlerdir. Örnekler: Yaş BMI (Vücut kitle indeksi) Ölçekten elde edilen toplam puan Hemoglobin, kolesterol gibi kandan cihaz yardımıyla ölçülen değişkenler Hastanede kalış süresi Sistolik kan basıncı Hastanın maliyeti

Kategorik-Binary İkili (binary): İki kategorili Sağ/Ölü Deney/Placebo Hasta/Sağlam HT var/ht yok

Kategorik-Nominal Nominal: Sıralama yapılamayan kategoriler Kan grubu Medeni durum Meslek

Kategorik-Ordinal Ordinal: Sıralama yapılabilen kategoriler Kanser evresi (I, II, III, IV) Doğum sırası (1., 2., 3. sıra) Likert ölçeği (Kesinlikle katılmıyorum, katılmıyorum, kararsızım, katılıyorum, kesinlikle katılıyorum) Yaş grubu (10-20, 21-30, 31-40)

Çeşitli örnekler Cinsiyet (kadın-erkek) Gelir (düşük-orta-yüksek) Eğitim durumu (ilköğretim-lise-üniversite) Diyabet (var-yok)-ht (var-yok) Test sonucu (pozitif-negatif) Sigara (içen-bırakmış-içmeyen) Hastalığın evresi (I-II-III)

Zamana bağlı değişkenler Bir olayın görülme zamanı, hastanın son görüldüğü tarih Hibrittir. İkili (olay oldu/olmadı) da olabilir, süre de olabilir. Kohort veya RKÇ gibi zamana bağlı takip gerektiren çalışmalarda hesaplanır Ör: Ölüm zamanı, MI zamanı, KBH zamanı

Veriyle tanışmak Kategorik Her kategoride kaç n var? Yüzdesi? Nicel Dağılımın formu nedir (normal mi dağılıyor, sağa/sola mı çarpık) Verinin merkezi nerede? Verinin yayılımı/değişkenliği nasıldır?

Merkezi ölçütler Ortalama Medyan Mod

Ortalama Dağılım simetrikse kullanılır Uç değerlerden etkilenir Daha detaylı bilgi verir Standart sapma ile birlikte sunulur 1 5 4 3 2 X = 1 + 5 + 4 + 3 + 2 = 15 Toplamı örneklem sayısına böl (n = 5): Ortalama= 15 / 5 = 3

Medyan Dağılım sağa veya sola çarpıksa kullanılır Uç değerlerden etkilenmez Bilgi kaybı Min-Max veya IQR ile birlikte sunulur 24 18 19 42 16 12 Sırala 42 24 19 18 16 12 Ortadaki değer (N + 1) / 2 = (6 + 1) / 2 = 3.5 Medyan = 3. ve 4. skor ortalaması: (19 + 18) / 2 = 18.5

Mod En sık tekrarlanan değer 24 18 19 42 16 12 18 19 19 Mod: 19

Yaygınlık gösteren ölçütler Standart sapma, Varyans Range (aralık) Persentil (çeyreklik) Inter-quartile range (IQR)

Standart sapma 2 4 6 8 10 Ort: 6 Verinin ortalamadan ne kadar uzakta olduğunu gösterir Ortalamadan uzaklık X i X n? Değildir çünkü sonuç 0 a eşittir. Çare:

9 hastanın yaşı: Range-IQR 22, 16, 24, 17, 16, 25, 20, 19, 26 Range: Max-Min= 26-16=10 Medyan 16 16 17 19 20 22 24 25 26 (16 + 17) 2 Q 1 = = 16.5 Q 3 = = 24.5 Q 3 Q 1 = 24.5 16.5 IQR = 8 (24 + 25) 2

Güven aralığı Evren parametresi için akla yatkın değer aralığı sunar. Tahminin kesinliğini hakkında fikir verir. Aralık genişse sonuçlar güven vermez. İstatistiksel anlamlılık yorumu yapılabilir. Güven aralığı H0 hipotezindeki değeri içermiyorsa p<0,05 denilir.

Biraz matematik 50 lise öğrencisinden oluşan bir örneklemin haftalık tv seyretme sürelerinin incelenmesi sonucunda, ortalama 20,5 saat ve standart sapması 5,5 saat olarak hesaplanmıştır. Bütün lise öğrencilerinin ortalama TV seyretme süreleri hakkında %95 lik güven aralığını belirleyin. n z X n z X n z X or X n z then For n z X or X n z then For n

Veri sunumu Kategorik Tablo: Sayı, % Grafik: Bar grafik, Pie chart Nicel/sürekli Tablo: Mean±Sd veya Median (IQR) veya Median (Min-Max) Grafik: Box plot, Histogram Scatter plot?

Baseline Patient Characteristics Characteristics Ranolazine (n=3279) Placebo (n=3281) Age, median (IQR), y 64 (55-72) 64 (56-72) Age 75y 562/3279 (17.1) 592/3281 (18.0) Female Sex 1106/3279 (33.7) 1185/3281 (36.1) White Race 3112/3279 (94.9) 3129/3281 (95.4) Weight, median (IQR), kg 80 (72-92) 81 (71-91) BMI, median (IQR) 28 (25-31) 28 (25-32) Comorbidities Diabetes mellitus 1104/3279 (33.7) 1116/3281 (34.0) Hypertension 2395/3257 (73.5) 2409/3258 (73.9) Hyperlipidemia 2028/3016 (67.2) 2022/2982 (67.8) Current Smoker 872/3276 (26.6) 804/3280 (24.5) Cardiac History Prior MI 1119/3245 (34.5) 1095/3251 (33.7) Prior coronary revascularization 891/3277 (27.2) 853/3278 (26.0) Prior heart failure 538/3279 (16.4) 557/3281 (17.0) (Morrow et al. Effects of Ranolazine on Recurrent Cardiovascular Events in Patients with Non-ST-Elevation Acute Coronary Syndromes. JAMA 2007; 297: 1775-1783.)

Verim normal dağılıyor mu? Sayısal verileri kullanan istatistiksel test seçiminde önemli (özellikle düşük örneklemde) Tüm sayısal veriler normal dağılmaz. Nasıl test ederiz?

Normal dağılım kontrolü

1. Histogram çan eğrisi şeklinde mi?

2. Normal olasılık grafiği (q-q plot) lineer mi?

3. Tanımlayıcı istatistiklere bak Ortalama ve medyan birbirine yakın mı? Standart sapma ortalamanın yarısından/dörtte birinden az mı? Çarpıklık/standart hatası, basıklık/standart hatası değerleri -1,96 ve +1,96 arasında mı?

4. Son olarak normallik testine bak (Shapiro Wilk) Örneklem sayısı arttıkça güvenilir değil. Çünkü p değeri ile çalışıyor. Grafiklere güven, normallik testi tamamlayıcı olsun. Mükemmeliyetçi olma. Dağılım çok çarpık olmadığı sürece, normal dağılıma yaklaşım konusunda optimist ol.

TEŞEKKÜRLER