İSTATİSTİKSEL VERİ ANALİZİ



Benzer belgeler
İÇİNDEKİLER ÖN SÖZ...

İstatistik Nedir? İstatistiğin Önemi Nedir? Tanımlayıcı ve Çıkarımcı İstatistik ttitik Tanımlayıcı İstatistik Türleri Çıkarımcı İstatistiğin i iği

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

OLASILIK ve KURAMSAL DAĞILIMLAR

İstatistik ve Olasılık

Mühendislikte İstatistik Yöntemler

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

TAŞINMAZ DEĞERLEMEDE İSTATİSTİKSEL ANALİZ

VERİ KÜMELERİNİ BETİMLEME

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER

İSTATİSTİK MHN3120 Malzeme Mühendisliği


Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

Yrd.Doç.Dr. Ali SICAK BEÜ. EREĞLİ EĞİTİM FAKÜLTESİ EĞİTİM BİLİMLERİ BÖLÜMÜ

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

TANIMLAYICI İSTATİSTİKLER

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

AKSARAYLI TEMEL İSTATİSTİK YÖNTEMLER

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

Copyright 2004 Pearson Education, Inc. Slide 1

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

ANADOLU ÜNİVERSİTESİ İST 213 OLASILIK DERSİ TANIMLAR VE VERİ SINIFLAMASI

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

13. Olasılık Dağılımlar

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

VERİ SETİNE GENEL BAKIŞ

İstatistik ve Olasılık

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

İstatistik ve Olasılık


İstatistik ve Olasılık

Merkezi Eğilim ve Dağılım Ölçüleri

BÖLÜM 1 GİRİŞ: İSTATİSTİĞİN MÜHENDİSLİKTEKİ ÖNEMİ

BÖLÜM 10 ÖRNEKLEME YÖNTEMLERİ

MAK 210 SAYISAL ANALİZ

BİYOİSTATİSTİK Merkezi Eğilim ve Değişim Ölçüleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

TEMEL İSTATİSTİK BİLGİSİ. İstatistiksel verileri tasnif etme Verilerin grafiklerle ifade edilmesi Vasat ölçüleri Standart puanlar

BÖLÜM 3 KURAMSAL ÇATI VE HİPOTEZ GELİŞ

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

İstatistik ve Olasılık

ÜSTEL DÜZLEŞTİRME YÖNTEMİ

Mühendislikte İstatistiksel Yöntemler

Prof.Dr.İhsan HALİFEOĞLU

Ders 1 Minitab da Grafiksel Analiz-I

Olasılık ve Normal Dağılım

Merkezi eğilim ölçüleri ile bir frekans dağılımının merkezi belirlenirken; yayılma ölçüleri ile değişkenliği veya yayılma düzeyini tespit eder.

Sürelerine Göre Tahmin Tipleri

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

Mühendislikte İstatistiksel Yöntemler

Korelasyon, Korelasyon Türleri ve Regresyon

DAĞILMA YADA DEĞİ KENLİK ÖLÇÜLERİ (MEASURE OF DISPERSION) Prof.Dr.A.KARACABEY Doç.Dr.F.GÖKGÖZ

ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. Ders 2 Merkezi Eğilim Ölçüleri

İçindekiler. Ön Söz... xiii

EĞĠTĠMDE ÖLÇME ve DEĞERLENDĠRME

İstatistik Nedir? Ders 1 Minitab da Grafiksel Analiz-I ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. İstatistiğin Konusu Olan Olaylar

Mühendislikte İstatistik Yöntemler

Verilerin Özetlenmesinde Kullanılan Sayısal Yöntemler

I. İSTATİSTİK VE OLASILIK

ALKÜ EKONOMİ ve FİNANS BÖLÜMÜ ISL 207 İSTATİSTİK I ALIŞTIRMALAR

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

SÜREKLĠ OLASILIK DAĞILIMLARI

ZAMAN SERİLERİNDE AYRIŞTIRMA YÖNTEMLERİ

Test İstatistikleri AHMET SALİH ŞİMŞEK

OLASILIK ve İSTATİSTİK Hipotez Testleri

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

DENİZ HARP OKULU TEMEL BİLİMLER BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

Gruplanmış serilerde standart sapma hesabı

Bölüm 2 VERİLERİN DERLENMESİ VE SUNUMU

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

Ders 8: Verilerin Düzenlenmesi ve Analizi

İSTATİSTİK ÖRNEK SORULARI

İstatistik. Temel Kavramlar Dr. Seher Yalçın 1

Prof.Dr.İhsan HALİFEOĞLU

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5

Tahminleme Yöntemleri

İÇİNDEKİLER 1. GİRİŞ...

İÇİNDEKİLER BÖLÜM 1 KAVRAMLAR VE YÖNTEMBİLİM

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ

Bölüm 2. Frekans Dağılışları VERİLERİN DERLENMESİ VE SUNUMU. Frekans Tanımı. Verilerin Derlenmesi ve Sunulması

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

Örnek...4 : İlk iki sınavında 75 ve 82 alan bir öğrencinin bu dersin ortalamasını 5 yapabilmek için son sınavdan kaç alması gerekmektedir?

GRAFİK YORUMLAMA. 1 ) Sütun Grafiği : Belirli bir zaman aralığında bazı veri grup-

EME 3117 SİSTEM SIMÜLASYONU. Girdi Analizi. Özet İstatistikler ve Histogram (Minitab)(1) Örnek: Eczane İçin Servis Süreleri

istatistik El 10 1_ ve 2_ sorular a Ş3 gldakl bilgilere göre Al 4 Bl 6 cı 7 Dl 8 Al 5 B) 12 CL 27 D) 28 E) 35 2Q 10 BS 4200-A

IİSTATIİSTIİK. Mustafa Sezer PEHLI VAN

Toplam İkinci harmonik. Temel Üçüncü harmonik. Şekil 1. Temel, ikinci ve üçüncü harmoniğin toplamı

Editörler Yrd.Doç.Dr.Aysen Şimşek Kandemir &Yrd.Doç.Dr.Tahir Benli İSTATİSTİK

Transkript:

İSTATİSTİKSEL VERİ ANALİZİ Prof. Dr. Gül ERGÜN Hacettepe Üniversitesi Kasım 2013

İstatistik Nedir? İSTATİSTİK Belirli bir konuda toplanan sayısal değerlerdir. Buna göre, 2012 yılında Türkiye de kayıtlı kadın işci sayısı, Türkiye de 1990-2013 yıllarında tarım ve sanayi kesiminde çalışanların sayısı, 2012 yılı enflasyon oranı ya da aynı yıla ait ihracat ve ithalat faaliyetlerine ilişkin rakamlar istatistiğin ilk tanımına örnek olarak verilebilir.

İstatistik Nedir? İSTATİSTİK Temelini matematikten alan bir bilim dalıdır. Buna göre istatistik, verileri toplama ve toplanan verileri düzenleme, analiz etme, yorumlama, objektif ve doğru kararı verme ile ilgili bilimsel teknik ve metotlar geliştiren ve uygulayan bir bilim dalıdır. Bu nedenle hangi alanda olursa olsun tüm araştırıcılar istatistik teknik ve yöntemlerini en azından tanımak ve belirli ölçüde bilmek zorundadır.

Önemli kavramlar, terimler, tanımlar Araştırma: İlgilenilen konuya ilişkin sorunların saptanması, çözüm yollarının planlanması, uygulamaya konulması ve sonuçların değerlendirilmesine yönelik çalışmadır. Buna göre, Araştırmada amaç ve konu, zaman/maliyet kısıtları gözetilerek belirgin ve sınırlı olmalıdır.

Önemli kavramlar, terimler, tanımlar Kitle: Araştırma kapsamına giren, aynı özelliği taşıyan birimlerin tümüdür. Nüfus sayımı için kitle Türkiye dir. Örneklem : Bir kitleden belirli yöntemler kullanarak seçilen birimlerin oluşturduğu bir alt kümedir.

VERİ Belirli amaçlar için toplanan bilgilerdir. Veri elde etmek için kullanılan yöntemler: Mevcut kaynaklardan (eski kayıtlar, arşivler, raporlar, yıllıklar) yararlanma, Anket yapma, Deney yapma, Simülasyon ya da projeksiyon çalışması yapma.

TAM SAYIM - ÖRNEKLEME Verilerin toplanmasında tam sayım ya da örnekleme çalışmalarından yararlanılır. Ancak tam sayımlar, içerdiği birim sayısının fazla olması nedeniyle, uzun bir süre sonunda düzenlenip kullanabilir duruma gelmektedir. Bu nedenle bir çok alanda istatistiklerin elde edilmesinde uygun örnekleme çalışmalarından yararlanılmasının gerekliliği açıktır.

NEDEN ÖRNEKLEME? Örneklemde çalışmak kitlede çalışmaktan daha kolaydır. Kitle üzerinde çalışmak çok daha masraflı olabilir. Çoğu durumda tüm kitleye ulaşmak mümkün değildir. Örneklem sonuçları daha doğru olabilir. Çünkü daha az sayıda kişi ile (örnek ile) çalışılacağından, araştırma daha özenli yürütülebilir. Eğer örneklem olasılıksal yöntemlerle seçiliyorsa, yapılan örnekleme hatasının kestirimini de bulmak mümkündür.

ÖRNEKLEME ÇALIŞMALARINDA ADIMLAR Örneklemenin Amaçlarının Belirlenmesi Kitlenin Belirlenmesi Toplanacak Bilginin Belirlenmesi Veri Toplama Yönteminin Seçimi Araştırmanın Güvenilirliğinin Belirlenmesi Örnekleme Yönteminin Seçimi Ön Test (Pilot Çalışma) Saha Araştırmasının Organizasyonu Uygulama, Analiz

ANKET ÇALIŞMASI Anket çalışmalarında dikkat edilmesi gereken önemli bir nokta, elde edilecek istatistiki verilerin isabet ve çabukluklarıyla doğru, maliyet ile ters orantılı bir şekilde değer kazanmalarıdır.

Anket Yöntemi KİŞİSEL GÖRÜŞME YARARLARI Cevaplamama Oranının Düşmesi Daha Detaylı Bilgi Alınabilir Hata Oranı Azalır SAKINCALARI Maliyet Oldukça Yüksektir Çekinme ve Övünme ya da Başka Nedenlerle Yanlış Bilgi Alınabilir Araştırma Süresi Uzar Hayali Görüşmeler Yapılabilir

Anket Yöntemi TELEFONLA GÖRÜŞME YARARLARI Diğer Yöntemlere Göre Ucuzdur Araştırma Süresi Kısadır Daha Kolaydır SAKINCALARI Toplanan Bilginin Doğruluğunu Kontrol Etmek Güçtür Ayrıntılı Bilgi Elde Edilemez Her yerde Telefon Olmayabilir

Anket Yöntemi POSTA / E-POSTA YOLUYLA YARARLARI Kişisel Görüşme Yöntemine Göre Daha Ekonomiktir Kişisel Görüşmede Yanlış Beyana Neden Olan Hususlar Ortadan Kalkar Kitledeki Birimlerin Büyük Çoğunluğuna Ulaşılabilir SAKINCALARI Cevaplama Oranı Çok Düşüktür Araştırma Süresi Uzar Okur-Yazar Olmayanlar Cevaplandıramaz Cevaplama Oranı Bölgelere Göre Farklılık Gösterebilir Soruları Kimin Cevapladığı Belirlenemez

ARAŞTIRMANIN GÜVENİLİRLİĞİNİN BELİRLENMESİ Örnekleme çalışmalarında elde edilen sonuçlar, belli bir hata payı içerir. Çünkü kitlenin tamamının incelenmemiştir ve tam sayımda da söz konusu olan bazı ölçme hataları yapılabilir. Örnekleme çalışmalarında elde edilen sonuçlar iki tür hatayı içerir.

Hata Örnekleme Hatası Sistematik Hata Örneklem Dışı Hata Veri Toplama, Seçim Hatası Seçilen Birimin Yerinin Saptanamaması ve Görüşme Yapılamaması Yanlış Bilgi Verme Hatası Veri Giriş Hatası

ÖRNEKLEME YÖNTEMİNİN SEÇİMİ Araştırmalarda kullanılacak çeşitli örnekleme yöntemleri vardır. Araştırmanın amacına, maliyet, süre gibi kısıtlayıcı şartlara ve kitlenin özelliklerine göre, bunlar içinden en uygun olanı seçilmelidir. Araştırma kapsamına alınacak birimlerin seçiminde rasgele ve rasgele olmayan örnekleme teknikleri kullanılabilir. Rasgele örneklemede, kitleden alınacak çeşitli örneklerle elde edilen tahminler arasındaki farkları belirleyen rasgele hatalar, belirli istatistiksel teknikler yardımıyla kontrol altında tutulabilir. Rasgele olmayan örneklemede ise bu hatalar belirlenemez.

RASGELE ÖRNEKLEME TÜRLERİ Basit Rasgele Örnekleme Tabakalı Örnekleme Aşamalı Örnekleme Küme Örneklemesi Sistematik Örnekleme Ardışık Örnekleme Dinamik Örnekleme ve diğer

ÖRNEKLEM GENİŞLİĞİNİN BELİRLENMESİ Araştırmacılar için önemli bir soru Örneklem Genişliği Ne Olmalıdır? sorusudur. Bu soru basit bir şekilde yukarıda verilen formülle cevaplanabilir. Ancak bu yol bazı spesifik problemlerin çözümünde tam yanıt vermeyebilir. Ya da elde edilen örneklem genişliği gereğinden büyük olabilir. Bunların yanında araştırmada amaç, Z testi, t testi ya da ANOVA gibi belirli istatistiksel testlerin uygulanması olabilir. Bu testlerin uygulanmasında gerekli olan minimum örneklem genişlikleri testlerin güçleri dikkate alınarak belirlenebilir.

ORAN KESTİRİMİNDE KULLANILACAK ÖRNEKLEM GENİŞLİĞİ (n) FORMÜLLERİ Kitle Genişliği (N) Bilinmiyorsa n z 2 / 2 P(1 P) 2 d Kitle Genişliği (N) Biliniyorsa 2 Nz / 2P(1 P) (N 1) z P(1 P) n 2 d 2 / 2

ORAN KESTİRİMİNDE KULLANILACAK ÖRNEKLEM GENİŞLİĞİ (n) FORMÜLLERİ Bu formüller basit rasgele örnekleme yöntemi için geçerli formüllerdir. Diğer yöntemlerde farklı formüller kullanılmalıdır. Formüllerde yer alan bilinmeyenler (P ve d) araştırıcı tarafından öngörülen ve/veya daha önceki çalışmalar (pilot çalışmalar) yardımıyla elde edilen değerler olabilmektedir.

Örnek Bir bölgede 50 yaş ve üstü yetişkinlerde 0.40 oranında olduğu düşünülen işssizlik oranını 0.04 hata ve 0.95 olasılıkla kestirebilmek için kullanılacak uygun örneklem genişliği nedir? 1.96 (0.40)(0.60) 0.04 2 n 2 577 zα/2 z0.025 P 0.40 d 0.04 1.96 2 5000 1.96 (0.40)(0.60) 2 0.04 (4999) 1.96 (0.40)(0.60) n 2 517

SORUN Türkiye İstatistik Kurumu nun yaptığı sayımlar ile diğer kaynaklardan elde edilen rakamlar arasında farklılıklar olabilir. Bu farklılık da mevcut duruma kuşkuyla bakılmasına sebep olabilir. Kurumların kendi verilerini toplamada sorunları olabilir. Odalar ve diğer kuruluşlara bağlı kalabilir.

DEĞERLENDİRME Bu aşamada araştırmanın amacı gözetilir. Bunlar: -Mevcut durumun betimlenmesi, -Bilinmeyen değerlerin tahmin edilmesi, -Öngörü ve projeksiyonların yapılması, -Farklı senaryolar ile problemin çözümlenmesi.

VERİLERİN ANALİZİ Araştırma kapsamında toplanan verilerin özetlenmesi, değerlendirilmesi için gerekli tüm istatistiksel yöntemleri kapsar.

İstatistiksel Yöntemler

Veri Tipleri

Verilerin Organizasyonu

İstatistiksel Bilgisayar Paketleri SPSS SAS MINITAB R EXCEL

Sıklık Tablosu Oluşturma Evli Bekar Bekar Bekar Evli Boşanmış Dul Evli Bekar Bekar Boşanmış Dul Boşanmış Evli Evli Bekar Evli Bekar Bekar Evli Bekar Bekar Bekar Evli Boşanmış Evli Boşanmış Evli Bekar Evli Bekar Boşanmış Bekar Bekar Evli

SIKLIK TABLOSU Sınıflar Sıklık Göreli Sıklık Yüzde Bekar 15 0,428571 42,85714 Evli 12 0,342857 34,28571 Boşanmış 6 0,171429 17,14286 Dul 2 0,057143 5,714286 TOPLAM 35 1 100

Frekans Çubuk Grafiği 16 14 12 10 8 6 4 2 0 Bekar Evli Boşanmış Dul Medeni Hal

Yüzde Çubuk Grafiği 45 40 35 30 25 20 15 10 5 0 Bekar Evli Boşanmış Dul Medeni Hal

Pasta Grafiği 17% 6% 43% 34% Bekar Evli Boşanmış Dul

Pasta Grafiği

Pareto Diyagramı

SIKLIK TABLOSU OLUŞTURMA Bir kurumda çalışan 52 kişiye ait boy uzunlukları: 140 142 148 148 149 151 154 155 155 156 157 158 158 159 159 160 160 163 163 164 164 164 165 165 166 166 167 167 168 168 168 168 168 169 169 170 170 171 173 175 176 177 177 177 180 180 181 182 185 186 191 198

SIKLIK TABLOSU Sınıflar Sınıf Ara Değeri Sıklık Göreli Sıklık Yüzde Birikimli Yüzde 140-150 145 5 150-160 155 10 160-170 165 20 170-180 175 9 180-190 185 6 190-200 195 2 TOPLAM - 52 0,096154 9,615385 9,615385 0,192308 19,23077 28,84615 0,384615 38,46154 67,30769 0,173077 17,30769 84,61538 0,115385 11,53846 96,15385 0,038462 3,846154 100 1 100 -

Dal yaprak grafiği (Sürekli Veri İçin)

Histogram (Sürekli Veri İçin)

Poligon (Sürekli Veri İçin)

Verilerin Dağılımları o Simetrik o Sağa Çarpık o Sola Çarpık

Çarpık Dağılımlar

Simetrik Dağılım

İki Değişkenli Sürekli Verilerde Grafiksel Sunumlar Saçılım Grafikleri Zaman Serisi Grafikleri

Tüketim Miktarı Tüketim Miktarı Saçılım Grafiği ve Korelasyon Pozitif Korelasyon (İki Değişken Aynı Yönde Artıyor/Azalıyor) Negatif Korelasyon 6 6 4 2 4 2 0 0 5 10 15 20 0 0 5 10 15 20 Gelir Fiyat

Saçılım Grafiği Korelasyon Yok 9 8 7 6 5 4 3 2 1 0 0 5 10 15 20 25

Zaman Serisi Grafiği

Zaman Serisi Grafiği ve Box Plot

Dendogram (Çok Değişkenli Veriler)

Verilerin Sunumunda HATALAR Gereksiz Tabloların Kullanımı Verilerin Karşılaştırılmasında Temelde Uyumsuzluk Kullanılan Grafiklerde Dikey Eksenin Sıkıştırılması Uygun olmayan grafiklerin seçimi Dikey eksende yüzde ya da frekans kullanımına dikkat edilmemesi Dikey eksende sıfır noktasının bulunmayışı

İşletme Sayısı Dikey Eksen Sıklık (Hatalı Sunum) 70 60 50 40 30 20 10 0 Sektör A Sektör B Sektör C

Yüzde Dikey Eksen Yüzde (Doğru Sunum) 60 50 40 30 20 10 0 Sektör A Sektör B Sektör C

Satış Miktarları Dikey Eksenin Genişletilmesi (Hatalı Sunum) 100 90 80 70 60 50 40 30 20 10 0 1 3 5 7 9 11 13 15 Zaman

Satış Miktarları Doğru Sunum 50 45 40 35 30 25 20 15 10 1 3 5 7 9 11 13 15 Zaman

Satış Miktarları Dikey Eksenin Sıkıştırılması (Hatalı Sunum) 32 30 28 26 24 22 20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Zaman

KONUM ÖLÇÜLERİ En çok bilinen ve kullanılan KONUM ölçüleri Aritmetik ortalama, Ağırlıklı ortalama, Medyan (orta değer), Mod (tepe değeri), Geometrik ortalama, Çeyrek değerler

Aritmetik Ortalama Aritmetik ortalama istatistikte çok kullanılması nedeniyle çok iyi bilinmesi gereken bir ortalama veya bir konum ölçüsüdür. Bu ortalama hem ham verilerden hem de sınıflandırılmış verilerden kolayca hesaplanabilir. Aritmetik ortalama, herhangi bir örneği meydana getiren gözlem değerlerinin toplamının, toplam gözlem sayısına bölünmesiyle elde edilen değer olarak tanımlanabilir.

Medyan Medyan (Orta Değer):Medyan, küçükten büyüğe doğru sıralanmış verilerde ortaya düşen değer olarak tanımlanabilir. Başka bir deyişle medyan, verileri iki eşit kısma ayıran değer olup gözlemlerin %50 si bu değerden küçük, %50 si ise bu değerlerden büyüktür. Örnek: X={6,18,12,62,15,10,17} veri seti için medyan=15 tir.

Değişim Ölçüleri Konum ölçüleri verilerin sadece merkezine ilişkin bilgiyi verirken, bu ölçüler merkez etrafındaki dağılışın şekli hakkında bir fikir vermezler. Örneğin aynı ortalamaya sahip iki grubun gösterdiği dağılış birbirinden farklı olabilir. Bu durumu daha iyi açıklayabilmek için aşağıdaki iki grup veriyi ele alalım. A={20,28,30,25,40,22,45} B={27,28,32,30,33,26,34}

Değişim Ölçüleri Genişlik Ortalama Mutlak Sapma Varyans Standart Sapma Değişim Katsayısı

Genişlik Veri setinde en büyük deger ile en küçük değer arasındaki farktır. Örnek: A grubu için Genişlik = 25 B grubu için Genişlik= 8

Genişlik, veri kümesinde sadece iki değeri kullanır. Bu değerlerin aykırı ya da uç değer olması durumunda olduğundan çok yüksek tahminler elde edilir. Bu da gerçeği yansıtmaz. Bunun yanında, genişlik örnek büyüklüğü ile birlikte büyüyebileceğinden, eşit sayıda veri içermeyen örneklerin karşılaştırılmasınde anlamlı bir sonuç vermeyebilir.

Varyans Verilerin aritmetik ortalamadan olan sapmalarının kareler ortalaması şeklinde tanımlanabilir. Bu tanım çerçevesinde varyans formülü: Kitle Varyansı: (x ) 2 N 2 Örneklem Varyansı S 2 (x x) n 1 2

Standart Sapma İstatistikte dağılış ölçüsü olarak kullanılmaya en uygun ve en elverişli ölçü; varyansve bunun karekökü olan standart sapmadır. Her iki ölçü de kitlede veya örneklemde mevcut tüm verileri dikkate alır. Genellikle varyansı yorumlamak oldukça güçtür. Çünkü varyansın birimi, verilerin ifade edildiği ölçü biriminin karesidir. Yani,veriler kg, gr, m, cm ile ifade edilmişse varyansın birimi sırasıyla kg2, gr2, m2, cm2 olur. Bu da bir anlam taşımaz. Bundan dolayı varyansın karekökü alınır ve buna standart sapma denir. Standart sapmanın birimi verilerin ifade edildiği ölçü birimi ile aynıdır(kg, gr, m, cm).

Örnek A Grubu için S 2 A (x x n 1 B Grubu için A ) 2 86.33 S 2 B (x n x 1 B ) 2 9.67

Değişim Katsayısı Standart sapma (veya varyans) bir değişim ölçüsü olarak iki gruba ait verilere bakarak hangi grubun daha homojen olduğunun belirlenmesinde her zaman yeterli bir ölçü olmayabilir. Çünkü bazı durumlarda yapılan ölçümlerin büyüklüğü standart sapmayı ortalamadan daha fazla etkileyebilir. Verilerin büyüklüğünün standart sapmayı etkilediği biliniyorsa veya öyle düşünülüyorsa, Gözlemler farklı ölçü birimi ile ifade edilmişlerse standart sapma yeterli bir değişim ölçüsü olmayıp yanıltıcı sonuçlara neden olabilir. Bu gibi durumlarda, yani gözlem değerlerinin büyüklüğünden ileri gelen farklılığı ortadan kaldırmak hem de farklı ölçü birimi ile ifade edilmiş gözlem değerlerini karşılaştırılabilir duruma getirmek için değişim katsayısının kullanılması daha uygundur.

Değişim Katsayısı D.K. S X *100 Değişim katsayısı ne kadar küçük olursa çalışmanın sonucuna olan güvenilirlik o oranda artar. Birçok alanda bu değerin % 30 un altında olması istenir.

Örnek 9.29 D.K. A *100 30 3.11 D.K. B *100 30 %31 %10 Sonuç: B grubu daha homojen.

İstatistiksel Çıkarsama Kitleye ait bilinmeyen değerlerin tahmin edilmesi -Nokta tahminlerinin elde edilmesi -Aralık tahminlerinin elde edilmesi Kitleye ait bilinmeyen değerlerin belirli değerlere eşit olup olmadığı hipotezlerinin test edilmesi

İstatistiksel Çıkarsama İstatistiksel çıkarsamalarda önemli bir araç model kurmak ve bu modelin parametrelerini tahmin etmektir. Bu modeller değişkenler arasındaki ilişkileri matematiksel olarak ortaya koyar.

İstatistiksel Modellerin Faydaları Değişkenler arasındaki ilişkileri ortaya koyma Tahmin yapma Öngörü yapma Ve diğer

Model Türleri Regresyon Modelleri Zaman Serisi Modelleri

Regresyon Modelleri Bağımsız Değişkenler (X): Başka bir değişken tarafından etkilenmeyen ama y nin nedeni olan yada onu etkilediği düşünülen (açıklayıcı) değişkenlerdir. Bağımlı Değişken (Y) : Bağımsız değişkenlere bağlı olarak değişebilen yada onlardan etkilenen (açıklanan) değişkendir.

Regresyon Modelleri Modelde bağımlı değişken sayısı tekdir. Ancak bağımsız değişken sayısı birden fazla olabilir. Şayet bir adet bağımsız değişken ile Y açıklayınıyorsa, kurulan model Basit Doğrusal Regresyon ; iki ve daha fazla bağımsız değişken var ise, ele alınan model Çoklu Doğrusal Regresyon modeli adını alır. Bu sunumda sadece Basit Doğrusal Regresyon Analizi tantılacaktır.

Basit Doğrusal Regresyon Modeli Regresyon Analizinde, değişkenler arasındaki ilişkiyi fonksiyonel olarak açıklamak ve bu ilişkiyi bir modelle tanımlayabilmek amaçlanmaktadır. Bir kitlede gözlenen X ve Y değişkenleri arasındaki doğrusal ilişki aşağıdaki Doğrusal Regresyon Modeli ile verilebilir; Y= 0 + 1 X+ Burada; X: Bağımsız Değişken Y: Bağımlı Değişken 0 : X=0 olduğunda bağımlı değişkenin alacağı değer (kesim noktası) 1 : Regresyon Katsayısı : Hata terimi (Ortalaması=0 ve Varyansı= 2 dir)

Basit Doğrusal Regresyon Modeli Regresyon analizinde amaç ele alınan seriler için, bu iki değişken arasındaki ilişkiyi en iyi açıklayan aşağıdaki fonksiyonu tahmin etmektir. Y a bx

Basit Doğrusal Regresyon Modeli Doğru ve güvenilir bir regresyon modelinde amaç, gerçek gözlem değeri ile tahmin değeri arasında fark olmaması yada farkın minimum olmasıdır. Bunun için En Küçük Kareler Yöntemi kullanılır.

Basit Doğrusal Regresyon Modeli Değişkenler birlikte artıyor artıyor yada birlikte azalıyor ise b pozitif değerli dir. X:Gelir ve Y:Tüketim Miktarı ise, b>0 çıkar. Değişkenlerden biri artarken diğeri azalıyor ise b negatif değerli dir. X:Fiyat ve Y:Tüketim Miktarı ise, b<0 çıkar.

Tüketim Miktarı Tüketim Miktarı İki Değişken Arasındaki Korelasyon Pozitif Korelasyon (İki Değişken Aynı Yönde Artıyor/Azalıyor) Negatif Korelasyon 6 6 4 2 4 2 0 0 5 10 15 20 0 0 5 10 15 20 Gelir Fiyat

Açıklama (Belirtme) Katsayısı R 2 Yüzde cinsinden ifade edilen bu katsayı, regresyon analizinde önemlidir. Açıklama Katsayısı bire yakın ise, bağımlı değişkendeki değişimin büyük bir kısmının bağımsız değişken (yada değişkenler) tarafından açıklandığı yorumu yapılabilir. Kurulan modelin iyi olduğu yorumlanabilir.

Trend Analizi Açıklayıcı değişkenin zaman olduğu bir durumda, amaç Y değişkeninin zaman boyunca eğilimini matematiksel olarak ortaya koymak ve öngörü yapmaktır.

Satışlar Örnek 35 30 25 20 15 0 5 10 15 Zaman

Satış Miktarı Y 21.75 0.703* X R 2 0.88 Trend Modeli 35 30 25 20 15 0 2 4 6 8 10 12 14 Zaman Gerçekleşen Tahmini

Zaman Serisi Modelleri Bir zaman serisi,ilgilenilen bir değişkenin zaman içerisinde sıralanmış ölçümlerinin bir kümesidir.zaman serisi ile ilgili bu analizin yapılma amacı ise, ilgilenilen serisin zaman boyunca gelişiminin açıklanması ve serinin gelecekteki değerlerinin doğru bir şekilde öngörülmesidir.

Zaman Serilerinin Bileşenleri Trend bileşeni; Zaman serilerinin uzun sürede gösterdiği düşme veya yükselme eğilimidir. Mevsim Bileşeni; Zaman serilerinde mevsimlere göre değişmeyi ifade eder. Çevrimsel Bileşen; Mevsimsel değişmeler ile ilgili olmayan dönemseldeğişmelerdir.örneğin,ekonomide genel eğilimden bağımsız kısa süreli genişleme ya da daralma durumu çevrimsel süreci tarif eder. Düzensiz Bileşen; Diğer unsurlar gibi belirli olmayan, hata terimi ile ifade edilebilecek değişmelerdir.

Zaman serisi analizlerinde amaç ilgilenilen değişkenin geçmiş verilerinden yararlanarak gelecek değerlerinin öngörülmesidir. Bu bakış açısı ve zaman serisileri üzerindeki teorik varsayımlar, regresyon modelleri ile zaman serisi modelleri arasındaki farkı ortaya koyar.

Zaman Serisi Analizi Otoregresif Süreç(AR) Hareketli Ortalama Süreci(MA) ARMA ve ARIMA Süreci

İstatistiksel Bilgisayar Paketleri SPSS SAS MINITAB R EXCEL

SİZLERLE TANIŞTIĞIM İÇİN MUTLUYUM. DİNLEDİĞİNİZ İÇİN TEŞEKKÜRLER