İstatistik ve Olasılık

Benzer belgeler
İstatistik ve Olasılık

Mühendislikte İstatistiksel Yöntemler

İstatistik ve Olasılık

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

Sürekli Rastsal Değişkenler

ARALIK TAHMİNİ (INTERVAL ESTIMATION):

İstatistiksel Yorumlama

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

ANADOLU ÜNİVERSİTESİ. ENM317 Mühendislik İstatistiği İSTATİSTİKSEL TAHMİN Prof. Dr. Nihal ERGİNEL

İstatistik ve Olasılık

İstatistik ve Olasılık

İstatistik ve Olasılık

İSTATİSTİK II. Hipotez Testleri 1

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5

SÜREKLİ OLASILIK DAĞILIŞLARI

BÖLÜM 12 STUDENT T DAĞILIMI

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

İstatistik ve Olasılık

ANADOLU ÜNİVERSİTESİ. Hipotez Testleri. ENM317 Mühendislik İstatistiği Prof. Dr. Nihal ERGİNEL

BÖLÜM 9 NORMAL DAĞILIM

Olasılık ve Normal Dağılım

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

13. Olasılık Dağılımlar

HİPOTEZ TESTLERİ HİPOTEZ NEDİR?

Hipotez Testleri. Mühendislikte İstatistik Yöntemler

İÇİNDEKİLER ÖN SÖZ...

ANADOLU ÜNİVERSİTESİ. ENM 317 Prof. Dr. Nihal ERGİNEL

SÜREKLĠ OLASILIK DAĞILIMLARI

ANADOLU ÜNİVERSİTESİ. ENM 317 MÜHENDİSLİK İSTATİSTİĞİ PARAMETRİK OLMAYAN TESTLER Prof. Dr. Nihal ERGİNEL

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ TELAFĐ SINAVI SORULARI

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

HİPOTEZ TESTLERİ ANADOLU ÜNİVERSİTESİ. Hipotez Testleri ENM317 Mühendislik İstatistiği Doç. Dr. Nihal ERGİNEL 2014

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ DÖNEM SONU SINAV SORULARI

ÖRNEKLEME TEORİSİ 1/30

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

10. Bir ana kütle oranının tahmininde α = 0,05 ise kullanılan Z değeri nedir? A) 1,64 B) 1,84 C) 1,96 D) 2,28 E) 3,08

İstatistiksel Tahmin ÜNİTE. Amaçlar. İçindekiler. Yazar Doç.Dr. Ahmet ÖZMEN

Mühendislikte İstatistik Yöntemler

OLASILIK ve İSTATİSTİK Hipotez Testleri

1.58 arasındaki her bir değeri alabileceği için sürekli bir

Appendix C: İstatistiksel Çıkarsama

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ BÜTÜNLEME SINAVI SORULARI

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

Gerçek uygulamalarda, standart normal olmayan sürekli bir rassal. değişken, sıfırdan farklı bir ortalama ve birden farklı standart sapma

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

OLASILIK ve KURAMSAL DAĞILIMLAR

SÜREKLİ RASSAL DEĞİŞKENLER

PARAMETRİK OLMAYAN TESTLER

T TESTİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ. Yrd. Doç. Dr. C. Deha DOĞAN

İstatistik ve Olasılık

ÖRNEKLEME TEORİSİ. Prof.Dr.A.KARACABEY Doç.Dr.F.GÖKGÖZ

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir

Bir Normal Dağılım Ortalaması İçin Testler

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

İstatistik ve Olasılık

Aktüerlik Sınavları I. Seviye / Olasılık-İstatistik Örnek Sorular I

BÖLÜM 13 HİPOTEZ TESTİ

İçindekiler. Ön Söz... xiii


Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

SÜREKLİ ŞANS DEĞİŞKENLERİ. Üstel Dağılım Normal Dağılım

Ders 6: Sürekli Olasılık Dağılımları

İstatistik ve Olasılık

Örneklem Dağılımları & Hipotez Testleri Örneklem Dağılımı

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

Merkezi Limit Teoremi

Nokta ve Aralık Tahmini Merkezi Limit Teoremi Örneklem Dağılımı Hipotez Testlerine Giriş

Merkezi eğilim ölçüleri ile bir frekans dağılımının merkezi belirlenirken; yayılma ölçüleri ile değişkenliği veya yayılma düzeyini tespit eder.

Mühendislikte İstatistiksel Yöntemler

İSTATİSTİK HAFTA. ÖRNEKLEME METOTLARI ve ÖRNEKLEM BÜYÜKLÜĞÜNÜN TESPİTİ

İki Değişkenli Bağlanım Çıkarsama Sorunu

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

Mühendislikte İstatistiksel Yöntemler

H 0 : θ = θ 0 Bu sıfır hipotezi şunu ifade eder: Anakütle parametresi θ belirli bir θ 0

HİPOTEZ TESTLERİ. Yrd. Doç. Dr. Emre ATILGAN

BİYOİSTATİSTİK PARAMETRİK TESTLER

İstatistik ve Olasılık

Hipotez Testi ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. Ders 4 Minitab da İstatiksel Çıkarım-I. Hipotez Testi. Hipotez Testi

BİYOİSTATİSTİK Uygulama 4 Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER

KİMYASAL ANALİZ KALİTATİF ANALİZ (NİTEL) (NİCEL) KANTİTATİF ANALİZ

BİYOİSTATİSTİK. Uygulama 4. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Parametrik Olmayan İstatistik

GÜVEN ARALIKLARI ve İSTATİSTİKSEL ANLAMLILIK. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Kazanımlar. Z puanları yerine T istatistiğini ne. zaman kullanacağını bilmek. t istatistiği ile hipotez test etmek

İstatistiksel Kavramların Gözden Geçirilmesi

Ekonometri I VARSAYIMLARI

SÜREKLİ OLASILIK DAĞILIMI

BÖLÜM 1 GİRİŞ: İSTATİSTİĞİN MÜHENDİSLİKTEKİ ÖNEMİ

BÖLÜM 10 ÖRNEKLEME YÖNTEMLERİ

Bölüm 3. Tanımlayıcı İstatistikler

MATE211 BİYOİSTATİSTİK

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

Popülasyon Ortalamasının Tahmin Edilmesi

Parametrik Olmayan İstatistik. Prof. Dr. Cenk ÖZLER

İSTATİSTİKSEL TAHMİNLEME. Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir.

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Transkript:

İstatistik ve Olasılık - I Prof. Dr. İrfan KAYMAZ

Tanım Tahmin (kes1rim veya öngörü): Mevcut bilgi ve deneylere dayanarak olayın bütünü hakkında bir yargıya varmak7r. ü Bu anlamda, anakütleden çekilen örnek verileri üzerinde ista?s?ksel yöntemler uygulanarak elde edilen sonuçlar anakütleye genelleş?rilir. ü Bu kapsamda uygulanan yöntemler karar teorisi içinde incelenir. Karar teorisi: 1. (örnek verilerinden hareketle parametre değerlerini tahmin etme) 2. Testler (örnek verilerinden hareketle tahmin edilen parametre değerleri hakkında karar verme) Bu kısmın konusunu oluşturan tahminler ise nokta tahmini ve aralık tahmini olmak üzere iki başlık al7nda incelenmektedir.

Nokta Tahmini Örneklerden hesaplanan ortalama ve varyans gibi değerler anakütle parametrelerinin nokta tahminleridir. ü Nokta tahminlerinin anakütle parametrelerine eşit olmaları beklenemez. ü Belirli bir hata veya sapma her zaman için söz konusudur. Örneğin: Bir şeker fabrikasında torbalanan şekerlerin ortalama ağırlığı µ=50 kg olduğu halde rastgele çekilen 4 örneğin (çuvalın) ağırlıkları X 1 =48 kg, X 2 =52 kg, X 3 =51 kg ve X 4 =49 kg olabilir Nokta tahminlerinin tutarlılığını ortaya koyan bazı özellikler: ü yansızlık, ü kararlılık, ü etkinlik ü yeterlilik

Nokta Tahmini Yansızlık (sapmasızlık- unbiased): Örnek verilerinden elde edilen bir tahminin beklenen değeri anakütle değerine eşit ise bu nokta tahmini yansızdır denir. Örneğin: E(X)=µ olduğu için aritme?k ortalama yansız bir tahmindir Kararlılık: Örnekteki birim sayısının artmasıyla nokta tahmini anakütle değerine (yani parametreye) daha da yakınsıyorsa ilgili tahmin kararlıdır. Örneğin: Örnekteki birim sayısı artkça aritme?k ortalama anakütle ortalamasına daha da yaklaş7ğı için mod ve medyana göre daha kararlıdır.

Nokta Tahmini Etkinlik: ü Nokta tahminlerinin en önemli özelliğidir ü Varyansı en küçük olan nokta tahmini en etkin tahmindir Örneğin: 2 2 σ aritme?k ortalamanın varyansı: σ = x n medyanın varyansı: V = σ 2 π med 2n daha küçük olduğundan, aritme?k ortalama daha etkin bir nokta tahminidir. Yeterlilik: ü Nokta tahmininin örnekteki bilgileri kullanma özelliğidir. ü Örnekteki bilgileri en fazla kullanan nokta tahmini en yeterli nokta tahminidir. Örneğin: mod ve medyan (bölünme asimetrik ise) örnekteki bütün bilgiler dikkate alınarak hesaplanmadıklarından, ortalamaya göre daha kötü nokta tahminleridir.

Aralık Tahmini (Güven Aralığı) ü Nokta tahmininin belirli bir hata payı ile anakütle parametresine yakınsama derecesinin tespit edilmesi oldukça önemlidir. ü Nokta tahminini kullanarak anakütle parametresini belirli bir olasılıkla (doğruluk payı ile) içinde bulunduracağı alt ve üst sınırları gösteren güven sınırları veya güven aralığı tahminleri yapılmaktadır. ü Tahminde yapılabilecek hata seviyesi α ile gösterilirse, 1- α tahminin doğruluk seviyesini (güven düzeyini) gösterilebilir. ü 1- α ile gösterilen güven düzeyi için genellikle %99 veya %95, nadiren de %90 değerleri (bu durumda hata payları, seçilen güven düzeyine bağlı olarak, sırasıyla %1, %5 ve %10 olacak7r) esas alınmaktadır.

Aralık Tahmini (Güven Aralığı) ü Hata terimi normal dağılım eğrisinin her iki ucunda eşit (α/2) olarak yer alır. α/2 lik hata seviyesine karşı gelen tablo değeri (Z α/2 ), ilgili dağılımın standart hatası ile çarpılarak aralığın alt ve üst sınırlarını belirlemede kullanılacak olan hata terimi belirlenmiş olur. ü Belirlenen hata terimi örnek ista?s?ğine eklendiğinde üst güven sınırı, çıkarıldığında ise alt güven sınırları oluşturulur.

Aralık Tahmini (Güven Aralığı) Gerek tahminlerde, gerekse hipotez testlerinde işlemler parametre (anakütleye ait gösterge) ve tahminin (örneğe ait gösterge) dağılım biçimine göre yürütülür. Özellikle normal dağılım gösteren verilerden elde edilen tahminlerde: ü Z (standart normal) dağılım, ü t dağılımı ü χ 2 (ki- kare) dağılımı yaygın olarak kullanılmaktadır.

Aralık Tahmini (Güven Aralığı) Güven aralıkları ve hipotez testlerinde kullanılacak dağılım: ü ilgilenilen parametreye ait anakütle varyansının bilinip bilinmemesine ü örnek büyüklüğüne bağlı olarak belirlenmektedir. Kullanılacak dağılım aşağıdaki ilkelere göre belirlenir: ü Anakütle varyansı (σ 2 ) biliniyorsa Z dağılımı ü Anakütle varyansı (σ 2 ) bilinmiyorsa ü n 30 ise Z dağılımı ü n<30 ise t dağılımı

Aralık Tahmini (Güven Aralığı) ü Hesaplamalarda t dağılımı veya Z dağılımı kullanmanın gerekliliği küçük ve büyük örnek teorilerine dayanmaktadır. ü Genellikle, büyük örneklere (n 30) ait örnek dağılımlarının yaklaşık olarak normal (daha gerçekçi) dağılım gösterdiği ve n büyüdükçe normale daha fazla yakınsadığı bilinmektedir. ü Küçük örneklere (n<30) ait örnek dağılımları normal dağılımdan uzaklaşmaktadır. Bu uzaklaşma n küçüldükçe daha da fazlalaşmaktadır. Bu nedenle, büyük örnekler için Z dağılımı kullanılırken, küçük örnekler için Z dağılımı yerine t (student) dağılımını kullanmak gerekmektedir.

t- Dağılımı ü Küçük örnek ista?s?klerinin gösterdiği dağılım normal dağılım eğrisi gibi simetrik bir görünümde olmakla birlikte, normal dağılım eğrisine göre daha basık ve yayvan biçimdedir. ü Yayvanlıktan dolayı t dağılımı eğrisinin kuyrukları al7nda kalan alan Z dağılımına göre daha büyüktür.

t- Dağılımı ü Küçük örnekler için Z tablosu yerine farklı örnek büyüklükleri ve önem (güven) seviyeleri esas alınarak hesaplanan t tabloları kullanılır. ü n 30 için t tablosu değeri Z tablosu değerine çok yaklaşır. ü Bu sebeple n 30 olan örneklerde t tablosu yerine Z tablosu kullanılmalıdır.

Ortalamanın Güven Aralığı Anakütle Varyansı Biliniyorsa ü Bir örnekten elde edilen X ista?s?ği anakütle ortalaması µ nün nokta tahminidir. ü Nokta tahmininin anakütle değerine eşit olması beklenemez. Bunun için anakütle ortalaması µ yü içinde bulunduracak 1- α güven düzeyindeki aralık tahmini aşağıdaki gibi yapılır:

Ortalamanın Güven Aralığı ifadesi elde edilir ve ortalamanın güven aralığı olarak adlandırılır.

Ortalamanın Güven Aralığı Örnek: Bir tezgahta üre?len parçaların dış çaplarının standart sapması σ=2.4 cm dir. Tezgahın üre?minden rastgele seçilen 16 parçanın dış çap ortalaması 3.2 cm olarak bulunmuştur. %5 hata (%95 güven) seviyesinde anakütle ortalamasının güven aralığını tahmin ediniz.

Ortalamanın Güven Aralığı Örnek Çözüm: σ=2.4 cm n=16 parça X = 3 2 cm 1-α=0.95à α=0.05 α/2=0.025 Z tablosundan Z α/2 =Z 0.05/2 =Z 0.025 =1.96 değeri alınır... Alınan örneklere göre sözü edilen tezgahta üre?len parçaların dış çapları ortalamasının %5 hata (%95 doğruluk) payı ile 2.024 cm ile 4.376 cm arasında olacağı söylenebilir.

Ortalamanın Güven Aralığı Nokta tahminini içine alan güven aralığının dar veya geniş olmasını etkileyen başlıca iki faktör vardır: ü Seçilen hata düzeyi (hata düzeyi küçüldükçe aralık genişler) -> az etkin ü İlgili varyansın değeri (varyans küçüldükçe aralık daralır) -> çok etkin

Örnek Büyüklüğü ü Az sayıda örneğin incelenmesi ile ulaşılan nokta tahmininin anakütle parametresine eşit olması beklenemez. ü Belirli bir sapma her zaman için söz konusu olabilir. ü Sapmanın büyüklüğü anakütle parametresi (örneğin µ) ile nokta tahmini (örneğin X ) arasındaki fark kadar olacak7r. ü Sözü edilen fark büyük ise (örneğin µ nün değeri X a dayalı olarak oluşturulan güven aralığının sınırlarına yakın ise) hata miktarı maksimum düzeyde olacak7r.

Örnek Büyüklüğü ü Örnek hacmi (n) ar7rılarak µ nün tahmininde yapılan hata miktarı azal7labilir. ü Bu amaçla ortalamanın güven aralığı oluşturulurken yapılabilecek hatanın belirlenen bir değerden az olması için alınması gereken örnek sayısı aşağıdaki formülü yardımıyla belirlenebilir

Ortalamanın Güven Aralığı Örnek: Bir tezgahta üre?len parçaların dış çaplarının standart sapması σ=2.4 cm dir. Tezgahın üre?minden rastgele seçilen 16 parçanın dış çap ortalaması 3.2 cm olarak bulunmuştur. %5 hata (%95 güven) seviyesinde örnek ortalaması (tahmin edilen değer) ile anakütle ortalaması (gerçek değer) arasındaki farkın (yani hatanın) 1 cm veya daha az olması için alınması gereken örnek hacmi ne olmalıdır? Örnek Çözüm: d=1 cm σ=2.4 cm ve Z α/2 =1.96 değerleri formülde yerine koyulursa n = 1.96 * 2.4 22. 12 23 1 2 parça örnek alınması gerek?ği görülür

Ortalamanın Güven Aralığı Anakütle Varyansı Bilinmiyorsa ü Anakütle varyansının bilinmediği, fakat örnek hacminin 30 veya daha büyük olduğu (n 30) durumlarda örnek varyansı (S 2 ) kullanılarak Z dağılımı yardımıyla güven aralığı oluşturulur. ü Anakütle varyansının bilinmediği durumlarda örnek hacmi 30 dan küçük (n<30) ise küçük örnek teorisine göre geliş?rilen t dağılımı yardımıyla güven aralığı oluşturulur.

Ortalamanın Güven Aralığı Anakütle varyansının bilinmediği ve n<30 olduğu durumlarda anakütle ortalaması µ yü içinde bulunduracak 1- α güven düzeyindeki aralık tahmini aşağıdaki gibi yapılır:

Ortalamanın Güven Aralığı Not: Güven aralığı formülünde verilen n- 1 ifadesi serbestlik derecesini göstermektedir. t tabloları tek veya çic yönlü olarak hazırlanmaktadır. Bu özellik tabloda belir?lir. Tek veya çic yönlü ayrımı; istenen bölge dağılımın her iki kuyruğunu kapsıyorsa çi< yönlü, sadece tek kuyruğunu kapsıyorsa tek yönlü olarak yapılmaktadır. Testlerin çic yönlü ve tek yönlü görünümleri aşağıdaki dağılım diyagramları üzerinde gösterilmiş?r.

Ortalamanın Güven Aralığı Örnek: Bir işyerinde çalışan işçilerin boylarına göre tezgah yüksekliklerinin ayarlanması amacıyla bir araş7rma yürütülmüştür. Farklı bölümlerden rasgele 25 işçi seçilmiş ve boyları ölçülmüştür. İşçilerin boyları ortalaması 1.72 m ve varyansı 0.18 olarak belirlendiğine göre %99 güven (%1 hata) seviyesinde anakütle ortalamasının güven sınırlarını tahmin ediniz. Örnek Çözüm: Anakütle varyansı (σ 2 ) bilinmediği ve örnek hacmi (n=25) 30 dan küçük olduğu için güven aralığının oluşturulmasında t dağılımından yararlanılacak7r %99 güven düzeyinde sözü edilen işyerindeki işçilerin boyları ortalamasının 1.48m ile 1.96m arasında olacağı söylenebilir(veya olması beklenir)

t- tablosunun okunuşu ü İstenen hata (yani α veya α/2) düzeyinin değeri tablonun yatay eksenindeki Pr kısmına işaretlenir. Serbestlik derecesi (yani SD=n- 1) değeri düşey sütundaki SD kısmına işaretlenir. ü Yatay ve düşey eksenlerde işaretlenen değerlerin kesiş?ği hücrede bulunan değer aranan t tablosu olasılık değeridir Bu probleme ait α/2=0.005 değeri yatay eksene, SD=24 değeri düşey eksene işaretlenir ve tablodan ilgili olasılık: t α/2,n-1 = t 0.005;24 =2.797

Gelecek Dersin Konusu e devam edilecek.