AST416 Astronomide Sayısal Çözümleme - II. 5. Model Testi, Karşılaştırma ve En İyi Modelin Seçimi
|
|
- Emine Yalman
- 6 yıl önce
- İzleme sayısı:
Transkript
1 AST416 Astronomide Sayısal Çözümleme - II 5. Model Testi, Karşılaştırma ve En İyi Modelin Seçimi
2 "All models are wrong" George Box 1976, Science and Statistics, Journal of the American Statistical Association "All models are wrong but some are useful" George Box Launer & Wilkinson, 1979, Robustness in the strategy of scientific model building, Academic Press "truth is much too complicated to allow anything but approximations" John von Neumann, 1947
3 Bu derste neler öğreneceksiniz? Artıklar (Residuals) Artık Kareler Toplamı (Residual Sum of Squares) Kök Ortalama Kare Hatası/Sapması (Root Mean Square Error/Deviation) Gecikme Grafiği (Lag Plot) Durbin-Watson İstatistiği Uyumlama Testi Serbestlik Derecesi (Degrees of Freedom) Sıfır Hipotezi, H 0 (Null Hypothesis) Güven Aralığı Güven Düzeyi (Confidence Interval Confidence Level) Anlamlılık Seviyesi (Statistical Significance) Ki-kare ve Ki-kare Testi (Pearson s Chi-squared Test) İndirgenmiş Ki-kare (Reduced Chi-squared) Kovaryans ve Kovaryans Matrisi (Covariance Matrix) p Değeri (p-value) Varyans Analizi (Analysis of Variance ANOVA) F-Testi Akaike Bilgi Ölçütü (Akaike Information Criterion) Bayes Bilgi Ölçütü (Bayesian Information Criterion) Veriyi Dışlamak!
4 Artıklar (Residuals) Bir uyumlama işlemi sonunda, gözlemsel veri ile uyumlama eğrisinin değerleri arasındaki farklara artık denir. Artıkların dağılımı ve trendi, uyumlamada kullanılan yöntemin veya modelin ne kadar başarılı veya kabul edilebilir olduğunun bir ölçütü olarak kullanılabilir.
5 Artıklar (Residuals) Bir uyumlama işlemi sonunda, gözlemsel veri ile uyumlama eğrisinin değerleri arasındaki farklara artık denir. Artıkların dağılımı ve trendi, uyumlamada kullanılan yöntemin veya modelin ne kadar başarılı veya kabul edilebilir olduğunun bir ölçütü olarak kullanılabilir.
6 Artıklar (Residuals) Bakıra ait X-ışın bölge kırınım tayfına yapılan uyumlama işlemi ve artıkları. a) Uyumlama işleminde iki uçlu model kullanılmıştır. b) Tek uçlu model uyumlanmıştır.
7 Artıklar (Residuals)
8 Artıklar (Residuals) Değişen varyans sorunu söz konusu olduğu durumlarda, doğrudan artıklara bakmak yerine, normalize artıklara bakmak anlamlı olabilir. R i, normalize artıkları, yi ölçüm değerlerini, y(x i ) model değerlerini ve α i ölçüm hatalarını göstermektedir.
9 Artık Kareler Toplamı (Residual Sum of Squares) Uyumlama sonrası elde edilen artıkların kareleri toplamı, artıkların uyumlama değerlerinden ne kadar farklı olduğunu gösterir. Bu değer, bir uyumlama işleminin ne kadar başarılı olduğunun doğrudan bir göstergesi değildir. Kök Ortalama Kare Hatası/Sapması (Root Mean Square Error/Deviation) Uyumlama sonrası elde edilen artıkların karekök ortalamaları, artıkların uyumlama etrafında ne kadar saçıldığını gösterir. Bu değer de, bir uyumlama işleminin ne kadar başarılı olduğunun doğrudan bir göstergesi değildir.
10 Gecikme Grafiği (Lag Plot) Bir ölçümün değerlerindeki bağlı değişkenin, sırası değiştirilerek kendi değerlerine göre çizdirilen grafiklerdir. Bir sıra kaydırılarak çizilen gecikme grafiklerine birinci dereceden gecikme grafiği adı verilir. Genellikle birinci dereceden gecikme grafikleri kullanılmaktadır. Bu grafiklerin kullanılmasıyla aşağıdaki özellikler sınanabilir: Model uygunluğu Aykırı değerleri Verinin rastgeleliği Seri korelasyon/otokorelasyon (hatanın bir sonraki veri grubuna aktarılması) Dönemli dalgalanmalar
11 Gecikme Grafiği (Lag Plot) Model uygunluğu Gecikme grafiğinin şekli uygulanabilecek modelin yapısına ilişkin fikir verebilmektedir. Örneğin gecikme grafiğinin Lineer bir trende sahip olması, otoregresif (modelin bir önceki bağlı değişkene göreli değiştiği) modellerin kullanılabileceği, Eliptik bir şekle sahip olması, değişimin baskın bir sinüsel yapıya sahip olduğu bilgilerini verebilir.
12 Gecikme Grafiği (Lag Plot) Seri korelasyon/otokorelasyon
13 Gecikme Grafiği (Lag Plot) Verinin rastgeleliği Dönemli dalgalanmalar
14 Durbin-Watson İstatistiği Uyumlama Testi Durbin-Watson istatistiği kullanılarak model uyumlamanın başarısı test edilebilir. Burada D, Durbin-Watson istatistiği, R i, uyumlama sonrası elde edilen artıklar, R i-1 ise i-1 sırasıyla başlayan artıklardır. D nin alacağı değerlere göre aşağıdaki çıkarımlar yapılabilir: D = 0; artıklar sistematik olarak korelasyon göstermektedir. D = 2; artıklar normal dağılıma sahiptir. D = 4; artıklar sistematik olarak antikorelasyona sahiptir.
15 Durbin-Watson İstatistiği Uyumlama Testi a) D = 1.97 b) D = 1.12
16 Serbestlik Derecesi (Degrees of Freedom) Serbest olarak değişebilen değerlerin sayısıdır. Örnek dağılımın eleman sayısına bağlıdır. Bir uyumlama söz konusu ise kullanılan parametre sayısına da bağlı olur. Eleman sayısının fazla olması serbest olarak değişebilecek değerlerin sayısının fazla olması anlamına gelir. Bir örnek dağılım için, df = N -1 Burada serbestlik derecesi df, eleman sayısı ise N dir. Örnek dağılım, bir ana dağılımdan üretilmekte olduğu için, örnek dağılımın ortalama değeri, ana dağılımın ortalama temsil etmelidir. Bu durum serbestlik derecesinin 1 azalması anlamına gelir. Eğri uyumlama durumunda, df = N m Burada m, uyumlamada kullanılan parametre sayısıdır. Uyumlamada kullanılan parametre sayısının fazla olması serbest olarak değişebilen değerlerin sayısının parametre sayısı kadar azalması anlamına gelir.
17 Sıfır Hipotezi, H 0 (Null Hypothesis) Genellikle gözlenen bir olayın sadece rastgele süreçler ile oluştuğunu belirten hipotezdir. Gözleme ilişkin alternatif hipotezin (H 1 ) geçerliliğinin test edilmesi için kullanılır. Sıfır hipotezinin yanlışlanamaması durumunda gözlenen olayın sadece rastgele süreçlerden kaynaklandığı (ya da sıfır hipotezinin geçerliliği) kabul edilir. Sıfır hipotezinin yanlışlanması durumunda alternatif hipotezin doğruluğu kanıtlanmış olmaz. Ancak gözlenen olgunun sadece rastgele süreçlerden (ya da sıfır hipotezinin öngördüğü süreçlerden kaynaklanmadığı sonucuna varılır. Sıfır hipotezinin yanlışlanması için, alternatif hipotezin gerçekleşebilme ihtimalinin, rastgele süreçler ile (ya da sıfır hipotezinin ilgilendiği dağılıma göre) benzer olayın gözlenebilme ihtimalinden anlamlı bir mertebede yüksek olması gerekir. Örneğin; bir bitkiyi sulamanın, bitkinin büyüme hızıyla alakalı olduğunu söyleyen bir alternatif hipotezin kabul edilebilmesi için, bitkinin büyüme hızıyla sulama arasında bir ilişki olmadığını söyleyen sıfır hipotezinin yanlışlanması gerekir. Örneğin; piramitleri uzaylıların inşa ettiğini iddia eden alternatif hipotezin kabul edilebilmesi için, piramitleri uzaylıların inşa etmediğini iddia eden sıfır hipotezinin yanlışlanması gerekir.
18 Sıfır Hipotezi, H 0 (Null Hypothesis) Sıfır hipotezi hata türleri Tip I Hata, Sıfır hipotezinin doğruluğuna rağmen reddetmek: doğruluğun kontrol edildiği olasılık olması gerekenden yüksektir. Örnek sayısının azlığından da oluşabilir. Tip II Hata, Sıfır hipotezinin yanlışlığına rağmen kabul etmek: doğruluğun kontrol edildiği olasılık çok düşüktür.
19 Güven Aralığı Güven Düzeyi (Confidence Interval Confidence Level)
20 Güven Aralığı (Confidence Interval) %95 güven aralığında bulunan bir değer, deney/gözlem tekrarlanmaya devam edilirse tekrarların %95 inde, gerçek değer bulunan güven aralığında çıkacaktır anlamına gelir.
21 Güven Aralığı (Confidence Interval) t-değeri tablosu
22 Güven Aralığı (Confidence Interval) Z değeri ise kısaca kuralı olarak bilinen, normal dağılımın standart sapması değerlerine karşılık, bu standart sapma değerlerinin kapsadığı yüzdelik dilimi temsil etmektedir. Örn: %95 güven seviyesi için z değeri 1.96 olur.
23 Güven Aralığı (Confidence Interval)
24 Anlamlılık Seviyesi (Statistical Significance) Bir alternatif hipotezin kanıtlanmaya çalışıldığı (örn. bir uyumlama işleminin yapıldığı) bir deneyde, gözlenen olayın gerçekleşebilme ihtimalinin bir kritik değerden (α) büyük olması durumunda istatistiksel olarak anlamlı olduğu sonucuna varılır. Gözlenen olayın rastgele süreçlerden meydana gelip gelmediği test edilmek istendiği için, olayın gerçekleşme ihtimali bir normal dağılım kullanılarak incelenir. Eğer olaya ilişkin dağılımın rastgele dağılım olmadığı biliniyorsa ilgili dağılım kullanılır. Ancak yeterli sayıda örnek dağılım elemanı bulunmuyorsa normal dağılım yerine, düşük serbestlik derecelerine daha duyarlı olan t-dağılımı kullanılır. Istatistiksel anlamlılığın belirlenebilmesi için kullanılan kritik değer α, bir olasılık değeri anlamındadır. Farklı bilim dallarında farklı değerleri kabul görülmektedir. Gözlenen olgunun rastgeleliğinin büyük oranda beklenir olduğu durumda daha küçük olasılık değerleri verilmesi uygun olur. Anlamlılık seviyesi, toplam olasılık olan 1 den güven seviyesinin farkıdır.
25 Anlamlılık Seviyesi (Statistical Significance) Sıfır hipotezi doğru ise ve normal dağılım sergilemesi bekleniyorsa, normal dağılımca beklenen en olası değer ortalama değerdir. Bu durumda kritik olasılık değeri (α) belirlendiği takdirde, kritik değere göre ortalamaya daha yakın olan toplam olasılık değerleri sıfır hipotezinin kabul edilmesi anlamına gelir. Bu durumda sıfır hipotezi 1- α güven aralığında kabul edilmiş olur. Eğer gözlenen olay, sıfır hipotezi ile beklenen olasılıktan kritik değere göre daha düşük bir toplam ihtimale sahipse (yani kritik değerden daha küçükse) sıfır hipotezi yanlışlanmış olur ve bu alternatif hipotezin anlamlılık seviyesi α olur.
26 Ki-kare (Chi-square)
27 Ki-kare (Chi-square) Ki-kare değeri aynı parametre sayısına sahip iki modelin doğrudan karşılaştırılması için bir gösterge olarak kullanılabilir.
28 Ki-kare Testi (Pearson s Chi-squared Test) Bir gözlem verisinin, gözlenen olaya ilişkin teori ile tutarlılığının sınanmasıdır. Bu testte sıfır hipotezi teorik yaklaşım gözlem verisi ile tutarlıdır. olur. Sıfır hipotezi doğru ise uyumlama sonrası artıkları, rastgele hatalardan kaynaklanır ve normal dağılım gösterir. Sıfır hipotezi doğru ise her bir gözlem verisinin uyumlama eğrisinden rastgele farklarının toplamı ki-kare dağılımı vereceğinden ki-kare testi uygulanabilir. Test adımları şu şekildedir: 1. Ki-kare değeri hesaplanır. 2. Serbestlik derecesi hesaplanır. 3. Bir güven aralığı seçilir. 4. Ki-kare tablolarından ilgili serbestlik derecesi ve güven aralığına karşılık gelen kritik ki-kare değeri, hesaplanan ki-kare ile karşılaştırılır. 5. Hesaplanan ki-kare değeri, tablodaki kritik değerden küçük ise sıfır hipotezi (gözlem verisinin teori ile tutarlı olduğu) kabul edilir. Eğer büyük ise sıfır hipotezi yanlışlanmış olur (teori gözlem ile tutarlı değildir). Ki-kare değeri aynı parametre sayısına sahip iki modelin doğrudan karşılaştırılması için bir gösterge olarak da kullanılabilir.
29 Ki-kare Testi (Pearson s Chi-squared Test) Ki-kare tablosu Örneğin, serbestlik derecesi 5 olan bir uyumlama işleminde kikare değeri 10 ise, sıfır hipotezi-gözlem uyumluluğu %10 ile %5 arasındadır. Eğer kritik değer α, 0.1 (%10) seçilmişse sıfır hipotezi 100*(1- α) güven seviyesinde reddedilir; eğer kritik değer %5 (1-2σ) seçilmişse sıfır hipotezi kabul edilir.
30 İndirgenmiş Ki-kare (Reduced Chisquared)
31 Kovaryans Kovaryans cov(a,b): rastgele iki değişken arasındaki lineer ilişkiyi veren istatistiksel ölçüttür. Bir değişkenin (X) değerinde değişim olması durumunda diğer değişkenin (Y) değerinde ne yönlü bir değişim olduğunu belirtir. Burada E[i], X değişkenin beklenen değeridir. Beklenen değer olarak ortalama değer alınabilir. Kovaryans değeri, değişkenlerin değerlerinin birbirlerine göre hangi yönde (pozitif, negative ya da sıfır) lineer ilişkiye sahip olduğunu söyler.
32 Kovaryans Yandaki örnekte x ve y değişkenlerinin değerleri ve ilgili kovaryans hesabı görülmektedir. Burada, cov(x,y) = 962.4/9 cov(x,y) = elde edilir. Bu rakamın büyüklüğü değil, işareti kovaryansın yönünü verir ve bu örnek için pozitif kovaryans bulunmaktadır. Yani x değerleri arttıkça, y değerleri de artmaktadır.
33 Kovaryans Matrisi Değişkenlerin birbirlerine göre kovaryans değerlerinin bulunduğu matrise kovaryans martisi adı verilir. Bu matriste farklı parametre ikililerinin birbirlerine göre nasıl bir lineer ilişkiye sahip oldukları hakkında bilgi elde edilebilir. Bu bilgi ile sadece uyumlamanın istatistiksel başarısı dışında, modelin fiziksel anlamına uygun ikili parametre ilişkilerinin bulunup bulunmadığı test edilebilir.
34 Kovaryans Matrisi Bir uyumlama işleminde kullanılan model parametrelerinin kovaryans matrisi, parametrelerin beklenen değerleri (örn. en küçük kareler yaklaşımı ile elde edilen en iyi değerleri) etrafındaki değişimlerinin bir diğer parametre ile lineer ilişkide olup olmadığı elde edilir. Bunun için parametrelerin en iyi değerleri hesaplanır. Bu değerler kovaryans hesabında E[X] değerleridir. E[X] değeri bir miktar azaltılır ve arttırılır. Buna karşılık E[Y] değerlerinin hangi değerleri aldığı elde edilir. cov(x,y) değeri hesaplanır ve matriste karşılık geldiği satır ve sütuna göre kaydedilir. Kovaryans matrisin diagonal değerleri (cov(x,x), cov(y,y),..) o parametrenin varyans değeridir. Kovaryans hesabı yapan bazı programlar (kodlar) bu eksende doğrudan ilgili parametrenin değerini verebilir.
35 p Değeri (p-value) Sıfır hipotezinin doğru olması durumunda, gözlenen olayların beklenen olasılıkta ya da daha ender görülmesi olasılığı değeridir. Eğer uyumlamada kullanılan model (yani hipotez) doğru kabul edilirse, uyumlama ile elde edilen ki-kare değerinin ya da daha büyük bir ki-karenin sadece rastlantı ile elde edilebilme ihtimalini veren değerdir. Eğer p değeri küçük değilse, gözlem verisi model ile uyumludur denilebilir. Model ile beklenen ki-kare değerinin (ya da daha büyük ki-kare değerlerinin) sadece rastgelelilik ile elde edilebilmesi olasıdır. Eğer p değeri küçük ise, gözlem verisi model ile uyumlu değildir. Yani gözlem verileri, model ile beklenen değerlerden büyük farklılık göstermektedir. Başka bir deyişle gözlem verilerinin, kabul edilen hipoteze göre elde edilebilmesi olası değildir.
36 p Değeri (p-value) p değeri ihtiyaca göre örneğin 0.05, 0.01, gibi değerleri alabilir. Yapılan testte ilgilenilen bölgeye göre üç farklı anlama sahip olabilir. Sağ taraflı Sol taraflı Iki taraflı Eğer p değeri, seçilen bir güven seviyesinden daha küçük ise sıfır hipotezi reddedilir. Bu durum, verinin sıfır hipotezi dışında alternatif bir hipotezin açıklanabilmesine uygun olmasından kaynaklanmaktadır. Ancak ki-kare değeri gözlem verilerindeki hata üzerinden hesaplandığı için, Gözlem hataları olması gerekenden küçük ise ki-kare değeri olası olmayan miktarda büyük hesaplanır. Gözlem hataları olması gerekenden büyük ise ki-kare değeri olası olmayan miktarda küçük hesaplanır. Yani sıfır hipotezinin yorumlanmasından önce gözlem verisinin hataları gözden geçirilmelidir. Sıfır hipotezinin reddedilmesi, alternatif hipotezi doğrulamaz!
37 Varyans Analizi (Analysis of Variance ANOVA) Örnek grupları arasındaki ortalamala farklarını, temelde, grupların varyansları üzerinden analiz eden istatistiksel yöntemlerdir. Örnek gruplar iki veya daha fazla sayıda olabilir. ANOVA nın temelleri istatistikçi ve biyolog Ronald A. Fisher tarafından atılmıştır. ANOVA nın temel varsayımları: Örnek gruplar normal dağılım göstermektedir. Gözlemlere ilişkin hatalar birbirlerinden bağımsızdır. Aykırı gözlemler bulunmamaktadır ya da ayıklanmıştır. Farklı örnek gruplarda, her bağımsız değişkene ilişkin varyans değerleri eşittir. ANOVA nın sıfır hipotezi, tüm örnek grupların ortalama değerleri birbirlerine eşittir. Alternatif hipotez ise, örnek grupların ortalama değerleri birbirlerine eşit değildir. Test edilen olguya ilişkin ortalama değeri değiştirebilecek tek bir etkinin (faktörün) bulunması durumunda ana etken (ing. main effect) test edilmiş olur. Eğer olguya ilişkin birden fazla etki bulunuyorsa bu etkiler arasındaki ilişki de ortaya çıkartılabileceği için etkileşim etkeni (ing. interaction effect) de test edilebilir. Bu durumda, Sıfır hipotezi, etkileşim yoktur. Alternatif hipotez, etkileşim vardır. olur.
38 Varyans Analizi (Analysis of Variance ANOVA) Deneysel araştırma alanlarında (örn. biyoloji, tıp, kimya) kullanılabildiği gibi, deneysel olmayan araştırma alanlarında (örn. astronomi) de kullanılabilmektedir. Deneysel araştırmalara örnek olarak; bir ilacın farklı dozajlarının sonuç etkide değişime sebep olup olmadığı testi yapılabilir. Böyle bir testte, tek bir değişken (dozaj) bulunduğundan bu teste tek yönlü ANOVA (ing. one way ANOVA) denilir. Eğer bu deneyde farklı dozajların farklı cinsiyetlere etkileri ve cinsiyetler arası bir farklılığın olup olmadığı test edilmek istenirse iki değişken olması sebebiyle (dozaj ve cinsiyet) bu teste iki yönlü ANOVA (ing. two way ANOVA) denilir. ANOVA nın temel adımları şu şekildedir: Sıfır ve alternatif hipotezin tanımlanması Kritik olasılık değerinin (α) tanımlanması Serbestlik derecesinin hesaplanması Hipotez seçim kararının belirlenmesi Test istatistiği değerinin belirlenmesi Sonucun belirlenmesi ve yorumlanması Model uyumlamada, farklı modellerden en iyi uyumu sağlayanın seçilebilmesi için, ANOVA da kullanılan yöntemlerden biri olan F-testi kullanılabilir.
39 F-Testi Bir gözlem verisine yapılan iki farklı model uyumlamanın karşılaştırılıp hangisinin istatistiksel olarak daha başarılı bir uyumlama olduğunun belirlenmesi için kullanılan sınamalardan birisidir. F adı, varyans analizinin temellerini atan istatistikçi ve biyolog Ronald A. Fisher a ithafen verilmiştir. Model seçimi için F-testinin temel adımları şöyledir: Karşılaştırılması istenen iki uyumlamanın artık kareler toplamının (residual sum of squares, RSS) hesaplanması Her iki uyumlama işlemine dair serbestlik derecelerinin hesaplanması Kritik olasılık değeri α nın belirlenmesi F değerinin hesaplanması Sonucun belirlenmesi ve yorumlaması
40 F-Testi F değeri yandaki şekilde hesaplanır. Burada RSS i, ilgili uyumlamanın artık kareler toplamı, p i, ilgili modelde kullanılan parametre sayısı, n ise gözlem sayısıdır. Eğer modellerin parametre sayıları aynı ise F değeri yandaki şekilde hesaplanabilir. Bu hesapta 1 numaralı modelin daha basit model, yani daha az parametre sayısı içeren model olması gerekir. Artık kareler toplamlarının serbestlik derecelerine oranı bir ki-kare dağılımı, kikare dağılımlarının oranları ise bir F dağılımı verir. Böylece hesaplanan F değeri, bir F dağılımı üzerinde kritik bir olasılık değeri (α) ile karşılaştırılabilir bir değer olur.
41 F-Testi Örneğin, yandaki tabloda birinci sütundaki zaman değerlerine karşılık ikinci sütundaki ölçüm değerleri görülmektedir. Bu veri setine biri üstel (exponential), diğeri bir kuvvet yasası olan (power law) iki model uyumlaması yapılabilir. Bu modellerden hangisinin veriyi daha iyi temsil edebildiğini doğrudan uyumlama eğrilerinden ya da artıklardan anlamamız her zaman mümkün olmaz.
42 F-Testi Uyumlamanın iyiliğini ölçebilecek istatistiksel yöntemlerin bazıları anlamlı bir seçim yapmaya yeterli olmayabilir.
43 F-Testi İki modelden hangisinin daha iyi uyumlama sonucu verdiğinin anlaşılması için F- testi uygulanabilir. F-testinde sıfır hipotezi, 1. model (üstel), istatistiksel olarak daha iyi uyumlama yapmıştır olarak seçilebilir. Buna göre F = / = olarak hesaplanır. Her iki model uyumlamanın serbestlik derecesi de df = N m = 10 2 = 8 dir. Serbestlik derecesi her iki model için de 8 olan ve F değeri olan bir F testinde, p değeri olarak hesaplanır. Kritik olasılık değeri α, 0.1, 0.05, 0.01 (%10, %5, %1) gibi değerlerden hangisini alırsa alsın sıfır hipotezi (1. modelin daha iyi olması) reddedilemez. Böylece sıfır hipotezi kabul edilir. Sıfır hipotezinin reddedilmemesi kararının güvenilirliği %99.09 dur.
44 F-Testi F-testinde sıfır hipotezi, 1. model (üstel), istatistiksel olarak daha iyi uyumlama yapmıştır olarak seçilebilir. F = Her iki model uyumlamanın serbestlik derecesi df = N m = 10 2 = 8 p = ar/applets/f.html
45 F-Testi F-testinde sıfır hipotezi, 2. model (kuvvet yasası), istatistiksel olarak daha iyi uyumlama yapmıştır olarak seçilseydi. F = / F = df = N m = 10 2 = 8 p = olurdu. Kritik olasılık değerimiz 0.01 (%1) dahi olsa sıfır hipotezini reddedebilirdik. applets/f.html
46 Akaike Bilgi Ölçütü (Akaike Information Criterion) AIC, bir modelin başarısını veren ölçütlerden biridir. Doğrudan bir modelin başarısını verebildiği gibi, farklı modellerin karşılaştırılabilmesini de sağlar. Bir sıfır hipotezi sınaması türünde değerlendirme yapmadığı için bir modelin mutlak doğruluğu ile ilgili bir bilgi vermez. Dolayısıyla ilgilenilen modellerin tamamının veriye iyi uyumlama sağlamaması durumunun göstergesi değildir. AIC değeri küçük olan modelin başarısı daha yüksektir. Burada k, modeled kullanılan parametrelerin sayısıdır. L^ ise modelin doğruluğu durumunda gözlem verisinin olabilirlik fonksiyonudur (likelihood function). Olabilirlik fonksiyonu, bir modelin önerdiği olasılık dağılımına göre tüm verilerin bu model ile oluşabilme olasılıklarının çarpımıdır. AIC ya da bir çok hesapta olabilirlik fonksiyonunun kendisi kullanılabildiği gibi, kolay hesaplanabilirliği sebebiyle logaritması da kullanılmaktadır. Görüldüğü gibi parametre sayısının artması durmunda AIC değeri artar. Yani modelde kullanılan parametre sayısının fazlalığı, modelin gerçek değişimden çok gürültü modellemeye doğru eğilimde bulunacağı kabulu yapılır. Dolayısıyla daha az parametre sayısına sahip (daha basit) modelerin seçilmesi yönünde bir denge sağlamış olur.
47 Akaike Bilgi Ölçütü (Akaike Information Criterion) Eğer uyumlama yapılmak istenen veri sayısı çok küçük ise AIC daha fazla parametreye sahip olan modelin seçilmesine sebep olur. Bu sebep ile AIC düzeltmesi (AIC correction, AICc) tanımı yapılmıştır. Sağ taraftaki bölümde n, gözlem verisi sayısı, k ise parametre sayısıdır. AIC ya da AICc kullanımı için sınır koşul olarak n/k < 40 kullanılır. Yani gözlem verisi sayısı, modeldeki parametre sayısından en az 40 kat büyük ise AIC kullanılabilir. Bu durumda parametre sayısı fazlalığının etkisi ihmal edilebilecek kadar küçük kalır. Eğer bu oran 40 tan daha az ise AICc kullanılmalıdır. AIC ya da AICc değeri pozitif ya da negatif olabilir. Başarılı model her zaman daha küçük değere sahip olandır. AIC, farklı sayıda veriye sahip uyumlama işlemlerinde kullanılamaz. AIC, bir sıfır hipotezi sınaması olmadığı için sonuçta anlamlılık düzeyi, hipotez redid gibi ifadeler kullanılmamalıdır.
48 Akaike Bilgi Ölçütü (Akaike Information Criterion) Model uyumlamada AIC hesabı yandaki şekilde yapılabilir. Burada n, gözlem sayısı; RSS, artık kareler toplamı; k, modelde kullanılan parametre sayısıdır. Model seçimi durumunda, Modellerin tamamının AIC değerleri hesaplanır. En düşük AIC değere sahip olan model baz alınarak AIC farkları hesaplanır. Tüm modellerin olabilirlik fonksiyonuna ilişkin aşağıdaki yaklaşım yapılır. Burada her modelin elde veri üzerinden hesaplanabilecek olabilirlik fonksiyonları, AIC farklarının üstel bir ifadesi ile orantılıdır denilmektedir. Akaike ağırlıkları hesaplanır. Bu değer tüm modellerin olabilirlik fonksiyonlarının kullanılan tüm modellerin toplam olabilirliklerine oranıdır.
49 Akaike Bilgi Ölçütü (Akaike Information Criterion) Örneğin, 3 farklı model için RSS, AICc, Δ i, w i hesapları bulunmaktadır. Sonuç ağırlıklarına göre 1 numaralı modelin, 2 numaralı modele göre / = 2.4 kat daha yüksek olabilirliğe sahip olduğu söylenebilir. Yine 1 numaralı modelin, 3 numaralı modele göre / = 15.8 kat daha yüksek olabilirliğe sahiptir.
50 Bayes Bilgi Ölçütü (Bayesian Information Criterion) BIC, bir modelin başarısını veren bir ölçüttür. AIC ile yakından ilişkilidir. Ancak ilave parametrelere daha hassastır. Burada n, gözlem sayısı, k, modelde kullanılan parametre sayısı ve L^, modele göre gözlem verilerinin olabilirlik fonksiyonudur. BIC değerinin küçük olduğu modeller veriyi uyumlamada daha başarılıdır denilebilir. Eğri uyumlama işleminde aşağıdaki şekilde kullanılabilir. Burada RSS, artık kareler toplamıdır. Farklı modellerin BIC değerleri arasındaki fark ΔBIC aşağıdaki şekilde yorumlanabilir. 0 < ΔBIC < 2, yüksek BIC değerli modele karşı güçlü bir kanıt yoktur. 2 < ΔBIC < 6, yüksek BIC değerli modele karşı pozitif bir kanıt vardır. 6 < ΔBIC < 10, yüksek BIC değerli modele karşı güçlü bir kanıt vardır. ΔBIC > 10, yüksek BIC değerli modele karşı çok güçlü bir kanıt vardır.
51 Veriyi Dışlamak! Gözlem verisi içerisinde genel trende uymayan gözlemlerin bulunması her zaman olasıdır. Bu tür verilere aykırılar (outliers) adı verilir. Şu ana kadar gördüğümüz eğri uyumlama yöntemleri, uyumlama test ve karşılaştırma yöntemlerinin tamamı aykırı noktalardan etkilenmektedir. Bu sebep ile aykırı noktaların ayıklanması uygun olabilecektir. Bu işlem için Chauvenet kriteri (Chauvenet s criterion) kullanılabilir. Chauvenet kriteri, normal bir dağılım göstermesi beklenen bir veride, her bir gözlemin ortalama değerden ne kadarlık standart sapma kadar uzaklıkta olduğunun kontrol edilmesine dayanır. Veri setinin ortalama değeri ve standart sapması elde edilir. Aykırı olması muhtemel gözlemlerin ortalamadan kaç standart sapma uzaklıkta olduğu hesaplanır. ABS(x out x mean ) / σ Bu farkın normal dağılımda (ya da ilgili dağılımda) ne olasılıkla elde edilebileceği hesaplanır. Bu olasılık verideki eleman sayısıyla çarpılır. Çarpım sonucu 0.5 ten küçük ise muhtemel aykırı veriden çıkarılıp, kalan verinin ortalaması ve standart sapması tekrar hesaplanır.
52 Veriyi Dışlamak! Örneğin bir gözlemin sonuçları aşağıdaki gibidir: 9, 10, 10, 10, 11, 50 6 elemanlı bu veri setinin ortalama değeri 16.7, standart sapması tür. 50 değeri potansiyel aykırı olarak, ortalamadan 33.3 kadar farklı bir değerdir ve, 33.3 / = standart sapma kadar ortalamadan ayrılmıştır. Normal dağılımda standart sapmaya sahip bir verinin elde edilmesi olasılığı 0.05 tir. Chauvenet kriterine göre 0.05 * 6 = 0.03 tür ve 0.3 < 0.5 olduğundan 50 değeri veriden çıkarılır. Kalan gözlem elemanlarının ortalama sapması 10, standart sapması 0.7 olur. Gözlem verilerinin çıkarılması dikkat edilmesi gereken bir konudur. Gözlemler içerisinde aykırı görünen noktaların, bu ölçüm değerlerine sahip olma durumuna ilişkin bir açıklamanın yapılması, gözlem verilerinin nasıl bir dağılım sergilemesi gerektiğinin iyi biliniyor olması (önceden yapılan deneyler ya da teori ile) ve gözlem verisinde az miktarda elamanın olmaması gerekmektedir. Chauvenet kriteri dışında birçok farklı aykırı nokta ayıklama yöntemleri bulunmaktadır. Yapılan çalışmanın türüne veya ayıklama yöntemlerinin güvenilirliğine göre seçim yapmak gerekebilir.
53 Kaynaklar Measurements and their Uncertainties, Ifan G. Hughes & Thomas P.A. Hase, Oxford University Press, 2010 Data Reduction and Error Analysis for the Physical Sciences, Philip R. Bevington & D. Keith Robinson, MC Graw Hill, 2003 Görseller;
AST416 Astronomide Sayısal Çözümleme - II. 6. Monte Carlo
AST416 Astronomide Sayısal Çözümleme - II 6. Monte Carlo Bu derste neler öğreneceksiniz? Monte Carlo Yöntemleri Markov Zinciri (Markov Chain) Rastgele Yürüyüş (Random Walk) Markov Chain Monte Carlo, MCMC
Detaylı3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI
ÖNSÖZ İÇİNDEKİLER III Bölüm 1 İSTATİSTİK ve SAYISAL BİLGİ 11 1.1 İstatistik ve Önemi 12 1.2 İstatistikte Temel Kavramlar 14 1.3 İstatistiğin Amacı 15 1.4 Veri Türleri 15 1.5 Veri Ölçüm Düzeyleri 16 1.6
DetaylıBÖLÜM 12 STUDENT T DAĞILIMI
1 BÖLÜM 12 STUDENT T DAĞILIMI 'Student t dağılımı' ya da kısaca 't dağılımı'; normal dağılım ve Z dağılımının da içerisinde bulunduğu 'sürekli olasılık dağılımları' ailesinde yer alan dağılımlardan bir
DetaylıBÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ
1 BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel
DetaylıAppendix C: İstatistiksel Çıkarsama
Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Notları Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix C: İstatistiksel Çıkarsama
DetaylıYTÜ İktisat Bölümü EKONOMETRİ I Ders Notları
Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix C: İstatistiksel Çıkarsama Doç.
DetaylıİÇİNDEKİLER 1. GİRİŞ...
İÇİNDEKİLER 1. GİRİŞ... 1 1.1. Regresyon Analizi... 1 1.2. Uygulama Alanları ve Veri Setleri... 2 1.3. Regresyon Analizinde Adımlar... 3 1.3.1. Problemin İfadesi... 3 1.3.2. Konu ile İlgili Potansiyel
DetaylıBKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )
4. SUNUM 1 Gözlem ya da deneme sonucu elde edilmiş sonuçların, rastlantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel yöntemlere HİPOTEZ TESTLERİ denir. Sonuçların rastlantıya bağlı
DetaylıAST416 Astronomide Sayısal Çözümleme - II. 2. Temel İstatistik Kavramlar ve Dağılımlar
AST416 Astronomide Sayısal Çözümleme - II 2. Temel İstatistik Kavramlar ve Dağılımlar Bu derste neler öğreneceksiniz? Sıklık Dağılımı ve Olasılık Dağılımı Olasılık ve Kümüatif Dağılım Fonksiyonları Dağılım
Detaylıİki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı
İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t test) Ölçümle
DetaylıİÇİNDEKİLER ÖN SÖZ...
İÇİNDEKİLER ÖN SÖZ... v GİRİŞ... 1 1. İSTATİSTİK İN TARİHÇESİ... 1 2. İSTATİSTİK NEDİR?... 3 3. SAYISAL BİLGİDEN ANLAM ÇIKARILMASI... 4 4. BELİRSİZLİĞİN ELE ALINMASI... 4 5. ÖRNEKLEME... 5 6. İLİŞKİLERİN
DetaylıDers 9: Kitle Ortalaması ve Varyansı için Tahmin
Ders 9: Kitle Ortalaması ve Varyansı için Tahmin Kitle ve Örneklem Örneklem Dağılımı Nokta Tahmini Tahmin Edicilerin Özellikleri Kitle ortalaması için Aralık Tahmini Kitle Standart Sapması için Aralık
DetaylıParametrik Olmayan Testler. İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi
Yrd. Doç. Dr. Neşet Demirci, Balıkesir Üniversitesi NEF Fizik Eğitimi Parametrik Olmayan Testler İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi Rank Korelasyon Parametrik
DetaylıA. Regresyon Katsayılarında Yapısal Kırılma Testleri
A. Regresyon Katsayılarında Yapısal Kırılma Testleri Durum I: Kırılma Tarihinin Bilinmesi Durumu Kırılmanın bilinen bir tarihte örneğin tarihinde olduğunu önceden bilinmesi durumunda uygulanır. Örneğin,
DetaylıTABLO I: Bağımlı değişken; Tüketim,- bağımsız değişkenler; gelir ve fiyat olmak üzere değişkenlere ait veriler verilmiştir.
EKONOMETRİ II Uygulama - Otokorelasyon TABLO I: Bağımlı değişken; Tüketim,- bağımsız değişkenler; gelir ve fiyat olmak üzere Tuketim 58 Gelir 3959 Fiyat 312 değişkenlere ait veriler verilmiştir. 56 3858
DetaylıHipotez Testleri. Mühendislikte İstatistik Yöntemler
Hipotez Testleri Mühendislikte İstatistik Yöntemler Hipotez Testleri Parametrik Testler ( z ve t testleri) Parametrik Olmayan Testler (χ 2 Testi) Hipotez Testleri Ana Kütle β( µ, σ ) Örnek Kütle b ( µ
DetaylıİSTATİSTİK II. Hipotez Testleri 1
İSTATİSTİK II Hipotez Testleri 1 1 Hipotez Testleri 1 1. Hipotez Testlerinin Esasları 2. Ortalama ile ilgili bir iddianın testi: Büyük örnekler 3. Ortalama ile ilgili bir iddianın testi: Küçük örnekler
DetaylıİÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37
İÇİNDEKİLER BÖLÜM 1 Değişkenler ve Grafikler 1 İstatistik 1 Yığın ve Örnek; Tümevarımcı ve Betimleyici İstatistik 1 Değişkenler: Kesikli ve Sürekli 1 Verilerin Yuvarlanması Bilimsel Gösterim Anlamlı Rakamlar
DetaylıÖrneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.
ÇIKARSAMALI İSTATİSTİKLER Çıkarsamalı istatistikler, örneklemden elde edilen değerler üzerinde kitleyi tanımlamak için uygulanan istatistiksel yöntemlerdir. Çıkarsamalı istatistikler; Tahmin Hipotez Testleri
DetaylıKARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005
KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005 1 Karşılaştırma istatistiği Temel kavramlar: Örneklem ve evren:
DetaylıK-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır.
İstatistiksel güven aralıkları uygulamalarında normallik (normal dağılıma uygunluk) oldukça önemlidir. Kullanılan parametrik istatistiksel tekniklerin geçerli olabilmesi için populasyon şans değişkeninin
DetaylıHipotez. Hipotez Testleri. Y. Doç. Dr. İbrahim Turan Nisan 2011
Hipotez Hipotez Testleri Y. Doç. Dr. İbrahim Turan Nisan 2011 Hipotez Nedir? Gözlemlenebilir (araştırılabilir) bir olay, olgu veya fikri mantıklı ve bilimsel olarak açıklamaya yönelik yapılan tahminlerdir.
DetaylıEME 3105 SİSTEM SİMÜLASYONU. Girdi Analizi Prosedürü. Dağılıma Uyum Testleri. Dağılıma Uyumun Kontrol Edilmesi. Girdi Analizi-II Ders 9
EME 3105 1 Girdi Analizi Prosedürü SİSTEM SİMÜLASYONU Modellenecek sistemi (prosesi) dokümante et Veri toplamak için bir plan geliştir Veri topla Verilerin grafiksel ve istatistiksel analizini yap Girdi
Detaylıİkiden Çok Grup Karşılaştırmaları
İkiden Çok Grup Karşılaştırmaları Bir onkoloji kliniğinde göğüs kanseri tanısı almış kadınlar arasından histolojik evrelerine göre 17 şer kadın seçilerek sağkalım süreleri (ay) alınmıştır. HİSTLOJİK EVRE
Detaylıİstatistik ve Olasılık
İstatistik ve Olasılık Ders 8: Prof. Dr. İrfan KAYMAZ Tanım Tahmin (kestirim veya öngörü): Mevcut bilgi ve deneylere dayanarak olayın bütünü hakkında bir yargıya varmaktır. Bu anlamda, anakütleden çekilen
DetaylıMühendislikte İstatistiksel Yöntemler
Mühendislikte İstatistiksel Yöntemler BÖLÜM 9 VARYANS ANALİZİ Yrd. Doç. Dr. Fatih TOSUNOĞLU 1 Varyans analizi niçin yapılır? İkiden fazla veri grubunun ortalamalarının karşılaştırılması t veya Z testi
Detaylıİstatistik ve Olasılık
İstatistik ve Olasılık Ders 10: Prof. Dr. İrfan KAYMAZ Tanım Varyans analizi niçin yapılır? İkiden fazla veri grubunun ortalamalarının karşılaştırılması t veya Z testi ile yapılabilir. Ancak karşılaştırılacak
DetaylıKRUSKAL WALLIS VARYANS ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı
KRUSKAL WALLIS VARYANS ANALİZİ Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı ükruskal Wallis varyans analizi, tek yönlü varyans analizinin parametrik olmayan karşılığıdır. üveriler ölçümle
DetaylıBİYOİSTATİSTİK PARAMETRİK TESTLER
BİYOİSTATİSTİK PARAMETRİK TESTLER Doç. Dr. Mahmut AKBOLAT *Bir testin kullanılabilmesi için belirli şartların sağlanması gerekir. *Bir testin, uygulanabilmesi için gerekli şartlar; ne kadar çok veya güçlü
DetaylıYrd. Doç. Dr. Neşet Demirci, Balıkesir Üniversitesi NEF Fizik Eğitimi. Parametrik Olmayan Testler. Ki-kare (Chi-Square) Testi
Parametrik Olmayan Testler Ki-kare (Chi-Square) Testi Ki-kare (Chi-Square) Testi En iyi Uygunluk (Goodness of Fit) Ki-kare Dağılımı Bir çok önemli istatistik testi ki kare diye bilinen ihtimal dağılımı
DetaylıÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ
ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ TEMEL KAVRAMLAR PARAMETRE: Populasyonun sayısal açıklayıcı bir ölçüsüdür ve anakütledeki tüm elemanlar dikkate alınarak hesaplanabilir. Ana kütledeki
DetaylıH 0 : θ = θ 0 Bu sıfır hipotezi şunu ifade eder: Anakütle parametresi θ belirli bir θ 0
YTÜ-İktisat İstatistik II Hipotez Testi 1 HİPOTEZ TESTİ: AMAÇ: Örneklem bilgisinden hareketle anakütleye ilişkin olarak kurulan bir hipotezin (önsavın) geçerliliğinin test edilmesi Genel notasyon: anakütleye
DetaylıHatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5
Ders Kodu: 0010070021 Kredi: 3 / ECTS: 5 Yrd. Doç. Dr. Serkan DOĞANALP Necmettin Erbakan Üniversitesi Harita Mühendisliği Bölümü Konya 07.01.2015 1 Giriş 2 Giriş Matematiksel istatistiğin konusu yığın
Detaylı1 Hipotez konusuna öncelikle yokluk hipoteziyle başlanılan yaklaşımda, araştırma hipotezleri ALTERNATİF HİPOTEZLER olarak adlandırılmaktadır.
Özellikle deneysel araştırmalarda, araştırmacının doğru olup olmadığını yapacağı bir deney ile test edeceği ve araştırma sonunda ortaya çıkan sonuçlarla doğru ya da yanlış olduğuna karar vereceği bir önermesi
DetaylıAMOS (Analysis of Moment Structures) ve Yapısal Eşitlik Modeli
AMOS (Analysis of Moment Structures) ve Yapısal Eşitlik Modeli Veri seti bulunur Değişkenler sürüklenerek kutucuklara yerleştirilir Hata terimi eklenir Mouse sağ tıklanır ve hata terimi tanımlanır.
DetaylıYANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.
AED 310 İSTATİSTİK YANLILIK Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır. YANLILIK Yanlı bir araştırma tasarımı uygulandığında,
DetaylıGÜVEN ARALIKLARI ve İSTATİSTİKSEL ANLAMLILIK. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı
GÜVEN ARALIKLARI ve İSTATİSTİKSEL ANLAMLILIK Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Kestirim Pratikte kitle parametrelerinin doğrudan hesaplamak olanaklı değildir. Bunun yerine
DetaylıGenel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.
4.SUNUM Genel olarak test istatistikleri Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri olmak üzere 2 grupta incelenebilir. 2 Ranj Çeyrek Kayma Çeyrekler Arası Açıklık Standart Sapma Varyans
DetaylıPARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER 8
PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER 8 Prof. Dr. Ali ŞEN İki Populasyonun Karşılaştırılması: Eşleştirilmiş Örnekler için Wilcoxon İşaretli Mertebe Testi -BÜYÜK ÖRNEK Bağımsız populasyonlara uygulanan
DetaylıMühendislikte İstatistiksel Yöntemler
Mühendislikte İstatistiksel Yöntemler BÖLÜM 7 TAHMİNLER Yrd. Doç. Dr. Fatih TOSUNOĞLU 1 Tahmin (kestirim veya öngörü): Mevcut bilgi ve deneylere dayanarak olayın bütünü hakkında bir yargıya varmaktır.
Detaylıİçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...
İçindekiler İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii BÖLÜM 1 Ölçme, İstatistik ve Araştırma...1 Ölçme Nedir?... 3 Ölçme Süreci... 3 Değişkenler
Detaylıİstatistik ve Olasılık
İstatistik ve Olasılık -II Prof. Dr. İrfan KAYMAZ İki Ortalama Farkının Güven Aralığı Anakütle Varyansı Biliniyorsa İki ortalama arasındaki farkın dağılımına ilişkin Z değişkeni: Güven aralığı ifadesinde
DetaylıMAK 210 SAYISAL ANALİZ
MAK 210 SAYISAL ANALİZ BÖLÜM 6- İSTATİSTİK VE REGRESYON ANALİZİ Doç. Dr. Ali Rıza YILDIZ 1 İSTATİSTİK VE REGRESYON ANALİZİ Bütün noktalardan geçen bir denklem bulmak yerine noktaları temsil eden, yani
DetaylıANADOLU ÜNİVERSİTESİ REGRESYON KATSAYILARININ GÜVEN ARALIĞI = + REGRESYON KATSAYILARININ GÜVEN ARALIĞI
ANADOLU ÜNİVERSİTESİ Deney Tasarımı ve Regresyon Analizi Regresyonda Güven Aralıkları ve Hipotez Testleri Doç. Dr. Nihal ERGİNEL-2015 REGRESYON KATSAYILARININ GÜVEN ARALIĞI + in güven aralığı : i-) n 30
Detaylıİstatistiksel Kavramların Gözden Geçirilmesi
İstatistiksel Kavramların Gözden Geçirilmesi İstatistiksel Çıkarsama Ekonometri 1 Konu 3 Sürüm 2,0 (Ekim 2011) UADMK Açık Lisans Bilgisi İşbu belge, Creative Commons Attribution-Non-Commercial ShareAlike
DetaylıBİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ
BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ DÖNEM I-I. DERS KURULU Konu: Bilimsel yöntem ve istatistik Amaç: Biyoistatistiğin tıptaki önemini kavrar ve sonraki dersler için gerekli terminolojiye hakim olur.
DetaylıBÖLÜM 13 HİPOTEZ TESTİ
1 BÖLÜM 13 HİPOTEZ TESTİ Bilimsel yöntem aşamalarıyla tanımlanmış sistematik bir bilgi üretme biçimidir. Bilimsel yöntemin aşamaları aşağıdaki gibi sıralanabilmektedir (Karasar, 2012): 1. Bir problemin
Detaylıİçindekiler. Ön Söz... xiii
İçindekiler Ön Söz.................................................... xiii Bölüm 1 İstatistiğe Giriş....................................... 1 1.1 Giriş......................................................1
DetaylıAppendix B: Olasılık ve Dağılım Teorisi
Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Notları Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix B: Olasılık ve Dağılım
DetaylıYTÜ İktisat Bölümü EKONOMETRİ I Ders Notları
Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix B: Olasılık ve Dağılım Teorisi
DetaylıYTÜ İktisat Bölümü EKONOMETRİ I Ders Notları
Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix B: Olasılık ve Dağılım Teorisi
DetaylıHipotez Testi Rehberi. Orhan Çevik İstanbul, 30 Ağustos 2014
Hipotez Testi Rehberi Orhan Çevik İstanbul, 30 Ağustos 2014 Hipotezler Sıfır Hipotezi: H 0 Aksi kanıtlanmadığı sürece doğru olduğu düşünülen varsayımdır. H 0 ın kanıta ihtiyacı yoktur. H 0 ı ret etmek
DetaylıPARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz.
PARAMETRİK TESTLER Tek Örneklem t-testi 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz. H0 (boş hipotez): 200 öğrencinin matematik dersinden aldıkları
Detaylı14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi
DEĞİŞEN VARYANS Hüseyin Taştan 1 1 Yıldız Teknik Üniversitesi İktisat Bölümü Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge 14 Ekim 2012 Ekonometri I: Değişen Varyans
DetaylıJEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA
JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ Prof. Dr. Mualla YALÇINKAYA Karadeniz Teknik Üniversitesi, Harita Mühendisliği Bölümü Trabzon, 2018 VERİLERİN İRDELENMESİ Örnek: İki nokta arasındaki uzunluk 80 kere
DetaylıBÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ
1 BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel sayma
DetaylıKİMYASAL ANALİZ KALİTATİF ANALİZ (NİTEL) (NİCEL) KANTİTATİF ANALİZ
KİMYASAL ANALİZ KALİTATİF ANALİZ (NİTEL) KANTİTATİF ANALİZ (NİCEL) KANTİTATİF ANALİZ Bir numunedeki element veya bileşiğin bağıl miktarını belirlemek için yapılan analizlere denir. 1 ANALİTİK ANALİTİK
DetaylıMerkezi Eğilim ve Dağılım Ölçüleri
Merkezi Eğilim ve Dağılım Ölçüleri Soru Öğrencilerin derse katılım düzeylerini ölçmek amacıyla geliştirilen 16 soruluk bir test için öğrencilerin ilk 8 ve son 8 soruluk yarılardan aldıkları puanlar arasındaki
DetaylıHipotez Testlerine Giriş. Hipotez Testlerine Giriş
Hipotez Testlerine Giriş Hipotez Testlerine Giriş Hipotez Testlerine Giriş Gözlem ya da deneme sonucu elde edilmiş sonuçların, raslantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel
DetaylıİSTATİSTİK 2. Hipotez Testi 21/03/2012 AYŞE S. ÇAĞLI. aysecagli@beykent.edu.tr
İSTATİSTİK 2 Hipotez Testi 21/03/2012 AYŞE S. ÇAĞLI aysecagli@beykent.edu.tr 1 Güven aralığı ve Hipotez testi Güven aralığı µ? µ? Veriler, bir değer aralığında hangi değeri gösteriyor? (Parametrenin gerçek
DetaylıSPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER. Abdullah Can
SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER SPSS in üzerinde işlem yapılabilecek iki ana ekran görünümü vardır. DATA VIEW (VERİ görünümü) VARIABLE VIEW (DEĞİŞKEN görünümü) 1 DATA VIEW (VERİ görünümü) İstatistiksel
DetaylıÖrneklem Dağılımları & Hipotez Testleri Örneklem Dağılımı
Örneklem Dağılımları & Hipotez Testleri Örneklem Dağılımı Ortalama veya korelasyon gibi istatistiklerin dağılımıdır Çıkarımsal istatistikte örneklem dağılımı temel fikirlerden biridir. Çıkarımsal istatistik
DetaylıKorelasyon, Korelasyon Türleri ve Regresyon
Korelasyon, Korelasyon Türleri ve Regresyon İçerik Korelasyon Korelasyon Türleri Korelasyon Katsayısı Regresyon KORELASYON Korelasyon iki ya da daha fazla değişken arasındaki doğrusal ilişkiyi gösterir.
DetaylıKORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN
KORELASYON VE REGRESYON ANALİZİ Doç. Dr. Bahar TAŞDELEN Günlük hayattan birkaç örnek Gelişim dönemindeki bir çocuğun boyu ile kilosu arasındaki ilişki Bir ailenin tükettiği günlük ekmek sayısı ile ailenin
DetaylıKategorik Veri Analizi
Kategorik Veri Analizi 6.Sunum Yrd. Doç. Dr. Sedat ŞEN 1 ANALİZ TÜRLERİ Bağımlı Değ. Bağımsız Değ. Analiz Sürekli İki kategorili t-testi, Wilcoxon testi Sürekli Kategorik ANOVA, linear regresyon Sürekli
DetaylıKestirim (Tahmin) Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir.
Biyoistatistik 9 Kestirim (Tahmin) Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir. Evren parametrelerinin kestirilmesi (tahmini) için: 1. Hipotez testleri 2. Güven
DetaylıKorelasyon ve Regresyon
Korelasyon ve Regresyon Korelasyon- (lineer korelasyon) Açıklayıcı (Bağımsız) Değişken x çalışma zamanı ayakkabı numarası İki değişken arasındaki ilişkidir. Günlük sigara sayısı SAT puanı boy Yanıt (Bağımlı)
DetaylıKazanımlar. Z puanları yerine T istatistiğini ne. zaman kullanacağını bilmek. t istatistiği ile hipotez test etmek
T testi Kazanımlar Z puanları yerine T istatistiğini ne 1 zaman kullanacağını bilmek 2 t istatistiği ile hipotez test etmek 3 Cohen ind sini ve etki büyüklüğünü hesaplamak 1 9.1 T İstatistiği: zalternatifi
DetaylıTEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ
TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ 1 İstatistik İstatistik, belirsizliğin veya eksik bilginin söz konusu olduğu durumlarda çıkarımlar yapmak ve karar vermek için sayısal verilerin
DetaylıBir Normal Dağılım Ortalaması İçin Testler
Bir Normal Dağılım Ortalaması İçin Testler İÇERİK o Giriş ovaryansı Bilinen Bir Normal Dağılım Ortalaması İçin Hipotez Testler P-değerleri: II. Çeşit hata ve Örnekleme Büyüklüğü Seçimi Örnekleme Büyüklüğü
DetaylıÖRNEKLEME TEORİSİ 1/30
ÖRNEKLEME TEORİSİ 1/30 NİÇİN ÖRNEKLEME Zaman Kısıdı Maliyeti Azaltma YAPILIR? Hata Oranını Azaltma Sonuca Ulaşma Hızı /30 Örnekleme Teorisi konusunun içinde, populasyondan örnek alınma şekli, örneklerin
Detaylırasgele değişkeninin olasılık yoğunluk fonksiyonu,
3.6. Bazı Sürekli Dağılımlar 3.6.1 Normal Dağılım Normal dağılım hem uygulamalı hem de teorik istatistikte kullanılan oldukça önemli bir dağılımdır. Normal dağılımın istatistikte önemli bir yerinin olmasının
DetaylıEME 3117 SİSTEM SIMÜLASYONU. Girdi Analizi. Özet İstatistikler ve Histogram (Minitab)(1) Örnek: Eczane İçin Servis Süreleri
EME 3117 1 2 Girdi Analizi SİSTEM SIMÜLASYONU Modellenecek sistemi (prosesi) dokümante et. Veri toplamak için bir plan geliştir. Veri topla. Verilerin grafiksel ve istatistiksel analizini yap. Girdi Analizi-I
Detaylıİstatistik ve Olasılık
İstatistik ve Olasılık Ders 9: Prof. Dr. İrfan KAYMAZ Tanım Hipotez, bir veya daha fazla anakütle hakkında ileri sürülen, ancak doğruluğu önceden bilinmeyen iddialardır. Ortaya atılan iddiaların, örnekten
Detaylıİçindekiler. I Varyans Analizi (ANOVA) 1. Önsöz. Simgeler ve Kısaltmalar Dizini
İçindekiler Önsöz Simgeler ve Kısaltmalar Dizini v xv I Varyans Analizi (ANOVA) 1 1 Varyans Analizine Giriş 3 1.1 TemelKavramlar... 3 1.2 Deney Tasarımının Temel İlkeleri... 5 1.2.1 Bloklama... 5 1.2.2
DetaylıSÜREKLĠ OLASILIK DAĞILIMLARI
SÜREKLĠ OLASILIK DAĞILIMLARI Sayı ekseni üzerindeki tüm noktalarda değer alabilen değişkenler, sürekli değişkenler olarak tanımlanmaktadır. Bu bölümde, sürekli değişkenlere uygun olasılık dağılımları üzerinde
DetaylıYrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü
Mühendislikte İstatistiksel Yöntemler Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü 1 Araştırma sonuçlarının açıklanmasında frekans tablosu
DetaylıNORMAL DAĞILIM VE ÖNEMLİLİK TESTLERİ İLE İLGİLİ PROBLEMLER
NORMAL DAĞILIM VE ÖNEMLİLİK TESTLERİ İLE İLGİLİ PROBLEMLER A) Normal Dağılım ile İlgili Sorular Sayfa /4 Hamileler ile ilgili bir araştırmada, bu grubun hemoglobin değerlerinin normal dağılım gösterdiği
DetaylıNitel Tepki Bağlanım Modelleri
Doğrusal-Dışı Yaklaşım ve Nitel Tepki Bağlanım Modelleri Doğrusal-Dışı Yaklaşım ve Ekonometri 2 Konu 18 Sürüm 2,0 (Ekim 2011) Doğrusal-Dışı Yaklaşım ve UADMK Açık Lisans Bilgisi İşbu belge, Creative Commons
Detaylı7. Ders Genel Lineer Modeller Singüler Modeller, Yanlış veya Bilinmeyen Kovaryanslar, Đlişkili Hatalar
7. Ders Genel Lineer Modeller Singüler Modeller, Yanlış veya Bilinmeyen Kovaryanslar, Đlişkili Hatalar Y = X β + ε Lineer Modeli pekçok özel hallere sahiptir. Bunlar, ε nun dağılımına, Cov( ε ) kovaryans
DetaylıOLASILIK ve İSTATİSTİK Hipotez Testleri
OLASILIK ve İSTATİSTİK Hipotez Testleri Yrd.Doç.Dr. Pınar YILDIRIM Okan Üniversitesi Mühendislik ve Mimarlık Fakültesi Bilgisayar Mühendisliği Bölümü Hipotezler ve Testler Hipotez, kitleye(yığına) ait
Detaylı3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1
3. TAHMİN 3.1. En Küçük Kareler (EKK) Yöntemi 1 En Küçük Kareler (EKK) yöntemi, regresyon çözümlemesinde en yaygın olarak kullanılan, daha sonra ele alınacak bazı varsayımlar altında çok aranan istatistiki
DetaylıOluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir
Bilimsel Araştırma Yöntemleri Prof. Dr. Şener Büyüköztürk Doç. Dr. Ebru Kılıç Çakmak Yrd. Doç. Dr. Özcan Erkan Akgün Doç. Dr. Şirin Karadeniz Dr. Funda Demirel Örnekleme Yöntemleri Evren Evren, araştırma
DetaylıHipotezlerin test edilip onaylanması için çeşitli istatistiksel testler kullanılmaktadır. Fakat...
Hipotezlerin test edilip onaylanması için çeşitli istatistiksel testler kullanılmaktadır. Fakat... Her istatistik teknik her tür analize elverişli değildir. Modele veya hipoteze uygun test istatistiği
DetaylıEME Sistem Simülasyonu. Girdi Analizi Prosedürü. Olasılık Çizgesi. Dağılıma Uyumun Kontrol Edilmesi. Dağılıma İyi Uyum Testleri Ders 10
EME 35 Girdi Analizi Prosedürü Sistem Simülasyonu Modellenecek sistemi (prosesi) dokümante et Veri toplamak için bir plan geliştir Veri topla Verilerin grafiksel ve istatistiksel analizini yap Dağılıma
DetaylıÇalıştığı kurumun prestij kaynağı olup olmaması KIZ 2,85 ERKEK 4,18
1 * BAĞIMSIZ T TESTİ (Independent Samples t test) ÖRNEK: Yapılan bir anket çalışmasında katılımcılardan, çalıştıkları kurumun kendileri için bir prestij kaynağı olup olmadığını belirtmeleri istenmiş. 30
DetaylıHİPOTEZ TESTLERİ HİPOTEZ NEDİR?
HİPOTEZ TESTLERİ HİPOTEZ NEDİR? Örnekleme ile test edilmeye çalışılan bir popülasyonun ilgili parametresi hakkında ortaya sunulan iddiadır. Örneğin; A dersi için vize ortalaması 50 nin altındadır Firestone
Detaylıİstatistik ve Olasılık
İstatistik ve Olasılık - I Prof. Dr. İrfan KAYMAZ Tanım Tahmin (kes1rim veya öngörü): Mevcut bilgi ve deneylere dayanarak olayın bütünü hakkında bir yargıya varmak7r. ü Bu anlamda, anakütleden çekilen
DetaylıBÖLÜM 3 KURAMSAL ÇATI VE HİPOTEZ GELİŞ
BÖLÜM 3 KURAMSAL ÇATI VE HİPOTEZ GELİŞ İŞTİRME Araştırma rma SüreciS 1.Gözlem Genel araştırma alanı 3.Sorunun Belirlenmesi Sorun taslağının hazırlanması 4.Kuramsal Çatı Değişkenlerin açıkça saptanması
DetaylıTek yönlü varyans analizi kısaltılmış olarak ANOVA (Analysis of Variance) bilinen
DÖNEM II ENDOKRİN SİSTEMİ Ders Kurulu Başkanı : Doç. Dr. Osman EVLİYAOĞLU VARYANS ANALİZİ (14.03.014 Cuma Y.ÇELİK Tek Yönlü Varyans Analizi Tek yönlü varyans analizi kısaltılmış olarak ANOVA (Analysis
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan
DetaylıBİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH
BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr
DetaylıÖrnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.
.4. Merkezi Eğilim ve Dağılım Ölçüleri Merkezi eğilim ölçüleri kitleye ilişkin bir değişkenin bütün farklı değerlerinin çevresinde toplandığı merkezi bir değeri gösterirler. Dağılım ölçüleri ise değişkenin
DetaylıKonum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan
Konum ve Dağılım Ölçüleri BBY606 Araştırma Yöntemleri Güleda Doğan Konum ölçüleri Merkezi eğilim ölçüleri Verilerin ortalamaya göre olan gruplanması nasıl? Yakın, uzak? Sıklık dağılımlarının karşılaştırılması
DetaylıHerhangi bir oranın belli bir değere eşit olmadığını test etmek için kullanılır.
Hipotez testleri-oran testi Oran Testi Herhangi bir oranın belli bir değere eşit olmadığını test etmek için kullanılır Örnek: Yüz defa atılan bir para 34 defa yazı gelmiştir Paranın yazı gelme olasılığının
Detaylıİstatistik ve Olasılık
İstatistik ve Olasılık Ders 8: Prof. Dr. Tanım Hipotez, bir veya daha fazla anakütle hakkında ileri sürülen, ancak doğruluğu önceden bilinmeyen iddialardır. Ortaya atılan iddiaların, örnekten elde edilen
DetaylıMerkezi eğilim ölçüleri ile bir frekans dağılımının merkezi belirlenirken; yayılma ölçüleri ile değişkenliği veya yayılma düzeyini tespit eder.
Yayılma Ölçütleri Merkezi eğilim ölçüleri ile bir frekans dağılımının merkezi belirlenirken; yayılma ölçüleri ile değişkenliği veya yayılma düzeyini tespit eder. Bir başka ifade ile, bir veri setinin,
DetaylıANALİTİK YÖNTEMLERİN DEĞERLENDİRİLMESİ. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2004
ANALİTİK YÖNTEMLERİN DEĞERLENDİRİLMESİ Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2004 1 Laboratuvarlarda yararlanılan analiz yöntemleri performans kalitelerine göre üç sınıfta toplanabilir: -Kesin yöntemler
Detaylı01.02.2013. Statistical Package for the Social Sciences
Hipotezlerin test edilip onaylanması için çeşitli istatistiksel testler kullanılmaktadır. Fakat... Her istatistik teknik her tür analize elverişli değildir. Modele veya hipoteze uygun test istatistiği
Detaylı