Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix B: Olasılık ve Dağılım Teorisi Doç. Dr. Hüseyin Taştan 1 Kesikli r.d.: Örnek Bir basketçinin iki atış yaptığını ve X r.d. nin başarılı atış sayısını gösterdiğini düşünelim. X in alabileceği değerler kümesi: {0,1,2} olsun. Olasılık fonksiyonu şöyle verilmiş olsun: f(0)=0.2, f(1)=0.44, f(2)=0.36 En az bir başarılı atış olasılığı nedir? P( X 1) = P( X = 1) + P( X = 2) = 0.44 + 0.36 = 0.80 1 Yıldız Teknik Üniversitesi, İktisat Bölümü, Yıldız Kampüsü H Blok, Oda no. 124, Beşiktaş, İstanbul. Email: tastan@yildiz.edu.tr Bu dağılımın grafiği şöyledir: 1 Rassal Değişkenler (Random Variables) Serbest basket atışı örneği için olasılık fonksiyonu Alacağı değer belli bir rassal (random) deneyin (experiment) sonucuna bağlı olan değişkenlere rassal değişken (r.d.) denir. X: r.d., x: X r.d. nin aldığı belli bir değer Kesikli r.d.: Alacağı değerler sayılabilir (sonlu ya da sonsuz) olan rassal değişken. Sürekli r.d.: Belli bir aralıkta (örneğin reel sayılar doğrusu üzerinde) herhangi bir değeri alan rassal değişken. Kesikli r.d. den farklı olarak sürekli r.d. sayılamaz. Bu nedenle bir sürekli r.d. nin belli bir değere eşit olma olasılığı sıfırdır. Kesikli Rassal Değişkenler Sürekli Rassal Değişkenler X sürekli r.d. nin olasılık yoğunluk fonksiyonu (probabilitydensity function, pdf) aşağıdaki koşulları sağlar: f ( x) 0 + f ( x) dx = 1 Aralık olasılıkları: Sürekli r.d. in aralık olasılıkları şöyle yazılabilir: Econometrics 1
Sürekli bir r.d. nin a ve b arasında olma olasılığı (taralı bölgenin alanı) Örnek: X~uniform(a,b) Birikimli Olasılık Fonksiyonu Ortak (bağlı)dağılımlar (joint distributions) ve bağımsızlık: X ve Y r.d. Aşağıdaki koşul sağlandığında istatistik bakımından bağımsızdırlar: Sürekli: Kesikli: Sürekli durumda ortak yoğunluklar marjinal yoğunlukların çarpımı olarak yazılabiliyorsa ya da kesikli durumda ortak olasılıklar marjinal olasılıkların çarpımı olarak yazılabiliyorsa bu değişkenler istatistik bakımından bağımsızdırlar. Aralık Olasılıkları ve Birikimli Olasılık Fonksiyonu Örnek B.1 : İki serbest basket atışı X :ilk atışın sonucu (1 veya 0) Y : ikinci atışın sonucu (1 veya 0) Atıcının genel başarı oranı %80 olsun: Yani, P(X=1)=P(Y=1)=0.80 Basketcinin iki atışı da basket yapma olasılığı nedir? X ve Y bağımsız (independent) ise, P(x=1,Y=1)=P(X=1).P(Y=1)=0.8x0.8=0.64 Bağımsız değillerse bu yanıt doğru olmaz.örneğin, koşullu olasılıkları şöyle olsun : Yanıt: (B.15 ) den, Econometrics 2
Beklenen Değer (Expected Value) E(x) veya µ: X in tüm muhtemel değerlerinin ağırlıklı bir ortalamasıdır. Ağırlıklar, olasılık fonksiyonları (ya da yoğunluk f., pdf) tarafından belirlenir. Kesikli: Varyans X, tesadüfi değişken (random variable), µ=e(x) olsun.varyans X rassal değişkeninin, kendi beklenen değeri çevresindeki değişkenliğinin bir ölçüsüdür. Anakütle (population) varyansı ile örneklem varyansı birbiriyle karıştırılmamalıdır. Varyans tanımı: Sürekli: Örnek : X kesikli r.d. -1,0,2 değerlerini sırasıyla 1/8, ½ ve 3/8 olasılıklarıyla alıyor olsun. Beklenen değerini bulalım. X in bir fonksiyonunun beklenen değeri: Aynı ortalamaya fakat farklı dağılımlara (varyansa) sahip iki değişken : x ve y Örnek B.4: Örnek B.3 den, X=-1,0 ve 2 ve olasılıklar, sırasıyla, 1/8, ½ ve 3/8 idi. g(x)=x 2 tanımlayalım. Böylece,g(X) in beklenen değeri : BEKLENEN DEĞERİN ÖZELLİKLERİ c sabit bir sayı olmak üzere a, b sabit sayılar olmak üzere a 1,a 2,,a n sabit sayılar olmak üzere Özel durum: a i =1, her i=1,,n Varyansın Özellikleri Eğer P(X=c)=1 ise Var(X)=0, E(X)=c Yani bir rassal değişkenin varyansı sıfırsa aslında o r.d. bir sabit sayıdır. Başka bir deyişle, sabit bir sayının varyansı sıfırdır. a ve b sabit sayılar olmak üzere Bir rassal değişkene sabit bir sayının eklenmesi o r.d. nin varyansını değiştirmez. Bir rassal değişken sabit bir sayıyla çarpılırsa, varyansı sabitin karesiyle çarpılır. Econometrics 3
Standart sapma Bir rassal değişkenin standart sapması o r.d. nin varyansının pozitif kareköküdür. Sabit bir sayının standart sapması sıfırdır. a ve b sabit sayılar olmak üzere Kovaryansın Özellikleri X ve Y bağımsız ise kovaryansları sıfırdır. Ancak bunun tersini söyleyemeyiz. Yani kovaryansın sıfır olması X ve Y nin bağımsız olduğu anlamına gelmez. a, b sabit sayılar olmak üzere Cauchy-Schwartz eşitsizliği Bir değişkenin standardize edilmesi Rassal değişken X in ortalaması µ ve standart sapması σ olsun. X in ortalamasından sapmalarını standart sapmasına bölerek yeni bir Z değişkeni tanımlayalım: Korelasyon katsayısı: doğrusal bağımlılık (linear dependence) ölçüsü X ve Y bağımsız ise korelasyon katsayısı 0 olur. Korelasyon katsayısının 0 olması X ve Y nin bağımsız olduğu anlamına gelmez. Bu durumda X ve Y ilişkisizdir (uncorrelated) denir. Korelasyon katsayısının işareti kovaryansın işaretine bağlıdır. Nedensellik ilişkisi belirtmez. Kovaryans X ve Y tesadüfi değişkenlerinin beklenen değerlerine, ve, diyelim. Kovaryans, X ve Y r.d. lerinin ortalamalarından farklarının çarpımının beklenen değeri olarak tanımlanır: Korelasyon () Econometrics 4
Tesadüfi değişkenlerin toplamlarının varyansı a ve b sabit sayılar olmak üzere X ve Y r.d. bağımsız ya da ilişkisiz ise sondaki Kovaryans terimi sıfır olur ve: Burada, ağırlıklar X in aldığı değerlere göre değişen olasılıklar olmaktadır. E(Y x), x in bir fonksiyonudur ve Y nin beklenen değerinin x ile birlikte nasıl değiştiğini gösterir. Örnek : X, eğitim durumu değişkeni (okunulan yıl sayısı), Y, saat başına ücretler. Ülkedeki tüm çalışanlar kapsanmaktadır (örnek değil kitle söz konusu) Aşağıdaki grafik, tahsile göre ücretlerin beklenen değerini verecektir. ve ikili olarak ilişkisiz rassal değişkenler sabit sayılar olmak üzere öyle bir doğrusal ilişki bulunmuş olsun: Özel durum: Koşullu beklenen değer (conditional expectation) Korelasyon ve kovaryans iki değişken arasındaki doğrusal (linear) ilişkiyi ölçer ve değişkenleri simetrik olarak ele alır. X ile Y aynı konumdadır. Oysa, çoğu kez, X i bağımsız, Y yi bağımlı değişken alarak, belli bir X değeri verilmişken Y nin alacağı değeri bulmak isteriz. İlişki, doğrusalolmayan(nonlinear) türden olacaktır. Koşullu beklenen değer kovaryans ve korelasyon katsayısının yakalayamayacağı doğrusal olmayan ilişkileri de gösterir. Bu durumda tek bir sayıdan ibaret bir ölçü bulamayacağız.onun yerine, X in verilmiş değerleri için Y nin koşullu beklenen değerine (conditional expectation or conditional mean) bakacağız. Koşullu beklenen değerin özellikleri 1. c(x), X in herhangi bir fonksiyonu olsun: E[c(X) X] = c(x) Eğer X e göre koşullu beklenti alıyorsak, X in fonksiyonları sabit gibi düşünülebilir (sabitin beklenen değeri kendisine eşittir). Örnek: E[X 2 X] = X 2 2. X in a(x) ve b(x) gibi iki fonksiyonu için: E[a(X)Y+b(X) X] = a(x)e[y X] +b(x) Örnek: XY+2X 2 nin X e göre koşullu beklenen değerini bulalım: E[XY+2X 2 X] = X E[Y X] + 2X 2 Econometrics 5
3. X ve Y bağımsız ise E(Y X) = E(Y) X ve Y bağımsızsa Y nin X e göre koşullu beklenen değeri X e bağlı değildir. X in değeri ne olursa olsun Y nin koşullu beklentisi koşulsuz beklentiye eşit olur. Örneğin, ücret-eğitim ilişkisinde eğer ücretler eğitim düzeyinden bağımsız olsaydı ilkokul ve üniversite mezunlarının ücret ortalamaları aynı olurdu. Ancak bu doğru olmadığından ücret ve eğitim seviyesinin bağımsız olduğunu varsayamayız. Bu özelliğin özel bir durumu şudur: Eğer U ve X bağımsızsa ve E(U)=0 ise: E(U X) = 0 Normal (Gaussian) Dağılım X sürekli rassal değişkeni normal dağılıma uyuyorsa herhangi bir değeri alabilir. Normal dağılımın iki parametresi vardır: beklenen değer ve varyans: µ=e(x) ve σ 2 =Var(X) Olasılık yoğunluk fonksiyonu (pdf): 4. Yinelenen Beklentiler Kanunu (Law of Iterated Expectations) E[E(Y X)] = E(Y) Anlamı: Eğer önce E(Y X) i X in bir fonksiyonu olarak hesaplar, daha sonra X in dağılımına göre beklentisini alırsak Y nin beklenen değerine ulaşırız. Bu özelliğin daha genel bir versiyonu: E(Y X) = E[E(Y X,Z) X] 5. Eğer E(Y X) = E(Y) ise Cov(X,Y)=0 ve Corr(X,Y)=0 X in her fonksiyonu Y ile ilişkisizdir. U ve X iki r.d. olsun. E(U X) = 0 ise (4) ve (5) özelliklerinden hareketle E(U)=0 dir ve U ve X ilişkisizdir (kovaryansları sıfırdır) Normal Dağılımın oyf nun grafiği Koşullu Varyans (Conditional Variance) Y nin X e göre koşullu varyansı ilgili koşullu dağılımdan hareketle hesaplanan varyanstır: Var(Y X=x) = E{[Y-E(Y x)] 2 x} = E(Y 2 x) [E(Y x)] 2 Eğer X ve Y bağımsızsa Var(Y X) = Var(Y) Econometrics 6
Ki-kare Dağılımı Z i, i=1,...,n, birbirinden bağımsız standart normal r.d. olsun. Bunların karelerinin toplamı n s.d. ile ki-kare dağılımına uyar. t-dağılımı Z std normal dağılan, X ise n s.d. ile ki-kare dağılan birbirinden bağımsız iki r.d. olsun. Bu durumda aşağıdaki r.d. n. s.d. ile t dağılımına uyar: F Dağılımı X 1 k 1 s.d. ile X 2 ise k 2 s.d. ile ki-kare dağılımına uyan birbirinden bağımsız iki r.d. olsun. Bu durumda aşağıdaki r.d. (k 1,k 2 ) s.d. ile F dağılımına uyar: Econometrics 7