MasColell Ders Notları Murat Donduran February 20, 2009
Contents 1 İşbirliksiz Oyunların Temel Elemanları 2 1.1 Oyun Nedir?................................... 2 1.2 Genişleyen Biçimde Oyunlar.......................... 3 1.3 Stratejiler ve Bir Oyunun Normal Biçimde Sunumu............. 7 1.4 Rastlantısallaşmış Seçimler........................... 9 1
Chapter 1 İşbirliksiz Oyunların Temel Elemanları 1.1 Oyun Nedir? Bir oyun, stratejik bir birbirine bağımlılık ilişkisi içinde çeşitli sayıda bireylerin durumlarının formal sunumudur. Kısacası, herbir bireyin rafaha sadece kendi eylemine değil aynı zamanda diğer bireylerin eylemlerine de bağlıdır. Bundan başka, kendisi için en iyi olan eylem diğer bireylerin ne yapacaklarının beklentisinde de bağlıdır. Stratejik etkileşim durumunu tanımlamak için, dört şey gereklidir; 1. Oyuncular: Kimler oyunu oynamaktadır? 2. Kurallar: Kim ne zaman oynamaktadır? Hareket ederlerken ne bilmektedirler? Ne yapabilirler? 3. Çıktılar: Oyuncular tarafından gerçekleştirilen eylemlerin olanaklı her kümesi için, oyunun çıktısı nedir? 4. Ödemeler: Olanaklı çıktılar üzerinde oyuncuların tercihleri (örneğin fayda fonksiyonları) nedir? Aşağıdaki örnek bir oyunun ilk üç öğesini göstermektedir. Örnek 1.1 (Eşleşen Paralar).. 1. Oyuncular: İki oyuncu vardır. 1 ve 2 ile gösterilmektedir. 2. Kurallar: Her iki oyuncu aynı anda havaya iki tane bozuk para atmaktadır. Ya yazı gelecek ya da tura gelecektir. 3. Çıktılar: İki para eşleşirse, 1. oyuncu 2. oyuncuya 1 lira eşleşmezse 2. oyuncu 1. oyuncuya 1 lira ödemektedir. 2
Bu örnekteki oyunu tamamlamak için, olanaklı çıktılar üzerinde oyuncuların tercihlerinin ne olduğunu belirtmek gerekmektedir. Kısacası, tanımdaki dördüncü öğe tamamlanmalıdır. Genel olarak, oyuncunun tercihi fayda fonksiyonları tarafından belirlenmektedir ve her olanaklı çıktı için fayda seviyesi atanmaktadır. Oyuncunun fayda fonksiyonuna ödeme fonksiyonu denmekte ve fayda seviyesi de ödeme olarak adlandırılmaktadır. Analiz boyunca fayda fonksiyonları beklenen fayda biçiminde olacaktır. Her oyuncunun ödemesini basit şekilde elde ettiği yada kaybettiği para miktarına eşitleyerek dördüncü öğe oluşturulabilir. Bu noktada oyuncuların ödemelerini maksimize eden eylemler rakibinin ne yaptığı beklentisine bağlıdır. Örnek 1.2 (New York ta Buluşma).. 1. Oyuncular: İki oyuncu, Ali ile Veli vardır. 2. Kurallar: Her iki oyuncu da ayrıdır ve iletişim içinde değildir. Öğle yemeği için New York ta buluşacaklardır ancak nerede buluşacaklarını unutmuşlardır. Herbiri nereye gideceğine karar vermek zorundadır ve sadece bir şeçim şansı vardır. 3. Çıktılar: Karşılaşırlarsa mutlu olacaklardır. Buluşamazlarsa yemeği yanlız yiyeceklerdir. 4. Ödemeler: Karşılaşırlarsa ödeme 100, ayrı ayrı kalırlarsa 0 birimdir. Bu örnekte, iki oyuncunun çıkarları bağlantılıdır. Problemleri basitçe koordinasyondur. Yine de, her oyuncunun ödemesi diğer oyuncunun ne yaptığına bağlıdır ve daha da önemlisi, her oyuncunun optimal eylemi diğerinin ne yapacağını düşünmesine bağlıdır. Böylece, kordinasyon görevi bile stratejik bir önem kazanmaktadır. 1.2 Genişleyen Biçimde Oyunlar Yukarıda tanımlanan dört öğe biliniyorsa, oyun genişleyen biçimde gösterilebilir. Genişleyen biçim kim ne zaman hareket edecek, her oyuncu hangi eylemleri gerçekleştirecek, hareket ettiklerini oyuncular neleri bilmektedir, oyuncular tarafından gerçekleştirilen eylemlerin bir fonksiyonu olarak çıktılar nelerdir, ve her olanaklı çıktıdan elde edilen ödemeler nelerdir gibi soruların cevaplarını kapsamaktadır. Genişleyen biçim oyun ağacı olarak bilinen kavramsal araca dayanmaktadır. Basit bir örnekle başlamak kolaylık sağlayacaktır. Örnek 1.3 (Eşleşen Paralar Versiyon B ve Genişleyen Biçimi).. Bu versiyon ilk versiyona özdeştir. Sadece iki oyuncu ardışık hareket etmektedir. İlk verisyonda eş-anlı olarak hareket etmektedirler. Önce birinci oyuncu parası çevirmekte daha sonra ikinci oyuncu birinci oyuncunun seçimini gördükten sonra parasını çevirmektedir (Bu 2. oyuncu için gerçekten çok güzel bir oyundur). 3
Bu oyunun genişleyen biçimdeki sunumu şekil (1.1) de gösterilmektedir. Oyun başlangıç karar noktasında başlamaktadır (Açık daire ile gösterilmiştir). 1. oyuncunun hareketini yaptığı yerdir. Yazı mı Tura mı kararını verecektir. 1. oyuncu için her iki olanaklı seçim bu başlangıç karar noktasından çizilen yollarla gösterilmektedir. Her yolun sonunda bir başka karar noktası vardır. Buralarda 2. oyuncu 1. oyuncunun seçimini gördükten sonra iki eylem arasından birini seçecektir. 2. oyuncu hareket ettikten sonra oyun sona erecektir. Varılan noktalara terminal noktalar denmektedir. Her terminal noktada oyuncuların ödemeleri sırasıyla gösterilmektedir. 1.Oyuncu Yazı Tura 2.Oyuncu 2.Oyuncu Yazı Tura Yazı Tura 1, 1 1, 1 1, 1 1, 1 Figure 1.1: Eşleşen Paralar Versiyon B için Genişleyen Biçim Örnek 1.4 (Eşleşen Paralar Versiyon C ve Genişleyen Biçimi).. Bu versiyon versiyon B ye özdeştir. Farklılık 1. oyuncu kararını verdiğinde parayı 2. oyuncuya göstermemektedir. 2. oyuncu hareket etmeden önce 1. oyuncunun seçimi görememektedir. 1.Oyuncu Yazı Tura 2.Oyuncu Yazı Tura Yazı Tura 1, 0 2, 3 0, 1 1, 0 Figure 1.2: Eşleşen Paralar Versiyon C için Genişleyen Biçim Bu oyun şekil (1.2) de gösterilmektedir. Şekil (1.1) e özdeş sadece 2. oyuncunun karar noktalarının arasına kesikli çizgi çizilmiştir. Bu çizginin anlamı iki karar noktasının tek bir enformasyon kümesinde olduğunu belirtmesidir. Bu enformasyon kümesinin anlamı kısaca şudur; 2. oyuncu hareket edeceği zaman 1. oyuncunun kararını göremediğinden hangi karar noktasında olduğunu bilemez. 2. oyuncunun enformasyon kümesindeki iki her iki noktadada aynı olanaklı eylemler vardır. 2. oyuncu iki nokta arasında ayrım yapamaz. Prensipte, 1. oyuncunun karar noktasının da bir enformasyon kümesi vardır. Çünkü 1. oyuncuda hareket etmeden önce hiçbir şeyin olmadığını bilmektedir. Bu enformasyon kümesinin bir elemanı vardır (1. oyuncu hareket ettiğinde hangi noktada olduğunu tam olarak bilmektedir). Kabaca, şekil (1.2) de de 1. oyuncu için bir enformasyon kümesi belirtilebilir. Ancak, grafiksel gösterimi basitleştirmek amacıyla bu gösterim kullanılmamaktadır. Bundan dolayı, kesikli çizgilerin olmadığı karar noktalarında enformasyon kümeleri tekildir (singleton). 4
Bir oyuncunun bütün enformasyon kümelerinin listesi oyuncunun perspektifinden hareketi hakkında olayları ve durumları ayırabilmesinin listesini vermektedir. Örneğin, örnek (1.1) de 2. oyuncunun perspektifinden, olabilecek iki ayrılabilir olay vardır. Bunlar iki tekil enformasyon kümesinden oluşmaktadır. Ancak, örnek (1.4) de 2. oyuncunun sadece olanaklı bir tane durumu vardır. Örnek (1.4) de, enformasyon kümeleri üzerine doğal bir kısıtlama konmaktadır: veri bir enformasyon kümesi içindeki her noktada, oyuncunun olanaklı eylemlerinin benzer bir kümesi olmak zorundadır. Diğer kısıtlama mükemmel hatırlama (perfect recall) olarak bilinmektedir. Mükemmel hatırlama oyuncunun bir kere öğrendiğini bir daha unutmaması durumudur. 1.Oyuncu l r 2.Oyuncu 2.Oyuncu L R L R 1.Oyuncu x y x y x y x y Figure 1.3: Mükemmel Hatırlamayı Sağlamayan Bir Oyun Ağacı Şekil (1.3) de, 1. oyuncu önceki hareketini unutmaktadır. Aksi belirtilmedikçe bütün oyunlar mükemmel hatırlama altında oynanacaktır. Enformayon kümelerinin kullanımı eş-anlı yerine ardışık oyunlara izin vermektedir. Böylelikle örnek (1.1) de oyun ağacı ile gösterilebilir. Bu bağlamda kusursuz enformasyonlu oyunun tanımı yapılabilir. Tanım 1.1. Her enformasyon kümesi sadece tek bir karar noktasını içeriyorsa bu oyun kusursuz enformasyonlu bir oyundur. Aksi takdirde, oyun kusurlu enformasyonludur. Örnek 1.5 (Eşleşen Paralar Versiyon D ve Genişleyen Biçimi).. Oyuncular oyunun B versiyonunu oynamadan önce, iki oyuncu biz bozuk para atarak oyuna kimin başlayacağına karar vermektedirler. Böylece, 1. ve 2. oyuncu için parayı ilk kullanacak oyuncuyu seçmede eşit olasılık olacaktır. Şekil (1.4) de bu oyun doğanın oyuna başlaması ile gösterilmektedir. Doğa oyuna iki yola sahip olarak 1 olasılıkla kararını vermektedir. Doğa sabit olasılıklarla iki eylemi 2 5
Doğa 1 1 2 2 1.Oyuncu 2.Oyuncu Y T Y T 2.Oyuncu 2.Oyuncu 1.Oyuncu 1.Oyuncu Y T Y T Y T Y T -1,1 1,-1 1,-1-1,1-1,1 1,-1 1,-1-1,1 Figure 1.4: Eşleşen Paralar Versiyon D oynamak zorunda olan bir oyuncu olarak eklenmiştir. Şekilde (Y ) yazı, (T ) tura için kullanılmıştır. Grafiksel olarak gösterimine ek olarak, genişleyen biçim matematiksel olarak da tanımlanabilir. Formal olarak, genişleyen biçimdeki bir oyun aşağıda sıralanan maddelere sahiptir; 1. Noktaların sonlu kümesi X, olanaklı eylemlerin sonlu kümesi A ve oyuncuların sonlu kümesi {1,..., I}. 2. Her x noktasının tek bir ara atasını belirten bir fonksiyon, p : X {X }, Başlangıç noktası x 0 hariç, bütün x X için p(x) boş-olmayandır. x noktasının ara torun noktası o zaman s(x) = p 1 (x) olacaktır. x noktasının bütün ataları ve torunları kümesi p(x) ve s(x) yinelemesi ile bulunabilir. Bir ağaç yapısı olması için, ayrık kümeler olmak zorundadır (x noktasının atası torunu olamaz.) Terminal noktalar kümesi T = {x X : s(x) = }. Diğer bütün noktaları X \ T karar noktalarıdır. 3. α : X \ {x 0 } A fonksiyonu başlangıç noktası olmayan bir x noktasına atasından p(x) bir eylemle gelmektedir ve x, x s(x) ve x x ise, α(x ) α(x ) olan özelliği sağlamaktadır. x karar noktasında elverişli seçimler kümesi c(x) = {a A : Bazı x s(x) noktaları için a = α(x )} 4. Enformasyon kümeleri koleksiyonu, H ve H : X H her x noktasını bir enformasyon kümesine H(x) H atayan fonksiyon. H koleksiyonundaki enformasyon kümeleri X kümesinin parçalanışı biçimindedir. Tekil enformasyon kümesine atanmış bütün karar noktalarında aynı seçimler elverişldir. Formal olarak, H(x) = H(x ) ise, c(x) = c(x ) geçerlidir. Bundan dolayı, H enformasyon kümesindeki elverişli seçimler C(H) = {a A : x H için a c(x)} şeklinde yazılmaktadır. 6
5. ι : H {0, 1,..., I} fonksiyonu, H koleksiyonundaki her enformasyon kümesini bu kümedeki karar noktasında hareket eden oyuncuya atamaktadır (ya da doğaya formal olarak 0. oyuncuya atamaktadır.) i. oyuncunun enformasyon kümeleri koleksiyonu H i = {H H : i = ι(h)} şeklinde gösterilmektedir. 6. ρ : H 0 A [0, 1] fonksiyonu doğanın hareket ettiği ve bütün H H 0 için a / C(H) ve a C(H) ρ(h, a) = 1 ise, ρ(h, a) = 0 olan enformasyon kümelerinde eylemlere olasılık atamaktadır. 7. Ödeme fonksiyonları koleksiyonu, u = {u 1 (.), u 2 (.),..., u I (.)}, ulaşılan her terminal noktada oyunculara fayda atamaktadır; u i : T R. Böylece, yukarıdaki maddelerle genişleyen biçimde bir oyun tanımlanmaktadır; Γ = {X, A, I, p(.), α(.), H, H(.), ι(.), ρ(.), u} 1.3 Stratejiler ve Bir Oyunun Normal Biçimde Sunumu Oyun teorisinde merkezi kavram oyuncunun stratejisi nosyonudur. Strateji tam bir tesadüfi plan ya da karar kuralıdır ve hareket etmesi gereken her olanaklı ayrılabilir durumda nasıl hareket edeceğini belirten bir plan ya da kuraldır. Oyuncunun perspektifinden, böyle durumlar kümesi enformasyonkümelerinin koleksiyonu taraafından belirtilmektedir. Hareket etme ihtiyacı duyabileceği farklı ayrılabilir durumları belirten her enformasyon kümesine konu olmaktadır. Tanım 1.2. H i ; i oyuncusunun enformasyon kümelerinin koleksiyonu, A oyundaki olanaklı eylemlerin kümesi, ve C(H) A, H enformasyon kümesindeki olanaklı eylemlerin kümesi olsun. i oyuncusu için bir strateji, bütün H H i için s i (H) C(H) olan bir s i : H i A fonksiyonudur. Tam bir tesadüfi plan olarak, strateji genellikle oyunun fiili oynanması sırasında ulaşılamayabilinecek enformasyon kümelerinde oyuncunun eylemlerini belirtmektedir. Örnek 1.6 (Eşleşen Paralar Versiyon B de Stratejiler).. Eşleşen paraler versiyon B de 1. oyuncu için strateji oyunun başlangıç noktasındaki hareketini belirtmektedir. İki olanaklı stratejisi vardır: yazı (Y) ya da tura (T) stratejilerini oynayabilir. Diğer taraftan, 2. oyuncu için strateji, her iki enformasyon kümesinde nasıl (Y yada T) oynayacağını belirtmektedir. Yani, 1. oyuncu Y oynarsa ve 1. oyuncu T oynarsa nasıl oynayacaktır? Böylece, 2. oyuncunun dört olanaklı stratejisi vardır; Strateji 1 (s 1 ): 1. oyuncu Y oynarsa, Y oyna, 1. oyuncu Y oynarsa, T oyna. Strateji 2 (s 2 ): 1. oyuncu Y oynarsa, Y oyna, 1. oyuncu T oynarsa, T oyna. Strateji 3 (s 3 ): 1. oyuncu T oynarsa, Y oyna, 1. oyuncu Y oynarsa, T oyna. Strateji 4 (s 4 ): 1. oyuncu T oynarsa, Y oyna, 1. oyuncu T oynarsa, T oyna. 7
Örnek 1.7 (Eşleşen Paralar Versiyon C de Stratejiler).. Eşleşen paralar oyununun C versiyonunda, 1. oyuncunun stratejileri versiyon B deki ile aynıdır. Fakat 2. oyuncunun sadece iki olanaklı stratejisi vardır. Y ya da T oynamak, çünkü sadece bir tane enformasyon kümesi vardır. I-oyunculu bir oyunda oyuncuların strateji seçimlerinin profilini s = (s 1,..., s I ) vektörü ile göstermek uygundur. s i, i. oyuncunun seçilen stratejisi belirtmektedir. Kısaca yazmak için, bazen s strateji profili (s i, s i ) şeklinde gösterilecektir. s i, i. oyuncu dışındaki oyuncuların (I 1) boyutundaki strateji vektörüdür. Oyuncuları için stratejilerin her profili s = (s 1,..., s I ), oyunun çıktısına neden olmaktadır. Böylece, herhangi bir strateji profili için, s = (s 1,..., s I ), her oyuncu tarafından elde edilen ödemeler ortaya çıkacaktır. Bundan dolayı, oyun direk olarak stratejiler ve ilgili ödemeleri ile belirlenebilir. Bir oyunun sunmanın ikinci yolu normal (ya da stratejik) biçim olarak bilinen yöntemle olacaktır. Bu genişleyen biçimdeki bir oyunun kısaltılmış halidir. Tanım 1.3. I oyuncu ile bir oyun için, Γ N normal biçim sunumu her i oyuncusu için stratejiler kümesi S i (s i S i ile) ve u i (s 1,..., s I ) ödeme fonksiyonu ile belirtilmektedir. u i (s 1,..., s I ), (s 1,..., s I ) stratejilerinden ortaya çıkan (muhtemelen rastlantısal) çıktılar ile ilgili von Neumann-Morgenstern fayda seviyelerini vermektedir. Formal olarak, şeklinde yazılmaktadır. Γ N = [I, {S i }, {u i (.)}] Gerçekte, normal biçimde bir oyunu tanımlarken, her strateji için spesifik hareketlerin kaydını tutmaya ihtiyaç yoktur. Oyuncunun çeşitli olanaklı stratejilerini i. oyuncunun strateji kümesi S i = (s 1i, s 2i,...) şeklinde yazarak basitçe sayılabilir ve her strateji numarası ile ifade edilebilir. Örnek 1.8 (Eşleşen Paralar Versiyon B nin Normal Biçimi).. Örnek (1.6) de iki oyuncunun strateji kümeleri tanımlanmıştır. Ödeme fonksiyonları aşağıdaki şekildedir; { +1, (s 1, s 2 ) = (H, 3 ya da 4 stratejileri) yada (T, 1 ya da 3 stratejileri) ise u 1 (s 1, s 2 ) = 1, (s 1, s 2 ) = (H, 1 ya da 2 stratejileri) yada (T, 2 ya da 4 stratejileri) ise ve u 2 (s 1, s 2 ) = u 1 (s 1, s 2 ). Bu bilgileri şekil (1.5) de özetlemek olanaklıdır. Her bir hücrede, iki oyuncunun ödemeleri u 1 (s 1, s 2, u 2 (s 1, s 2 ) olarak gösterilmiştir. 8
1. Oyuncu 2. Oyuncu s 1 s 2 s 3 s 4 Y 1, +1 1, +1 +1, 1 +1, 1 T +1, 1 1, +1 +1, 1 1, +1 Figure 1.5: Eşleşen Paralar Versiyon B Normal Biçimi 2.Oyuncu a b d c 1. Oyuncu L R L R L R L R 1, +1 +1, 1 1, +1 1, +1 +1, 1 +1, 1 +1, 1 1, +1 Figure 1.6: Yukarıdaki Normal Biçimin Genişleyen Biçimi Yukarıdaki normal biçimdeki oyun şekil (1.6) de genişleyen biçimde gösterilmektedir. Oyundaki davranışları incelemek için normal biçim sunumunu kullanmaktaki mantık, oyuncunun karar problemini rakibinin benimseyeceğini düşündüğü stratejileri veri kabul ederek stratejisini seçmesi olarak düşünülmektedir. Çünkü her oyuncu bu problemle karşı karşıyadır, oyuncular stratejilerini eş-anlı olarak {S i } kümelerinden seçtikleri düşünülmektedir. 1.4 Rastlantısallaşmış Seçimler Bu bölüme kadar oyuncuların seçimlerini belirlilik (kesinlik) altında yaptıkları varsayılmıştır. Bununla beraber, birseçimle karşılaşan oyuncunun rastlantısallaştırma olanağını dışlamanın önsel (priori) bir nedeni yoktur. Tanım (1.3) de belirtildiği gibi, deterministik bir strateji, pür strateji olarak da adlandırılabilir. i oyuncusu için her H H enformasyon kümesinde s i (H) deterministik seçimini belirtmektedir. i oyuncusunun (sonlu) pür stratejiler kümesi S i olsun. Oyuncunun rastlantısallaştırmasının yolu bu kümeden rastlantısal olarak bir elemanı seçmesidir. Bu tip rastlantısallaştıma durumunda karma strateji söz konusudur. Tanım 1.4. i oyuncusunun veri (sonlu) pür strateji kümesi S i ile, karma stratejisi, σ i : S i [0, 1] sayesinde, s i S i σ i (s i ) = 1 koşulunu sağlayan σ i (s i ) 0 olasılığını her pür s i S i stratejisine atamaktadır. 9
i oyuncusunun M tane pür stratejisi olsun; S i = {s 1i,..., s Mi }. i oyuncusunun olanaklı karma stratejiler kümesi bundan dolayı aşağıdaki simpleksin noktalarıyla ilgilidir; (S i ) = { (σ 1i,..., σ Mi ) : bütün m = 1,..., M için σ mi 0 ve } M σ mi = 1 m=1 Bu simpleks S i kümesinin karma genişlemesi olarak adlandırılmaktadır. Pür strateji, S i kümesinin elemanları üzerindeki olasılık dağılımının yozlaştığı (degenerate) karma stratejilerin özel bir durumu olarak da görülebilir. 10