Borsa verileri Çağrı merkezine gelen arama sayısı Gün içerisinde bir dükkana gelen müşteri sayısı

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "Borsa verileri Çağrı merkezine gelen arama sayısı Gün içerisinde bir dükkana gelen müşteri sayısı"

Transkript

1 Zaman Serileri 1.Zaman Serisi Nedir? Zaman serileri, bir değişkenin zaman içindeki hareketini gözlemleyen, gözlem sonuçlarının zamana göre dağılım gösterdiği serilerdir. Zaman serileri frekanslı seriler olup, serilerin frekansları yıllık, üçer aylık, aylık, haftalık ve günlük olarak değişen değerler alabilmektedirler. Borsa verileri Çağrı merkezine gelen arama sayısı Gün içerisinde bir dükkana gelen müşteri sayısı Gibi veriler zaman serilerine örnek verilebilir. 2.Zaman serileri çeşitleri Zaman serileri değişken sayılarına göre ve serinin yapısına göre temelde iki bölüme ayrılır. Bu ayrışım serinin özelliklerinin iyi belirlenmesini amaçlar bu sayede yapılan analizden en doğru sonuç alınması hedeflenir. 2.1 Değişken sayısına göre Tek değişkenli zaman serisi (univariate): Eğer bir zaman serisi analizi tek değişkenin zaman içindeki hareketini inceliyorsa denir Çok değişkenli zaman serisi (multivariate): Eğer birden fazla değişkenin birlikte zaman içindeki değişimi gözlemleniyorsa denir. 2.2 Yapısına göre Stokastik ve deterministik olmak üzere ikiye ayrılır. Bu kavramları inceleyelim.

2 2.2.1 Stokastik: Gelecekte serinin alabileceği verilerin kısmen geçmiş değerleri tarafından tanımlanabilmesi demektir. Stokastik serilerin tam öngörülerini yapmak mümkün değildir. Ancak gelecekteki değerler, geçmiş değerlerin bir bilgisiyle koşullandırılan bir olasılık dağılımına sahiptirler. Zaman serileri genellikle random (tesadüfi) değişkenler yani stokastik (olasılıklı) değişkenlerle çalışmaktadır. Stokastik özellikler değişkenin durağanlığı ile ilgilenmektedir. Zaman serileri için model oluşturulurken, seriyi ortaya çıkaran stokastik sürecin zaman içinde değişmediği varsayılmaktadır. Ayrıca amaç öngörü yapmak olduğundan, zaman serisinin geçmişte gösterdiği değişikliklerin iyi incelenmesi gerekmektedir. Bu nedenle zaman serisinin özellikleri ayrıntılı olarak incelenmeli ve incelenen zaman serisi için amaca uygun bir öngörü formu geliştirilmelidir. Öngörü için seçilecek olan algoritma ise gözlenen zaman serisinin davranışının incelenmesi ile belirlenecektir. Ancak ilk aşamada zaman serisi ile iyi uyum gösteren bir modelin saptanması temel hedeftir. Bu yüzden serinin durağan olması veya olmaması temel etken olarak ortaya çıkmaktadır. Durağanlık (Stationarity): İlk tanım olarak Zaman serisinin ortalamasında ve varyansında sistematik bir değişme bulunmaması halinde durağan seri söz konusudur ve serinin durağan olması durumunda yapısal ilişkinin zaman içinde değişmediği varsayımı ile değişken basit bir regresyon modeli kullanılarak tahmin edilebilir. İkinci tanım olarak Zaman serisinin bir trende velveya yığılıma sahip olmaması, yani serinin farklarının alınmasını gerekmemesi durumunda serinin durağandır.

3 Şekil 1. Nil Nehrinin seviyesinin ölçümü MS arasında alınmış Yukarıdaki grafikte serinin durağan olduğunu gözle bakarak anlayabiliyoruz. Burada seride yükselmeler ve alçalmalar görüyoruz ancak sürekli belli bir değere rutin geri dönüş olduğu için serinin durağan olduğunu ifade ediyoruz.

4 Şekil 2. ABD Doları / Kanada Doları arasındaki döviz kuru bir dakikalık kesit Ancak bu seri durağan değildir. Görüldüğü gibi seri herhangi bir değer aralığında kalmamış yükselme ve alçalma eğilimine girmiş. Zaman serileri her zaman yukarıdaki grafikler kadar basit yapıda değildir. Bu yüzden serinin durağanlığını tanımlamak için istatistiksel tanımlardan yararlanarak açıklamamız gerekir. Durağanlığın bazı koşulları vardır. Bu koşulların tamamının veya bir kısmının karşılanması durumuna göre de zayıf durağanlık, güçlü durağanlık, kesin durağanlık tanımları oluşturulmuştur. İlk ve ikinci koşul durağan sürecin zaman içinde değişmeyen sonlu ortalamaya ve sonlu varyansa sahip olmasıdır. Üçüncü ve son koşulda bu sürece ait kovaryansın geçmişten bağımsız olmasıdır. Zayıf durağan bir seri;

5 E(yt) nin sabit ve zamandan bağımsız olması Var(yt) nin sabit ve zamandan bağımsız olması Kov(yt,ys) nin zamanın değil, nin bir fonksiyonu olması şeklinde tanımlanır. Daha anlaşılır bir şekilde ifade edersek serinin ortalaması, varyansı, kovaryansı zaman boyunca sabit kalıyorsa o seri durağandır denilir. Ortalama iki veya ikiden fazla sayının toplamının toplanan sayıların adedine bölünmesiyle elde edilen sayıdır. Varyans kavramı dağılıma ait her bir değerin dağılımın ortalamasından ne kadar uzak olduğuyla ilgilidir. Varyans söz konusu sapmaların ortalama değerini ölçmektedir. Kovaryans terimi ise iki değişkenin ortalamalarına göre birlikte ne kadar değiştiklerini gösterir. Güçlü durağan bir seri; Bunlara ek olarak yt rassal değişkeninin zayıf durağanlıktan bahsedilen özelliklere sahip olmasının yanı sıra dağılımının zaman içerisinde değişmemesi özelliğine de sahip olması şeklinde tanımlanır. Kesin durağan seri; yt rassal değişkenin zayıf ve güçlü durağanlıkta sıralanan özelliklere sahip olmasının yanı sıra bileşik dağılımının normal olması durumu kesin durağanlık olarak adlandırılmaktadır.

6 Şekil 3. Ortalaması 0 olan veri grubunun normal dağılım grafiği Deterministik: Eğer bir zaman serisi tam olarak öngörülebiliyorsa, deterministik (kesin) zaman serisi olarak ifade edilmektedir. Deterministik özellikler, sabit, trend ve mevsimselliğin varlığı ile ilgilenirler. Trend(Genel Eğilim) bileşeni: Zaman serilerinin uzun sürede gösterdiği düşme ve yükselme süreçlerinden sonra oluşan kararlı durumdur. Zaman serileri uzun dönem açısından kararlı alçalma ya da yükselme şeklinde bir eğilime sahiptir. Mevsim Bileşeni: Zaman serilerinde mevsimlere göre değişmeyi ifade eder. Zaman serileri açısından kullanılan verilerin kimi dönemleri diğer dönemlere göre farklılık gösterir. Çevrimsel Bileşen: Ekonomide, mevsimsel değişmeler ile ilgili olmayan dönemsel değişmelerdir. Örneğin, ekonomide genel eğilimden bağımsız kısa süreli genişleme ya da daralma durumu çevrimsel süreci tarif eder. Düzensiz Bileşen: Diğer unsurlar gibi belirli olmayan, hata terimi ile ifade edilebilecek değişmelerdir. Zaman serileri tüm bu kendilerini oluşturan bileşenlere ayrıştırıldıktan sonra, bileşenlerin toplamı şeklinde, Yt=Tt+St+Ct+Lt ya da çarpma yöntemi ile; Yt=Tt St Ct Lt şeklinde belli edilebilir. bir Trend(Genel Eğilim) t döneminde Y zaman serisi ifade

7 Zaman serilerinin durağan olmaması durumunda, zaman serileri trend içerecektir. Zamana bağlı bir değişken hakkında elde edilen gözlem değerlerinin, uzun zaman aralığında artma veya azalma yönünde gösterdiği eğilime trend denir. Gözlemlerin toplanış sırası ile aldığı değerler arasındaki korelasyonun önemini belirlemek için trend analizleri yapılır. Artma veya azalma yönündeki değişmeler, bazen artabilir bazen de yavaşlayabilir. Sonuç olarak trend aynı kalmaz. Zaman içerisinde artış veya azalış göstermeyen, aynı düzeyde kararlılık gösteren serilerin ise trendi yoktur. Şekil 4.Trend örnekleri Yukarıdaki grafikte trend mavi ile gösterilmiştir. Trendin ölçülmesinde başlıca üç amaç güdülmektedir. Bunlardan ilki geçmiş performansın incelenerek bir durum değerlendirmesi yapabilmektir. Böylece örneğin bir firmanın endüstrideki diğer firmalara kıyasla veya ekonominin genel faaliyet düzeyine (konjonktüre) kıyasla durumu saptanabilir. Trendin belirlenmesindeki ikinci amaç seride trendden ileri gelen değişmelerin giderilerek diğer unsurların (konjonktür,

8 mevsim gibi) etkisinin ortaya çıkarılmasıdır. Üçüncü ve en önemli amaç ise trend yardımıyla uzun dönemli projeksiyonların (tahminlerin) yapılabilmesidir. İncelenen dönem istikrarlı ise eğilimin ileride de devam edeceği varsayılarak, seride bulunmayan devrelerde değişkenin alması beklenen değerler hesaplanabilir. Ancak çok uzun dönemli projeksiyonlarda belirsizlik unsurunun artacağı unutulmamalıdır. 3. Analiz Yöntemleri 3.1 Hareketli ortalama (Simple Moving Average) Seçilen zaman periyodundaki verinin toplamının bu zaman dilimindeki toplam veri sayısına bölünmesiyle elde edilen göstergedir. Buradaki n değerinin 4 olduğu düşünülürse her bulduğumuz değerde son 4 günün ortalamasını bulmuş oluruz. 3.2Birikimli hareketli ortalama (Cumulative Moving Average) Burada basit hareketli ortalamadan fark alınan değerlerin kaydırılmamasıdır yani hep ilk veriden başlayarak ortalama hesabı yaparız. 3.3 Ağırlıklı hareketli ortalama (Weighted Moving Average) Ağırlıklı Hareketli Ortalama,belirli bir zaman dilimi içerisinde son günlerdeki verilere ağırlık verilerek hesaplanan hareketli ortalama çeşididir.

9 3.4 Üstel hareketli ortalama (Exponential Moving Average) Alfa değeri 0 ile 1 arasında olmalıdır. Alfa değeri son günün değerini göstermektedir. Son güne çok fazla önem verilir. Azalma üstel olduğu için de son güne verilen önem çok azdır. 3.5 Basit hareketli medyan (Simple Moving Median) Elimizdeki verileri 5 sayı ile sıralayarak medyan değerleri alınıyor. Bu şekilde verilen değeler medyan değerlerine göre tekrar ilişkilendiriliyor. 3.6 Bağıl güç İndeksi (Relative Strength Index ) RSI, J.Welles Wilder tarafından 1978 yılında yayınlanmıştır.ilgili enstrümanın kendi iç gücünü baz alarak matematiksel hesap yapan ve içinde bulunduğu dönemi geçmiş günlere göre değerlendiren RSI grafiğe eklendiğinde alt bölümde bir histogram şeklinde gösterilir. Dikey eksende 0 ile 100 arasında bir skalada hareket eden gösterge için 30 ve 70 fiyat seviyesinde iki sınır çizilmiştir. 30 seviyesi altında bulunan RSI fiyatla uyum sağlamayan aşırı satış talebini betimlerken, 70 seviyesi üzerine çıktığında aşırı alım talebini gösterir. Bu sayede fiyat hareketinin yön değiştireceğine ilişkin öncü bilgiler vermeye çalışır. RSI bu hesabı yaparken belirtilen periyot içindeki günlere ait düşüşleri ve yükselişleri ayrı ayrı toplar, ortalamalarını hesaplar ve şu anki fiyat seviyesi ile karşılaştırır. Bu sayede yatırım aracının kendi iç gücüyle talebi karşılayıp karşılayamayacağını anlamaya çalışır. Geçmiş dönemdeki talepler karşısında oluşan fiyat cevabı RSI için en önemli

10 veridir ve göstergenin temeli bu belirtilen iç güce dayalıdır. Şekil 6.RSI 3.7 Momentum ve Rate of Chance Momentum da herhangi bir n değeri alınnır. Mesela 3 değeri alındı.hesaplayacağımız değerden 3 gün önceki değeri çıkardığımızda momentumu bulmuş oluruz. Rate of chance de ise momentum değerini hesapladığımız değerden bir önceki günü çıkartarak buluruz. Şekil 7. Momentum ve Rate of Chance 4.REFERANSLAR bolum1.html Metin.pdf 5. Zaman.pdf

11 duraganlik_ve_testler.html 9. statistik.html 10. file:///c:/users/tu%c4%9f%c3%a7e%20der%c4%b0n/downloads/ hafta1.pdf 11. Prof. Dr. Işık AKGÜL, Zaman Serilerinin analizi ve ARIMA modelleri (İstanbul DER Yayınları, 2003) Weka İle Sınıflandırma WEKA yı kullanarak bir çok sınıflandırıcıyı kullanabilirsiniz; Karar Ağaçları, SVM, Multi-layer Perceptrons vs. Veri setinizi yükledikten sonra Classify bölümüne tıklayarak sınıflandırma sayfasına erişebilirsiniz. Ön tanımlı ayarlara göre ZeroR algoritması gelmektedir. Şekil 1. Ön Tanımlı Ayar Choose butonuna tıklayarak başka bir sınıflandırıcı seçebilirsiniz. J48 en verimli sınıflandırıcılardandır.

12 Şekil 2. Yeni Sınıflandırma Ayarı Seçme Sınıflandırma algoritmasını çalıştırmadan önce test seçenekleri ayarlanmalı. Test Options Box içerisinde test seçeneklerini bulabilirsiniz: 1. Use Training Set: Üzerinde eğitildiği örneklerin ne kadar iyi sınıflandırıldığını kontrol eder. 2. Supplied Test Set: Bir dosyadan yüklenen örnek setinin ne kadar iyi sınıflandırıldığını kontrol eder. Set butonuna tıklayarak test için bir dosya seçebilirsiniz. 3. Cross-validation: Cross-validation ill sınıflandırıcıyı test eder, bunun için de Folds metin bölgesinden girilen sayıyı fold sayısı olarak kabul eder. Yazdığınız değere göre ayırdığı veri setinin %90 ıyla eğitim %10 u ile de test yapar. 4. Percentage Split: Belli bir yüzdeye göre sınıflandırıcının ne kadar iyi olduğunu test eder. % Bölgesine girilen değere göre bu işlemi gerçekleştirir.

13 Şekil 3. Classifier Output Ekranı Classifier Output ekranındaki Run Information bölümü size kullandığınız algoritmayı, veri setinizin ismini, kaç veriniz ve özellik bilgiliniz olduğunu verir. Ağaç yapısında : sınıf etiketini temsil eder. Seçtiğimiz yöntem başlık olarak ekranda bulunur. Detailed Accuracy By Class başlığı altına bakacak olursak her sınıf için True Positive, False PCositive, Recall ve F-Measure ve ROC Alanı karşılıklarını görebiliriz. Confusion Matrix kısmında sınıflarımız için de kaç tane örnek doğru sınıflandırılmış kaç tanesi yanlış sınıflandırılmış ve hangi sınıf olarak sınıflandırılmış gibi soruların cevaplarını bulabiliriz. Sonuçları Görselleştirme Sınıflandırma sonuçlarımızı daha görsel bir şekilde görmek istersek, WEKA nın bize sağladığı grafiksel seçeneklerden yararlanabiliriz. Şekil 4. Grafiksel Gösterim Seçenekleri

14 Sağ tıklayarak Visualize tree yi seçtikten sonra Classifier Output ta incelediğimiz ağacın grafiksel gösterimini görebiliriz. Şekil 5. Ağaç Gösterimi Ayrıca sınıflandırma hatalarını da görebilirsiniz bunun için aynı menüden Visualize Classifier Errors seçeneğini seçin. Şekil 6. Hataları Sınıflandırma Eğer daha geniş açıdan görmek isterseniz kırmızı okla gösterile jitter ı sağa doğru iterseniz tüm veri örneklerinin sınıflandırılmış hallerini görebilirsiniz, yanlış sınıflandırılmış olanlar kare ile doğru sınıflandırılmış olanlar da x ile gösteriliyor.

15 Şekil 7. Verilerin Sınıflandırılmış Hali Eğer karelerden bir tanesinin üzerine çift tıklarsanız, daha ayrıntılı bilgi görebilirsiniz. Şekil 8. Sınıflandırılmış Verinin Detaylı Bilgisi REFERANSLAR 1- 2http:// le-siniflandirma/ 3- 4http://bilgisayarkavramlari.sadievrenseker.com/2011/09/19/weka -ile-svm/

16 Karar Öğrenmesi(Decision Learning) Ağacı Tree Bu yazımızda karar ağacı öğrenmesini inceleyeceğiz. Öncelikle karar ağacı öğrenmesi danışmanlı öğrenmenin, danışmanlı öğrenme de makine öğrenmesinin bir alt dalıdır. İlk etapta makine öğrenmesi hakkında bilgi edindikten sonra konumuz olan karar ağacı öğrenmesine giriş yapacağız. Makine Öğrenmesi, verilen bir problemi probleme ait ortamdan edinilen veriye göre modelleyen bilgisayar algoritmalarının genel adıdır. Yoğun çalışılan bir konu olduğu için önerilmiş birçok yaklaşım ve algoritma mevcuttur. Bu yaklaşımların bir kısmı tahmin (prediction) ve kestirim (estimation) bir kısmı da sınıflandırma (classification) yapabilme yeteneğine sahiptir. Makine öğrenmesinde yer alan bu terimleri açıklayacak olursak; Tahmin (prediction): Veriden öğrenen modellerde sistem çıkışının nicel olması durumunda kullanılan yöntemlerin ürettiği değerlerdir. Sınıflandırma (classification): Giriş verisine ait çıkışların nitel olduğu durumlarda kullanılan yöntemlerin her veri örneğinin hangi sınıfa ait olduğunu belirlemesidir. Makine Öğrenmesi yöntemleri verinin yapısına göre ikiye ayrılır. Bunlar; Danışmanlı (Supervised) Öğrenme ve Danışmansız (Unsupervised) Öğrenme dir. Danışmanlı öğrenmede, sınıf niteliği vardır ve görevi, sınıf nitelik değerini tahmin etmektir. Danışmansız öğrenmede, veri kümesinin sınıf niteliği yoktur ve bizim görevimiz, veri kümesinde benzer örnekleri bulmak ve bunları gruplamaktır. Bu benzer örnekleri

17 gruplayarak, bir veri kümesinde önemli desenler bulabiliriz. Örneğin, tweet atma sıklığı çeşitli olaylar için farklı olduğu için denetimsiz öğrenme Twitter daki olayları tanımlamak için kullanılabilir. Denetimsiz öğrenmeyi kullanarak, tweet ler göründükleri zamana göre gruplandırılabilir ve bu şekilde tweet lerin karşılık gelen gerçek dünyadaki olaylarını tanımlayabilir. Karar Ağacı Nedir? Karar Ağaçları, belirli bir parametreye göre verilerin sürekli olarak bölündüğü bir Denetimli Makine Öğrenmesi türüdür. Ağaç, karar düğümleri ve yapraklar olmak üzere iki varlık tarafından açıklanabilir. Yapraklar kararlar veya nihai sonuçlardır. Ve karar düğümleri verilerin nereye bölündüğünü gösterir. Şekil 1. Karar Ağacı Örneği Bir karar ağacı örneği, yukarıdaki ikili ağaç kullanılarak açıklanabilir. Diyelim ki, bir insanın yaş, yeme alışkanlığı ve fiziksel aktivite gibi verilmiş bilgilerle fit olup olmadığını tahmin etmek isteyebilirsiniz. Buradaki karar düğümleri, Yaş durumu, Sabahları egzersiz yapıyor mu?, Fazla pizza yer mi? ve yapraklar da, fit ya da fit değil şeklindedir. Bu durumda bu, binary(ikili) bir sınıflandırma problemiydi (evet hayır tip problemi).

18 Karar Ağaçları Sınıflandırma ile Sınıflandırma problemleri için yaygın kullanılan yöntemdir. Sınıflandırma doğruluğu diğer öğrenme metotlarına göre çok etkindir. Öğrenmiş sınıflandırma modeli ağaç şeklinde gösterilir ve karar ağacı (decision tree) olarak adlandırılır. Karar ağaçları akış şemalarına benzeyen yapılardır. Her bir nitelik bir düğüm tarafından temsil edilir. Dallar ve yapraklar ağaç yapısının elemanlarıdır. En son yapı yaprak en üst yapı kök ve bunların arasında kalan yapılar dal olarak isimlendirilir. Sınıflandırma Uygulamaları Kredi başvurusu değerlendirme Kredi kartı harcamasının sahtekarlık olup olmadığına karar verme Hastalık teşhisi Ses tanıma Karakter tanıma Gazete haberlerini konularına göre ayırma Kullanıcı davranışları belirleme Sınıflandırma yöntemleri olarak Karar ağaçları nın yanı sıra Yapay Sinir Ağları (Artificial Neural Networks), Bayes Sınıflandırıcılar (Bayes Classifier), İlişki Tabanlı Sınıflandırıcılar (Association-Based Classifier), k-en Yakın Komşu Yöntemi (k- Nearest Neighbor Method), Destek Vektör Makineleri (Support Vector Machines) ve Genetik Algoritmalar (Genetic Algorithms) gibi yöntemler bulunmaktadır. Karar ağaçlarında sınıflandırma yöntemleri 2 çeşittir. Bunlar Entropiye Dayalı Algoritmalar ve Sınıflandırma ve Regresyon Ağaçları(CART) dır. ID3 Algoritması ve C4.5 Algoritması

19 Entropiye dayalı algoritmalar arasındayken Twoing Algoritması ve Gini Algoritması Sınıflandırma ve regresyon ağaçları sınıfındadır. Karar Ağacı Yöntemleri Oluşturma Karar ağacı oluşturma yöntemleri genel olarak iki aşamadan oluşur; 1.Ağaç oluşturma En başta bütün öğrenme kümesi örnekleri kökte seçilen niteliklere bağlı olarak örnek yinelemeli olarak bölünüyor. 2. Ağaç budama Öğrenme kümesindeki gürültülü verilerden oluşan ve sınama kümesinde hataya neden olan dalları silme (sınıflandırma başarımını artırır) Karar ağacı oluşturma yinelemeli bir işlemdir. Ağaç bütün verinin oluşturduğu tek bir düğümle başlar. Eğer örneklerin hepsi aynı sınıfa aitse düğüm yaprak olarak sonlanır ve sınıf etiketini alır. Eğer değilse örnekleri sınıflara en iyi bölecek olan nitelik seçilir. İşlemin sona ermesi için ise aşağıdaki şartların sağlanması gerekmektedir. Örneklerin hepsi (çoğunluğu) aynı sınıfa ait olduğunda Örnekleri bölecek nitelik kalmamışsa Kalan niteliklerin değerini taşıyan örnek yoksa Aşırı uyum(overfitting) budanması(pruning) gerekir. olması durumunda ağacın

20 Veriye Geçme Aşırı Uyumun Önüne Eğitim verilerini en iyi sınıflandıracak şekle kadar her dalını derinleştirir.bu mantıklı bir stratejiyken, veriler arasında gürültü varsa zorluklara sebep olabilir.gürültü varken, her yaprak saf (pure) olana dek bölünmeye izin vermek, veriyi ezberleyen (overfitting) çok büyük bir karar ağacı oluşmasına neden olabilir. Şekil 2. Doğruluk Oran Grafiği Budama(Pruning) Nedir? Verideki gürültüyü azaltmak için budama yaparız.düşük öneme sahip özellikleri kullanan dalları kaldırmayı içerir. Böylece ağaçların karmaşıklığı düşer ve aşırı uyum azalarak tahmin gücü artar. Budama kök veya yapraklardan başlayabilir. Budama işleminin en basit yöntemi yapraklarda başlar ve bu yaprağın en popüler sınıfa sahip her bir düğümünü kaldırır; bu değişiklik doğruluk bozulmazsa tutulur. Buna hata düzeltme denir. İki çeşit budama yöntemi vardır. Bunlar; 1. Erken budama(pre-prunning)

21 Ağacın büyümesini erken durduran bir yaklaşımdır. 1. Geç budama(post-pruning) Ağacın tamamlanmasının ardından işlem yapılır.daha doğru bir çözümdür ID3 Nedir? Karar Ağaçları yapısını oluşturan birçok algoritmanın en iyilerinden birisi ID3 Algoritması olarak adlandırılır. ID3, Iterative Dichotomiser 3 anlamına gelir.(tekrarlı ikilikçi ağaç).id3 algoritması 3 adımı esas alır: 1. H e n ü z a ğ a c a d a h i l e d i l m e y e n ö z e l l i k l e r e l e alınıp entropi (dağınım) değerleri hesaplanır. 2. Entropi değerlerine göre sıralanır ve aralarından en düşük değerli özellik seçilir. 3. Seçilen özelliğin kararı ağaca eklenir. Entropi Nedir? Bir sistemin düzensizliğini ifade eden terimdir. Örneğin entropi terimini hilesiz bir yazı tura atma işleminde 1 bitlik (ikil) ve %50 ihtimallik bir değer olarak görebiliriz.hileli olarak düşünürsek sürekli tura gelen bir paranın ürettiği sayıların entropisi sıfırdır. Bilgisayar bilimleri açısından daha kesin bir tanım yapmak gerekirse elimizdeki veriyi kaç bit ile (ikil) kodlayabileceğimize entropi ismi verilir. Örneğin bir haftada bulunan günleri kodlamak için kaç ikile ihtiyacımız olduğu günlerin dağınımıdır. Tablo 1. Haftanın Günleri Örneği Görüldüğü üzere 7 gün için 3 bit yeterlidir.yani haftanın

22 günleri entropisi 3 tür. Genellikle bir bilginin entropisi hesaplanırken log2n formülü kullanılır. Burada n birbirinden farklı ihtimal sayısını belirler. Örneğin haftanın günlerinde bu sayı 7 dir ve log 2 7 = 2,80 olmaktadır gibi bir bit olamayacağı için yani bilgisayar kesikli matematik (discrete math) kullandığı için 3 bit gerektiğini söyleyebiliriz. up1, p2,.., ps toplamları 1 olan olasılıklar olmak üzere entropi formülümüz; Şekil 3. Entropi Formülü Bir örnek verecek olursak; S veri kümesinde 14 örnek bulunacak şekilde, C0 sınıfına ait 9, C1 sınıfına ait 5 örnek var diyelim. Entropi formülümüzü kullanarak işlemi hesaplayacağımızda sonucunu buluruz bu da bu örneğin entropisini gösterir. Şekil 4. Hesaplama Bu konuyla ilişkili olarak bilmemiz gereken bir diğer bilgi de Bilgi Kazancı(Information Gain)dır.İlgili formül ise Şekil 5 de mevcuttur. Şekil 5. Bilgi Kazancı Formülü ID3 Hesaplama Örneği

23 Tablo 2. Örnek Veriler Şimdi devam edip karar ağacını oluşturacağız. İlk adım, H(S), mevcut durumun entropisini hesaplamaktır. Yukarıdaki örnekte toplam 5 No ve 9 Yes olduğunu görüyoruz.toplam 14 değerimiz olduğundan entropi bulunur. Şekil 6. Hesaplama Sonucu Bütün üyelerin aynı sınıfa ait olması durumunda entropinin 0 ve bunların yarısı bir sınıfa, diğer yarısı diğer sınıfa ait olduğunda entropinin 1 (örn.: yazı-tura) olduğunu hatırlayın. Burada sonucumuz 0.94, yani dağıtımın oldukça rasgele olduğu anlamına geliyor. Şimdi bir sonraki adım, kök düğüm olarak seçeceğimiz en yüksek Bilgi Kazanımı nı veren nitelik seçmektir. Rüzgar ile başlayalım. Şekil 7. Rüzgar İçin Formül Formüldeki x bir özniteliğin olası değerleridir.burada, Rüzgar özelliği örnek veride iki olası değeri alır; dolayısıyla x = {Zayıf,Güçlü}.Hesaplanması gereken değerler; H(Szayıf),P(Szayıf),P(Sgüçlü) ve önceki işlemde hesapladığımız

24 H(S)=0.94. Şekil 8. PZayıf ve PGüçlü için Hesaplamalar Şimdi 8 zayıf örnekten 6 sı oynama durumu için Evet 2 si oynama durumu için Hayır idi. Yani elimizde, Şekil 9. Zayıf Rüzgar İçin Entropi Benzer şekilde 6 Güçlü örnekte sonucun oynama durumu için Evet olduğu 3, Hayır olduğu 3 örnek var. Şekil 10. Güçlü rüzgar İçin Entropi Unutmayın, burada yarım öğeler bir sınıfa aitken, diğer yarısı diğerine aittir. Dolayısıyla mükemmel rasgeleliğe sahibiz.şimdi, Bilgi Kazançını hesaplamak için gereken tüm parçaları elde ettik. Şekil 11. Rüzgar İçin Bilgi Kazancı Bu, Rüzgar özelliği ile ilgili Bilgi Kazanımını bize bildirir ve bize 0,048 lik bilgi kazandırır. Şimdi de benzer şekilde tüm özelliklerin Bilgi Kazanımlarını hesaplamalıyız. BK(S,Hava Durumu) = BK(S,Sıcaklık) = BK(S,Nem) = BK(S,Rüzgar) = (örneğimiz)

25 Açıkça görüyoruz ki, BK(S, Hava Durumu)=0.246 en yüksek bilgi kazanımına sahip, dolayısıyla kök düğüm olarak Hava Durumu özniteliğini seçtik. Bu noktada, karar ağacı aşağıdaki gibidir. Şekil 12. Ağacın İlk Durumu Burada, Hava durumu Bulutlu olduğunda, Oynama Durumunun her zaman Evet olduğunu gözlemlersek, bu hiçbir şekilde herhangi bir tesadüf değildir. En yüksek bilgi kazanımı, Hava Durumu özelliği tarafından verilen basit ağaçtır. Şimdi bu noktadan nasıl ilerleyebiliriz? Yineleme uygulayabiliriz, daha önce açıklanan algoritma adımlarına bakmak isteyebilirsiniz. Artık Hava Durumu nu kullandık, kalan üçümüzde Nem, Sıcaklık ve Rüzgar bulunuyor. Ve Hava Durumu nun üç olası değeri vardı: Güneşli, Bulutlu, Yağmurlu. Bulutlanmış düğümün bitiş düğümünde Evet olan yaprak düğümü olması nedeniyle, hesaplamak için kalan iki alt ağacı dallandırmaya devam ederiz; Güneşli ve Yağmurlu. BK(S,Güneşli) i hesaplayacak olursak; Tablo 3. Güneşli Durumda Veriler Şekil 13. Güneşli İçin Entropi

26 Aynı şekilde diğer verileri de hesapladığımızda; BK (Sgüneşli,Nem) = 0,96 BK (Sgüneşli,Sıcaklık) =0.57 BK (Sgüneşli,Rüzgar) = Gördüğümüz gibi en yüksek Bilgi Kazancı, Nem tarafından verilir. Aynı şekilde Syağmurlu için işlemleri yaptığımızda en yüksek bilgi kazancı olanı Rüzgar olarak buluyoruz. Ağacın son durumu aşağıdaki gibidir; Şekil 14. Nihai Karar Ağacı C4.5 Ağacı C4.5 ağacı, ID3 ağacının geliştirilmiş bir hali olarak düşünülebilir. ID3 algoritmasından farklı olarak nümerik değerler kategorik değerler haline dönüştürülebilir. Ayrıca ağaç üzerinde erişim sıklıklarına göre alt ağaçların farklı seviyelere taşınması da mümkündür. C4.5 ağacının diğer bir farkı ise tam bu noktada ortaya çıkar ID3 ağacının yaklaşımından farklı olarak C4.5 ağacında budama (prunning) işlemi yapılmaktadır.

27 Şekil 15. Budama Örneği Nümerik değerleri kategorik hale getirmek için en büyük bilgi kazancını sağlayacak biçimde bir eşik değer belirlenir.eşik değeri belirlemek için tüm değerler sıralanır ve ikiye bölünür. Eşik değer için, +1 aralığının orta noktası alınabilir. = vi + vi+1 /2. Böylece nitelikteki değerler eşik değere göre iki kategoriye ayrılmış olur. Tablo 4. Örnek Veriler Nitelik 2 = {65, 70, 75, 80, 85, 90, 95, 96} için eşik değer (80+85)/2 = 83 alınmıştır. Tablo 5. Sayısal Verilerin İki Kategoriye İndirilmesi Şimdi yapmamız gereken ID3 hesaplamasında kullandığımız formülleri aynı şekilde kullanarak en büyük bilgi kazanımı

28 olan niteliği düğüm olarak seçmek. Nitelik1 için hesaplamalar; 1.H(SINIF) = -(5/14 log2 5/14 + 9/14 log2 9/14 ) = )= H(NİTELİK1A) = -( 2/5 log2 2/5 3/5 log2 3/5 3.H(NİTELİK1B) = -( 4/4 log2 4/4 + 0/4 log2 0/4 )= 0 4.H(NİTELİK1C) = 3/5 log2 3/5 2/5 log2 2/5 = H(S,NİTELİK1,SINIF) = 5/14 H(NİTELİK1A) + 4/14 H(NİTELİK1B) + 5/14 H(NİTELİK1C) 6.= (5/14)(0.971) + (4/14)(0) + (5/14)(0.971) = BK(NİTELİK1,SINIF) = = Nitelik2 için hesaplamalar; 1.H(SINIF) = H(NİTELİK2 EK ) = -( 7/9 log 2 7/9 2/9 log 2 2/9 )= H(NİTELİK1B) = -( 2/5 log2 2/5 + 3/5 log2 3/5 )= H(S,NİTELİK2,SINIF) = 9/14 H(NİTELİK2EK) + 5/14 H(NİTELİK2B) 5.= (9/14)(0.765) + (5/14)(0.971) = BK(NİTELİK2,SINIF) = = Nitelik3 için hesaplamalar; 1.H(SINIF) = H(NİTELİK3DOĞRU) = -( 3/6 log2 3/6 3/6 3.H(NİTELİK3YANLIŞ) = -( 6/8 log2 6/8 + 2/8 4.H(S,NİTELİK3,SINIF) = 6/14 log2 3/6 )= 1 log2 2/8 )= H(NİTELİK3DOĞRU) + 8/14

29 H(NİTELİK3 Y A N L I Ş ) 5.= (6/14)(1) + (8/14)(0.811) = BK(NİTELİK2,SINIF) = = BK(NİTELİK1,SINIF) > BK(NİTELİK2,SINIF) > BK(NİTELİK3,SINIF) İşlemler bittiğinde bilgi kazancı büyüklükleri sırasıyla Nitelik1,Nitelik2 ve Nitelik3 olarak bulunmuştur. Buna göre hesaplamalar tamamlanır ve nihai karar ağacı elde edilir. Şekil 16. Nihai Karar Ağacı Sınıflandırma ve Regresyon Ağaçları (CART) 1984 te Leo Breiman tarafından ortaya atılmıştır. CART karar ağacı, herbir karar düğümünden itibaren ağacın iki dala ayrılması ilkesine dayanır. Yani bu tür karar ağaçlarında ikili dallanmalar söz konusudur. CART algoritmasında bir düğümde belirli bir kriter uygulanarak bölünme işlemi gerçekleştirilir. Bunun için önce tüm niteliklerin var olduğu değerler göz önüne alınır ve tüm eşleşmelerden sonra iki bölünme elde edilir. Bu bölünmeler üzerinde seçme işlemi uygulanır. Bu kapsamda bu yazıda üç algoritma anlatılmaktadır; 1. Twoing Algoritması 2. Gini Algoritması 3. Rastgele Orman Algoritması

30 Twoing Algoritması Twoing algoritmasında eğitim kümesi her adımda iki parçaya ayrılarak bölümleme yapılır. Aday bölünmelerin sağ ve sol kısımlarının her birisi için nitelik değerinin ilgili sütundaki tekrar sayısı alınır. Aday bölünmelerin sağ ve sol kısımlarındaki her bir nitelik değeri için sınıf değerlerinin olma olasılığı hesaplanır.her bölünme için uygunluk değeri en yüksek olan alınır. Şekil 17. Formül Burada, T eğitim kümesindeki kayıt sayısını, B aday bölünmeyi, d düğümü, Tsinifj ise j.sınıf değerini gösterir Tablo 6. Örnek Tablo Tablo 7. Örnek Tablonun Etkenlere Göre Düzenlenmesi MAAŞ = NORMAL için PSol = ( BSol )/( T ) = 1/11 = 0,09 P EVET/ tsol = ( TSınıfEVET )/( B Sol ) = 1/1 = 1 ( TSınıfHAYIR )/( BSol ) = 0/1 = 0 ve P HAYIR/ tsol =

31 Tablo 8.Bölünme şartı sonucu elde edilen veriler MAAŞ = DÜŞÜK,YÜKSEK için PSağ = ( BSağ )/( T ) = 10/11 = 0,91 P EVET/tSağ = ( TSınıfEVET )/( B Sağ ) = 6/10 = 0,6 ve P HAYIR/tSağ = ( TSınıfHAYIR )/( BSağ ) = 4/10 = 0,4 Tablo 9.Bölünme şartı sonucu elde edilen veriler Uygunluk değeri hesaplanır(1. aday bölünme için) Şekil 18. Kullanılacak Formül = 2(0,09)(0,91)[ 1 0, ,4 ] = 0,13 Tablo 10. Bölünme şartı sonucu elde edilen veriler Ve ağacın ilk durumu belirlenir;

32 Şekil 19. Ağacın İlk Durumu Aynı işlemler ALT DÜĞÜM e de uygulanır Şekil 20. Nihai Karar Ağacı Gini Algoritması Gini algoritmasında nitelik değerleri iki parçaya ayrılarak bölümleme yapılır. Her bölünme için Ginisol ve Ginisağ değerleri hesaplanır. Şekil 21. Formül Burada, Tsinifi soldaki bölümdeki her bir sınıf değerini, Tsinifi sağdaki bölümdeki her bir sınıf değerini, B sol sol bölümdeki tüm değer sayısını, B sağ sağ bölümdeki tüm değer sayısını gösterir.

33 Şekil 22. Formül Her bölümlemeden sonra Gini değeri en küçük olan seçilir Tablo 11. Örnek Veriler Tablomuzdaki verileri sonuç için sıralarsak; Tablo 12. Verilerin Sonuç için Sıralanmış Hali EĞİTİM için 1.Ginisol = 1- [(1/3)2 + (2/3)2 ] = 0,444 2.Ginisağ = 1- [(4/5)2 + (1/5)2 ] = 0,320 YAŞ için 1.Ginisol = 1- [(0/2)2 + (2/2)2 ] = 0 2.Ginisağ = 1- [(5/6)2 + (1/6)2 ] = 0,278 CİNSİYET için 1.Ginisol = 1- [(1/3)2 + (2/3)2 ] = 0,444 2.Ginisağ = 1- [(4/5)2 + (1/5)2 ] = 0,320

34 Gini değerleri; Şekil 23. Gini Değerleri Buna göre ilk bölünme YAŞ a göre yapılacaktır. Şekil 24. Ağacın İlk Durumu Aynı işlemler alt düğümlere de uygulandığında sonuç karar ağacı elde edilir. Şekil 25. Nihai Karar Ağacı Rastgele Orman Algoritması (Random Forest Algorithm) Rastgele orman algoritması denetimli(supervised) bir sınıflandırma algoritmasıdır. Adından da anlaşılacağı gibi, bu

35 algoritma ağaçları bir dizi orman oluşturur. Çevremizdeki ormanlara baktığımızda bir ormanda ne kadar çok ağaç varsa orman o kadar sağlam görünür. Rastgele orman sınıflandırıcısında da aynı şekilde, ormandaki ağaç sayısı arttıkça yüksek doğrulukta sonuçlar elde edilir. Kısaca anlatacak olursak Rastgele Orman da sınıflandırma işlemi sırasında birden fazla karar ağacı kullanılarak sınıflandırma değerinin yükseltilmesi hedeflenir. Önce rastgele orman algoritması için sözde kod a(pseudo code) bakalım ve daha sonra rastgele orman algoritmasını adım adım inceleyelim. Rastgele orman algoritması ayrılabilir.bunlar; için sözde kod iki aşamaya 1. Rastgele orman yaratma sözde kodu. 2. Yaratılan rastgele orman sınıflandırıcısından tahmin yapmak için sözde kod. İlk olarak, rastgele orman yaratma sözde koduyla başlayalım. Rastgele Orman sözde kodu: 1. M özelliklerinden rastgele K özelliklerini seçin. 2. k << m olduğunda 3. K özellikleri arasında, D düğümünü en iyi bölme noktasını kullanarak hesaplayın. 4. En iyi bölünmeyi kullanarak düğümü çocuk düğümlere bölün. 5. L düğüm sayısına ulaşılana kadar 1-3 basamağı tekrarlayın. 6. N sayıdaki ağaçları oluşturmak için 1 ila 4 arasındaki adımları N kere tekrarlayarak orman oluşturun. Rastgele orman algoritmasının başlangıcı, toplam m özelliğinden k özelliklerini rastgele seçerek başlar. Bir sonraki aşamada, en iyi bölünmüş yaklaşımı kullanarak kök

36 düğümü bulmak için rastgele seçilen k özelliklerini kullanıyoruz. Sonraki aşamada, çocuk düğümlerini aynı en iyi bölünmüş yaklaşımı kullanarak hesaplayacağız. Bir kök düğümle ağacı oluşturana ve hedefi yaprak düğüm olarak oluşturana kadar ilk 3 aşamayı yapacağız. Sonunda, n adet rastgele oluşturulmuş ağaçlar elde etmek için 1-4 basamaklarını tekrar ederiz. Bu rastgele oluşturulmuş ağaçlar rastgele ormanı oluşturur. Rasgele Orman tahmini sözde kodu: Eğitimli rastgele orman algoritması kullanılarak tahmin yapmak için aşağıdaki yalancı kod kullanılmaktadır. 1. Test özelliklerini alır ve sonuçları tahmin etmek için her rastgele oluşturulmuş karar ağacının kurallarını kullanır ve tahmin edilen sonucu (hedef) depolayın. 2. Tahmini her hedef için oyları hesaplayın. 3. Yüksek oylanmış tahmin hedefini rastgele algoritmasından nihai tahmin olarak düşünün. orman Tahminleri eğitilmiş rastgele orman algoritması kullanarak gerçekleştirmek için, test özelliklerini her rastgele oluşturulmuş ağaçların kuralları aracılığıyla iletmemiz gerekmektedir. Rastgele orman için 100 rastgele karar ağacı oluşturduğumuzu düşünelim. Her rastgele orman, aynı test özelliği için farklı hedef (sonuç) öngörür. Daha sonra tahmin edilen her bir hedef dikkate alınarak oylar hesaplanacaktır. 100 rastgele karar ağacı tahmininin 3 benzersiz hedef x,y,z olduğunu varsayalım, buna göre, 100 ağaçtan kaç tane ağaç öngörüsü x dir buna bakacağız. Diğer iki hedef (y, z) için olduğu gibi. Eğer x yüksek oy alıyorsa. Diyelim ki 100 rastgele karar ağacından 60 ağaç hedef x olarak tahmin ediyor olacaktır. En sonunda da son rastgele orman tahmin edilen hedef olarak x i döndürür. Bu oy verme konsepti çoğunluk oylaması(majority voting) olarak bilinir.

37 Rastgele orman algoritmasının avantajları şu şekildedir; Herhangi bir sınıflandırma probleminde rastgele orman algoritması kullandığımızda, aşırı uyum(overfitting) problemi asla ortaya çıkmaz. Aynı rastgele orman algoritması hem sınıflandırma hem de regresyon görevi için kullanılabilir. Rastgele orman algoritması, özellik mühendisliği(feature engineering) için kullanılabilir. -Bu, eğitim verisetindeki mevcut özelliklerin dışındaki en önemli özelliklerin belirlenmesi anlamına gelir. Rastgele orman algoritması ile ilgili daha fazla bilgi için bu bağlantıya göz atabilirsiniz. Karar Ağacının Avantajları Anlamak, yorumlamak, görselleştirmek basittir.karar ağaçları örtülü olarak değişken tarama veya özellik seçimi gerçekleştirir. Hem sayısal hem de kategorik verileri işleyebilir. Aynı zamanda çoklu çıktı problemlerini de halledebilir. Karar ağaçları, veri hazırlığı için nispeten az çaba gerektirir. Parametreler arasındaki doğrusal olmayan ilişkiler ağaç performansını etkilemez. Karar Ağacının Dezavantajları Karar ağacı öğrenenleri, veriyi genelleştirmeyen aşırı karmaşık ağaçlar oluşturabilir. Buna overfitting(aşırı uygunluk,ezber) denir.açgözlü algoritmalar, küresel olarak en uygun karar ağacını geri getireceğini garanti edemez. Bu, özelliklerin ve örneklerin rastgele değiştirilmesi ile örneklendiği birden fazla ağaç eğiterek hafifletilebilir.karar ağacı öğrenenleri, bazı sınıflara hakimse, önyargılı ağaçlar oluştururlar. Dolayısıyla, karar ağacına uydurmadan önce veri setini dengelemek önerilir.

38 WEKA ile Bir Örnek Bu başlık altında WEKA programının kullanımını öğrenmek amacı ile karar ağacı algoritmalarından olan C4.5 algoritmasıyla örnek bir uygulama yapacağız. Öncelikle Weka programını açıp Explorer tuşuna basıyoruz. Şekil 26. Weka Giriş Ekranı Önümüze gelen ekranda Open File a tıklayıp dosyamızı seçiyoruz(dosya arrf uzantılı olmalı). Şekil 27. Dosya Seçme I

39 Şekil 28. Dosya Seçme II Dosyayı seçtikten sonra Şekil 29 daki gibi bir görünüm elde ettik. Ağacımızı oluşturma işlemine devam etmek için Classify sekmesine tıklıyoruz. Şekil 29. Sekmenin Dosya Seçildikten Sonraki Görünümü Buradaki ekrandan Choose a tıklıyoruz. Şekil 30. Algoritma Seçme Ardından gelen menüden en altta trees bölümünden istediğimiz karar ağacı algoritmasını seçiyoruz. Biz bu örnek için C4.5 in ücretsiz sürümü olan J48 i seçtik. Bu algoritma seçimi sonrası az önce ZeroR yazan bölüm Şekil 32 de kırmızı ile gösterilen halini aldı. Kırmızı alanla gösterilen yere tıklıyoruz.

40 Şekil 31. C4.5 in WEKA daki ücretsiz versiyonu olan J48 Şekil 32. Algoritma Seçimi Sonrası ZeroR Açılan seçeneklerde örnek kümemizin Minimum Number Object(minNumObj) ini 1 yapıyoruz(minimum nesneyi belirtmek için).örnekten örneğe en doğru karar ağacını elde etmek için farklı minimum nesne değerleri gerekebilir. Şekil 33. Örneğe Özgü Düzenlemeler Bunu da tamamladıktan sonra Start tuşuna basıyoruz ve algoritmamız çalışıyor. Algoritma çalıştı fakat biz görsel bir karar ağacı istiyoruz bunun için Result list bölümünde çıkan

41 sonucumuza sağ tıklıyoruz ve Visualize Tree ifadesine tıklıyoruz. Şekil 34. Algoritmayı Çalıştırma Şekil 35. Hesaplamanın Tamamlanması

42 Şekil 36. Sağ Tıklama Menüsü Şekil 37 deki gibi Ağacımızı elde etmiş oluyoruz. Şekil 37. Karar Ağacı Özet Karar ağaçları veri madenciliği için popüler araçlardır Anlaması kolaydır. Uygulaması kolaydır. Kullanımı kolaydır. Finansal açıdan ucuzdur. Overfitting(Ezber) meydana gelebilir. Önlemek için Pruning(Budama) işlemi uygulanır.kökten bir yaprağa kadar olan her yol, yaprağa götüren tüm kararların kuralın öncüsünü tanımladığı bir kurala karşılık gelir ve bunun sonucunda yaprak düğümünde sınıflandırma yapılır. Referanslar 1. chine-learning-641b9c4e sion-trees-for-machine-learning/

43 3.Tom Mitchell, Princeton, Decision Tree Learning s/mitchell-dectrees.pdf 4. ees-machine-learning-algorithm.html 5.Yrd.Doç.Dr. Kadriye ERGÜN, Balıkesir Üniversitesi, Veri Madenciliği 6.Yrd.Doç.Dr.Umut Öğrenmesi ORHAN, Çukurova Üniversitesi, Makine tropi-entropy/ Jerry Zhu, University of Wisconsin-Madison, Machine Learning:Decision Trees

Karar Ağacı Öğrenmesi(Decision Tree Learning)

Karar Ağacı Öğrenmesi(Decision Tree Learning) Karar Ağacı Öğrenmesi(Decision Tree Learning) Bu yazımızda karar ağacı öğrenmesini inceleyeceğiz. Öncelikle karar ağacı öğrenmesi danışmanlı öğrenmenin, danışmanlı öğrenme de makine öğrenmesinin bir alt

Detaylı

Karar Ağacı Öğrenmesi(Decision Tree Learning)

Karar Ağacı Öğrenmesi(Decision Tree Learning) Karar Ağacı Öğrenmesi(Decision Tree Learning) Bu yazımızda karar ağacı öğrenmesini inceleyeceğiz. Öncelikle karar ağacı öğrenmesi danışmanlı öğrenmenin, danışmanlı öğrenme de makine öğrenmesinin bir alt

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Sınıflandırma yöntemleri Karar ağaçları ile sınıflandırma Entropi Kavramı ID3 Algoritması C4.5

Detaylı

Makine Öğrenmesi 3. hafta

Makine Öğrenmesi 3. hafta Makine Öğrenmesi 3. hafta Entropi Karar Ağaçları (Desicion Trees) ID3 C4.5 Sınıflandırma ve Regresyon Ağaçları (CART) Karar Ağacı Nedir? Temel fikir, giriş verisinin bir kümeleme algoritması yardımıyla

Detaylı

Zaman Serileri. IENG 481 Tahmin Yöntemleri Dr. Hacer Güner Gören

Zaman Serileri. IENG 481 Tahmin Yöntemleri Dr. Hacer Güner Gören Zaman Serileri IENG 481 Tahmin Yöntemleri Dr. Hacer Güner Gören Zaman Serisi nedir? Kronolojik sırayla elde edilen verilere sahip değișkenlere zaman serisi adı verilmektedir. Genel olarak zaman serisi,

Detaylı

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir sınıflandırma: temel kavramlar, karar ağaçları ve model değerlendirme Sınıflandırma : Tanım Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir Eğitim setindeki her kayıt

Detaylı

Zaman Serileri-1. If you have to forecast, forecast often. EDGAR R. FIEDLER, American economist. IENG 481 Tahmin Yöntemleri Dr.

Zaman Serileri-1. If you have to forecast, forecast often. EDGAR R. FIEDLER, American economist. IENG 481 Tahmin Yöntemleri Dr. Zaman Serileri-1 If you have to forecast, forecast often. EDGAR R. FIEDLER, American economist IENG 481 Tahmin Yöntemleri Dr. Hacer Güner Gören Zaman Serisi nedir? Kronolojik sırayla elde edilen verilere

Detaylı

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ 1 İstatistik İstatistik, belirsizliğin veya eksik bilginin söz konusu olduğu durumlarda çıkarımlar yapmak ve karar vermek için sayısal verilerin

Detaylı

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ 127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi

Detaylı

Gözetimli & Gözetimsiz Öğrenme

Gözetimli & Gözetimsiz Öğrenme Bölüm 5. Sınıflandırma 1 http://ceng.gazi.edu.tr/~ozdemir Gözetimli & Gözetimsiz Öğrenme Predictive Data Mining vs. Descriptive Data Mining Gözetimli (Supervised) öğrenme= sınıflandırma (clasification)

Detaylı

ZAMAN SERİLERİNDE AYRIŞTIRMA YÖNTEMLERİ

ZAMAN SERİLERİNDE AYRIŞTIRMA YÖNTEMLERİ ZAMAN SERİLERİNDE AYRIŞTIRMA YÖNTEMLERİ 1 A. GİRİŞ Gözlemlerin belirli bir dönem için gün, hafta, ay, üç ay, altı ay, yıl gibi birbirini izleyen eşit aralıklarla yapılması ile elde edilen seriler zaman

Detaylı

Uzaktan Algılama Teknolojileri

Uzaktan Algılama Teknolojileri Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk alp.erturk@kocaeli.edu.tr Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve

Detaylı

TANIMLAYICI İSTATİSTİKLER

TANIMLAYICI İSTATİSTİKLER TANIMLAYICI İSTATİSTİKLER Tanımlayıcı İstatistikler ve Grafikle Gösterim Grafik ve bir ölçüde tablolar değişkenlerin görsel bir özetini verirler. İdeal olarak burada değişkenlerin merkezi (ortalama) değerlerinin

Detaylı

Veri Madenciliği. Bölüm 5. Sınıflandırma 1. Doç. Dr. Suat Özdemir.

Veri Madenciliği. Bölüm 5. Sınıflandırma 1. Doç. Dr. Suat Özdemir. Bölüm 5. Sınıflandırma 1 http://ceng.gazi.edu.tr/~ozdemir Gözetimli & Gözetimsiz Öğrenme Predictive Data Mining vs. Descriptive Data Mining Gözetimli (Supervised) öğrenme= sınıflandırma (clasification)

Detaylı

Hafta 05 - Karar Ağaçları/Kümeleme

Hafta 05 - Karar Ağaçları/Kümeleme BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr İstanbul Şehir Üniversitesi 2018 - Bahar İçindekiler

Detaylı

İÇİNDEKİLER ÖN SÖZ...

İÇİNDEKİLER ÖN SÖZ... İÇİNDEKİLER ÖN SÖZ... v GİRİŞ... 1 1. İSTATİSTİK İN TARİHÇESİ... 1 2. İSTATİSTİK NEDİR?... 3 3. SAYISAL BİLGİDEN ANLAM ÇIKARILMASI... 4 4. BELİRSİZLİĞİN ELE ALINMASI... 4 5. ÖRNEKLEME... 5 6. İLİŞKİLERİN

Detaylı

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 ) 4. SUNUM 1 Gözlem ya da deneme sonucu elde edilmiş sonuçların, rastlantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel yöntemlere HİPOTEZ TESTLERİ denir. Sonuçların rastlantıya bağlı

Detaylı

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir Kümeleme Analizi: Temel Kavramlar ve Algoritmalar Kümeleme Analizi Nedir? Her biri bir dizi öznitelik ile, veri noktalarının bir kümesi ve noktalar arasındaki benzerliği ölçen bir benzerlik ölçümü verilmiş

Detaylı

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine

Detaylı

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data

Detaylı

Veri Madenciliği Karar Ağacı Oluşturma

Veri Madenciliği Karar Ağacı Oluşturma C4.5 Algoritması Veri Madenciliği Karar Ağacı Oluşturma Murat TEZGİDER 1 C4.5 Algoritması ID3 algoritmasını geliştiren Quinlan ın geliştirdiği C4.5 karar ağacı oluşturma algoritmasıdır. ID3 algoritmasında

Detaylı

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir Bilimsel Araştırma Yöntemleri Prof. Dr. Şener Büyüköztürk Doç. Dr. Ebru Kılıç Çakmak Yrd. Doç. Dr. Özcan Erkan Akgün Doç. Dr. Şirin Karadeniz Dr. Funda Demirel Örnekleme Yöntemleri Evren Evren, araştırma

Detaylı

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticisiz (unsupervised) öğrenme: Kümeleme (clustering) Hangi nesnenin hangi

Detaylı

BMÜ-421 Benzetim ve Modelleme Kesikli Olay Benzetimi. İlhan AYDIN

BMÜ-421 Benzetim ve Modelleme Kesikli Olay Benzetimi. İlhan AYDIN BMÜ-421 Benzetim ve Modelleme Kesikli Olay Benzetimi İlhan AYDIN KESİKLİ-OLAY BENZETİMİ Kesikli olay benzetimi, durum değişkenlerinin zaman içinde belirli noktalarda değiştiği sistemlerin modellenmesi

Detaylı

Tesadüfi Değişken. w ( )

Tesadüfi Değişken. w ( ) 1 Tesadüfi Değişken Tesadüfi değişkenler gibi büyük harflerle veya gibi yunan harfleri ile bunların aldığı değerler de gibi küçük harflerle gösterilir. Tesadüfi değişkenler kesikli veya sürekli olmak üzere

Detaylı

Sürelerine Göre Tahmin Tipleri

Sürelerine Göre Tahmin Tipleri Girişimcilik Bölüm 5: Talep Tahmini scebi@ktu.edu.tr 5.1. Talep Tahmini Tahmin: Gelecek olayları önceden kestirme bilim ve sanatı. İstatistiksel Tahmin: Geçmiş verileri matematiksel modellerde kullanarak

Detaylı

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR Sınıflandırma Yöntemleri: Karar Ağaçları (Decision Trees) Örnek Tabanlı Yöntemler (Instance Based Methods): k en yakın komşu (k nearest

Detaylı

Ders 8: Verilerin Düzenlenmesi ve Analizi

Ders 8: Verilerin Düzenlenmesi ve Analizi Ders 8: Verilerin Düzenlenmesi ve Analizi Betimsel İstatistik Merkezsel Eğilim Ölçüleri Dağılım Ölçüleri Grafiksel Gösterimler Bir kitlenin tamamını, ya da kitleden alınan bir örneklemi özetlemekle (betimlemekle)

Detaylı

Boosting. Birol Yüceoğlu Migros T.A.Ş.

Boosting. Birol Yüceoğlu Migros T.A.Ş. Boosting Birol Yüceoğlu Migros T.A.Ş. www.veridefteri.com biroly@migros.com.tr İçerik Karar ağaçları Bagging Boosting Ana fikir Boosting vs. Bagging LightGBM Scikit-learn AdaBoost Calibration Gradient

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall

Detaylı

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 MIT OpenCourseWare http://ocw.mit.edu 14.30 Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 Bu materyale atıfta bulunmak ve kullanım koşulları için http://ocw.mit.edu/terms sayfasını ziyaret ediniz.

Detaylı

BAYES ÖĞRENMESİ BİLECİK ÜNİVERSİTESİ. Araş. Gör. Nesibe YALÇIN. Yapay Zeka-Bayes Öğrenme

BAYES ÖĞRENMESİ BİLECİK ÜNİVERSİTESİ. Araş. Gör. Nesibe YALÇIN. Yapay Zeka-Bayes Öğrenme BAYES ÖĞRENMESİ Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ Yapay Zeka-Bayes Öğrenme 1 İÇERİK Bayes Teoremi Bayes Sınıflandırma Örnek Kullanım Alanları Avantajları Dezavantajları Yapay Zeka-Bayes Öğrenme

Detaylı

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 MIT OpenCourseWare http://ocw.mit.edu 14.30 Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 Bu materyale atıfta bulunmak ve kullanım koşulları için http://ocw.mit.edu/terms sayfasını ziyaret ediniz.

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık Ders 8: Prof. Dr. İrfan KAYMAZ Tanım Tahmin (kestirim veya öngörü): Mevcut bilgi ve deneylere dayanarak olayın bütünü hakkında bir yargıya varmaktır. Bu anlamda, anakütleden çekilen

Detaylı

K En Yakın Komşu Methodu (KNearest Neighborhood)

K En Yakın Komşu Methodu (KNearest Neighborhood) K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre

Detaylı

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım 2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI 2.1. Tanım Regresyon analizi, bir değişkenin başka bir veya daha fazla değişkene olan bağımlılığını inceler. Amaç, bağımlı değişkenin kitle ortalamasını, açıklayıcı

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık KORELASYON ve REGRESYON ANALİZİ Doç. Dr. İrfan KAYMAZ Tanım Bir değişkenin değerinin diğer değişkendeki veya değişkenlerdeki değişimlere bağlı olarak nasıl etkilendiğinin istatistiksel

Detaylı

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI ÖNSÖZ İÇİNDEKİLER III Bölüm 1 İSTATİSTİK ve SAYISAL BİLGİ 11 1.1 İstatistik ve Önemi 12 1.2 İstatistikte Temel Kavramlar 14 1.3 İstatistiğin Amacı 15 1.4 Veri Türleri 15 1.5 Veri Ölçüm Düzeyleri 16 1.6

Detaylı

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız. .4. Merkezi Eğilim ve Dağılım Ölçüleri Merkezi eğilim ölçüleri kitleye ilişkin bir değişkenin bütün farklı değerlerinin çevresinde toplandığı merkezi bir değeri gösterirler. Dağılım ölçüleri ise değişkenin

Detaylı

Tahminleme Yöntemleri-2

Tahminleme Yöntemleri-2 PAU ENDÜSTRİ MÜHENDİSLİĞİ IENG 318 - Üretim Planlama ve Kontrolü 1 Tahminleme Yöntemleri-2 İçerik 1. Mevsimsel Değişim Bazlı Teknik 2. Box-Jenkins Modelleri 3. Tahmin Yöntemlerini Uygulamada Dikkat Edilmesi

Detaylı

ideal Sistem Tester Kullanım Klavuzu

ideal Sistem Tester Kullanım Klavuzu 1- Sistem Modülüne Giriş ideal Sistem Tester Kullanım Klavuzu Herhangi bir Grafik penceresinin başlığındaki S harfine basılarak açılan menüden yapılabilen seçimlerle kullanılmaya başlanır. Bu menüden,

Detaylı

009 BS 400- İstatistik sonılannın cevaplanmasında gerekli olabilecek tablolar ve formüller bu kitapçığın sonunda verilmiştir. 1. şağıdakilerden hangisi doğal birimdir? l TV alıcısı Bl Trafik kazası CL

Detaylı

Prof. Dr. Aydın Yüksel MAN 504T Yön. için Finansal Analiz & Araçları Ders: Risk-Getiri İlişkisi ve Portföy Yönetimi I

Prof. Dr. Aydın Yüksel MAN 504T Yön. için Finansal Analiz & Araçları Ders: Risk-Getiri İlişkisi ve Portföy Yönetimi I Risk-Getiri İlişkisi ve Portföy Yönetimi I 1 Giriş İşlenecek ana başlıkları sıralarsak: Finansal varlıkların risk ve getirisi Varlık portföylerinin getirisi ve riski 2 Risk ve Getiri Yatırım kararlarının

Detaylı

VERİ SETİNE GENEL BAKIŞ

VERİ SETİNE GENEL BAKIŞ VERİ SETİNE GENEL BAKIŞ Outlier : Veri setinde normal olmayan değerler olarak tanımlanır. Ders: Kantitatif Yöntemler 1 VERİ SETİNE GENEL BAKIŞ Veri setinden değerlendirme başlamadan çıkarılabilir. Yazım

Detaylı

Concept Learning. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ. Yapay Zeka - Kavram Öğrenme

Concept Learning. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ. Yapay Zeka - Kavram Öğrenme Concept Learning Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ 1 İÇERİK Öğrenme Metotları Kavram Öğrenme Nedir? Terminoloji Find-S Algoritması Candidate-Elimination Algoritması List-Then Elimination Algoritması

Detaylı

İSTATİSTİK EXCEL UYGULAMA

İSTATİSTİK EXCEL UYGULAMA İSTATİSTİK EXCEL UYGULAMA EXCEL UYGULAMA Bu bölümde Excel ile ilgili temel bilgiler sunulacak ve daha sonra İstatistiksel Uygulamalar hakkında bilgi verilecektir. İşlenecek Konular: Merkezi eğilim Ölçüleri

Detaylı

İÇİNDEKİLER 1. GİRİŞ...

İÇİNDEKİLER 1. GİRİŞ... İÇİNDEKİLER 1. GİRİŞ... 1 1.1. Regresyon Analizi... 1 1.2. Uygulama Alanları ve Veri Setleri... 2 1.3. Regresyon Analizinde Adımlar... 3 1.3.1. Problemin İfadesi... 3 1.3.2. Konu ile İlgili Potansiyel

Detaylı

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız. Örnek Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız. i. ii. X 1 2 3 4 1 2 3 4 Y 2 3 4 5 4 3 2 1 Örnek Aşağıdaki veri

Detaylı

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ 1 BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel sayma

Detaylı

Zeki Optimizasyon Teknikleri

Zeki Optimizasyon Teknikleri Zeki Optimizasyon Teknikleri Genetik Algoritma (Genetic Algorithm) Doç.Dr. M. Ali Akcayol Genetik Algoritma 1970 li yıllarda John Holland tarafından geliştirilmiştir. 1989 yılında David E. Goldberg Genetik

Detaylı

VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme

Detaylı

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( )

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( ) İKİ DEĞİŞKENLİ OLASILIK Rassal bir deneme yapılmakta ve farklı iki olay ile ilgilenilmektedir. A 1, A 2,,A i olayları bağdaşmaz ve bütünü kapsayıcıdır. B 1, B 2,,B j olayları bağdaşmaz ve bütünü kapsayıcıdır.

Detaylı

BİLGİSAYAR PROGRAMLAMA. Yrd. Doç. Dr. Beytullah EREN beren@sakarya.edu.tr 0264 295 5642

BİLGİSAYAR PROGRAMLAMA. Yrd. Doç. Dr. Beytullah EREN beren@sakarya.edu.tr 0264 295 5642 BİLGİSAYAR PROGRAMLAMA Yrd. Doç. Dr. Beytullah EREN beren@sakarya.edu.tr 0264 295 5642 EXCEL DE GRAFİK UYGULAMA GRAFİKLER Grafikler, çok sayıda verinin ve farklı veri serileri arasındaki ilişkinin anlaşılmasını

Detaylı

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme

Detaylı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Hatice NİZAM İstanbul Üniversitesi Bilgisayar Mühendisliği Bölümü haticenizam@outlook.com Saliha Sıla AKIN ERS Turizm Yazılım Şirketi, Bilgisayar

Detaylı

Örnek...4 : İlk iki sınavında 75 ve 82 alan bir öğrencinin bu dersin ortalamasını 5 yapabilmek için son sınavdan kaç alması gerekmektedir?

Örnek...4 : İlk iki sınavında 75 ve 82 alan bir öğrencinin bu dersin ortalamasını 5 yapabilmek için son sınavdan kaç alması gerekmektedir? İSTATİSTİK Bir sonuç çıkarmak ya da çözüme ulaşabilmek için gözlem, deney, araştırma gibi yöntemlerle toplanan bilgiye veri adı verilir. Örnek...4 : İlk iki sınavında 75 ve 82 alan bir öğrencinin bu dersin

Detaylı

1.58 arasındaki her bir değeri alabileceği için sürekli bir

1.58 arasındaki her bir değeri alabileceği için sürekli bir 7.SUNUM Hatırlanacağı gibi, kesikli rassal değişkenler sonlu (örneğin; 0, 1, 2,...,10) veya sayılabilir sonsuzlukta (örneğin; 0, 1, 2,...) değerler alabilmektedir. Fakat birçok uygulamada, rassal değişkenin

Detaylı

EME 3117 SİSTEM SIMÜLASYONU. Girdi Analizi. Özet İstatistikler ve Histogram (Minitab)(1) Örnek: Eczane İçin Servis Süreleri

EME 3117 SİSTEM SIMÜLASYONU. Girdi Analizi. Özet İstatistikler ve Histogram (Minitab)(1) Örnek: Eczane İçin Servis Süreleri EME 3117 1 2 Girdi Analizi SİSTEM SIMÜLASYONU Modellenecek sistemi (prosesi) dokümante et. Veri toplamak için bir plan geliştir. Veri topla. Verilerin grafiksel ve istatistiksel analizini yap. Girdi Analizi-I

Detaylı

İçindekiler. Ön Söz... xiii

İçindekiler. Ön Söz... xiii İçindekiler Ön Söz.................................................... xiii Bölüm 1 İstatistiğe Giriş....................................... 1 1.1 Giriş......................................................1

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan

Detaylı

ÜSTEL DÜZLEŞTİRME YÖNTEMİ

ÜSTEL DÜZLEŞTİRME YÖNTEMİ ÜSEL DÜLEŞİRME YÖNEMİ ÜSEL DÜLEŞİRME YÖNEMİ Bu bölüme kadar anlatılan yöntemler zaman içinde değişmeyen parametre varsayımına uygun serilerin tahminlerinde kullanılmaktaydı. Bu tür seriler deterministik

Detaylı

Prof. Dr. KARACABEY Yrd. Doç. Dr. GÖKGÖZ. Yatırım süreci beş temel aşamadan oluşmaktadır:

Prof. Dr. KARACABEY Yrd. Doç. Dr. GÖKGÖZ. Yatırım süreci beş temel aşamadan oluşmaktadır: Risk ve Getiri Konsepti Prof. Dr. Argun KARACABEY Yrd. Doç. Dr. Fazıl GÖKGÖZ 1 Yatırım süreci beş temel aşamadan oluşmaktadır: 1.Yatırım Politikasının belirlenmesi,.menkul kıymet analizinin yapılması,

Detaylı

Nedensel Modeller Y X X X

Nedensel Modeller Y X X X Tahmin Yöntemleri Nedensel Modeller X 1, X 2,...,X n şeklinde tanımlanan n değişkenin Y ile ilgili olmakta; Y=f(X 1, X 2,...,X n ) şeklinde bir Y fonksiyonu tanımlanmaktadır. Fonksiyon genellikle aşağıdaki

Detaylı

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

rasgele değişkeninin olasılık yoğunluk fonksiyonu, 3.6. Bazı Sürekli Dağılımlar 3.6.1 Normal Dağılım Normal dağılım hem uygulamalı hem de teorik istatistikte kullanılan oldukça önemli bir dağılımdır. Normal dağılımın istatistikte önemli bir yerinin olmasının

Detaylı

İSTATİSTİK STATISTICS (2+0) Yrd.Doç.Dr. Nil TOPLAN SAÜ.MÜH. FAK. METALURJİ VE MALZEME MÜH. BÖLÜMÜ ÖĞRETİM ÜYESİ ÖĞRETİM YILI

İSTATİSTİK STATISTICS (2+0) Yrd.Doç.Dr. Nil TOPLAN SAÜ.MÜH. FAK. METALURJİ VE MALZEME MÜH. BÖLÜMÜ ÖĞRETİM ÜYESİ ÖĞRETİM YILI İSTATİSTİK STATISTICS (+) Yrd.Doç.Dr. Nil TOPLAN SAÜ.MÜH. FAK. METALURJİ VE MALZEME MÜH. BÖLÜMÜ ÖĞRETİM ÜYESİ ÖĞRETİM YILI KONU BAŞLIKLARI :. İSTATİSTİĞE GİRİŞ. VERİLERİN DÜZENLENMESİ. MERKEZİ EĞİLİM ÖLÇÜLERİ.

Detaylı

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ 1 BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel

Detaylı

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir. BÖLÜM 1: FREKANS DAĞILIMLARI 1.1. Giriş İstatistik, rasgelelik içeren olaylar, süreçler, sistemler hakkında modeller kurmada, gözlemlere dayanarak bu modellerin geçerliliğini sınamada ve bu modellerden

Detaylı

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN Tanımlayıcı İstatistikler Yrd. Doç. Dr. Emre ATILGAN 1 Tanımlayıcı İstatistikler Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri 2 3 Aritmetik Ortalama Aritmetik ortalama,

Detaylı

Veriye Dayalı Karar Verme (Bölüm 2) Can Akkan

Veriye Dayalı Karar Verme (Bölüm 2) Can Akkan Veriye Dayalı Karar Verme (Bölüm 2) Can Akkan 1 Ders Planı 1. Karar Problemleri i. Karar problemlerinin bileşenleri ii. Değerler, amaçlar, bağlam iii. Etki diagramları 2. Model Girdilerinde Belirsizlik

Detaylı

Merkezi Eğilim ve Dağılım Ölçüleri

Merkezi Eğilim ve Dağılım Ölçüleri Merkezi Eğilim ve Dağılım Ölçüleri Soru Öğrencilerin derse katılım düzeylerini ölçmek amacıyla geliştirilen 16 soruluk bir test için öğrencilerin ilk 8 ve son 8 soruluk yarılardan aldıkları puanlar arasındaki

Detaylı

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37 İÇİNDEKİLER BÖLÜM 1 Değişkenler ve Grafikler 1 İstatistik 1 Yığın ve Örnek; Tümevarımcı ve Betimleyici İstatistik 1 Değişkenler: Kesikli ve Sürekli 1 Verilerin Yuvarlanması Bilimsel Gösterim Anlamlı Rakamlar

Detaylı

Matematik Ders Notları. Doç. Dr. Murat Donduran

Matematik Ders Notları. Doç. Dr. Murat Donduran Matematik Ders Notları Doç. Dr. Murat Donduran Mart 18, 28 2 İçindekiler 1 Tanımlı Integral Uygulamaları 5 1.1 Olasılık.............................. 5 3 4 İÇINDEKILER Bölüm 1 Tanımlı Integral Uygulamaları

Detaylı

Kesikli Şans Değişkenleri İçin; Olasılık Dağılımları Beklenen Değer ve Varyans Olasılık Hesaplamaları

Kesikli Şans Değişkenleri İçin; Olasılık Dağılımları Beklenen Değer ve Varyans Olasılık Hesaplamaları Kesikli Şans Değişkenleri İçin; Olasılık Dağılımları Beklenen Değer ve Varyans Olasılık Hesaplamaları 1 Şans Değişkeni: Bir dağılışı olan ve bu dağılışın yapısına uygun frekansta oluşum gösteren değişkendir.

Detaylı

Mühendislikte İstatistik Yöntemler

Mühendislikte İstatistik Yöntemler .0.0 Mühendislikte İstatistik Yöntemler İstatistik Parametreler Tarih Qma.3.98 4..98 0.3.983 45 7..984 37.3.985 48 0.4.986 67.4.987 5 0.3.988 45.5.989 34.3.990 59.4.99 3 4 34 5 37 6 45 7 45 8 48 9 5 0

Detaylı

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik 6.SUNUM İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik özellikleri (ortalama, varyans v.b. gibi) hakkında

Detaylı

MATEMATiKSEL iktisat

MATEMATiKSEL iktisat DİKKAT!... BU ÖZET 8 ÜNİTEDİR BU- RADA İLK ÜNİTE GÖSTERİLMEKTEDİR. MATEMATiKSEL iktisat KISA ÖZET KOLAY AOF Kolayaöf.com 0362 233 8723 Sayfa 2 içindekiler 1.ünite-Türev ve Kuralları..3 2.üniteTek Değişkenli

Detaylı

1. GİRİŞ Kılavuzun amacı. Bu bölümde;

1. GİRİŞ Kılavuzun amacı. Bu bölümde; 1. GİRİŞ Bu bölümde; Kılavuzun amacı EViews Yardım EViews Temelleri ve Nesneleri EViews ta Matematiksel İfadeler EViews Ana Ekranındaki Alanlar 1.1. Kılavuzun amacı Ekonometri A. H. Studenmund tarafından

Detaylı

BARKOD SİSTEMİ (Çizgi İm)

BARKOD SİSTEMİ (Çizgi İm) BARKOD SİSTEMİ (Çizgi İm) Hepimiz günde en az bir kere ihtiyacımız olan herhangi bir ürünü almak için bakkala veya markete gideriz. Aldığımız her ürünün üzerinde değişik kalınlıktaki çizgilerden oluşan

Detaylı

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1 3. TAHMİN 3.1. En Küçük Kareler (EKK) Yöntemi 1 En Küçük Kareler (EKK) yöntemi, regresyon çözümlemesinde en yaygın olarak kullanılan, daha sonra ele alınacak bazı varsayımlar altında çok aranan istatistiki

Detaylı

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ - 150110046 İÇERİK Uygulama ve uygulamaya ilişkin temel kavramların tanıtımı Uygulamanın yapısı Ön yüz Veritabanı Web Servisler K-Means Algoritması ile kategori

Detaylı

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ Akış Makine Öğrenmesi nedir? Günlük Hayatımızdaki Uygulamaları Verilerin Sayısallaştırılması Özellik Belirleme Özellik Seçim Metotları Bilgi Kazancı (Informaiton Gain-IG) Sinyalin Gürültüye Oranı: (S2N

Detaylı

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü Mühendislikte İstatistiksel Yöntemler Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü 1 Araştırma sonuçlarının açıklanmasında frekans tablosu

Detaylı

BÖLÜM 1 GİRİŞ: İSTATİSTİĞİN MÜHENDİSLİKTEKİ ÖNEMİ

BÖLÜM 1 GİRİŞ: İSTATİSTİĞİN MÜHENDİSLİKTEKİ ÖNEMİ BÖLÜM..AMAÇ GİRİŞ: İSTATİSTİĞİ MÜHEDİSLİKTEKİ ÖEMİ Doğa bilimlerinde karşılaştığımız problemlerin birçoğunda olaydaki değişkenlerin değerleri bilindiğinde probleme kesin ve tek bir çözüm bulunabilir. Örneğin

Detaylı

YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT

YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ Umut FIRAT ufirat@yahoo.com Öz: Depremler yeryüzünde en çok yıkıma neden olan doğal afetlerdir. Bu durum, depremlerin önceden tahmin edilmesi fikrini

Detaylı

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH ORTALAMA ÖLÇÜLERİ Ünite 6 Öğr. Gör. Ali Onur CERRAH Araştırma sonucunda elde edilen nitelik değişkenler hakkında tablo ve grafikle bilgi sahibi olunurken, sayısal değişkenler hakkında bilgi sahibi olmanın

Detaylı

Ders 1: Markov Zincirleri YÖNEYLEM ARAŞTIRMASI III. Markov Süreçleri Ders 4. Stokastik Süreç Nedir? Stokastik Süreç Nedir?

Ders 1: Markov Zincirleri YÖNEYLEM ARAŞTIRMASI III. Markov Süreçleri Ders 4. Stokastik Süreç Nedir? Stokastik Süreç Nedir? Ders : Markov Zincirleri YÖNEYLEM ARAŞTIRMASI III Markov Süreçleri Ders 4 Yrd. Doç. Dr. Beyazıt Ocaktan E-mail: bocaktan@gmail.com Ders İçerik: nedir? Markov Zinciri nedir? Markov Özelliği Zaman Homojenliği

Detaylı

MAK 210 SAYISAL ANALİZ

MAK 210 SAYISAL ANALİZ MAK 210 SAYISAL ANALİZ BÖLÜM 5- SONLU FARKLAR VE İNTERPOLASYON TEKNİKLERİ Doç. Dr. Ali Rıza YILDIZ MAK 210 - Sayısal Analiz 1 İNTERPOLASYON Tablo halinde verilen hassas sayısal değerler veya ayrık noktalardan

Detaylı

MIT OpenCourseWare http://ocw.mit.edu. 14.30 Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

MIT OpenCourseWare http://ocw.mit.edu. 14.30 Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 MIT OpenCourseWare http://ocw.mit.edu 14.30 Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 Bu materyale atıfta bulunmak ve kullanım koşulları için http://ocw.mit.edu/terms sayfasını ziyaret ediniz.

Detaylı

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir. Koşullu Öngörümleme Ex - ante (tasarlanan - umulan) öngörümleme söz konusu iken açıklayıcı değişkenlerin hatasız bir şekilde bilindiği varsayımı gerçekçi olmayan bir varsayımdır. Çünkü bazı açıklayıcı

Detaylı

İSTATİSTİKSEL VERİ ANALİZİ

İSTATİSTİKSEL VERİ ANALİZİ İSTATİSTİKSEL VERİ ANALİZİ Prof. Dr. Gül ERGÜN Hacettepe Üniversitesi Kasım 2013 İstatistik Nedir? İSTATİSTİK Belirli bir konuda toplanan sayısal değerlerdir. Buna göre, 2012 yılında Türkiye de kayıtlı

Detaylı

ZAMAN SERİLERİNDE REGRESYON ANALİZİ

ZAMAN SERİLERİNDE REGRESYON ANALİZİ ZAMAN SERİLERİNDE REGRESYON ANALİZİ 1 1. GİRİŞ Trent, serinin genelinde yukarıya ya da aşağıya doğru olan hareketlere denmektedir. Bu hareket bazen düz bir doğru şeklinde olmaktadır. Bu tür harekete sahip

Detaylı

İSTATİSTİK I KISA ÖZET KOLAYAOF

İSTATİSTİK I KISA ÖZET KOLAYAOF DİKKATİNİZE: BURADA SADECE ÖZETİN İLK ÜNİTESİ SİZE ÖRNEK OLARAK GÖSTERİLMİŞTİR. ÖZETİN TAMAMININ KAÇ SAYFA OLDUĞUNU ÜNİTELERİ İÇİNDEKİLER BÖLÜMÜNDEN GÖREBİLİRSİNİZ. İSTATİSTİK I KISA ÖZET KOLAYAOF 2 Kolayaof.com

Detaylı

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir. 4.SUNUM Genel olarak test istatistikleri Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri olmak üzere 2 grupta incelenebilir. 2 Ranj Çeyrek Kayma Çeyrekler Arası Açıklık Standart Sapma Varyans

Detaylı

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Yrd. Doç. Dr. Emre ATILGAN 1 RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Olasılığa ilişkin olayların çoğunluğunda, deneme sonuçlarının bir veya birkaç yönden incelenmesi

Detaylı

Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti

Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr

Detaylı

2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21

2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21 İçindekiler Önsöz İkinci Basım için Önsöz Türkçe Çeviri için Önsöz Gösterim xiii xv xvii xix 1 Giriş 1 1.1 Yapay Öğrenme Nedir?......................... 1 1.2 Yapay Öğrenme Uygulamalarına Örnekler...............

Detaylı

İstatistik 1. Bölüm 5 Olasılık Teorisi ve Kesikli Olasılık Dağılımları. Ankara Üniversitesi SBF, GYY

İstatistik 1. Bölüm 5 Olasılık Teorisi ve Kesikli Olasılık Dağılımları. Ankara Üniversitesi SBF, GYY İstatistik 1 Bölüm 5 Olasılık Teorisi ve Kesikli Olasılık Dağılımları Bu Bölümde İşlenecek Konular Temel Olasılık Teorisi Örnek uzayı ve olaylar, basit olasılık, birleşik olasılık Koşullu Olasılık İstatistiksel

Detaylı