KARAR AĞAÇLARI SÜMEYYE ÖZKAN BAHAR BAKAR İZEL KOLCU

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "KARAR AĞAÇLARI SÜMEYYE ÖZKAN BAHAR BAKAR İZEL KOLCU"

Transkript

1 KARAR AĞAÇLARI SÜMEYYE ÖZKAN BAHAR BAKAR İZEL KOLCU

2 NEDİR? Karar ağaçları ve karar ağaç algoritmaları Karar ağaçları; sınıflandırma ve tahmin için sıkça kullanılan ağaç şekilli bir karar yapısı çeşididir.

3 Yorum: Basit karar verme adımları uygulanarak büyük miktarlardaki kayıtları çok küçük kayıt gruplarına bölerek kullanılan bir yapıdır.

4 NEDEN KULLANILIR? Veri madenciliğinde karar ağacı kuruluşlarının kolay olması, yorumlarının kolay olması, veri tabanı sistemlerine kolayca entegre edilebilmeleri, güvenilir olması nedenleri ile en çok kullanıma sahip sınıflandırma tekniğidir.

5 Karar ağaçları, tahmin ediciler ve hedef değişkeni arasındaki ilişkileri kullanarak veriyi alt gruplara ayırır. Karar ağaçlarında temel fikir, giriş verisinin bir kümeleme algoritması yardımıyla tekrar tekrar gruplara bölünmesine dayanır. Grubun tüm elemanları aynı sınıf etiketine sahip olana dek kümeleme işlemi devam eder. Karar ağaçları algoritmaları: C5.0 CHAID C&RT (CART) DECİSİON LİST ID3 QUEST

6 Karar ağacı tekniğini kullanarak verinin sınıflandırılması; Öğrenme Önceden bilinen bir verinin model oluşturmak amacıyla sınıflama algoritması tarafından analizidir. Model sınıflama kuralları veya karar ağacı olarak gösterilir. Sınıflama Test verisi sınıflama kurallarının veya karar ağacının doğruluğunu belirlemek için kullanılır. Doğruluk kabul edilebilir ise kuralları yeni verilerin sınıflaması amacıyla kullanılır.

7 C5.0 Algoritması En yaygın kullanılan karar ağacı algoritması ID3 algoritmasının geliştirilmiş hali C4.5 algoritmasının geliştirilmiş halidir ve özellikle büyük veri setleri için kullanılır. C5.0 algoritması, doğruluğu arttırmak için boosting algoritmasını kullanır, boosting ağaçları olarak da bilinir.

8 Sadece sembolik(kategori k) tipteki hedef değişkenlerini kullanır. Kayıp tahmin edici değerlerinin elde edilmesinde parçalama yöntemini kullanır. ÖZELLİKLERİ Tahmin ediciler kırılma noktası olarak belirlendiğinde çok sayıda alt gruba bölünmesine izin verir. Tahmin edicinin seçimi için bilgi kuramı ölçüsü(entropi) kullanılır. Ağaçları aşırı şekilde büyüyebilir ve sonra budanabilir. Bu sayede karar ağacı anlaşılır olur

9 C5.0 algoritması kullanılırken modellemeden önce, veriler Type işlemcisinden geçirilmelidir. Nedeni; Tüm modelleme işlemcilerinin tür bilgilerini, model kurulması sırasında kullanılmasıdır. Hangi değişkenin tahmin edici hangilerinin hedef değişkeni olduğu belirlenmelidir.

10 Aynı veri üzerinde birden fazla model kurulur. Model süreçleri ile ilgili daha ileri seviyeli özellikler ve parametreler tanımlamak için kullanılır. C5.0 işlemcisine ve üretilecek model işlemlerine manuel isim verilir. Auto seçeneğini seçildiğinde otomatik olarak hedef değişkenin ismi verilir. Oluşturulacak model sonuçlarının hangi formatta olacağı belirlenir. Varsayılan olarak seçilmiş durumda bulunur. Eğer model öncesinde veri seti test ve train olarak ikiye ayrılmışsa model geliştirirken sadece train grubunda bulunan kayıtların kullanılmasını sağlar. Seçilmediği durumda veri seti ikiye bölünmüş olsa bile, model tüm veri seti kullanılarak geliştirilir. Kurulan modelin doğruluğunu test etmek için kullanılır. Bu seçenek seçilirse, C5.0 benzer kategorileri birleştirir ve okutulacak kural sayısını azaltır.

11 Accuary: C5.0 algoritması en doğru ve geçerli sonuçları veren bir karar ağacı oluşturmaya çalışır.alternatif olarak Generality özelliği ile olumsuz etki ortadan kaldırılabilir. Expected Noise: Veri içerinde olması beklenen hatalı, tutarsız veya yanlış değer oranı C5.0 algoritmasına belirtilir. Minimum records per child branch: C5.0 algoritmasının ağaç yapısı gelişiminin her bir dalında en az iki gözlem bulunana kadar devam etmesine imkan verir. Model Manager penceresinde modelin sonucunu görmek için, C5.0 modeline sağ tıklanır ve Browse seçilir.

12 Entropi (Bilgi Kazancı) Ayırt edici niteliği belirlemek için her nitelik için bilgi kazancı ölçülür. Bilgi Kazancı ölçümünde Entropi kullanılır. Entropi rastgeleliği, belirsizliği ve beklenmeyen durumun ortaya çıkma olasılığını gösterir.

13 HAFTASONU ÖRNEĞİ: 1. Adım: Veri setinden T öğrenme kümesi oluşturulur.

14 Haftasonu veri kümesindeki (T kümesi) 10 örnekten 6 örnek için karar sinema 2 örnek için karar tenis oynamak 1 örnek için karar evde kalmak ve 1 örnek için karar alışverişe gitmek olduğuna göre Entropy: H(T)= - (6/10) log 2 (6/10) - (2/10) log 2 (2/10) - (1/10) log 2 (1/10) - (1/10) log 2 (1/10) H(T)= 1,571

15 A niteliğinin T veri kümesindeki bilgi kazancı: Gain(T,A)=Entropy(T)-Σ P(v) Entropy(T(v)) v: Values of A P(v)= T(v) / T

16 Gain(T, weather)=? Sunny=3 (1 Cinema, 2 Tennis) Windy=4 (3 Cinema, 1 Shopping) Rainy=3 (2 Cinema, 1 Stay in) Entropy(T sunny )= - (1/3) log 2 (1/3) - (2/3) log 2 (2/3)=0,918 Entropy(T windy )= - (3/4) log 2 (3/4) - (1/4) log 2 (1/4) =0,811 Entropy(T rainy )= - (2/3) log 2 (2/3) - (1/3) log 2 (1/3) =0,918 Gain(T, weather) = Entropy(T)- ((P(sunny)Entropy(T sunny ) + P(windy) Entropy(T windy )+ P(rainy) Entropy(T rainy ) ) =1,571- ((3/10)Entropy(T sunny )+(4/10)Entropy(T windy )+ (3/10)Entropy(T rainy )) Gain(T, weather) =0,70

17 Gain(T, parents)=? Yes=5 (5 Cinema) No =5 (2 Tennis, 1 Cinema, 1 Shopping, 1 Stay in) Entropy(T yes )= - (5/5) log 2 (5/5) = 0 Entropy(T no )= - (2/5) log 2 (2/5) - 3(1/5) log 2 (1/5) =1,922 Gain(T, parents) = Entropy(T)- ((P(yes)Entropy(T yes ) + P(no) Entropy(T no )) Gain(T, parents)=0,61 =1,571- ((5/10)Entropy(T yes )+(5/10)Entropy(T no ))

18 Gain(T, money)=? Rich=7 (3 Cinema, 2 Tennis, 1 Shopping, 1 Stay in) Poor=3 (3 Cinema) Entropy(T rich )= 1,842 Entropy(T poor )= 0 Gain(T, money) = Entropy(T)- ((P(rich)Entropy(T rich ) + P(poor) Entropy(T poor )) Gain(T, money)=0,2816 =1,571- ((7/10)Entropy(T rich )+(3/10)Entropy(T poor ))

19 Gain(T, weather) =0,70 Gain(T, parents)=0,61 Gain(T, money)=0,2816 Weather özelliği en büyük bilgi kazancını sağladığı için ağacın kökünde yer alacak özellik olarak seçilir. Bu özellik en ayırt edici özellik olarak bulunmuş olur.

20 3. Adım: Ağacın alt düğümü olan A düğümüne ait alt veri kümesi belirlenir. Her alt küme için tekrar bilgi kazancı hesaplanarak en ayırt edici özellik belirlenir.

21 Yeni düğüm için en ayırt edici özellik Parents olarak belirlenmiştir. Bu işlemler her düğüm için aşağıdaki durumlardan biri oluşuncaya kadar devam eder Örneklerin hepsi aynı sınıfa ait Örnekleri bölecek özellik kalmamış Kalan özelliklerin değerini taşıyan örnek yok

22 CHAID Algoritması Optimal bölünmelerin teşhisi için ki-kare istatistiğini kullanan bir yöntemdir. Bölümlendirme amaçlı kullanılır.

23 Nasıl İşler? İstatistiksel bir testin anlamlılığını kullanarak bir potansiyel ön kestirici değişkenin tüm değerlerini değerlendirir. Hedef değişkene göre homojen olarak değerlendirilen tüm değerleri birleştirir ve diğer tüm değerleri heterojen olarak değerlendirir. Karar ağacındaki ilk dalın formuna göre en iyi ön kestirici değişkenin seçilmesiyle, her bir düğümün seçilen değişkenin homojen değerlerinin bir grubunu oluşturmasını sağlar. Kategoriler, anlamlı bir şekilde birleştirildikten sonra tablolar oluşturulur ve x 2 istatistikleri hesaplanır. Veriler birbirleriyle karşılaştırılıp kategorilere göre alt gruplara ayrılır. Bu süreç, ağaç tamamıyla büyüyene kadar sürer.

24 CHAID ile diğer algoritmalar arasındaki en önemli farklılıklardan birisi, ağacın yapraklarının ikili değil verideki farklı yapı sayısı kadar dallanmasıdır. Bu özelliği nedeniyle, daha fazla alt gruplarla değerlendirme yapmak ve daha homojen gruplardan sonuç çıkarmak mümkün olacaktır.

25 C5.0 algoritmasında bulunan budama yoktur. Burada dallardaki nodların büyümesi sınırlandırılabilir. Özellikleri İnteraktif olarak ağacı adım adım büyütme olanağı sağlar. Tuvalde Type işlemcisine bağlanır. Hem sembolik hem de sayısal tipteki hedef değişkenleri kullanılır. Kayıp tahmin edici değerlerini ayrı bir kategori yaparak ağaç oluşumunda kullanılmasına izin verir.

26 Exhaustive CHAID veya CHAID algoritmalarından birini seçebiliriz. Exhaustive CHAID, klasik CHAID algoritmasında bulunan bazı zayıflıkları ortadan kaldıran bir algoritmadır. Model geliştirme sürecini tamamen kullanıcının yönlendirebileceği bir şekilde model geliştirilmesine imkan verir.. Generate model seçeneği seçildiğinde model, belirlenen kriterler çerçevesinde otomatik olarak genişletilir. Bu algoritmayı kullanarak iki farklı şekilde model oluşturabiliriz. Oluşturulacak ağacın derinliği sınırlandırılır. Varsayılan değeri 5 tir. Not: kayıp değerleri modellemeye dahil eden tek algoritma budur.

27 CHAID, tahmin edicileri belirlemek için ki kare testini kullanır. En düşük p değerine sahip değişkeni seçerek ağacı geliştirir. Seçilen tahminci değişken 2 den fazla kategoriye sahipse, algoritma bu kategorilerin her birinin hedef değişken üzerindeki etkisini araştırır ve hedef değişken üzerinde etkisi olmayan kategorileri birleştirir. Bu kategori birleştirme işlemi geriye kalan tüm değişken kategorileri, belirlenen (Alpha for Merging) anlamlılık seviyesinde hedef değişken üzerinde etkili olduğunda sona erer. Bu bölünme işlemini yönetmek için ise Allow splitting of merged categories özelliği kullanılır.

28 C&R TREE Algoritması AID adlı karar ağacı algoritmasının devamı niteliğindedir. Sınıflandırma ve regresyon problemlerinde bir çözüm olarak kullanılabilir. İkili olarak özyinelemeli biçimde bölünen bir yapıya sahiptir. Dallanma kriteri olarak Gini indeksinden yararlanır. Kuruluş aşamasında herhangi bir durma kuralı olmaksızın sürekli olarak bölünerek büyümektedir. Yeni bir bölünmenin gerçekleşmeyeceği durumda, uçtan köke doğru budama işlemi başlatılır.

29 Hem sembolik hem de sayısal tipteki hedef değişkenleri için kullanılır. Özellikleri Algoritma kullanıldığında ağaçlar aşırı şekilde büyüyebilir ve sonra budanabilir. Kayıp tahmin edici değerlerinin ele alınmasında vekil tahmin edicileri kullanır. Algoritmanın parametrik olmaması esnek olması ve kayıp değerleri de içermesinden dolayı kullanışlı yöntemdir. Sadece ikili duruma göre karar vermesi ve işlem süresinin uzun sürmesi zayıf noktalarıdır. Vekil değişken demek ilgili değişkenle en yüksek ilişkiye sahip değişken demektir.

30 Nasıl kullanılır? otomatik model oluşturulabilir tüm model gelişim sürecini kendimiz yönetebiliriz. Elde edilen ağaç seviyesi burada yazılı değerden küçük olabilir, bunun nedeni ağacı geliştirirken farklı durdurma kuralları tanımlanabilmesi ve budama işlemi gerçekleştirilmesidir.

31 Üç farklı saflık katsayısıdır. Budama işlemini aktivite eder. Risk tahmini değerine göre en basit ağacın seçilmesi sağlanır. Multiplier parametresi, sonuçta elde edilen ağaç ile en küçük riskli ağaç arasındaki risk tahmininde kaç standart hata farkına izin verileceğini belirler. Bu değer ne kadar artırılırsa gerçekleşen budama o kadar şiddetli olacaktır.

32 GİNİ İNDEKSİ Bütün değişkenlerin sürekli olduğu varsayılır Her değişken için mümkün olan birçok ayrımın olduğu varsayılır Değişkenlerin ayrım noktaları için gruplama gibi diğer araçlara ihtiyaç duyulabilir Kategorik değişkenler için kullanıldığında değiştirilmelidir

33 ÖRNEK:

34

35

36

37

38

39 Karar Ağaçlarının Avantajları Zahmetsiz ve güvenilirdir. Maliyeti düşüktür. Anlaşılabilir kurallar oluşturulabilir. Sürekli ve kesikli nitelik değerleri için kullanılabilir. Hem sayısal hem de sınıfsal verilerin işlenmesi için kullanılabilir. Çoğu alternatif tekniklere göre çok az işlem ile veri kullanılabilir hale gelir.

40 DEZAVANTAJLARI Zaman ve yer karmaşıklığı vardır. Hem ağaç oluşturma karmaşıklığı hem de ağaç budama karmaşıklığı fazladır. Büyük ağaçların yorumlanması güçtür. Sınıf sayısı fazla ve öğrenme kümesi örnekleri sayısı az olduğunda model oluşturma çok başarılı değildir. Eksik veri yanlış modellemeye sebep olabilir.

41 Karar ağaçların karşılaştırılması Tüm karar ağacı algoritmaları tahmin edici değişkenleri kullanarak hedef değişkeni tahmin edecek karar ağacı yapısı ortaya koymaya çalışır. Farkları ise, bu tahminleri gerçekleştirirken kullandıkları yöntemlerin farklı olmasıdır. Algoritmaların tahmin edici değişken seçiminde kullandıkları kriterler birbirinden farklı olduğu için çoğu zaman bu algoritmalardan elde edilen ağaçlarının yapıları farklıdır. Buna rağmen, hedef değişken üzerinde etkili olan tüm değişkenler tüm algoritmalarla elde edilen ağaç yapısına dâhildir. Tahmin edici değişken seçiminde CHAID istatistiksel yöntemler kullanır. C5.0 ve C&RT istatiksel olmayan yöntemler kullanır.

42 Vekil değişken demek ilgili değişkenle en yüksek ilişkiye sahip değişken demektir. Model Kriteri C5.0 CHAID C&R Tree Bölünme Tipi Çoklu Çoklu İkili Sürekli Hedef Değişken Hayır Evet Evet Sürekli Tahmin Edici Değişken Evet Evet Evet Kategorik Tahmin Edici Değişken Evet Evet Evet Kategorik Hedef Değişken Evet Evet Evet Tahminci Seçim Kriteri Bilgi Ölçüsü Ki-Kare F testi Inpurity Ölçüsü İnteraktif Ağaç Özelliği Yok Var Var

43 Karar Ağaçlarının Uygulama Alanları Türkiye de yerli ve yabancı ticaret bankalarının finansal etkinliğe göre sınıflandırılması Sektörlerde personel seçimi ve performans değerlendirmesi Türkiye de turistlerin hangi şehir ve otelleri tercih ettiği Kredi geçmişlerinin kullanılmasıyla bireylere ilişkin kredi kararlarının verilmesi Yeni satış stratejilerin belirlenmesi Tıp ile ilgili gözlem verileri dikkate alınarak en etkin kararların verilmesi Satışları hangi değişkenlerin etkilediğinin belirlenmesi İşletmeye en faydalı olan bireylerin özelliklerinin kullanılma ile işe alma süreçlerinin belirlenmesi

44 BUDAMA Bir ağaç oluşturulduktan sonra, istenmeyen alt ağaçlar veya düğümler bulunabilir. Budama işlemi ile bunlar çıkarılarak karar ağacı daha genel bir biçimde ifade edilebilmektedir.

45 Bölme Bu işlem, verilerin daha küçük alt kümelere ayrılmasını sağlayan tekrarlı bir süreçtir. İlk tekrar tüm veriyi içeren kök düğüm ile başlar. Bundan sonraki tekrarlar, verinin alt kümelerini içeren üretilmiş düğümler üzerinde işlem yapmaktadır. Her bölme işleminde, değişkenler analiz edilir ve en iyi bölme seçilir.

46 DURDURMA Durdurma kuralları genellikle, maksimum ağaç derinliği, bir düğümde bölme için ele alınan minimum eleman sayısı ve yeni bir düğümde olması gereken minimum eleman sayısı gibi çeşitli faktörlere dayanır.

47 TEŞEKKÜRLER

tree) nedir? Karar Ağacı (Decision Decisiontree

tree) nedir? Karar Ağacı (Decision Decisiontree Karar Ağacı (Decision Decisiontree tree) nedir? Bir işletme yönetimi tarafından tercihlerin, risklerin, kazançların, hedeflerin tanımlanmasında yardımcı olabilen ve birçok önemli yatırım alanlarında uygulanabilen,

Detaylı

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticisiz (unsupervised) öğrenme: Kümeleme (clustering) Hangi nesnenin hangi

Detaylı

YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA

YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA Makine Öğrenmesi Çok büyük miktardaki verilerin elle işlenip analiz edilmesi mümkün değildir. Bu tür problemlere çözüm bulmak amacıyla makine öğrenmesi

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Sınıflandırma yöntemleri Karar ağaçları ile sınıflandırma Entropi Kavramı ID3 Algoritması C4.5

Detaylı

Makine Öğrenmesi 3. hafta

Makine Öğrenmesi 3. hafta Makine Öğrenmesi 3. hafta Entropi Karar Ağaçları (Desicion Trees) ID3 C4.5 Sınıflandırma ve Regresyon Ağaçları (CART) Karar Ağacı Nedir? Temel fikir, giriş verisinin bir kümeleme algoritması yardımıyla

Detaylı

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir sınıflandırma: temel kavramlar, karar ağaçları ve model değerlendirme Sınıflandırma : Tanım Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir Eğitim setindeki her kayıt

Detaylı

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme

Detaylı

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ 127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi

Detaylı

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan

Detaylı

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine

Detaylı

İçindekiler. Ön Söz... xiii

İçindekiler. Ön Söz... xiii İçindekiler Ön Söz.................................................... xiii Bölüm 1 İstatistiğe Giriş....................................... 1 1.1 Giriş......................................................1

Detaylı

YZM ALGORİTMA ANALİZİ VE TASARIM DERS#9: AÇGÖZLÜ ALGORİTMALAR

YZM ALGORİTMA ANALİZİ VE TASARIM DERS#9: AÇGÖZLÜ ALGORİTMALAR YZM 3207- ALGORİTMA ANALİZİ VE TASARIM DERS#9: AÇGÖZLÜ ALGORİTMALAR Aç Gözlü (Hırslı) Algoritmalar (Greedy ) Bozuk para verme problemi Bir kasiyer 48 kuruş para üstünü nasıl verir? 25 kuruş, 10 kuruş,

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall

Detaylı

Veri Madenciliği Karar Ağacı Oluşturma

Veri Madenciliği Karar Ağacı Oluşturma C4.5 Algoritması Veri Madenciliği Karar Ağacı Oluşturma Murat TEZGİDER 1 C4.5 Algoritması ID3 algoritmasını geliştiren Quinlan ın geliştirdiği C4.5 karar ağacı oluşturma algoritmasıdır. ID3 algoritmasında

Detaylı

Uzaktan Algılama Uygulamaları

Uzaktan Algılama Uygulamaları Aksaray Üniversitesi Uzaktan Algılama Uygulamaları Doç.Dr. Semih EKERCİN Harita Mühendisliği Bölümü sekercin@aksaray.edu.tr 2010-2011 Bahar Yarıyılı Uzaktan Algılama Uygulamaları GÖRÜNTÜ İŞLEME TEKNİKLERİ

Detaylı

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data

Detaylı

VERİ MADENCİLİĞİNDE KARAR AĞACI ALGORİTMALARI İLE BİLGİSAYAR VE İNTERNET GÜVENLİĞİ ÜZERİNE BİR UYGULAMA

VERİ MADENCİLİĞİNDE KARAR AĞACI ALGORİTMALARI İLE BİLGİSAYAR VE İNTERNET GÜVENLİĞİ ÜZERİNE BİR UYGULAMA Endüstri Mühendisliði Dergisi Cilt: 5 Sayý: 3-4 Sayfa: (-19) Makale VERİ MADENCİLİĞİNDE KARAR AĞACI ALGORİTMALARI İLE BİLGİSAYAR VE İNTERNET GÜVENLİĞİ ÜZERİNE BİR UYGULAMA Aslı ÇALIŞ, Sema KAYAPINAR*,

Detaylı

YZM 3217 YAPAY ZEKA DERS#10: KÜMELEME

YZM 3217 YAPAY ZEKA DERS#10: KÜMELEME YZM 317 YAPAY ZEKA DERS#10: KÜMELEME Sınıflandırma (Classification) Eğiticili (supervised) sınıflandırma: Sınıflandırma: Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğunu bilinir Eğiticisiz (unsupervised)

Detaylı

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 ) 4. SUNUM 1 Gözlem ya da deneme sonucu elde edilmiş sonuçların, rastlantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel yöntemlere HİPOTEZ TESTLERİ denir. Sonuçların rastlantıya bağlı

Detaylı

Örnek 02: Amaç: Şekil Wizard yardımıyla yeni proje açılması.

Örnek 02: Amaç: Şekil Wizard yardımıyla yeni proje açılması. Örnek 02: Amaç: Bu çalışmadaki amaç, şarap oluşumunda ve sonrasında oluşan kimyasal maddelerin şarap tadıcılarının değerlendirmelerine nasıl bir etkide bulunduğunu tespit etmek ve bu tespitler sonucunda

Detaylı

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ 1 İstatistik İstatistik, belirsizliğin veya eksik bilginin söz konusu olduğu durumlarda çıkarımlar yapmak ve karar vermek için sayısal verilerin

Detaylı

Gözetimli & Gözetimsiz Öğrenme

Gözetimli & Gözetimsiz Öğrenme Bölüm 5. Sınıflandırma 1 http://ceng.gazi.edu.tr/~ozdemir Gözetimli & Gözetimsiz Öğrenme Predictive Data Mining vs. Descriptive Data Mining Gözetimli (Supervised) öğrenme= sınıflandırma (clasification)

Detaylı

ortalama ve ˆ ˆ, j 0,1,..., k

ortalama ve ˆ ˆ, j 0,1,..., k ÇOKLU REGRESYONDA GÜVEN ARALIKLARI Regresyon Katsayılarının Güven Aralıkları y ( i,,..., n) gözlemlerinin, xi ortalama ve i k ve normal dağıldığı varsayılsın. Herhangi bir ortalamalı ve C varyanslı normal

Detaylı

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ 1 BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel

Detaylı

Algoritmalar. Sıralama Problemi ve Analizi. Bahar 2017 Doç. Dr. Suat Özdemir 1

Algoritmalar. Sıralama Problemi ve Analizi. Bahar 2017 Doç. Dr. Suat Özdemir 1 Algoritmalar Sıralama Problemi ve Analizi Bahar 2017 Doç. Dr. Suat Özdemir 1 Sıralama Problemi ve Analizi Bu bölümde öncelikle bir diğer böl-ve-yönet yöntemine dayalı algoritma olan Quick Sort algoritması

Detaylı

İÇİNDEKİLER ÖN SÖZ...

İÇİNDEKİLER ÖN SÖZ... İÇİNDEKİLER ÖN SÖZ... v GİRİŞ... 1 1. İSTATİSTİK İN TARİHÇESİ... 1 2. İSTATİSTİK NEDİR?... 3 3. SAYISAL BİLGİDEN ANLAM ÇIKARILMASI... 4 4. BELİRSİZLİĞİN ELE ALINMASI... 4 5. ÖRNEKLEME... 5 6. İLİŞKİLERİN

Detaylı

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir. 4.SUNUM Genel olarak test istatistikleri Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri olmak üzere 2 grupta incelenebilir. 2 Ranj Çeyrek Kayma Çeyrekler Arası Açıklık Standart Sapma Varyans

Detaylı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Hatice NİZAM İstanbul Üniversitesi Bilgisayar Mühendisliği Bölümü haticenizam@outlook.com Saliha Sıla AKIN ERS Turizm Yazılım Şirketi, Bilgisayar

Detaylı

Öğr. Elemanı: Dr. Mustafa Cumhur AKBULUT

Öğr. Elemanı: Dr. Mustafa Cumhur AKBULUT Ünite 10: Regresyon Analizi Öğr. Elemanı: Dr. Mustafa Cumhur AKBULUT 10.Ünite Regresyon Analizi 2 Ünitede Ele Alınan Konular 10. Regresyon Analizi 10.1. Basit Doğrusal regresyon 10.2. Regresyon denklemi

Detaylı

DERS BİLGİLERİ Ders Kodu Yarıyıl T+U Saat Kredi AKTS Çok Değişkenli İstatistik EKO428 Bahar Ön Koşul Dersin Dili

DERS BİLGİLERİ Ders Kodu Yarıyıl T+U Saat Kredi AKTS Çok Değişkenli İstatistik EKO428 Bahar Ön Koşul Dersin Dili DERS BİLGİLERİ Ders Kodu Yarıyıl T+U Saat Kredi AKTS Çok Değişkenli İstatistik EKO428 Bahar 3+0 3 3 Ön Koşul Yok Dersin Dili Türkçe Dersin Seviyesi Lisans Dersin Türü Seçmeli Dersi Veren Öğretim Elemanı

Detaylı

VERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL

VERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL VERİ MADENCİLİĞİ Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL SPRINT Algoritması ID3,CART, ve C4.5 gibi algoritmalar önce derinlik ilkesine göre çalışırlar ve en iyi dallara ayırma kriterine

Detaylı

T.C. ESKİŞEHİR OSMANGAZİ ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ BİYOİSTATİSTİK ANABİLİM DALI. BiR UYGULAMA YÜKSEK LİSANS TEZİ HÜLYA YILMAZ

T.C. ESKİŞEHİR OSMANGAZİ ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ BİYOİSTATİSTİK ANABİLİM DALI. BiR UYGULAMA YÜKSEK LİSANS TEZİ HÜLYA YILMAZ T.C. ESKİŞEHİR OSMANGAZİ ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ BİYOİSTATİSTİK ANABİLİM DALI RANDOM FORESTS YöNTEMiNDE KAYIP VERi PROBLEMiNiN incelenmesi VE SAĞLIK ALANINDA BiR UYGULAMA YÜKSEK LİSANS

Detaylı

BLM-431 YAPAY ZEKA. Ders-4 Bilgisiz Arama Yöntemleri. Yrd. Doç. Dr. Ümit ATİLA

BLM-431 YAPAY ZEKA. Ders-4 Bilgisiz Arama Yöntemleri. Yrd. Doç. Dr. Ümit ATİLA BLM-431 YAPAY ZEKA Ders-4 Bilgisiz Arama Yöntemleri Yrd. Doç. Dr. Ümit ATİLA umitatila@karabuk.edu.tr http://web.karabuk.edu.tr/umitatilla/ Dersin Hedefleri Aşağıda verilen arama stratejilerini anlamak

Detaylı

Boosting. Birol Yüceoğlu Migros T.A.Ş.

Boosting. Birol Yüceoğlu Migros T.A.Ş. Boosting Birol Yüceoğlu Migros T.A.Ş. www.veridefteri.com biroly@migros.com.tr İçerik Karar ağaçları Bagging Boosting Ana fikir Boosting vs. Bagging LightGBM Scikit-learn AdaBoost Calibration Gradient

Detaylı

TANIMLAYICI İSTATİSTİKLER

TANIMLAYICI İSTATİSTİKLER TANIMLAYICI İSTATİSTİKLER Tanımlayıcı İstatistikler ve Grafikle Gösterim Grafik ve bir ölçüde tablolar değişkenlerin görsel bir özetini verirler. İdeal olarak burada değişkenlerin merkezi (ortalama) değerlerinin

Detaylı

PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Veri Madenciliği Yöntemleri Dr. Yalçın ÖZKAN -II-

PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Veri Madenciliği Yöntemleri Dr. Yalçın ÖZKAN -II- Dr. Yalçın ÖZKAN Dr. Yalçın ÖZKAN PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Ankara Caddesi, Prof. Fahreddin Kerim Gökay Vakfı İşhanı Girişi, No: 11/3, Cağaloğlu (Fatih)/İstanbul Tel

Detaylı

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir. ÇIKARSAMALI İSTATİSTİKLER Çıkarsamalı istatistikler, örneklemden elde edilen değerler üzerinde kitleyi tanımlamak için uygulanan istatistiksel yöntemlerdir. Çıkarsamalı istatistikler; Tahmin Hipotez Testleri

Detaylı

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri Veri modelleri, veriler arasında ilişkisel ve sırasal düzeni gösteren kavramsal tanımlardır. Her program en azından bir veri modeline dayanır. Uygun

Detaylı

Görüntü Segmentasyonu (Bölütleme)

Görüntü Segmentasyonu (Bölütleme) Görüntü Segmentasyonu (Bölütleme) Segmentasyon, görüntüyü aynı cinsten obje ve bölgelere ayırmaktır. 20 Aralık 2014 Cumartesi 1 Görüntü Segmentasyonu 20 Aralık 2014 Cumartesi 2 Gestalt kanunları Görüntü

Detaylı

Ankara Üniversitesi, SBF İstatistik 2 Ders Notları Prof. Dr. Onur Özsoy 1

Ankara Üniversitesi, SBF İstatistik 2 Ders Notları Prof. Dr. Onur Özsoy 1 Ankara Üniversitesi, SBF İstatistik 2 Ders Notları Prof. Dr. Onur Özsoy 1 Population Belirli bir konudaki verilerin tamamıdır. Örnek Populasyonun belirli bir kesitidir. Parametre Populasyonla ilgili tanımsal

Detaylı

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım 2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI 2.1. Tanım Regresyon analizi, bir değişkenin başka bir veya daha fazla değişkene olan bağımlılığını inceler. Amaç, bağımlı değişkenin kitle ortalamasını, açıklayıcı

Detaylı

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir Kümeleme Analizi: Temel Kavramlar ve Algoritmalar Kümeleme Analizi Nedir? Her biri bir dizi öznitelik ile, veri noktalarının bir kümesi ve noktalar arasındaki benzerliği ölçen bir benzerlik ölçümü verilmiş

Detaylı

Veri Tabanı, Veri Ambarı, Veri Madenciliği. Veri Madenciliği Uygulama Alanları

Veri Tabanı, Veri Ambarı, Veri Madenciliği. Veri Madenciliği Uygulama Alanları 1 Veri Tabanı, Veri Ambarı, Veri Madenciliği Bilgi Keşfi Aşamaları Apriori Algoritması Veri Madenciliği Yöntemleri Problemler Veri Madenciliği Uygulama Alanları 2 Bir bilgisayarda sistematik şekilde saklanmış,

Detaylı

Esnek Hesaplamaya Giriş

Esnek Hesaplamaya Giriş Esnek Hesaplamaya Giriş J E O L O J İ M Ü H E N D İ S L İ Ğ İ A. B. D. E S N E K H E S A P L A M A Y Ö N T E M L E R İ - I DOÇ. DR. ERSAN KABALCI Esnek Hesaplama Nedir? Esnek hesaplamanın temelinde yatan

Detaylı

BLM-431 YAPAY ZEKA. Ders-5 Bilgili Arama Yöntemleri. Yrd. Doç. Dr. Ümit ATİLA

BLM-431 YAPAY ZEKA. Ders-5 Bilgili Arama Yöntemleri. Yrd. Doç. Dr. Ümit ATİLA BLM-431 YAPAY ZEKA Ders-5 Bilgili Arama Yöntemleri Yrd. Doç. Dr. Ümit ATİLA umitatila@karabuk.edu.tr http://web.karabuk.edu.tr/umitatilla/ Arama Grafları Eğer arama uzayı ağaç yapısından değil de graf

Detaylı

VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme

Detaylı

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 MIT OpenCourseWare http://ocw.mit.edu 14.30 Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 Bu materyale atıfta bulunmak ve kullanım koşulları için http://ocw.mit.edu/terms sayfasını ziyaret ediniz.

Detaylı

Büyük Veri ve Endüstri Mühendisliği

Büyük Veri ve Endüstri Mühendisliği Büyük Veri ve Endüstri Mühendisliği Mustafa Gökçe Baydoğan Endüstri Mühendisliği Bölümü Boğaziçi Üniversitesi İstanbul Yöneylem Araştırması/Endüstri Mühendisliği Doktora Öğrencileri Kolokyumu 21-22 Nisan

Detaylı

Hafta 05 - Karar Ağaçları/Kümeleme

Hafta 05 - Karar Ağaçları/Kümeleme BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr İstanbul Şehir Üniversitesi 2018 - Bahar İçindekiler

Detaylı

AMAÇ. Finansal Performans Ölçümü İĞİ RLENMESİ. Kamu Hastanelerinde Finansal Perspektif

AMAÇ. Finansal Performans Ölçümü İĞİ RLENMESİ. Kamu Hastanelerinde Finansal Perspektif HASTANELER İÇİN N VERİ MADENCİLİĞİ İĞİ ile FİNANSAL F ERKEN UYARI SİNYALLERİNİN N ve YOL HARİTALARININ BELİRLENMES RLENMESİ Dr. Ali Serhan KOYUNCUGİL Sermaye Piyasası Kurulu Araştırma Dairesi askoyuncugil@gmail.com

Detaylı

Veri Madenciliği. Bölüm 5. Sınıflandırma 1. Doç. Dr. Suat Özdemir.

Veri Madenciliği. Bölüm 5. Sınıflandırma 1. Doç. Dr. Suat Özdemir. Bölüm 5. Sınıflandırma 1 http://ceng.gazi.edu.tr/~ozdemir Gözetimli & Gözetimsiz Öğrenme Predictive Data Mining vs. Descriptive Data Mining Gözetimli (Supervised) öğrenme= sınıflandırma (clasification)

Detaylı

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ 1 BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel sayma

Detaylı

K En Yakın Komşu Methodu (KNearest Neighborhood)

K En Yakın Komşu Methodu (KNearest Neighborhood) K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre

Detaylı

MUHASEBELEŞTĐRME SIRASINDA OTOMATĐK KATEGORĐ

MUHASEBELEŞTĐRME SIRASINDA OTOMATĐK KATEGORĐ MUHASEBELEŞTĐRME SIRASINDA OTOMATĐK KATEGORĐ Versiyon : 3.6.6.x Đlgili Programlar : Yakamoz ve Üstü Ticari Paketler Tarih : 10.02.2009 Doküman Seviyesi (1 5) : 3 (Tecrübeli Kullanıcı) GĐRĐŞ taksitli kredi

Detaylı

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN Tanımlayıcı İstatistikler Yrd. Doç. Dr. Emre ATILGAN 1 Tanımlayıcı İstatistikler Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri 2 3 Aritmetik Ortalama Aritmetik ortalama,

Detaylı

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir Bilimsel Araştırma Yöntemleri Prof. Dr. Şener Büyüköztürk Doç. Dr. Ebru Kılıç Çakmak Yrd. Doç. Dr. Özcan Erkan Akgün Doç. Dr. Şirin Karadeniz Dr. Funda Demirel Örnekleme Yöntemleri Evren Evren, araştırma

Detaylı

Ücret Simülasyonu LOGO

Ücret Simülasyonu LOGO Ücret Simülasyonu LOGO KASIM 2011 İçindekiler Ücret Bütçe Simülasyonu...3 Senaryo Kanun Parametreleri...4 Senaryo Kanun Parametresi Bilgileri...5 Senaryo Sanal Sicil Kartları...7 Sanal Sicil Bilgileri...8

Detaylı

Biyoistatistiğe Giriş: Temel Tanımlar ve Kavramlar DERS I VE II

Biyoistatistiğe Giriş: Temel Tanımlar ve Kavramlar DERS I VE II Biyoistatistiğe Giriş: Temel Tanımlar ve Kavramlar DERS I VE II İstatistik Nedir? İstatistik kelimesi farklı anlamlar taşımaktadır. Bunlar; Genel anlamda; üretim, tüketim, nüfus, sağlık, eğitim, tarım,

Detaylı

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5 Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5 Sıklık Tabloları Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu denir. Tek değişken için çizilen

Detaylı

ELEKTRA LOGO AKTARIM PROGRAMI...3

ELEKTRA LOGO AKTARIM PROGRAMI...3 İçindekiler Tablosu ELEKTRA LOGO AKTARIM PROGRAMI...3 1. Özellikler.. 3 2. Kullanım...4 2.1. Elektra Fatura Aktarım Modülü.5 2.2. Mahsup Fişi Modülü.7 2.3. Bavel Fatura XML Modülü.9 2 ELEKTRA LOGO AKTARIM

Detaylı

Bölüm 3. Tanımlayıcı İstatistikler

Bölüm 3. Tanımlayıcı İstatistikler Bölüm 3 Tanımlayıcı İstatistikler 1 Tanımlayıcı İstatistikler Bir veri setini tanımak veya birden fazla veri setini karşılaştırmak için kullanılan ve ayrıca örnek verilerinden hareket ile frekans dağılışlarını

Detaylı

AVĐVASA da Veri Madenciliği Reşat Fırat ERSĐN Stratejik Planlama ve ĐşGeliştirme Birim Yöneticisi

AVĐVASA da Veri Madenciliği Reşat Fırat ERSĐN Stratejik Planlama ve ĐşGeliştirme Birim Yöneticisi AVĐVASA da Veri Madenciliği Reşat Fırat ERSĐN Stratejik Planlama ve ĐşGeliştirme Birim Yöneticisi AvivaSA Bir emeklilik ve hayat sigortası şirketi 1 Kasım 2007. Ak Emeklilik A.Ş. ve Aviva Hayat ve Emeklilik

Detaylı

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ - 150110046 İÇERİK Uygulama ve uygulamaya ilişkin temel kavramların tanıtımı Uygulamanın yapısı Ön yüz Veritabanı Web Servisler K-Means Algoritması ile kategori

Detaylı

2. BASİT DOĞRUSAL REGRESYON 12

2. BASİT DOĞRUSAL REGRESYON 12 1. GİRİŞ 1 1.1 Regresyon ve Model Kurma / 1 1.2 Veri Toplama / 5 1.3 Regresyonun Kullanım Alanları / 9 1.4 Bilgisayarın Rolü / 10 2. BASİT DOĞRUSAL REGRESYON 12 2.1 Basit Doğrusal Regresyon Modeli / 12

Detaylı

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı REGRESYON ANALİZİ VE UYGULAMA Yrd. Doç. Dr. Hidayet Takcı htakci@cumhuriyet.edu.tr Sunum içeriği Bu sunumda; Lojistik regresyon konu anlatımı Basit doğrusal regresyon problem çözümleme Excel yardımıyla

Detaylı

VERI TABANLARıNDA BILGI KEŞFI

VERI TABANLARıNDA BILGI KEŞFI 1 VERİ MADENCİLİĞİ VERI TABANLARıNDA BILGI KEŞFI Veri Tabanlarında Bilgi Keşfi, veriden faydalı bilginin keşfedilmesi sürecinin tamamına atıfta bulunmakta ve veri madenciliği bu sürecin bir adımına karşılık

Detaylı

SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER. Abdullah Can

SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER. Abdullah Can SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER SPSS in üzerinde işlem yapılabilecek iki ana ekran görünümü vardır. DATA VIEW (VERİ görünümü) VARIABLE VIEW (DEĞİŞKEN görünümü) 1 DATA VIEW (VERİ görünümü) İstatistiksel

Detaylı

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin Ders 9: Kitle Ortalaması ve Varyansı için Tahmin Kitle ve Örneklem Örneklem Dağılımı Nokta Tahmini Tahmin Edicilerin Özellikleri Kitle ortalaması için Aralık Tahmini Kitle Standart Sapması için Aralık

Detaylı

Karar Ağacı Öğrenmesi(Decision Tree Learning)

Karar Ağacı Öğrenmesi(Decision Tree Learning) Karar Ağacı Öğrenmesi(Decision Tree Learning) Bu yazımızda karar ağacı öğrenmesini inceleyeceğiz. Öncelikle karar ağacı öğrenmesi danışmanlı öğrenmenin, danışmanlı öğrenme de makine öğrenmesinin bir alt

Detaylı

Sık kullanılan istatistiksel yöntemler ve yorumlama. Doç. Dr. Seval KUL Gaziantep Üniversitesi Tıp Fakültesi

Sık kullanılan istatistiksel yöntemler ve yorumlama. Doç. Dr. Seval KUL Gaziantep Üniversitesi Tıp Fakültesi Sık kullanılan istatistiksel yöntemler ve yorumlama Doç. Dr. Seval KUL Gaziantep Üniversitesi Tıp Fakültesi Biyoistatistik AD Bşk. 1 Hakkımda 2 Hedef: Katılımcılar modülün sonunda temel istatistiksel yöntemler

Detaylı

VERİLERİN SINIFLANDIRILMASI

VERİLERİN SINIFLANDIRILMASI VERİLERİN SINIFLANDIRILMASI Yrd. Doç. Dr. Ünal ERKORKMAZ Sakarya Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı uerkorkmaz@sakarya.edu.tr NİTEL VE NİCEL VERİLERİN SINIFLANDIRMASI Sınıflandırma

Detaylı

RİSK DEĞERLENDİRME TEKNİKLERİNİN KARŞILAŞTIRILMASI. Abidin Özler Makine Müh. İGU (A) Meditek Yazılım

RİSK DEĞERLENDİRME TEKNİKLERİNİN KARŞILAŞTIRILMASI. Abidin Özler Makine Müh. İGU (A) Meditek Yazılım RİSK DEĞERLENDİRME TEKNİKLERİNİN KARŞILAŞTIRILMASI Abidin Özler Makine Müh. İGU (A) Meditek Yazılım Tanımlar Risk Değerlendirme : Risk yönetiminin bir parçası olup, hedeflerin nasıl etkilenebileceğini

Detaylı

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ DÖNEM I-I. DERS KURULU Konu: Bilimsel yöntem ve istatistik Amaç: Biyoistatistiğin tıptaki önemini kavrar ve sonraki dersler için gerekli terminolojiye hakim olur.

Detaylı

Uzaktan Algılama Teknolojileri

Uzaktan Algılama Teknolojileri Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk alp.erturk@kocaeli.edu.tr Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve

Detaylı

Merkezi Eğilim ve Dağılım Ölçüleri

Merkezi Eğilim ve Dağılım Ölçüleri Merkezi Eğilim ve Dağılım Ölçüleri Soru Öğrencilerin derse katılım düzeylerini ölçmek amacıyla geliştirilen 16 soruluk bir test için öğrencilerin ilk 8 ve son 8 soruluk yarılardan aldıkları puanlar arasındaki

Detaylı

MONTE CARLO BENZETİMİ

MONTE CARLO BENZETİMİ MONTE CARLO BENZETİMİ U(0,1) rassal değişkenler kullanılarak (zamanın önemli bir rolü olmadığı) stokastik ya da deterministik problemlerin çözümünde kullanılan bir tekniktir. Monte Carlo simülasyonu, genellikle

Detaylı

Görüntü Segmentasyonu (Bölütleme) Dijital Görüntü İşleme Fevzi Karslı, KTÜ Segmentasyon, görüntüyü aynı cinsten obje ve bölgelere ayırmaktır.

Görüntü Segmentasyonu (Bölütleme) Dijital Görüntü İşleme Fevzi Karslı, KTÜ Segmentasyon, görüntüyü aynı cinsten obje ve bölgelere ayırmaktır. Görüntü Segmentasyonu (Bölütleme) Segmentasyon, görüntüyü aynı cinsten obje ve bölgelere ayırmaktır. 16 Ocak 2014 Perşembe 1 Görüntü Segmentasyonu 16 Ocak 2014 Perşembe 2 Görüntüden Objelere Bir objeyi

Detaylı

10.Hafta Minimum kapsayan ağaçlar Minimum spanning trees (MST)

10.Hafta Minimum kapsayan ağaçlar Minimum spanning trees (MST) 1 10.Hafta Minimum kapsayan ağaçlar Minimum spanning trees (MST) Kapsayan ağaç Spanning Tree (ST) Bir Kapsayan Ağaç (ST); G, grafındaki bir alt graftır ve aşağıdaki özelliklere sahiptir. G grafındaki tüm

Detaylı

PAZARLAMA ARAŞTIRMA SÜRECİ

PAZARLAMA ARAŞTIRMA SÜRECİ PAZARLAMA ARAŞTIRMA SÜRECİ Pazarlama araştırması yapılırken belirli bir sıra izlenir. Araştırmada her aşama, birbirinden bağımsız olmayıp biri diğeri ile ilişkilidir. Araştırma sürecinde başlıca aşağıdaki

Detaylı

ĐSTATĐSTĐK. Okan ERYĐĞĐT

ĐSTATĐSTĐK. Okan ERYĐĞĐT ĐSTATĐSTĐK Okan ERYĐĞĐT Araştırmacı, istatistik yöntemlere daha işin başında başvurmalıdır, sonunda değil..! A. Bradford Hill, 1930 ĐSTATĐSTĐĞĐN AMAÇLARI Bilimsel araştırmalarda, araştırmacıya kullanılabilir

Detaylı

Bölüm 2 Varlık-İlişki Veri Modeli: Araçlar ve Teknikler. Fundamentals, Design, and Implementation, 9/e

Bölüm 2 Varlık-İlişki Veri Modeli: Araçlar ve Teknikler. Fundamentals, Design, and Implementation, 9/e Bölüm 2 Varlık-İlişki Veri Modeli: Araçlar ve Teknikler Fundamentals, Design, and Implementation, 9/e Üç Şema Modeli Üç şema modeli 1975 de ANSI/SPARC tarafından geliştirildi Veri modellemeninç ve rolünü

Detaylı

BÜYÜK VERI UYGULAMALARı DERS 7. Doç. Dr. Yuriy Mishchenko

BÜYÜK VERI UYGULAMALARı DERS 7. Doç. Dr. Yuriy Mishchenko 1 BÜYÜK VERI UYGULAMALARı DERS 7 Doç. Dr. Yuriy Mishchenko PLAN Azure ML hizmeti kullanılmasına bir pratik giriş 2 3 MS AZURE ML 4 MS AZURE ML Azure Microsoft tarafından sağlanan bulut hesaplama hizmetleri

Detaylı

KARAR TEORİSİ. Özlem AYDIN. Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü

KARAR TEORİSİ. Özlem AYDIN. Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü KARAR TEORİSİ Özlem AYDIN Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü Karar Ortamları Karar Analizi, alternatiflerin en iyisini seçmek için akılcı bir sürecin kullanılması ile ilgilenir. Seçilen

Detaylı

AHP ye Giriş Karar verici, her alternatifin her kriterde ne kadar başarılı olduğunu değerlendirir. Her kriterin amaca ulaşmadaki görece önemini değerl

AHP ye Giriş Karar verici, her alternatifin her kriterde ne kadar başarılı olduğunu değerlendirir. Her kriterin amaca ulaşmadaki görece önemini değerl AHP ye Giriş 2 Analitik Hiyerarşi Süreci Bölüm 3 AHP, birebir değerlendirerek alternatifleri sıralamaya dayanan çok nitelikli karar verme yöntemidir. Amaçlar ve alt amaçlar iç içe katmanlar halinde ve

Detaylı

FREKANS VERİLERİ. Prof.Dr. Levent ŞENYAY III - 1

FREKANS VERİLERİ. Prof.Dr. Levent ŞENYAY III - 1 3 FREKANS VERİLERİ 3.1. Frekans Tablolarının Düzenlenmesi 3.2. Frekans poligonu 3.3. Frekans tablosu hazırlama 3.4. Frekans Histogramı 3.5. Frekans eğrisi tipleri 3.6. Diğer İstatistiksel Grafik Gösterimler

Detaylı

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir. Koşullu Öngörümleme Ex - ante (tasarlanan - umulan) öngörümleme söz konusu iken açıklayıcı değişkenlerin hatasız bir şekilde bilindiği varsayımı gerçekçi olmayan bir varsayımdır. Çünkü bazı açıklayıcı

Detaylı

İSTATİSTİKSEL PROSES KONTROLÜ

İSTATİSTİKSEL PROSES KONTROLÜ İSTATİSTİKSEL PROSES KONTROLÜ ZTM 433 KALİTE KONTROL VE STANDARDİZASYON PROF: DR: AHMET ÇOLAK İstatistiksel işlem kontrolü (İPK), işlemle çeşitli istatistiksel metotların ve analiz sapmalarının kullanımını

Detaylı

İSTATİSTİK. Bölüm 1 Giriş. Ankara Üniversitesi SBF İstatistik 1 Ders Notları Prof. Dr. Onur Özsoy 4/4/2018

İSTATİSTİK. Bölüm 1 Giriş. Ankara Üniversitesi SBF İstatistik 1 Ders Notları Prof. Dr. Onur Özsoy 4/4/2018 İSTATİSTİK Bölüm 1 Giriş 1 Bu Bölümde Anlatılacak Konular Bir Yönetici Neden İstatistik Bilmeli? Modern İstatistiğin Gelişimi İstatistiksel Düşünce ve Yönetim Tanımsal ve Yargısal İstatistik Data Türleri

Detaylı

VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Birliktelik Kurallarının Tanımı Destek ve Güven Ölçütleri Apriori Algoritması Birliktelik Kuralları (Association

Detaylı

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma... İçindekiler İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii BÖLÜM 1 Ölçme, İstatistik ve Araştırma...1 Ölçme Nedir?... 3 Ölçme Süreci... 3 Değişkenler

Detaylı

Veri ve Metin Madenciliği

Veri ve Metin Madenciliği Veri ve Metin Madenciliği Zehra Taşkın Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Fikirler? Veri Madenciliği Data Information Knowledge Veri madenciliği; Büyük yoğunluklu

Detaylı

Veri ve Metin Madenciliği. Zehra

Veri ve Metin Madenciliği. Zehra Veri ve Metin Madenciliği Zehra Taşkın @zehrataskin Büyük Veri https://www.youtube.com/watch?v=tzxmjbl-i4y Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Veri Madenciliği

Detaylı

BÖLÜM 4 FREKANS DAĞILIMLARININ GRAFİKLE GÖSTERİLMESİ

BÖLÜM 4 FREKANS DAĞILIMLARININ GRAFİKLE GÖSTERİLMESİ BÖLÜM 4 FREKANS DAĞILIMLARININ GRAFİKLE GÖSTERİLMESİ Frekans dağılımlarının betimlenmesinde frekans tablolarının kullanılmasının yanı sıra grafik gösterimleri de sıklıkla kullanılmaktadır. Grafikler, görselliği

Detaylı

GENETİK ALGORİTMA ÖZNUR CENGİZ HİLAL KOCA

GENETİK ALGORİTMA ÖZNUR CENGİZ HİLAL KOCA GENETİK ALGORİTMA ÖZNUR CENGİZ 201410306014 HİLAL KOCA 150306024 GENETİK ALGORİTMA Genetik Algoritma yaklaşımının ortaya çıkışı 1970 lerin başında olmuştur. 1975 te John Holland ın makine öğrenmesi üzerine

Detaylı

BAYES ÖĞRENMESİ BİLECİK ÜNİVERSİTESİ. Araş. Gör. Nesibe YALÇIN. Yapay Zeka-Bayes Öğrenme

BAYES ÖĞRENMESİ BİLECİK ÜNİVERSİTESİ. Araş. Gör. Nesibe YALÇIN. Yapay Zeka-Bayes Öğrenme BAYES ÖĞRENMESİ Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ Yapay Zeka-Bayes Öğrenme 1 İÇERİK Bayes Teoremi Bayes Sınıflandırma Örnek Kullanım Alanları Avantajları Dezavantajları Yapay Zeka-Bayes Öğrenme

Detaylı

Ücret Simülasyonu Nasıl Yapılır?

Ücret Simülasyonu Nasıl Yapılır? Ücret Simülasyonu Nasıl Yapılır? Logo İnsan Kaynakları Ücret Simülasyonu Genel bütçeye hazırlık için IK bölümlerinin ücret ve bordro maliyetlerini senaryolaştırabileceği bir modüldür. Ücret simülasyonu

Detaylı

Konular. VERİ MADENCİLİĞİ Veri Önişleme. Değer Kümeleri. Veri Nedir? Nitelik Türleri. Konular. Veri Veri Önişleme Benzerlik ve farklılık

Konular. VERİ MADENCİLİĞİ Veri Önişleme. Değer Kümeleri. Veri Nedir? Nitelik Türleri. Konular. Veri Veri Önişleme Benzerlik ve farklılık 0 VERİ MADENCİLİĞİ Veri Önişleme Yrd. Doç. Dr. Şule Gündüz Öğüdücü Veri Nedir? nesneler ve nesnelerin niteliklerinden oluşan küme kayıt (record), varlık (entity), örnek (sample, instance) nesne için kullanılabilir.

Detaylı