T.C. ERCİYES ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ VERİ MADENCİLİĞİNDE GENETİK PROGRAMLAMA TEMELLİ YENİ BİR SINIFLANDIRMA YAKLAŞIMI VE UYGULAMASI

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "T.C. ERCİYES ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ VERİ MADENCİLİĞİNDE GENETİK PROGRAMLAMA TEMELLİ YENİ BİR SINIFLANDIRMA YAKLAŞIMI VE UYGULAMASI"

Transkript

1 T.C. ERCİYES ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ VERİ MADENCİLİĞİNDE GENETİK PROGRAMLAMA TEMELLİ YENİ BİR SINIFLANDIRMA YAKLAŞIMI VE UYGULAMASI Tezi Hazırlayan M. Burak TELCİOĞLU Tezi Yöneten Yrd. Doç. Dr. Lale ÖZBAKIR Endüstri Mühendisliği Anabilim Dalı Yüksek Lisans Tezi Ocak 2007 KAYSERİ

2

3 ii TEŞEKKÜR Bu tezin hazırlanmasında bir çok değerli insanın katkıları olmuştur. Hepsine ayrı ayrı teşekkür etmek istiyorum. Bu tez çalışmasının başarı ile sonuçlanmasını sağlayan değerli danışmanım Yrd. Doç. Dr. Lale ÖZBAKIR a tez çalışmam sırasında her türlü konudaki anlayışı, desteği, motivasyonu ve yardımları için minnettarlıklarımı belirtmek istiyorum. Tez çalışmam süresince her türlü yardımı ve desteği sağlayan değerli müdürüm Tuncer AKTAŞ a sonsuz teşekkür ediyorum. Her türlü yardımlarından dolayı Araştırma Görevlisi Sinem KULLUK a teşekkür ederim. Tez çalışmam sırasında, her zaman bana destek olan eşim Ayşe TELCİOĞLU na her türlü anlayışı ve yardımı için teşekkür ederim. Hayatımın her aşamasında her türlü destek ve anlayışları ile yanımda olan sevgili annem ve babam Gülçin ve Mahmut TELCİOĞLU na ve kardeşim Murat TELCİOĞLU na anlayış ve desteklerinden dolayı sonsuz teşekkürlerimi iletmek istiyorum.

4 iii VERİ MADENCİLİĞİNDE GENETİK PROGRAMLAMA TEMELLİ YENİ BİR SINIFLANDIRMA YAKLAŞIMI VE UYGULAMASI M. Burak TELCİOĞLU Erciyes Üniversitesi, Fen Bilimleri Enstitüsü Yüksek Lisans Tezi, Ocak 2007 Tez Danışmanı: Yrd. Doç. Dr. Lale ÖZBAKIR ÖZET Bu çalışmanın amacı veritabanlarında bulunan veri kümelerinin sınıflandırma sürecini mümkün olduğunca hızlı ve kolay biçimde tamamlayacak bir algoritma tasarlamaktır. Bu algoritmanın diğer çalışmalardan ayrılan iki önemli özelliği çoklu denklem programlama temelli bir kromozom yapısı kullanması ve genetik programlamanın uygunluk değerlendirme aşamasını evrimleştirdiği SQL cümleciklerini kullanarak başarmasıdır. Geliştirilen MEPAR-SQL algoritması çeşitli literatür ve gerçek veri kümelerine uygulanmış, deney tasarımında bulunan parametre düzeyleri kullanılarak bulunan sonuçlar iyi bilinen çeşitli geleneksel algoritmalar ile karşılaştırılmıştır. Karşılaştırma sonucunda MEPAR-SQL algoritması çok iyi sonuçlar bulmuştur. Anahtar Kelimeler: Veri madenciliği, sınıflandırma, genetik programlama, çoklu denklem programlama.

5 iv A NEW GENETIC PROGRAMMING BASED CLASSIFICATION APPROACH IN DATA MINING AND APPLICATION M. Burak TELCİOĞLU Erciyes University, Graduate School of Natural and Applied Sciences M.Sc. Thesis, January 2007 Thesis Supervisor: Assist. Prof. Dr. Lale ÖZBAKIR ABSTRACT The aim of the study is, to design an algorithm that can complete a classification process of datasets resides in databases in a fast and easy manner. This algorithm differs from others by the two distinctions; this algorithm uses a multi expression programming based chromosome structure and it uses SQL scripts for fitness evaluation which is one of the steps of the genetic programming. MEPAR-SQL algorithm is applied to several literature and real datasets and the parameter levels which are found by experimental design are compared with several well known traditional algorithms. According to the comparison it is found that MEPAR-SQL algorithm shows good performance. Keywords: Data mining, classification, genetic programming, multi expression programming.

6 v İÇİNDEKİLER KABUL VE ONAY...i TEŞEKKÜR...ii ÖZET...iii ABSTRACT... iv ŞEKİLLER LİSTESİ... x 1.BÖLÜM... 1 GİRİŞ BÖLÜM... 3 GENEL BİLGİLER Veri Madenciliği Veri Madenciliğine Giriş Veri Madenciliği Nedir? Veri Madenciliği Süreci Problemin Tanımlanması Geçmiş Bilgiler Veri Seçimi Veri Önişleme Analiz ve Yorumlama Raporlama ve Kullanım Veri Madenciliğinin Görevleri Sınıf Betimlemesi Birliktelik Sınıflandırma Tahmin Kümeleme Zaman Serileri Analizi Veri Madenciliğinde Kullanılan Algoritmalar Danışmansız Öğrenme Algoritmaları K-Yol Kümeleme Özdüzenleyici Haritalar (Self Organized Maps) Danışmanlı Öğrenme Algoritmaları... 13

7 vi Regresyon Modelleri K-En Yakın Komşu Yapay Sinir Ağları Yapay Sinir Ağlarının Özellikleri Yapay Sinir Ağlarının Yapısı Karar Ağaçları Evrimsel Algoritmalar Veri Madenciliğinin Kullanım Alanları Veri Madenciliğinde Yapılan Çalışmalar Sınıflandırma Sınıflandırmaya Giriş Sınıflandırma Nedir? Sınıflandırma Kuralları AQ (Ancestral Quest) Algoritması CN2 Algoritması ID3 Algoritması C4.5 Algoritması Evrimsel Algoritmalar Genetik Algoritmalar Genetik Algoritma Çeşitleri Basit Genetik Algoritma İşleyişi Genetik Programlama Evrim Stratejileri Evrimsel Programlama Genetik Programlama Genetik Programlama ve Veri Sınıflandırma Standart Genetik Programlama Hazırlık Adımları Fonksiyon ve Terminal Seti Uygunluk Ölçümü Kontrol Parametreleri Durdurma Kriteri Genetik Programlama Çalışma Adımları... 48

8 vii Standart Genetik Programlama Akış Diyagramı Başlangıç Popülasyonunun Oluşturulması Genetik Programlamanın Ana Nesil Döngüsü Mutasyon Operasyonu Çaprazlama Operasyonu Çoğalma Operasyonu Mimari Değişim Operasyonu Doğrusal Genetik Programlama GEP GEP Akış Diyagramı GEP Gen Yapısı Açık Okuma Çatısı ve Genler GEP Genleri Çoklu Gen Kromozomları Seçim ve Replikasyon Mutasyon Sıra Değişimi ve Sıralı Elemanların Eklenmesi Çaprazlama Çoklu Denklem Programlama MEP Gösterimi MEP Gösterimi ile GP ve GEP Gösterimi Karşılaştırması MEP Çaprazlama MEP Mutasyon Uygunluk Hesaplama Süreci MEP Algoritması Veri Madenciliği ve İlişkisel Veritabanları BÖLÜM YÖNTEM MEPAR-SQL Algoritmasının Geliştirilmesi Fonksiyon ve Terminal Kümeleri Başlangıç Popülasyonu Uygunluk Fonksiyonu Genetik Operatörler... 79

9 viii 3.2. Yazılımın Kullanılması Ön Gereksinimler Yazılımın Çalıştırılması BÖLÜM BULGULAR VE YORUMLAR Test Problemleri Uygun Parametre Kümesinin Belirlenmesi Analiz Sonuçları Hepatitis Veri Kümesi Analiz Sonuçları Adult Veri Kümesi Analiz Sonuçları Iris Veri Kümesi Analiz Sonuçları Lymphograpy Veri Kümesi Analiz Sonuçları Zoo Veri Kümesi Analiz Sonuçları Credit App Veri Kümesi Analiz Sonuçları ENDQ Veri Kümesi Analiz Sonuçları Sonuçların Diğer Çalışmalar ile Karşılaştırması BÖLÜM SONUÇ VE ÖNERİLER KAYNAKLAR EKLER EK-1 ENDQ Veri Kümesi Hakkında Bilgiler EK-2. MINITAB Analiz Grafikleri EK-2.a. Adult Ana Etki Grafiği EK-2.b. Adult Etkileşim Grafiği EK-2.c. Adult Etkileşim Grafiği EK-2.d. Adult Etkileşim Grafiği EK-2.e. Creadit-App Ana Etki Grafiği EK-2.f. Credit-App Etkileşim Grafiği EK-2.g. Credit-App Etkileşim Grafiği EK-2.h. Credit-App Etkileşim Grafiği EK-2.i. Iris Ana Etki Grafiği EK-2.j. Iris Etkileşim Grafiği EK-2.k. Iris Etkileşim Grafiği

10 ix EK-2.l. Iris Etkileşim Grafiği EK-2.m. Lymphography Ana Etki Grafiği EK-2.n. Lymphography Etkileşim Grafiği EK-2.o. Lymphography Etkileşim Grafiği EK-2.p. Lymphography Etkileşim Grafiği EK-2.q. Zoo Ana Etki Grafiği EK-2.r. Zoo Etkileşim Grafiği EK-2.s. Zoo Etkileşim Grafiği EK-2.t. Zoo Etkileşim Grafiği EK-2.u. ENDQ Ana Etki Grafiği EK-2.v. ENDQ Etkileşim Grafiği EK-2.y. ENDQ Etkileşim Grafiği EK-2.z. ENDQ Etkileşim Grafiği EK-3. MEPAR-SQL Sonuç Çıktıları EK-3.a Adult Veri Kümesi Sonuç Çıktısı EK-3.b Credit-App Veri Kümesi Sonuç Çıktısı EK-3.c Iris Veri Kümesi Sonuç Çıktısı EK-3.d Lymphography Veri Kümesi Sonuç Çıktısı EK-3.e Zoo Veri Kümesi Sonuç Çıktısı EK-3.f ENDQ Veri Kümesi Sonuç Çıktısı ÖZGEÇMİŞ

11 1.BÖLÜM GİRİŞ Verilerin dijital ortamda saklanmaya başlanması ile birlikte, yeryüzündeki bilgi miktarının her 20 ayda bir kendini iki katına çıkardığı günümüzde veri tabanlarının sayısı da benzer, hatta daha yüksek bir oranda artmaktadır. Yüksek kapasiteli işlem gücünün ucuzlaması ile, veri saklama hem daha hızlı hem de kolay hale gelmiştir [1]. Veritabanları günümüzde terabyte 1,000,000,000,000 byte tan daha büyük veri, büyüklüklerine ulaşabilmektedir. Bu büyüklükteki veri yığınlarının içinde stratejik öneme sahip gizli bilgiler bulunabilmektedir [2]. Veritabanları değerli hazinelerdir. Bir veritabanı sadece veri saklayıp veri sağlamaz, aynı zamanda çok önemli olabilecek gizli değerli bilgiler de içerir. Bu bilim için yeni bir kanun olabilir, bir hastalığın tedavisi için yeni bir kavrayış olabilir veya milyon dolarlar kazandırabilecek yeni bir pazar eğilimi olabilir. Genelde verilerin analizi elle yapılır. Bir çok gizli ve fayda potansiyeli olan ilişkiler analist tarafından tanınmayabilir. Bugünlerde, bir çok organizasyon büyük miktarlarda veri üretme veya toplama kabiliyetindedir. Mevcut durumda analiz için elde edilebilecek veriler yalın insan aklının kapasitenin çok ötesine geçmiştir. İnsanoğlu bu sorunla başa çıkmak için bilgisayar gücünden faydalanmaya ihtiyaç duymaktadır. Veri madenciliği veya veritabanlarından bilgi keşfi, veritabanlarında gömülü olan altını almak için otomatikleştirilmiş veri eleme sürecidir [3]. Veri madenciliği terimi ile veritabanında bilgi keşfi terimlerinin birbirine yakın anlamları vardır. Veritabanında bilgi keşfi ile elde edilen desen alışılmamış, doğrudan hesaplamalarla elde edilemez ve nihayetinde insan tarafından anlaşılabilir olmalıdır. Veri madenciliği ise veri içinde yararlı desen bulmayı ifade eder. Veritabanında bilgi keşfi etkileşimli ve tekrarlı birkaç adıma sahip bir süreçtir. Veri madenciliği ise bu

12 2 adımlardan biridir. Veri madenciliği KDD sürecinin çekirdeği olduğu için bu iki terim birbirlerinin yerine kullanılabilmektedir [3]. Veri madenciliği, esas olarak veriden bilgi elde etmeyi içeren bir süreçtir. Temel fikir şudur; eğer keşfetme imkanı varsa gerçek-dünya veritabanları karar vermede kullanılacak faydalı ancak gizli bilgiler barındırmaktadır. Örnek olarak, bir şirketin geçmiş satışları hakkındaki veriler satışlarda hangi müşterinin hangi ürünü almaya eğilimi olduğu hakkında gizli bilgiler içerebilir. Bundan dolayı veriler analiz edilerek şirket satışlarını artırma potansiyeli olan bir bilgi keşfedilebilir [4]. Veri madenciliği, veri içerisindeki desenleri ve ilişkileri keşfetmek için çeşitli veri analiz araçlarını kullanarak geçerli tahminler yapmak için kullanılabilecek sürece denir [2]. Veri madenciliği, aslında disiplinler arası bir çalışma alanıdır. Bu alanda başta makine öğrenme ve istatistik olmak üzere ayrı araştırma alanlarından türetilmiş bir çok türde algoritma vardır. Bu algoritmalar veriden bilgi elde etmekte kullanılmaktadır [4].

13 2.BÖLÜM GENEL BİLGİLER 2.1. Veri Madenciliği Veri Madenciliğine Giriş Geçmişte veri madenciliği bilgi yönetimi veya bilgi mühendisliği olarak adlandırılırdı li yıllara kadar daha çok yapay zeka alanında çalışan teorisyenler tarafından tartışılan, anlaşılması güç ve yabancı bir teknoloji idi [5]. Fayyad ve ark. [6] veri madenciliğini; kabul edilebilir etkinlik sınırlarına sahip bilgisayar tekniklerini ihtiva eden, veri üzerinden olağandışı örüntü ve model sıralamaları üreten süreç olarak tanımlanan veritabanlarından bilgi keşfi sürecinin bir adımı olarak tanımlamışlardır. Adriaans ve Zantige [7] ise bir çok araştırmacı tarafından kullanılan daha genel bir tanım kullanarak; veri madenciliğini verinin detayları arasında bilinmeyen örüntü ve eğilimler araştırma süreci olarak tanımlamışlardır. Son yıllarda bilgi toplama çok daha kolay hale gelmiştir, ancak eldeki bilgiler arasındaki ilgi parçacıklarını ortaya çıkarmak için ihtiyaç duyulan çaba özellikle büyük ölçekli veritabanlarında büyük artış göstermiştir [8]. Veri toplama ve depolama teknolojilerindeki hızlı artışı veritabanı, veri ambarı veya WWW gibi diğer depolama türlerindeki verilerin aşırı genişlemesine sebep olmuştur [9]. Buna karşılık bilim adamlarının, mühendislerin ve analistlerin sayısı değişmemektedir [1]. Örnek olarak; klinik tedavi alanında, büyüyen hacimli verilerden bilgi keşfetmede zorluklarla karşılaşılmaktadır. Bugünlerde gözlem altında bulunan hastaların fizyolojik parametrelerinin sürekli olarak toplanması devasa hacimlerdeki bilgilerin ortaya

14 4 çıkmasına sebep olmaktadır. Büyüyen miktarlardaki veri, elle analiz yapan tıp uzmanlarının görevlerini yapmalarını engellemektedir. Bir çok saklı ve potansiyel olarak faydalı ilişkiler analist tarafından fark edilememektedir [10]. Geleneksel teknikler kendi hipotezinizin doğruluğunu kanıtlamanıza izin verir. Şekil 2.1. de görüldüğü gibi bütün ilişkilerin yaklaşık %5 i bu yolla bulunabilir. Veri madenciliği ise kalan %95 lik ilişkilere açılan bir kapıdır. Başka bir deyişle geleneksel teknikler veritabanlarına söz söyleyen bir insana benzetilirse, veri madenciliği tekniği veritabanını dinleyen bir insana benzetilebilir [11]. Geleneksel teknikler %5 Bilinen ilişkiler Veri Madenciliği %95 Saklı ilişkiler Şekil 2.1. İlişkiler Bir çok zaman büyük veritabanları önceden varlığı bilinmeyen veya görülmemiş ilişkiler, eğilimler ve örüntüler için araştırılır. Bu ilişkiler veya eğilimler genelde mühendis, analist veya pazar araştırmacıları tarafından varsayılır, ancak bu ilişkilerin elde edildikleri veriler tarafından ispat edilmesine ihtiyaç duyulmaktadır. Yeni bilgiler kullanıcıların yaptıkları işi daha iyi yapmalarına yardımcı olur [5]. Bunun sonucu olarak, büyük miktarlardaki veriler içerisinden ilginç ve yararlı bilgi keşfetme kabiliyetine sahip güçlü araçlar tesis etmeye karşı ilgi artmıştır [10]. Genel olarak veri madenciliğine ilginin artması aşağıdaki faktörlerle açıklanabilir [7]; lerde şirketler, müşterileri, rakipleri, ürünleri ile ilgili verilerden oluşan veri tabanları oluşturmuşlardır. Bu veri tabanları potansiyel altın madeni gibidir. Sayısı milyonları geçen bu veriler, gizli bilgiler içerirler ve bunlara kolaylıkla SQL (Yapısal Sorgulama Dili) veri tabanı sorgulama dili ya da başka yüzeysel sorgulama dilleri

15 5 kullanılarak ulaşılabilir. SQL sadece bir sorgulama dilidir ve önceden bilinen sınırlamalar altında bilgileri bulmaya yardım eder. Veri madenciliği algoritmaları tipik olarak, veri tabanının alt gruplarında ya da uygun kümelerde belirginleşir. Bir çok durumda tekrarlanabilen SQL sorguları kullanılır ve ortalama sonuçlar elde edilir. Bunu elle yapmak mümkündür fakat oldukça yorucu ve uzun süren bir iştir. 2. Bilgisayarlarda ağ kullanımı gelişmeye devam etmektedir. Bu durumda veri tabanı ile bağlantı kurmak kolaylaşır. Böylece demografik verili dosya ile müşteri dosyası arasında bağlantı kurulabilir ve belirli popülasyon gruplarının kimliklerinin belirlenmesi sağlanabilir. 3. Son birkaç yılda makine öğrenimi teknikleri oldukça gelişmiştir. Sinir ağları, genetik algoritmalar ve diğer basit uygulanabilir öğrenme teknikleri veri tabanlarıyla ilginç bağlantılar kurmayı kolaylaştırır. 4. Müşteri ile hizmet veren arasındaki ilişki, kişisel bilgileri hizmet verenin masasındaki bilgisayardan merkezi bilgi sistemlerine gönderir. Pazarlamacılar ve sigortacılar da bu yeni kazanılan teknikleri kullanmak isterler Veri Madenciliği Nedir? Veri madenciliği veritabanlarından yapılandırılmış bilgilerin otomatik olarak çıkarılma sürecidir. Bu süreç veritabanlarından bilgi keşfi olarak adlandırılan genel sürecin özel bir parçasıdır [12]. Veri madenciliği, çok sayıdaki verinin depolandığı veri tabanlarından elde edilen modeller, örüntüler, ilişkiler, sapmalar ve anlamlı yapılar gibi ilginç bilgilerin keşfedilmesi sürecidir [13]. Veri Madenciliği, organizasyonların karar aşamaları için yeni bilgiler üreten ya da gelecekle ilgili tahminler ve planlar yapmamızı sağlayan bir dizi teknikler ve anlayışlar bütünü olarak da tanımlanabilir [14].

16 6 Veri madenciliği, bilgi keşfetmenin gerekli bir adımı gibi görülmesine rağmen, veri tabanında bilgiyi keşfetmekle eşanlamlı gibi kabul edilir. Bilgi keşfetme işlemi sırasıyla aşağıdaki işlemlerden oluşur [13]; Veri Temizleme: Gürültülü, hatalı, eksik ya da konuyla ilgisi olmayan verilerin dışlanmasıdır. Veri Zenginleştirme: Farklı veri kaynaklarının birleştirilmesidir. Veri Seçimi: Veritabanında yapılacak analiz için kullanılacak bağlantılı verilerin düzeltilmesidir. Veri Kodlama: Verilerin özetlenerek madencilik için uygun olan forma dönüştürülmesi yada birleştirilmesidir. Veri Madenciliği: Veri modellerinin elde edilmesi için uygun yöntemlerin uygulandığı önemli bir işlemdir. Bilgi Sunma: İşlenmiş bilginin çeşitli tekniklerle kullanıcıya sunulmasıdır. Bilgi keşfi süreçlerinin bir adımı olan veri madenciliği son araştırmalarda istatistik, veritabanı, makine öğrenme ve yapay zeka çalışmalarını bir araya toplamıştır. Veritabanları için uygulanan bu sürecin çekirdeğinde makine öğrenme-temelli algoritmalar bulunmaktadır [8]. Büyük miktarlardaki veri araştırılırken örüntülerin ortaya çıkması için etkin bir arama metoduna kullanılması önemlidir [5]. Veri madenciliği tahminde kullanılacak modeller kurarken iyi kurulmuş istatistiksel ve makine öğrenme tekniklerini kullanır. Bugünlerde yukarıda da bahsedildiği gibi teknoloji, madencilik sürecini otomatikleştirmekte, ticari veri ambarlarını bütünleştirmekte ve kullanıcılara faydalı bilgiler sunmaktadır [11] Veri Madenciliği Süreci Veri madenciliği tekrarlanan bir süreçtir. Süreç ilerlerken, verinin kalitesini ve içeriğini ayarlamak için yeni bilgi ve yeni hipotezler üretilmelidir. Bunun anlamı; çalışılan verinin kalitesi veri madenciliği algoritmasının çalışma süresini ve doğruluğunu belirleyecektir, ve eğer algoritma yeterince esnek ise asıl soru tam olarak

17 7 cevaplanmadığı durumda bile problemle ilgili önemli bilgiler bulunabilecektir. Veri madenciliği süreci altı aşamaya sahip bir metodoloji olarak ifade edilebilir. Bu metodoloji; çözüm aranacak problemin tanımlanması, problemle ilgili geçmiş bilgilerin elde edilmesi, kullanılabilir verilerin seçimi, verinin ön işleme tabi tutulması, analiz ve sonuçların yorumlaması ve bu sonuçların kullanılması aşamalarını içerir [5]. Bu aşamalar Şekil 2.2. de görülmektedir. Problemin Tanımlanması Geçmiş Bilgiler Veri Seçimi Veri Önişleme Analiz ve Yorum Raporlama ve Kullanım Şekil 2.2. Veri Madenciliği Süreci Problemin Tanımlanması Problemin tanımlanması safhası veri madenciliği sürecinin ilk aşamasıdır. Bu aşama süresince, belirlenen problem için veri madenciliğinin kullanılmasındaki amaçlar tanımlanır. Veri madenciliği projesinde başlangıç sorusu çoğunlukla üstü kapalı olmalıdır. Çünkü bu durumda veri madenciliği süreci probleme yararı olmayan büyük miktarda veriyi önemsemeyecektir. Bu yolla, veri seçimi ve veri önişleme adımları başta iyice incelenmiş verilerle başlayarak, problemi çözmeye yardımcı olacaktır. Bu safha süresince sonuçların nasıl kullanılacağını bilmek büyük önem taşımaktadır.

18 8 Bu safha veri madenciliği sürecinin beklentilerinin ve standartlarının saptandığı safhadır. Ayrıca çalışılan verilerin kalitesini öğrenmeye yardımcı olur. Eğer çok fazla iterasyona ihtiyaç varsa ve sonuçlar kabul edilemeyecek kadar belirsizlikle sonuçlanıyorsa, problemin tanımı yerine verinin kalitesi üzerinde durulmalıdır Geçmiş Bilgiler Analistin, çalışılan veri üzerindeki muhtemel önyargı ve seçim etkileri hakkında bilgi sahibi olması gerekmektedir. Bu bilgi sayesinde geliştirici ekibe muhtemel kısıtlamalar hakkında bilgi verilebilmektedir. Veri seçimi yapmadan önce bilinmesi gereken bir başka bilgi ise veri üzerinde bulunan tipik gündelik ilişkilerdir. Heckerman [15] bu sorun için Bayesian Ağlarını önermiştir. Böylece, veriden sağlanan sonuç üzerindeki muhtemel kayıplara işaret eden önceki bilgilerle birleşme sağlanabilmektedir. Önceki bilgilerin elde edilmesi bilginin yeniden keşfinin önlenmesini sağlar. Özde, veri madenciliği algoritması, mevcut olan örüntülerin tekrar öğrenilmesini önleyecek birkaç açıklama ile bir sorunun üstesinden gelebilmektedir. Feelders ve ark. [16] kural türetme (rule induction) adını verdikleri bir metot önermişlerdir. Bu metotta analizin bilinen ilişkileri göz önünde bulundurması için kullanıcının rehberliğine ihtiyaç duyulmaktadır. Bilginin edinimi veri madenciliği sürecinde kritik bir role sahiptir. Bu aşama olumlu sonuçlar veren sürece doğrudan zamanında yardımcı olabilir Veri Seçimi Geçmiş bilgiler elde edildikten sonra, veri madenciliği süreci probleme cevap teşkil edecek analizde kullanılacak verilerin seçiminin yapılacağı önemli bir adıma ulaşır. Bu seçim yapılırken geleneksel kalıplardan çıkılmalıdır. Çünkü, veri madenciliğinde insanın görevi problemin çözümünü bulmak değildir, aksine verinin kendi kendine bu sonuçlara yaklaşmasına yardım etmektir. Süreç, geçmiş verilerin eldesi ile zaten uzman kişinin zararlı sonuçlara götürecek eğilimlerinden korunmuş olmaktadır. Subramanian ve ark. [17] ve Yevich [18] potansiyel ilgiye sahip verilerin seçimi için ideal desteği sunan veri ambarı kullanımını önermişlerdir. Ancak, veri ambarı

19 9 halihazırda nadiren bulunabilir. Bu durumda şirketler bu işlemi seçimden önce bir sefer oluşturma sürecinin üzerinden geçmelidirler. Eğer veri ambarı seçim aşamasında hazır değilse, veri madenciliği süreci çok uzun sürelere ihtiyaç duyacaktır. Veri seçimi hayati öneme sahiptir. Önceki aşamaların uygun şekilde tamamlandığını varsaydığımızda veri seçiminin sonraki aşamalarda sonuca ulaşma süresini kısaltıcı etkisi görülecektir Veri Önişleme Veri ambarında bütün ilgili verilerin bulunduğu durumlarda bile analizin yapılabilmesi için önişlemeye sıklıkla ihtiyaç duyulur. Bu aşamada uzman yeni özellikler ekleyebilme özgürlüğüne sahiptir. Bu eklemeler sayesinde veri madenciliği sürecinde algoritmanın varlığını belirlemekte zorlandığı ilişkilerin kurulması sağlanır. Sınıflandırma ağaç algoritması gibi bazı algoritmalar, veri madenciliği süreci için önemli sayılan kesin ilişkileri belirlemekte başarısızlığa uğrayabilir. Diğer algoritmalar çok uzun zaman harcayarak belirlemeleri yapabilir. Eğer uzman halihazırda bu bilgiye sahipse, bunu doğrudan bir özellik olarak eklemesi, algoritmanın belirlemeye çalışmasından daha uygun bir seçim olur. Veritabanlarındaki bire-çok ilişkiler çoğunlukla önişleme aşamasında karşımıza çıkmaktadır. Veri madenciliği algoritması çoğu durumda bir kayıtla ilgili bütün özelliklerin tek bir satırda bulunması varsayımına göre tasarlanmıştır. Şartların sağlanması doğrultusunda algoritma çok büyük tekil bir tablo ile çalışmak zorunda kalabilir. Analist muhtemel özellikleri belirlerken ve kayıtları oluştururken alan bilgisini kullanmalı ve ortak akıl kaidelerine uymalıdır Analiz ve Yorumlama Bu aşamadaki süreç veri madenciliği süresinin en az %70 ini kullanır. Bu aşama esnasında analistin veri madenciliği, veri analizi ve çalışılan alanda tecrübe ve bilgiye sahip olması kritik öneme sahiptir. Çalışılan konu hakkındaki bilgilerin ilk olarak ihtiyaç duyulduğu yer, sonuçların yorumlanma aşamasıdır. Bu bilgiler, ileriki araştırmalarda hangi sonuç veya sonuçların göz önünde bulundurulması gerektiğini muhtemel doğru hareketle yapabilmek için büyük öneme sahiptirler. Veri analizi deneyimi veri üzerinde garip örüntüler bulunduğu zaman açıklama için ve çalışılan

20 10 verinin daha ilginç parçalarına önem göstermek için prensipte ihtiyaç duyulan bir özelliktir. Sonuç olarak, veri madenciliği deneyimi ve uzmanlığı sonuçların teknik olarak yorumlanması için gereklidir. Analiz ve yorumlama aşaması asıl madenciliğin yapıldığı aşamadır. Verinin seçilip, önişleme tabi tutulup ve çözülecek problemin anlaşılmasından sonra bu aşama veriler arasında belirli örüntüler, benzerlikler ve diğer ilginç ilişkileri bulmaya çalışır. Bütün bu örüntüler genellikle veri madenciliği sürecinin son aşamasında kurallara çevrilir Raporlama ve Kullanım Veri madenciliği sürecinin sonuçları çok geniş kullanım alanına sahiptir. Sonuçlar karar ağacı gibi çok basit uygulamalara girdi olabileceği gibi son kullanıcı uygulamasına tam olarak bütünleşmiş uygulamalarda da kullanılabilmektedir. Bu sonuçlar ayrıca karar destek sistemlerinde veya bir bilgi tabanı sisteminde de kullanılabilir. Bu alandaki bir uygulama bilgi tabanlı bir sistemde öğrenmeyi daha hızlı ve etkin kılar. Çünkü uzman kişilerin yanlı etkilerinin ayarlanmasını beklemesine gerek yoktur. Edinilen bilgi bazı koşullarda daha doğru olabilmektedir. Ve eğer süreç içerisinde edinilen geçmiş bilgi güvenilir ise sonuçlarda güvenilir olacaktır Veri Madenciliğinin Görevleri Genel olarak veri madenciliği, tanımlayıcı ve tahminleyici veri madenciliği olmak üzere iki kategoride sınıflandırılır. Betimsel veri madenciliğinde, veri kümesi kısa ve öz bir şekilde tanımlanır ve verilerin ilginç genel özellikleri sunulur. Kestirim veri madenciliğinde ise bir ya da daha fazla modeller kümesi oluşturulup varolan verilerden sonuçlar çıkarılır ve yeni veri kümelerinin davranışları tahmin edilmeye çalışılır [7]. Veri madenciliğinin başlıca görevleri kısaca açıklanmıştır [19] Sınıf Betimlemesi Veri kümesinin kısa bir özetini sağlar ve diğerlerinden farklılığını ortaya koyar. Bir veri kümesinin özetlenmesine sınıf nitelendirmesi denir. İki ya da daha fazla veri kümesinin karşılaştırılmasına ise sınıf karşılaştırması ya da ayrımı denir. Sınıf betimlemesi sadece

21 11 özet özellikleri değil merkezi eğilim ölçüleri ve dağılım ölçüleri gibi özellikleri de içerir. Örneğin Avrupa ya karşı Asya şirketlerinin satışlarını karşılaştırmak, iki sınıfı ayırt edip önemli faktörleri belirlemek ve özet bir bilgi sunmak için sınıf betimlemesi kullanılır Birliktelik Birliktelik, modeller kümesi arasındaki birliktelik ilişkilerini ya da korelasyonları keşfetmektir. Birliktelik analizi, pazarlama yönetimi, katalog planı ve diğer alanlarda karar verme sürecinde geniş ölçüde kullanılır. Son zamanlarda kurulmuş etkin algoritmalı birliktelik analizinde önemli araştırmalar yapılmıştır. Bunlar, düzey-tarz, önsel araştırma, çoklu düzeyde madencilik, çok boyutlu birliktelikler, sayısal, kategorik ve sürekli veri, meta-örüntü, yönelimli yada kısıt temelli madencilik ve madencilik korelasyonları için madencilik birlikteliklerini içerir Sınıflandırma Sınıflandırma çalışılan verilerin kümesini çözümler (sınıf ismi, etiketi bilinen objelerin kümesi) ve verilerin içinde özelliklerine göre sınıflar oluşturup her bir sınıf için bir model kurar. Veritabanındaki her bir sınıfın daha iyi anlaşılması ve daha sonra elde edilen verilerin sınıflandırılması için sınıflama işlemi bir karar ağacı ya da sınıflandırma kurallarının bir kümesini oluşturur. Örneğin, hastalıkların belirtilerine göre hastalıkları sınıflama, hastalık türlerini tahmin etmeye yardım eder. Makine öğrenimi, istatistik, veritabanı, sinir ağları, evrimsel algoritmalar ve diğer alanlarda geliştirilmiş bir çok sınıflandırma yöntemi vardır. Sınıflandırma, müşteri bölümü, iş modelleme ve kredi analizlerinde kullanılır. Sınıflandırma ile ilgili geniş bilgi Bölüm 2.2.'de verilmiştir Tahmin Bu fonksiyon, bazı eksik verilerin muhtemel değerlerini ya da nesnelerin bir kümesinde kesin özelliklerin değer dağılımını ve seçilen nesnelere benzer verilerin kümesini temel alan değer dağılımını tahmin eder. Örneğin, bir işçinin maaşı, çalıştığı yerdeki diğer

22 12 işçilerin maaş dağılımı temel alınarak tahmin edilebilir. Genellikle, regresyon analizi, genelleştirilmiş doğrusal model, korelasyon analizi, karar ağaçları, genetik algoritmalar, sinir ağı modelleri nitelikli bir tahmin için kullanılan yöntemlerdir Kümeleme Kümeleme çözümlemesi, özellikleri birbirine benzeyen objelerin değerlerinin toplanmasından oluşan bir kümede, verilerin içindeki gizli kümeleri belirlemektir. Benzerlik, uzmanlar ya da kullanıcılar tarafından belirlenmiş uzaklık fonksiyonlarıyla tanımlanabilir. İyi bir kümeleme yöntemi, kümeler arası benzerliğin düşük ve küme içi benzerliğin yüksek olduğu nitelikli kümeler meydana getirir. Örneğin, evler, zemin alanı ve coğrafik yerleşime göre kümelenebilir. Veri madenciliği araştırması, büyük veritabanları ve çok boyutlu veri depoları için yüksek nitelikli ve hesaplanabilir kümeleme yöntemlerine odaklanır Zaman Serileri Analizi Zaman-serileri çözümlemesi, benzer seriler ve ardışık örüntülerin madenciliği, periyodikler, eğilimler ve sapmaların araştırılması, ilginç özellikler ve kesin düzenlerin bulunması için zaman serilerinin geniş kümesini çözümler. Örneğin, bir şirketin geçmişteki stok durumuna, iş durumuna, rekabet performansına ve günlük piyasasına bakarak stok değerlerinin eğilimi tahmin edilebilir Veri Madenciliğinde Kullanılan Algoritmalar Veri madenciliği algoritmaları danışmansız ve danışmanlı öğrenme olarak iki ayrı şekilde gerçekleştirilir. Danışmansız öğrenme, veri örüntülerini veri kümesi içindeki bazı mantıksal düzenlerini karakterize ederek bulur. Bu durumda nitelik ilişkileri arasında hiçbir ön varsayım yapılmaz. Danışmanlı öğrenmede ise; denetmen bilinen durumları modele göstererek veya iyi tanımlanmış örüntülerin modele etki etmesini sağlayarak genelleştirmeleri şekillendirir. Uzmanlar bu şekilde aramaya rehberlik eder. Sınıflandırma ise belkide uygulanan en genel danışmanlı veri madenciliği tekniğidir. Bu teknik sınıf bilgileri bulunan öğrenme örnek kümesinden grup kuralları üreterek gelecek örüntüleri sınıflandırmayı içerir [8].

23 13 Sınıflandırma konusu doğası gereği danışmanlı algoritma kullanmaktadır. Bu sebeple danışmanlı algoritmalarla ilgili daha geniş bilgi verilecektir Danışmansız Öğrenme Algoritmaları K-Yol Kümeleme K-yol iyi bilinen kümeleme problemlerini çözebilen en basit danışmansız öğrenme algoritmasıdır. Prosedür, çalışılan veri kümesini, daha önceden belirlenmiş bir sayıda kümeye ulaşıncaya kadar sınıflandırır. İşleyiş bu kadar basittir. Ana fikir her bir küme için bir adet yani K adet merkez tanımlamaktır. Bu merkezlerin yerlerine akıllıca karar verilmelidir, çünkü farklı yerler farklı sonuçlar doğurur. Birbirinden olabildiğince uzak olarak belirlenen merkezlerin daha iyi sonuç verdiği düşünülmektedir. Algoritma adımları şöyledir; 1. K adet noktayı kümelenecek nesnelerin uzayına yerleştir. Bu noktalar başlangıç grup merkezleri olacaktır. 2. Her bir nesneyi en yakın merkeze ata. 3. Bütün nesneler atandığında K merkezin pozisyonunu tekrar hesapla. 4. Merkezler hareketsiz kalana kadar 2. ve 3. ü tekrarla. Bu hesaplama en az mesafeyi hesaplayana kadar nesneleri gruplara bölecektir [20] Özdüzenleyici Haritalar (Self Organized Maps) Özdüzenleyici haritalar, veri görüntüleme tekniğidir. Kendinden örgütlü sinir ağları kullanarak verinin boyutlarını indirger. İnsanın çok yüksek boyutlardaki verileri görememe problemine karşı uygulanmaktadır [21] Danışmanlı Öğrenme Algoritmaları Regresyon Modelleri İstatistik uzun zamandır veri küme modelleri oluşturmak için kullanılmaktadır. Doğrusal regresyon süreci olasılık, veri analizi ve istatistiksel sonuç çıkarma tekniklerini kullanan bir süreçtir. Regresyon analizi yüz yılın başlarında Francis Galton

24 14 tarafından ilk kez ortaya atılmıştır. Veri modellemede ise genellikle verilen bağımsız değişkenlere göre bir bağımlı değişkenin koşullu beklenen değeri için kullanılır [22]. Regresyon modelleri veri madenciliğinde kullanılan en eski ve en fazla bilinen istatistik tekniklerinden biridir. Temel olarak regresyon, nümerik veriyi girdi olarak kabul edip, sonuç olarak matematiksel bir formül verir. Az boyutlu verilerde rahatlıkla uygulanabilir, ancak, kümelerin arasından ilginç olanları seçmek için bazı zamanlarda ileri araştırma programlarına gerek duyulabilir. Doğrusal regresyon modelleri de diğer veri madenciliği araçlarının yaptığı işlerin benzerini yapmaktadır. Regresyon teknikleri koşullu olasılığın bulunduğu durumlarda tahminleme yapmak için kullanılabilir. Tahminleme için kullanılan regresyon modeli doğrusal olasılık modeli olarak adlandırılır. Regresyon modellerinden biri de bütün bağımsız değişkenleri koşulsuz olan logit modeldir. Lojistik regresyon modeli ise logit modeline benzeyen ek olarak sürekli değişkenleri de ihtiva eden bir modeldir. Bir çok tipte regresyon modeli vardır. Verilerin doğrusal fonksiyona kolayca girilemeyeceği durumlarda doğrusal olmayan regresyon ve doğrusal olmayan çoklu regresyon modelleri kullanılabilir. Çeşitli istatistiksel modeller kullanılarak, çoklu ve kısmi korelasyon katsayıları tanımlanabilir [22]. Bu modellerin en büyük kusuru, etkin bir kullanım için zor anlaşılır olmasıdır. Veri madenciliği, veriden anlamlı bilgileri çıkarma süreci olarak tanımlanırken, istatistik veriden anlamlı bilgi çıkarmayı da içeren çalışma alanının bütünüdür. İstatistik uzmanları ile tahmine dayalı modelleme ile ilgilenen diğer uzmanlar arasında çoğu zaman bir duvar vardır. Bir çok profesyonel istatistikte kullanılan terminolojiyi kullanmakta zorlanmaktadır. Daha ötesi, endüstri analistleri geçmiş tarihten bu yana istatistik ile veri madenciliğini birbirinden ayırt etmişler ve veri madenciliğinin istatistikten farklı olduğunu belirtmişleridir. Özel sektördeki profesyoneller için veri madenciliği üzerine yoğunlaşmak daha kolay bir tercihtir. IBM, SPSS ve SAS bu sezgiyi yok etmek için çok yol kat edip, standart istatistik modellerini yapay sinir ağları, karar ağaçları ve veri madenciliği ile bütünleşik diğer tekniklerin yanına eklemişlerdir [22].

25 K-En Yakın Komşu Kayıtlar, bir veri uzayındaki noktalar olarak düşünülürse, birbirine yakın olan kayıtlar, birbirinin civarında (yakın komşu) olur. K-en yakın komşuluğunda temel düşünce komşunun yaptığı gibi yap tır. Eğer belirli bir kişinin davranışı tahmin edilmek isteniyorsa, veri uzayında o kişiye yakın, örneğin on kişinin davranışlarına bakılır. Bu on kişinin davranışlarının ortalaması hesaplanır ve bu ortalama belirlenen kişi için tahmin olur. K-en yakın komşuluğunda, K harfi araştırılan komşuların sayısıdır. 5-en yakın komşuluğunda, 5 kişiye ve 1-en yakın komşuluğunda 1 kişiye bakılır [23]. En yakın komşuluk modelleri yerel modellerin kombinasyonu temeline dayanan veri madenciliği metotlarının esnek bir grubudur. Bu metotların yerel kombinasyonlardan oluşması demek lokal mantıkta çalıştıkları anlamına gelmemektedir. Bunlar bütün veri kümesine uygulanabilen metotlardır ancak, istatistiksel analiz yerel analizlere bölünmüştür. Temel fikir oldukça basittir. Uygun değişkenler, açıklayıcı (x) ve hedef (y) değişkenlere bölünür. Öğrenme verisinden (x,y) formatında gözlemler toplanır. Bu öğrenme verisi için, gözlemdeki x değerleri arasında uzaklık formülü oluşturulur. Bu hesaplama gözlem esnasında oluşan bir komşuluğa en yakın olan her bir gözlem için x değerleri arasında yapılır. Sürekli bir cevap değişkeni için, her bir gözlemin cevabı olan y i için uygun en yakın komşu değeri; 1 y ˆ = (1) i y j k x N ( ) j x i ile tanımlanır. Bu değer, N(x i ) yani x i nin bütün komşularına karşılık gelen x cevap değerlerinin ortalamasıdır. Bunun yanında, k ise daha önceden belirlenmiş olan hesaba dahil edilecek komşu sayısını gösteren değerdir [24]. En yakın komşu metotları tahminsel sınıflandırmada da kullanılmaktadır. Y gözlemini sınıflandırmak için, önce onun komşuluğu belirlenir ve her bir kategorinin yerleştirilmiş olasılıkları komşuluktaki göreceli sıklıklar şeklinde hesaplanır. Sınıflandırmak için en yüksek yerleştirilmiş olasılık seçilir. Ağaç modellerindeki gibi, en yakın komşu modelleri olasılık dağılımına ihtiyaç duymaz. Bu modeldeki can alıcı seçimler uzaklık fonksiyonu ve dahil edilecek komşu sayısı parametresi olan k dır [22].

26 16 Bu modellerin olası dezavantajları özellikle çok fazla açıklayıcı değişken varsa çok fazla hesaplama yükü getirmesidir. Bu durumda komşuluklar ilgisiz noktalarda belirebilir, bu sebepten dolayı ortalamalarını almak anlamlı sonuçlar vermeyebilir Yapay Sinir Ağları Yapay sinir ağlarında amaç fonksiyonu birbirine bağlı basit işlemci ünitelerinden oluşan bir ağ üzerine dağıtılmıştır. Yapay sinir ağlarında kullanılan öğrenme algoritmaları veriden üniteler arasındaki bağlantı ağırlıklarını hesaplar. Yapay sinir ağları istatistiksel yöntemler gibi veri hakkında parametrik bir model varsaymaz yani uygulama alanı daha geniştir ve bellek tabanlı yöntemler kadar yüksek işlem ve bellek gerektirmez [25]. Beynin üstün özellikleri, bilim adamlarını üzerinde çalışmaya zorlamış ve beynin nörofiziksel yapısından esinlenerek matematiksel modeli çıkarılmaya çalışılmıştır. Beynin bütün davranışlarını tam olarak modelleyebilmek için fiziksel bileşenlerinin doğru olarak modellenmesi gerektiği düşüncesi ile çeşitli yapay hücre ve ağ modelleri geliştirilmiştir. Böylece yapay sinir ağları denen yeni ve günümüz bilgisayarlarının algoritmik hesaplama yönteminden farklı bir bilim alanı ortaya çıkmıştır. Yapay sinir ağları; yapısı, bilgi işleme yöntemindeki farklılık ve uygulama alanları nedeniyle çeşitli bilim dallarının da kapsam alanına girmektedir [26]. Genel anlamda yapay sinir ağları, beynin bir işlevi yerine getirme yöntemini modellemek için tasarlanan bir sistem olarak tanımlanabilir. Yapay sinir ağları, yapay sinir hücrelerinin birbirleri ile çeşitli şekillerde bağlanmasından oluşur ve genellikle katmanlar şeklinde düzenlenir. Donanım olarak elektronik devrelerle ya da bilgisayarlarda yazılım olarak tasarlanabilir. Beynin bilgi işleme yöntemine uygun olarak yapay sinir ağları, bir öğrenme sürecinden sonra bilgiyi toplama, hücreler arasındaki bağlantı ağırlıkları ile bu bilgiyi saklama ve genelleme yeteneğine sahip paralel dağılmış bir işlemcidir. Öğrenme süreci, arzu edilen amaca ulaşmak için yapay sinir ağları ağırlıklarının yenilenmesini sağlayan öğrenme algoritmalarını içerir [27]. Yapay sinir ağlarında kullanılan öğrenme algoritmaları veriden üniteler arasındaki bağlantı ağırlıklarını hesaplar. Yapay sinir ağları, sonuçları bilinen belirli veri kümeleri üzerinde algoritmaları çalıştırarak eğitilirler. Bunun sonucunda yapay sinir ağının

27 17 içindeki ağırlık belirlenir. Bu ağırlıklar yeni gelen verilerin işlenmesinde kullanılır. Karmaşık veri tabanları üzerinde daha iyi sonuçlar üretebilirler [23] Yapay Sinir Ağlarının Özellikleri Yapay sinir ağlarının hesaplama ve bilgi işleme gücünü paralel dağılmış yapısından, öğrenebilme ve genelleme yeteneğinden aldığı söylenebilir. Genelleme, eğitim ya da öğrenme sürecinde karşılaşılmayan girişler için de yapay sinir ağlarının uygun tepkileri üretmesi olarak tanımlanır. Bu özellikler yapay sinir ağlarının karmaşık problemleri çözebilme yeteneğini göz önüne çıkarır. Günümüzde birçok bilim alanında yapay sinir ağları, aşağıdaki özellikleri nedeniyle etkin olmuş ve uygulama yeri bulmuştur [26]. 1. Doğrusal Olmama: Yapay sinir ağlarının temel işlem elemanı olan hücre doğrusal değildir. Dolayısıyla hücrelerin birleşmesinden meydana gelen yapay sinir ağları da doğrusal değildir ve bu özellik bütün ağa yayılmış durumdadır. 2. Öğrenme: Yapay sinir ağlarının arzu edilen davranışı gösterebilmesi için amaca uygun olarak ayarlanması gerekir. Bu, hücreler arasında doğru bağlantıların yapılması ve bağlantıların uygun ağırlıklara sahip olması gerektiğini ifade eder. Yapay sinir ağlarının karmaşık yapısı nedeniyle bağlantılar ve ağırlıklar önceden ayarlı olarak verilemez ya da tasarlanamaz. Bu nedenle yapay sinir ağları, istenen davranışı gösterecek şekilde ilgilendiği problemden aldığı eğitim örneklerini kullanarak problemi öğrenmelidir. 3. Genelleme: Yapay sinir ağları, ilgilendiği problemi öğrendikten sonra eğitim sırasında karşılaşmadığı test örnekleri için de arzu edilen tepkiyi üretebilir. Örneğin, karakter tanıma amacıyla eğitilmiş bir yapay sinir ağı, bozuk karakter girişlerinde de doğru karakterleri verebilir ya da bir sistemin eğitilmiş yapay sinir ağı modeli, eğitim sürecinde verilmeyen giriş sinyalleri için de sistemle aynı davranışı gösterebilir. 4. Uyarlanabilirlik: Yapay sinir ağları, ilgilendiği problemdeki değişikliklere göre ağırlıklarını ayarlar. Yani, belirli bir problemi çözmek amacıyla eğitilen yapay sinir ağı, problemdeki değişimlere göre tekrar eğitilebilir, değişimler devamlı ise gerçek zamanda da eğitime devam edilebilir.

28 18 5. Hata Toleransı: Yapay sinir ağları, çok sayıda hücrenin çeşitli şekillerde bağlanmasından oluştuğundan paralel dağılmış bir yapıya sahiptir ve ağın sahip olduğu bilgi, ağdaki bütün bağlantılar üzerine dağılmış durumdadır. Bu nedenle, eğitilmiş bir yapay sinir ağının bazı bağlantılarının hatta bazı hücrelerinin etkisiz hale gelmesi, ağın doğru bilgi üretmesini önemli ölçüde etkilemez. Bu nedenle, geleneksel yöntemlere göre hatayı tolere etme yetenekleri son derece yüksektir. 6. Donanım ve Hız: Yapay sinir ağları, paralel yapısı nedeniyle büyük ölçekli entegre devre teknolojisi ile gerçeklenebilir. Bu özellik, yapay sinir ağlarının hızlı bilgi işleme yeteneğini artırır ve gerçek zamanlı uygulamalarda arzu edilir. 7. Analiz ve Tasarım Kolaylığı: Yapay sinir ağlarının temel işlem elemanı olan hücrenin yapısı ve modeli, bütün yapay sinir ağları yapılarında yaklaşık aynıdır. Dolayısıyla yapay sinir ağlarının farklı uygulama alanlarındaki yapıları da standart yapıdaki bu hücrelerden oluşacaktır Yapay Sinir Ağlarının Yapısı Sinir hücreleri bir grup halinde işlev gördüklerinde ağ olarak adlandırılırlar ve böyle bir grupta binlerce nöron bulunur. Yapay nöronların birbirleriyle bağlantılar aracılığıyla bir araya gelmeleri yapay sinir ağını oluşturmaktadır. Yapay sinir ağıyla aslında biyolojik sinir ağının bir modeli oluşturulmak istenmektedir. Nöronların aynı doğrultu üzerinde bir araya gelmeleriyle katmanlar oluşmaktadır [27]. Katmanların değişik şekilde birbirleriyle bağlanmaları değişik ağ mimarilerini doğurur. Yapay sinir ağları üç katmadan oluşur. Bu katmanlar sırasıyla; Girdi Katmanı: Bu katmandaki proses elemanları dış dünyadan bilgileri alarak ara katmanlara transfer ederler. Bazı ağlarda girdi katmanında herhangi bir bilgi işleme olmaz. Gizli Katman (Ara Katman): Girdi katmanından gelen bilgiler işlenerek çıktı katmanına gönderilirler. Bu bilgilerin işlenmesi gizli katmanlarda gerçekleştirilir. Bir ağ içinde birden fazla gizli katman olabilir.

29 19 Çıktı Katmanı: Bu katmandaki proses elemanları gizli katmandan gelen bilgileri işleyerek ağın girdi katmanından sunulan girdi seti için üretmesi gereken çıktıyı üretirler. Üretilen çıktı dış dünyaya gönderilir. Girdi katmanı, gizli katman ve çıktı katmanı Şekil 2.3. te görülmektedir. Girdi Katmanı Çıktı Katmanı Gizli Katman Şekil 2.3. Yapay Sinir Ağı Modeli Karar Ağaçları Verileri sınıflandırmak ve bu verilerle tahminleme yapmak, birbirleriyle çok yakın bağlantılı işlemlerdir. Bu işlemler karar ağaçlarıyla daha iyi görülebilir. Örnek olarak; belirli bir müşterinin, belirli bir davranışı gösterip göstermeyeceği kestirilmek istenebilir. Bu durumda müşterinin, belirli bir müşteri sınıfında yer aldığı ve bundan dolayı da belirli bir davranışı göstereceği açıktır. Karar ağacı, ağaç yapısında olan bir akış şeması şeklindedir. Her düğüm, bir nitelik üzerindeki test işlemini temsil eder. Her dallanma test işleminin sonucunu temsil eder, ve sonuç olarak ağaç sınıflar ile son bulur [23].

30 20 Tümevarım algoritmaları, büyük veri kümelerini çok iyi analiz eder ve tümevarım algoritmaları ile kurulan karar ağacı ile karar süreci kolaylaştırılır. Yapılan kestirimler de daha iyi sonuçlar verir [28]. İstatistiksel yöntemlerde veya yapay sinir ağlarında veriden bir fonksiyon öğrenildikten sonra bu fonksiyonun insanlar tarafından anlaşılabilecek bir kural olarak yorumlanması oldukça zordur. Karar ağaçları ise veriden oluşturulduktan sonra kökten yaprağa doğru inilerek kurallar yazılabilir; IF <Koşul> THEN < Tahmin (sınıf)> Bu şekilde kural çıkarma, veri madenciliği çalışmasının sonucunun doğrulanmasını sağlar. Bu kurallar uygulama konusunda uzman bir kişiye gösterilerek sonucun anlamlı olup olmadığı denetlenebilir. Sonradan başka bir teknik kullanılacak bile olsa karar ağacı ile önce bir kısa çalışma yapmak, önemli değişkenler ve yaklaşık kurallar konusunda analiste bilgi verir ve daha sonraki analizler için yol gösterici olabilir [25]. Tahmin edici ve tanımlayıcı özelliklere sahip olan karar ağaçları, veri madenciliğinde, kuruluşlarının ucuz olması, yorumlanmalarının kolay olması, veri tabanı sistemleri ile kolayca entegre edilebilmeleri, güvenilirliklerinin daha iyi olması nedenleri ile sınıflama modelleri içerisinde en yaygın kullanıma sahip algoritmalardır [29]. Karar ağacı algoritmasının yaygın olarak kullanıldığı sahalar, Belirli bir sınıfın muhtemel üyesi olacak elemanların belirlenmesi, Çeşitli vakaların yüksek, orta, düşük risk grupları gibi çeşitli kategorilere ayrılması, Gelecekteki olayların tahmin edilebilmesi için kurallar oluşturulması, Parametrik modellerin kurulmasında kullanılmak üzere çok miktardaki değişken ve veri kümesinden faydalı olacakların seçilmesi, Sadece belirli alt gruplara özgü olan ilişkilerin tanımlanması, Kategorilerin birleştirilmesi ve sürekli değişkenlerin kesikli hale dönüştürülmesidir Evrimsel Algoritmalar Veri madenciliğinde arama süreci genel zayıf metotları ve alan spesifik güçlü metotları içeren çeşitli tekniklerle yapılabilir. 4 çeşit evrimsel algoritmadan bahsedilebilir;

31 21 Genetik Algoritmalar (GA), Genetik Programlama (GP), Evrim Stratejileri (ES), Evrimsel Programlama (EP). Evrimsel algoritmalar ile ilgili daha geniş bilgi 4. Bölümde verilmiştir Veri Madenciliğinin Kullanım Alanları Günümüzde veri madenciliğinin başlıca ilgi alanları olarak aşağıdakiler sayılabilir [30]; 1. Pazarlama Müşteri segmentasyonu, Müşterilerin demografik özellikleri arasındaki bağlantıların kurulması, Çeşitli pazarlama kampanyaları, Mevcut müşterilerin elde tutulması için geliştirilecek pazarlama stratejilerinin oluşturulması, Pazar sepeti analizi, Çapraz satış analizleri, Müşteri değerlemesi, Müşteri ilişkileri yönetimi, Çeşitli müşteri analizleri, Satış tahminleri. 2. Bankacılık Farklı finansal göstergeler arasındaki gizli korelasyonların bulunması, Kredi kartı dolandırıcılıklarının tespiti, Müşteri segmentasyonu, Kredi taleplerinin değerlendirilmesi, Usulsüzlük tespiti, Risk analizleri, Risk yönetimi. 3. Sigortacılık Yeni poliçe talep edecek müşterilerin tahmin edilmesi,

32 22 Sigorta dolandırıcılıklarının tespiti, Riskli müşteri tipinin belirlenmesi. 4. Perakendecilik Satış noktası veri analizleri, Alış-veriş sepeti analizleri, Tedarik ve mağaza yerleşim optimizasyonu. 5. Borsa Hisse senedi fiyat tahmini, Genel piyasa analizleri, Alım-satım stratejilerinin optimizasyonu. 6. Telekomünikasyon Kalite ve iyileştirme analizleri, Hisse tespitleri, Hatların yoğunluk tahminleri. 7. Sağlık ve İlaç Test sonuçlarının tahmini, Ürün geliştirme, Tıbbi teşhis, Tedavi sürecinin belirlenmesi. 8. Endüstri Kalite kontrol analizleri, Lojistik, Üretim süreçlerinin optimizasyonu. 9. Bilim ve Mühendislik

33 23 Ampirik veriler üzerinde modeller kurarak bilimsel ve teknik problemlerin çözümlenmesi Veri Madenciliğinde Yapılan Çalışmalar Tzu-Liang ve ark. [31], CNC tezgahlarında işlem görmüş parçaların kabulünün tahminindeki kalite güvence problemini çözmek için yeni bir yaklaşım sunmuşlardır. Gerçek yüzey pürüzlülük değerinin tahmini yerine, işlem görmüş parçaların kalite kabulü üzerinde odaklanmışlardır. Sunulan kural bileşimi algoritmasını ve kural onaylama prosedürünü, işletmenin uzun yıllar boyu topladığı geçmiş veriler üzerinde test etmişlerdir. Sonuçlar geliştirdikleri tekniğin, yüzey pürüzlülüğünün kabul edilebilirliğinin tahmini açısından istatistiksel tekniklerden (çoklu nominal regresyon ve genel diskriminant) çok daha doğru sonuçlar verdiğini göstermiştir. Menon ve ark. [32] yaptıkları çalışmada, kalite ve güvenirliliği iyileştirmek için metinsel veri madenciliğini araç olarak kullanmışlardır. Literatürdeki ürün geliştirme süreci ile ilgili yapılan çoğu çalışma sayısal veritabanları üzerine yoğunlaştığından, metinsel veritabanları ile ilgili çalışmalara ihtiyaç olduğunu vurgulamışlar ve bu sebepten dolayı metinsel veritabanları üzerinde yoğunlaşmışlardır. Metinsel veri madenciliğinin uygulanabileceği tüketici ve son ürünler için genel ürün geliştirme süreci alanlarını belirtmişlerdir. Ayrıca iki büyük çok uluslu işletmede metinsel veri madenciliğinin başarılı uygulamalarını sunmuşlardır. M. C. Jothishankar ve ark. [33], basılmış devre levhalarının akış lehimlenmesi sırasındaki hataların oluşumuna etki eden faktörlerle birlikte problemin tanımını vermişlerdir. Önemli olan faktörleri belirlemek için gerekli olan veri madenciliği yaklaşımlarını sunmuşlardır. Bununla birlikte sonuçlarını önerilen iyileştirmelerle birlikte ortaya koymuşlardır. Mark Last ve ark. [34] yeni, algı-tabanlı Otomatik Algı Ağı: APN -Automated Perceptions Network- adını verdikleri metodu, yüksek derecede gürültülü veri kümelerinden özlü ve yorumlanabilir modellerin otomatik kurulumu için geliştirmişlerdir. Yöntemlerini iki yarı iletken ürünün gelir verilerinde

Yapay Sinir Ağları. (Artificial Neural Networks) DOÇ. DR. ERSAN KABALCI

Yapay Sinir Ağları. (Artificial Neural Networks) DOÇ. DR. ERSAN KABALCI Yapay Sinir Ağları (Artificial Neural Networks) J E O L O J İ M Ü H E N D İ S L İ Ğ İ A. B. D. E S N E K H E S A P L A M A Y Ö N T E M L E R İ - I DOÇ. DR. ERSAN KABALCI Yapay Sinir Ağları Tarihçe Biyolojik

Detaylı

Esnek Hesaplamaya Giriş

Esnek Hesaplamaya Giriş Esnek Hesaplamaya Giriş J E O L O J İ M Ü H E N D İ S L İ Ğ İ A. B. D. E S N E K H E S A P L A M A Y Ö N T E M L E R İ - I DOÇ. DR. ERSAN KABALCI Esnek Hesaplama Nedir? Esnek hesaplamanın temelinde yatan

Detaylı

VERI TABANLARıNDA BILGI KEŞFI

VERI TABANLARıNDA BILGI KEŞFI 1 VERİ MADENCİLİĞİ VERI TABANLARıNDA BILGI KEŞFI Veri Tabanlarında Bilgi Keşfi, veriden faydalı bilginin keşfedilmesi sürecinin tamamına atıfta bulunmakta ve veri madenciliği bu sürecin bir adımına karşılık

Detaylı

YAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ

YAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ YAPAY SİNİR AĞLARI Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ İÇERİK Sinir Hücreleri Yapay Sinir Ağları Yapısı Elemanları Çalışması Modelleri Yapılarına Göre Öğrenme Algoritmalarına Göre Avantaj ve

Detaylı

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine

Detaylı

Veri Tabanı, Veri Ambarı, Veri Madenciliği. Veri Madenciliği Uygulama Alanları

Veri Tabanı, Veri Ambarı, Veri Madenciliği. Veri Madenciliği Uygulama Alanları 1 Veri Tabanı, Veri Ambarı, Veri Madenciliği Bilgi Keşfi Aşamaları Apriori Algoritması Veri Madenciliği Yöntemleri Problemler Veri Madenciliği Uygulama Alanları 2 Bir bilgisayarda sistematik şekilde saklanmış,

Detaylı

VERİ KAYNAKLARI. Bilgi sisteminin öğelerinden biride veri

VERİ KAYNAKLARI. Bilgi sisteminin öğelerinden biride veri VERİ KAYNAKLARI YÖNETİMİ İ İ 5. ÜNİTE GİRİŞ Bilgi sisteminin öğelerinden biride veri yönetimidir. Geleneksel yada çağdaş, birinci yada ikinci elden derlenen veriler amaca uygun veri formlarında tutulur.

Detaylı

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

Genetik Algoritmalar. Bölüm 1. Optimizasyon. Yrd. Doç. Dr. Adem Tuncer E-posta:

Genetik Algoritmalar. Bölüm 1. Optimizasyon. Yrd. Doç. Dr. Adem Tuncer E-posta: Genetik Algoritmalar Bölüm 1 Optimizasyon Yrd. Doç. Dr. Adem Tuncer E-posta: adem.tuncer@yalova.edu.tr Optimizasyon? Optimizasyon Nedir? Eldeki kısıtlı kaynakları en iyi biçimde kullanmak olarak tanımlanabilir.

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing

Detaylı

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım 2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI 2.1. Tanım Regresyon analizi, bir değişkenin başka bir veya daha fazla değişkene olan bağımlılığını inceler. Amaç, bağımlı değişkenin kitle ortalamasını, açıklayıcı

Detaylı

GENETİK ALGORİTMALAR. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ

GENETİK ALGORİTMALAR. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ GENETİK ALGORİTMALAR Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ GENETİK ALGORİTMALAR Genetik algoritmalar, Darwin in doğal seçim ve evrim teorisi ilkelerine dayanan bir arama ve optimizasyon yöntemidir.

Detaylı

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri Veri modelleri, veriler arasında ilişkisel ve sırasal düzeni gösteren kavramsal tanımlardır. Her program en azından bir veri modeline dayanır. Uygun

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Sınıflandırma yöntemleri Karar ağaçları ile sınıflandırma Entropi Kavramı ID3 Algoritması C4.5

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

MEÜ. SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ DERS TANIMI FORMU

MEÜ. SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ DERS TANIMI FORMU MEÜ. SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ DERS TANIMI FORMU Dersin Adı-Kodu: BİS 601 Örnek Genişliği ve Güç Programın Adı: Biyoistatistik Dersin düzeyi Doktora Ders saatleri ve Teori Uyg. Lab. Proje/Alan Çalışması

Detaylı

Fonksiyon Optimizasyonunda Genetik Algoritmalar

Fonksiyon Optimizasyonunda Genetik Algoritmalar 01-12-06 Ümit Akıncı Fonksiyon Optimizasyonunda Genetik Algoritmalar 1 Fonksiyon Optimizasyonu Fonksiyon optimizasyonu fizikte karşımıza sık çıkan bir problemdir. Örneğin incelenen sistemin kararlı durumu

Detaylı

Veritabanı Yönetimi Bilgisayarların. Keşfi Hedefler. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi

Veritabanı Yönetimi Bilgisayarların. Keşfi Hedefler. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi Hedefler Veritabanı Yönetimi Bilgisayarların Discovering Keşfi 2010 Computers 2010 Living in a Digital World Dijital Dünyada Yaşamak Veritabanı terimini tanımlamak ve bir veritabanının veri ve bilgi ile

Detaylı

Sistem Geliştirme Yaşam Döngüsü (The Systems Development Life Cycle) (SDLC)

Sistem Geliştirme Yaşam Döngüsü (The Systems Development Life Cycle) (SDLC) Sistem Geliştirme Yaşam Döngüsü (The Systems Development Life Cycle) (SDLC) Sistem analistlerinin ve kullanıcı faaliyetlerinin spesifik döngüsünün kullanılmasıyla En iyi geliştirilmiş sistemin oluşmasını

Detaylı

2011 Third International Conference on Intelligent Human-Machine Systems and Cybernetics

2011 Third International Conference on Intelligent Human-Machine Systems and Cybernetics 2011 Third International Conference on Intelligent Human-Machine Systems and Cybernetics Özet: Bulanık bir denetleyici tasarlanırken karşılaşılan en önemli sıkıntı, bulanık giriş çıkış üyelik fonksiyonlarının

Detaylı

Kredi Limit Optimizasyonu:

Kredi Limit Optimizasyonu: Kredi Limit Optimizasyonu: «Teorik Değil Pratik" Simge Danışman Analitik Direktörü, Experian EMEA Kar Gelişimi Kredi Limit Optimizasyonu Optimizasyona Genel Bakış Profilleme Modelleme Karar Matrisleri

Detaylı

İçindekiler. Ön Söz... xiii

İçindekiler. Ön Söz... xiii İçindekiler Ön Söz.................................................... xiii Bölüm 1 İstatistiğe Giriş....................................... 1 1.1 Giriş......................................................1

Detaylı

BİLGİ SİSTEMLERİNİN GELİŞTİRİLMESİ

BİLGİ SİSTEMLERİNİN GELİŞTİRİLMESİ BİLGİ SİSTEMLERİNİN GELİŞTİRİLMESİ Bilgi sistemi kavramı genellikle işletmelere yönelik olarak kullanılmaktadır. Bu yönüyle bilgi sisteminin amacını; yöneticilere teslim edilen ekonomik kaynakların kullanımına

Detaylı

Tedarik Zinciri Yönetiminde Yapay Zeka Teknikler

Tedarik Zinciri Yönetiminde Yapay Zeka Teknikler Tedarik Zinciri Yönetiminde Yapay Zeka Teknikler Doç.Dr.Mehmet Hakan Satman mhsatman@istanbul.edu.tr İstanbul Üniversitesi 2014.10.22 Doç.Dr.Mehmet Hakan Satmanmhsatman@istanbul.edu.tr Tedarik Zinciri

Detaylı

SAYISAL ÇÖZÜMLEME. Yrd.Doç.Dr.Esra Tunç Görmüş. 1.Hafta

SAYISAL ÇÖZÜMLEME. Yrd.Doç.Dr.Esra Tunç Görmüş. 1.Hafta SAYISAL ÇÖZÜMLEME Yrd.Doç.Dr.Esra Tunç Görmüş 1.Hafta Sayısal çözümleme nümerik analiz nümerik çözümleme, approximate computation mühendislikte sayısal yöntemler Computational mathematics Numerical analysis

Detaylı

BSM 532 KABLOSUZ AĞLARIN MODELLEMESİ VE ANALİZİ OPNET MODELER

BSM 532 KABLOSUZ AĞLARIN MODELLEMESİ VE ANALİZİ OPNET MODELER BSM 532 KABLOSUZ AĞLARIN MODELLEMESİ VE ANALİZİ OPNET MODELER Yazılımı ve Genel Özellikleri Doç.Dr. Cüneyt BAYILMIŞ Kablosuz Ağların Modellemesi ve Analizi 1 OPNET OPNET Modeler, iletişim sistemleri ve

Detaylı

TANIMLAYICI İSTATİSTİKLER

TANIMLAYICI İSTATİSTİKLER TANIMLAYICI İSTATİSTİKLER Tanımlayıcı İstatistikler ve Grafikle Gösterim Grafik ve bir ölçüde tablolar değişkenlerin görsel bir özetini verirler. İdeal olarak burada değişkenlerin merkezi (ortalama) değerlerinin

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan

Detaylı

KALİTE SİSTEM YÖNETİCİSİ EĞİTİMİ

KALİTE SİSTEM YÖNETİCİSİ EĞİTİMİ FMEA-HATA TÜRLERİ VE ETKİ ANALİZİ Tanımlama Mevcut veya olası hataları ortaya koyan, bu hataların yaratabileceği etkileri göz önünde bulunduran ve etkilerine göre hataları önceliklendirerek oluşmalarının

Detaylı

Başlıca Ürün-Bilgi Sistemleri

Başlıca Ürün-Bilgi Sistemleri BİLGİ SİSTEMLERİ Başlıca Ürün-Bilgi Sistemleri Süreç İşleme Sistemleri, Ofis Otomasyon Sistemleri ve Bilgi İşleme Sistemleri, Yönetim Bilişim Sistemleri, Karar Destek Sistemleri, Uzman Sistemler ve Yapay

Detaylı

BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR

BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR VERİ MADENCİLİĞİ İSİMLER BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR MOLEKÜLER BİYOLOJİ ve GENETİK GEBZE TEKNİK ÜNİVERSİTESİ ARALIK 2015 İçindekiler ÖZET... iii 1.GİRİŞ... 1 1.1 Veri Ambarı, Veri

Detaylı

İSTATİSTİKTE TEMEL KAVRAMLAR

İSTATİSTİKTE TEMEL KAVRAMLAR İSTATİSTİKTE TEMEL KAVRAMLAR 1. ve 2. Hafta İstatistik Nedir? Bir tanım olarak istatistik; belirsizlik altında bir konuda karar verebilmek amacıyla, ilgilenilen konuya ilişkin verilerin toplanması, düzenlenmesi,

Detaylı

İÇİNDEKİLER ÖN SÖZ...

İÇİNDEKİLER ÖN SÖZ... İÇİNDEKİLER ÖN SÖZ... v GİRİŞ... 1 1. İSTATİSTİK İN TARİHÇESİ... 1 2. İSTATİSTİK NEDİR?... 3 3. SAYISAL BİLGİDEN ANLAM ÇIKARILMASI... 4 4. BELİRSİZLİĞİN ELE ALINMASI... 4 5. ÖRNEKLEME... 5 6. İLİŞKİLERİN

Detaylı

Bilgiyi Keşfedin! Özelleştirme, Eklenti ve Veri Entegrasyonu Kurumsal Seviyede Yönetim ve Performans

Bilgiyi Keşfedin! Özelleştirme, Eklenti ve Veri Entegrasyonu Kurumsal Seviyede Yönetim ve Performans Bilgiyi Keşfedin! LOGO MIND INSIGHT (powered by Qlik) İŞ ANALİTİĞİ ÜRÜNÜ, HERKESİN SEZGİLERİ İLE ARAŞTIRMA VE KEŞİF YAPMASINI SAĞLAYAN ÇOK ÇEŞİTLİ ESNEK VE İNTERAKTİF GÖRSELLER OLUŞTURABİLECEĞİ YENİ NESİL

Detaylı

Serdar BİROĞUL YÜKSEK LİSANS TEZİ (ELEKTRİK EĞİTİMİ) GAZİ ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ANKARA

Serdar BİROĞUL YÜKSEK LİSANS TEZİ (ELEKTRİK EĞİTİMİ) GAZİ ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ANKARA i GENETİK ALGORİTMA YAKLAŞIMIYLA ATÖLYE ÇİZELGELEME Serdar BİROĞUL YÜKSEK LİSANS TEZİ (ELEKTRİK EĞİTİMİ) GAZİ ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ OCAK 2005 ANKARA ii Serdar BİROĞUL tarafından hazırlanan

Detaylı

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ 127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi

Detaylı

VERİ MADENCİLİĞİNE BAKIŞ

VERİ MADENCİLİĞİNE BAKIŞ VERİ MADENCİLİĞİNE BAKIŞ İçerik Veri Madenciliği Neden Veri Madenciliği? Veri ve Veri Madenciliğinin Önemi Günümüzde Kullanılan Veri Madenciliğinin Çeşitli İsimleri Veri Madenciliği Nedir? Neden Veri Madenciliği?

Detaylı

MONTE CARLO BENZETİMİ

MONTE CARLO BENZETİMİ MONTE CARLO BENZETİMİ U(0,1) rassal değişkenler kullanılarak (zamanın önemli bir rolü olmadığı) stokastik ya da deterministik problemlerin çözümünde kullanılan bir tekniktir. Monte Carlo simülasyonu, genellikle

Detaylı

Bölüm 2 Varlık-İlişki Veri Modeli: Araçlar ve Teknikler. Fundamentals, Design, and Implementation, 9/e

Bölüm 2 Varlık-İlişki Veri Modeli: Araçlar ve Teknikler. Fundamentals, Design, and Implementation, 9/e Bölüm 2 Varlık-İlişki Veri Modeli: Araçlar ve Teknikler Fundamentals, Design, and Implementation, 9/e Üç Şema Modeli Üç şema modeli 1975 de ANSI/SPARC tarafından geliştirildi Veri modellemeninç ve rolünü

Detaylı

TOPLAM KALİTE YÖNETİMİ

TOPLAM KALİTE YÖNETİMİ SAKARYA ÜNİVERSİTESİ TOPLAM KALİTE YÖNETİMİ Hafta 13 Yrd. Doç. Dr. Semra BORAN Bu ders içeriğinin basım, yayım ve satış hakları Sakarya Üniversitesi ne aittir. "Uzaktan Öğretim" tekniğine uygun olarak

Detaylı

FMEA. Hata Türleri ve Etkileri Analizi

FMEA. Hata Türleri ve Etkileri Analizi FMEA Hata Türleri ve Etkileri Analizi 2007 FMEA Tanımı FMEA (HTEA), bir ürün veya prosesin potansiyel hatalarını ve bunların sonucu olabilecek etkilerini tanımlama, değerlendirme, potansiyel hatanın ortaya

Detaylı

Okut. Yüksel YURTAY. İletişim : (264) Sayısal Analiz. Giriş.

Okut. Yüksel YURTAY. İletişim :  (264) Sayısal Analiz. Giriş. Okut. Yüksel YURTAY İletişim : Sayısal Analiz yyurtay@sakarya.edu.tr www.cs.sakarya.edu.tr/yyurtay (264) 295 58 99 Giriş 1 Amaç : Mühendislik problemlerinin bilgisayar ortamında çözümünü mümkün kılacak

Detaylı

SİSTEM ANALİZİ ve TASARIMI. ÖN İNCELEME ve FİZİBİLİTE

SİSTEM ANALİZİ ve TASARIMI. ÖN İNCELEME ve FİZİBİLİTE SİSTEM ANALİZİ ve TASARIMI ÖN İNCELEME ve FİZİBİLİTE Sistem Tasarım ve Analiz Aşamaları Ön İnceleme Fizibilite Sistem Analizi Sistem Tasarımı Sistem Gerçekleştirme Sistem Operasyon ve Destek ÖN İNCELEME

Detaylı

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI ÖNSÖZ İÇİNDEKİLER III Bölüm 1 İSTATİSTİK ve SAYISAL BİLGİ 11 1.1 İstatistik ve Önemi 12 1.2 İstatistikte Temel Kavramlar 14 1.3 İstatistiğin Amacı 15 1.4 Veri Türleri 15 1.5 Veri Ölçüm Düzeyleri 16 1.6

Detaylı

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir Bilimsel Araştırma Yöntemleri Prof. Dr. Şener Büyüköztürk Doç. Dr. Ebru Kılıç Çakmak Yrd. Doç. Dr. Özcan Erkan Akgün Doç. Dr. Şirin Karadeniz Dr. Funda Demirel Örnekleme Yöntemleri Evren Evren, araştırma

Detaylı

Yazılım Mühendisliği Bölüm - 3 Planlama

Yazılım Mühendisliği Bölüm - 3 Planlama 1 Yazılım Mühendisliği Bölüm - 3 Planlama 2 3 4 Planlama 5 Yazılım geliştirme sürecinin ilk aşaması Başarılı bir proje geliştirebilmek için projenin tüm resminin çıkarılması işlemi Proje planlama aşamasında

Detaylı

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veri Modelleri

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veri Modelleri Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veri Modelleri Konular Veritabanı Tasarım Aşamaları Veri Modeli Nedir? Veri Modeli Temel Bileşenleri İş Kuralları (Business Rules) İş Kurallarını Veri

Detaylı

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı ARAŞTIRMA MODELLİLERİNDE KULLANILACAK İSTATİSTİKLERİ BELİRLEME ÖLÇÜTLERİ Parametrik mi Parametrik Olmayan mı? Kullanılacak İstatistikleri Belirleme Ölçütleri Değişken Sayısı Tek değişkenli (X) İki değişkenli

Detaylı

Neden Endüstri Mühendisliği Bölümünde Yapmalısınız?

Neden Endüstri Mühendisliği Bölümünde Yapmalısınız? Lisansüstü Eğitiminizi Neden Endüstri Mühendisliği Bölümünde Yapmalısınız? Uludağ Üniversitesi Mühendislik-Mimarlık Fakültesi Endüstri Mühendisliği Bölümü, 1990 yılında kurulmuş ve ilk mezunlarını 1994

Detaylı

2. BASİT DOĞRUSAL REGRESYON 12

2. BASİT DOĞRUSAL REGRESYON 12 1. GİRİŞ 1 1.1 Regresyon ve Model Kurma / 1 1.2 Veri Toplama / 5 1.3 Regresyonun Kullanım Alanları / 9 1.4 Bilgisayarın Rolü / 10 2. BASİT DOĞRUSAL REGRESYON 12 2.1 Basit Doğrusal Regresyon Modeli / 12

Detaylı

Muhammet Fatih AKBAŞ, Enis KARAARSLAN, Cengiz GÜNGÖR

Muhammet Fatih AKBAŞ, Enis KARAARSLAN, Cengiz GÜNGÖR Yazılım Tanımlı Ağların Güvenliğinde Yapay Zeka Tabanlı Çözümler: Ön İnceleme Muhammet Fatih AKBAŞ, Enis KARAARSLAN, Cengiz GÜNGÖR İzmir Katip Çelebi Üniversitesi, Muğla Sıtkı Koçman Üniversitesi, Ege

Detaylı

Kural Motoru. www.paperwork.com.tr

Kural Motoru. www.paperwork.com.tr Kural Motoru www.paperwork.com.tr İş Kuralı Örnekleri Aşağıda iş kurallarına çeşitli örnekler verilmiştir; : İş Kuralı Nedir? T üm işletmeler kural merkezli çalışırlar. Kurallar hangi fırsatların takip

Detaylı

Makine Öğrenmesi 3. hafta

Makine Öğrenmesi 3. hafta Makine Öğrenmesi 3. hafta Entropi Karar Ağaçları (Desicion Trees) ID3 C4.5 Sınıflandırma ve Regresyon Ağaçları (CART) Karar Ağacı Nedir? Temel fikir, giriş verisinin bir kümeleme algoritması yardımıyla

Detaylı

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Yrd. Doç. Dr. Emre ATILGAN 1 RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Olasılığa ilişkin olayların çoğunluğunda, deneme sonuçlarının bir veya birkaç yönden incelenmesi

Detaylı

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI 10 Aralık 2011, Cumartesi Fen ve Mühendislik Alanlarındaki Çeşitli Araştırma Projelerinden Örneklemeler İçerik

Detaylı

İÇİNDEKİLER 1. GİRİŞ...

İÇİNDEKİLER 1. GİRİŞ... İÇİNDEKİLER 1. GİRİŞ... 1 1.1. Regresyon Analizi... 1 1.2. Uygulama Alanları ve Veri Setleri... 2 1.3. Regresyon Analizinde Adımlar... 3 1.3.1. Problemin İfadesi... 3 1.3.2. Konu ile İlgili Potansiyel

Detaylı

Veritabanı, Veri Madenciliği, Veri Ambarı, Veri Pazarı

Veritabanı, Veri Madenciliği, Veri Ambarı, Veri Pazarı Veritabanı, Veri Madenciliği, Veri Ambarı, Veri Pazarı Başkent Üniversitesi Bilgisayar Mühendisliği Yönetim Bilişim Sistemleri (Bil 483) 20394676 - Ümit Burak USGURLU Veritabanı Veri tabanı düzenli bilgiler

Detaylı

Veri ve Metin Madenciliği

Veri ve Metin Madenciliği Veri ve Metin Madenciliği Zehra Taşkın Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Fikirler? Veri Madenciliği Data Information Knowledge Veri madenciliği; Büyük yoğunluklu

Detaylı

Öğr.Gör.İnan ÜNAL Tunceli Üniversitesi Bilgisayar Mühendisliği Bölümü

Öğr.Gör.İnan ÜNAL Tunceli Üniversitesi Bilgisayar Mühendisliği Bölümü Öğr.Gör.İnan ÜNAL Tunceli Üniversitesi Bilgisayar Mühendisliği Bölümü Büyük miktardaki veriler içerisinden önemli olanlarını bulup çıkarmaya veri Madenciliği denir. Veri madenciliği bir sorgulama işlemi

Detaylı

Benzetim 13. Ders. Benzetim Paketleri ve Promodel e Giriş

Benzetim 13. Ders. Benzetim Paketleri ve Promodel e Giriş Benzetim 13. Ders Benzetim Paketleri ve Promodel e Giriş BENZETİM PAKETİNDEN BEKLENEN ÖZELLİKLERİ Genel Özellikler: Modelleme esnekliği (bir modelin değişik parametrelerle yenilenebilmesi), Yeni model

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık KORELASYON ve REGRESYON ANALİZİ Doç. Dr. İrfan KAYMAZ Tanım Bir değişkenin değerinin diğer değişkendeki veya değişkenlerdeki değişimlere bağlı olarak nasıl etkilendiğinin istatistiksel

Detaylı

UZAKTAN EĞİTİM MERKEZİ

UZAKTAN EĞİTİM MERKEZİ ÜNİTE 2 VERİ TABANI İÇİNDEKİLER Veri Tabanı Veri Tabanı İle İlgili Temel Kavramlar Tablo Alan Sorgu Veri Tabanı Yapısı BAYBURT ÜNİVERSİTESİ UZAKTAN EĞİTİM MERKEZİ BİLGİSAYAR II HEDEFLER Veri tabanı kavramını

Detaylı

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37 İÇİNDEKİLER BÖLÜM 1 Değişkenler ve Grafikler 1 İstatistik 1 Yığın ve Örnek; Tümevarımcı ve Betimleyici İstatistik 1 Değişkenler: Kesikli ve Sürekli 1 Verilerin Yuvarlanması Bilimsel Gösterim Anlamlı Rakamlar

Detaylı

9.DERS Yazılım Geliştirme Modelleri

9.DERS Yazılım Geliştirme Modelleri 9.DERS Yazılım Geliştirme Modelleri 1 Yazılım Geliştirme Yaşam Döngüsü ve Modeller Herhangi bir yazılımın, üretim aşaması ve kullanım aşaması birlikte olmak üzere geçirdiği tüm aşamalar olarak tanımlanabilir.

Detaylı

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara Veri Madenciliğine Genel Bir Bakış Veri Madenciliğinin Görevleri Sınıflama Seri Sınıflama Algoritmaları Paralel Sınıflama

Detaylı

İÇİNDEKİLER BİRİNCİ KISIM: TASARIM PAZARLAMA ARAŞTIRMASINA GİRİŞ

İÇİNDEKİLER BİRİNCİ KISIM: TASARIM PAZARLAMA ARAŞTIRMASINA GİRİŞ İÇİNDEKİLER ÖNSÖZ... v TEŞEKKÜR... vi İKİNCİ BASKIYA ÖNSÖZ VE TEŞEKKÜR... vii İÇİNDEKİLER... ix ŞEKİLLER LİSTESİ... xviii TABLOLAR LİSTESİ... xx BİRİNCİ KISIM: TASARIM BİRİNCI BÖLÜM PAZARLAMA ARAŞTIRMASINA

Detaylı

BÖLÜM 12 STUDENT T DAĞILIMI

BÖLÜM 12 STUDENT T DAĞILIMI 1 BÖLÜM 12 STUDENT T DAĞILIMI 'Student t dağılımı' ya da kısaca 't dağılımı'; normal dağılım ve Z dağılımının da içerisinde bulunduğu 'sürekli olasılık dağılımları' ailesinde yer alan dağılımlardan bir

Detaylı

Pazarlama araştırması

Pazarlama araştırması Pazarlama araştırması Etkin bir pazarlama kararı alabilmek için gerekli olan enformasyonun ve bilginin toplanması ve kullanılmasıdır. Bu sayede, pazarla ilgili risk ve belirsizlik azalacak ve başarı artacaktır.

Detaylı

BİLİMSEL ARAŞTIRMA SÜRECİ ve BECERİLERİ

BİLİMSEL ARAŞTIRMA SÜRECİ ve BECERİLERİ 3/14/12 BİLİMSEL ARAŞTIRMA SÜRECİ ve BECERİLERİ Olay ve nesnelerin hareketlerinin duyu organlarının kullanılması ile doğal ortamlarında izlenmesidir. İki türlü gözlem vardır; a) Kontrollü gözlem (Deney)

Detaylı

1 PAZARLAMA ARAŞTIRMASI

1 PAZARLAMA ARAŞTIRMASI İÇİNDEKİLER ÖNSÖZ III Bölüm 1 PAZARLAMA ARAŞTIRMASI 11 1.1. Pazarlama Araştırması Kavramı ve Kapsamı 12 1.2. Pazarlama Araştırmasının Tarihçesi 14 1.3. Pazarlama Araştırması Pazarlama Bilgi Sistemi ve

Detaylı

MAK 210 SAYISAL ANALİZ

MAK 210 SAYISAL ANALİZ MAK 210 SAYISAL ANALİZ BÖLÜM 5- SONLU FARKLAR VE İNTERPOLASYON TEKNİKLERİ Doç. Dr. Ali Rıza YILDIZ MAK 210 - Sayısal Analiz 1 İNTERPOLASYON Tablo halinde verilen hassas sayısal değerler veya ayrık noktalardan

Detaylı

Gezgin Satıcı Probleminin İkili Kodlanmış Genetik Algoritmalarla Çözümünde Yeni Bir Yaklaşım. Mehmet Ali Aytekin Tahir Emre Kalaycı

Gezgin Satıcı Probleminin İkili Kodlanmış Genetik Algoritmalarla Çözümünde Yeni Bir Yaklaşım. Mehmet Ali Aytekin Tahir Emre Kalaycı Gezgin Satıcı Probleminin İkili Kodlanmış Genetik Algoritmalarla Çözümünde Yeni Bir Yaklaşım Mehmet Ali Aytekin Tahir Emre Kalaycı Gündem Gezgin Satıcı Problemi GSP'yi Çözen Algoritmalar Genetik Algoritmalar

Detaylı

İŞLETME VE ORGANİZASYON STAJI UYGULAMA ESASLARI

İŞLETME VE ORGANİZASYON STAJI UYGULAMA ESASLARI İŞLETME VE ORGANİZASYON STAJI UYGULAMA ESASLARI ENDÜSTRİ MÜHENDİSLİĞİ BÖLÜMÜ İŞLETME VE ORGANİZASYON STAJI UYGULAMA ESASLARI 2014 İŞLETME VE ORGANİZASYON STAJI UYGULAMA ESASLARI Açıklama Staj yapılan işletmelerde

Detaylı

Nitel Araştırmada Geçerlik ve Güvenirlik

Nitel Araştırmada Geçerlik ve Güvenirlik Nitel Araştırmada Geçerlik ve Bilimsel araştırmanın en önemli ölçütlerinden biri olarak kabul edilen geçerlik ve güvenirlik araştırmalarda en yaygın olarak kullanılan iki en önemli ölçüttür. Araştırmalarda

Detaylı

BİLİŞİM SİSTEMLERİNİN PRENSİPLERİ

BİLİŞİM SİSTEMLERİNİN PRENSİPLERİ BİLİŞİM SİSTEMLERİNİN PRENSİPLERİ Derleyen: Prof. Dr. Güngör BAL Bölüm 09 Bilişim ve Karar Destek Sistemleri Prensipler ve Öğrenme Hedefleri İyi karar-verme ve problem çözme yetenekleri etkin bilişim ve

Detaylı

İŞLETMELERDE İŞ SÜREÇ YÖNETİMİ (BPM) UYGULAMASI. Hazırlayanlar Fatma Didem GÜRKAN Endüstri Mühendisi Ahmet Alper ÇALIŞKAN Endüstri Mühendisi

İŞLETMELERDE İŞ SÜREÇ YÖNETİMİ (BPM) UYGULAMASI. Hazırlayanlar Fatma Didem GÜRKAN Endüstri Mühendisi Ahmet Alper ÇALIŞKAN Endüstri Mühendisi İŞLETMELERDE İŞ SÜREÇ YÖNETİMİ (BPM) UYGULAMASI Hazırlayanlar Fatma Didem GÜRKAN Endüstri Mühendisi Ahmet Alper ÇALIŞKAN Endüstri Mühendisi 4 Haftalık Ajanda 1. Hafta: Örneklerle BPM-ERP İlişkisi 2. Hafta:

Detaylı

Yapı Kredi Bankası Ar-Ge Çalışmaları Araştırma, Vizyon ve Uygulama. Eğitmen: Onur AĞIN

Yapı Kredi Bankası Ar-Ge Çalışmaları Araştırma, Vizyon ve Uygulama. Eğitmen: Onur AĞIN Yapı Kredi Bankası Ar-Ge Çalışmaları Araştırma, Vizyon ve Uygulama Eğitmen: Onur AĞIN 2016 Biz Kimiz? Kuruluş 9Eylül 2013 14 Kişilik bir Takım 11 Ar-Ge Mühendisi 2 Ar-Ge Koordinatörü 1 Müdür Yenilik Prototip

Detaylı

Bilişim Sistemleri. Modelleme, Analiz ve Tasarım. Yrd. Doç. Dr. Alper GÖKSU

Bilişim Sistemleri. Modelleme, Analiz ve Tasarım. Yrd. Doç. Dr. Alper GÖKSU Bilişim Sistemleri Modelleme, Analiz ve Tasarım Yrd. Doç. Dr. Alper GÖKSU Ders Akışı Hafta 5. İhtiyaç Analizi ve Modelleme II Haftanın Amacı Bilişim sistemleri ihtiyaç analizinin modeli oluşturulmasında,

Detaylı

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1 3. TAHMİN 3.1. En Küçük Kareler (EKK) Yöntemi 1 En Küçük Kareler (EKK) yöntemi, regresyon çözümlemesinde en yaygın olarak kullanılan, daha sonra ele alınacak bazı varsayımlar altında çok aranan istatistiki

Detaylı

PROF. DR. ŞAKİR ESNAF IN BİTİRME PROJESİ KONULARI

PROF. DR. ŞAKİR ESNAF IN BİTİRME PROJESİ KONULARI PROF. DR. ŞAKİR ESNAF IN TEORİK ÇALIŞMA BAŞLIKLARI Ø Coğrafi Çoklu Tesis Yeri Seçimi (Weber) Probleminin Çözümü için Sezgisel ve Metasezgisel Algoritmalar Ø Çoklu Tesis Yeri Seçimi (Pmedyan) Probleminin

Detaylı

2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21

2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21 İçindekiler Önsöz İkinci Basım için Önsöz Türkçe Çeviri için Önsöz Gösterim xiii xv xvii xix 1 Giriş 1 1.1 Yapay Öğrenme Nedir?......................... 1 1.2 Yapay Öğrenme Uygulamalarına Örnekler...............

Detaylı

SİSTEM ANALİZİ VE TASARIMI

SİSTEM ANALİZİ VE TASARIMI SİSTEM ANALİZİ VE TASARIMI BİLGİ SİSTEMİ GELİŞTİRME SÜRECİ Sistem Geliştirme Süreci ve Modelleri Sistem Geliştirme Yaşam Döngüsü Bilgi sistemlerinin geliştirilmesi için izlenen sürece Sistem Geliştirme

Detaylı

UNIVERSAL BİLGİ TEKNOLOJİLERİ

UNIVERSAL BİLGİ TEKNOLOJİLERİ UNIVERSAL BİLGİ TEKNOLOJİLERİ Coğrafi Bilgi Sistemleri (CBS) ile Bilgisayar Destekli Tasarım (CAD) Sistemleri Arasındaki Temel Farklar Universal Bilgi Teknolojileri Ltd. Şti. 2010. Tüm hakları saklıdır.

Detaylı

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ DÖNEM I-I. DERS KURULU Konu: Bilimsel yöntem ve istatistik Amaç: Biyoistatistiğin tıptaki önemini kavrar ve sonraki dersler için gerekli terminolojiye hakim olur.

Detaylı

MAK 210 SAYISAL ANALİZ

MAK 210 SAYISAL ANALİZ MAK 210 SAYISAL ANALİZ BÖLÜM 6- İSTATİSTİK VE REGRESYON ANALİZİ Doç. Dr. Ali Rıza YILDIZ 1 İSTATİSTİK VE REGRESYON ANALİZİ Bütün noktalardan geçen bir denklem bulmak yerine noktaları temsil eden, yani

Detaylı

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı cse@akdeniz.edu.tr Antalya, 2016 2 Özet Akdeniz Üniversitesi tanıtım filmi Neden Bilgisayar Mühendisliği Bilgisayar Mühendisi

Detaylı

İÇİNDEKİLER İÇİNDEKİLER KODLAB

İÇİNDEKİLER İÇİNDEKİLER KODLAB İÇİNDEKİLER IX İÇİNDEKİLER 1 GİRİŞ 1 Kitabın Amacı 1 Algoritmanın Önemi 2 Bilgisayarın Doğuşu ve Kullanım Amaçları 3 Programlama Dili Nedir? 3 Entegre Geliştirme Ortamı (IDE) Nedir? 4 2 ALGORİTMA VE AKIŞ

Detaylı

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı cse@akdeniz.edu.tr Antalya, 2017 2 Özet Akdeniz Üniversitesi tanıtım filmi Neden Bilgisayar Mühendisliği Bilgisayar Mühendisi

Detaylı

Sosyal Bilimler İçin Veri Analizi El Kitabı

Sosyal Bilimler İçin Veri Analizi El Kitabı 292 Dicle Üniversitesi Ziya Gökalp Eğitim Fakültesi Dergisi, 18 (2012) 292-297 KİTAP İNCELEMESİ Sosyal Bilimler İçin Veri Analizi El Kitabı Editör Doç. Dr. Şener BÜYÜKÖZTÜRK Dilek SEZGİN MEMNUN 1 Bu çalışmada,

Detaylı

VERİ TABANI YÖNETİM SİSTEMLERİ

VERİ TABANI YÖNETİM SİSTEMLERİ VERİ TABANI YÖNETİM SİSTEMLERİ Veri Tabanı Nedir? Sistematik erişim imkânı olan, yönetilebilir, güncellenebilir, taşınabilir, birbirleri arasında tanımlı ilişkiler bulunabilen bilgiler kümesidir. Bir kuruluşa

Detaylı

MÜŞTERİ İLİŞKİLERİ YÖNETİMİ (PZL208U)

MÜŞTERİ İLİŞKİLERİ YÖNETİMİ (PZL208U) DİKKATİNİZE: BURADA SADECE ÖZETİN İLK ÜNİTESİ SİZE ÖRNEK OLARAK GÖSTERİLMİŞTİR. ÖZETİN TAMAMININ KAÇ SAYFA OLDUĞUNU ÜNİTELERİ İÇİNDEKİLER BÖLÜMÜNDEN GÖREBİLİRSİNİZ. MÜŞTERİ İLİŞKİLERİ YÖNETİMİ (PZL208U)

Detaylı

Büyük Veri ve Endüstri Mühendisliği

Büyük Veri ve Endüstri Mühendisliği Büyük Veri ve Endüstri Mühendisliği Mustafa Gökçe Baydoğan Endüstri Mühendisliği Bölümü Boğaziçi Üniversitesi İstanbul Yöneylem Araştırması/Endüstri Mühendisliği Doktora Öğrencileri Kolokyumu 21-22 Nisan

Detaylı

Zaman Serileri Tutarlılığı

Zaman Serileri Tutarlılığı Bölüm 3 Zaman Serileri Tutarlılığı Ulusal Sera Gazı Envanterleri Uygulamalı Eğitim Çalıştayı - IPCC Kesişen Konular 4-5-6 Kasım 2015, Ankara Türkiye Giriş Çok yıllı sera gazı (GHG) envanterleri, emisyonların

Detaylı

İstatistik. Temel Kavramlar Dr. Seher Yalçın 1

İstatistik. Temel Kavramlar Dr. Seher Yalçın 1 İstatistik Temel Kavramlar 26.12.2016 Dr. Seher Yalçın 1 Evren (Kitle/Yığın/Popülasyon) Herhangi bir gözlem ya da inceleme kapsamına giren obje ya da bireylerin oluşturduğu bütüne ya da gruba Evren veya

Detaylı

ULUSLARARASI ANTALYA ÜNİVERSİTESİ ENDÜSTRİ MÜHENDİSLİĞİ BÖLÜMÜ DERS KATALOĞU

ULUSLARARASI ANTALYA ÜNİVERSİTESİ ENDÜSTRİ MÜHENDİSLİĞİ BÖLÜMÜ DERS KATALOĞU ULUSLARARASI ANTALYA ÜNİVERSİTESİ ENDÜSTRİ MÜHENDİSLİĞİ BÖLÜMÜ DERS KATALOĞU ZORUNLU DERSLER IE 201 - Operasyon Modelleme Karar vermedeki belirsizlik rolü de dahil olmak üzere işletme kararlarının matematiksel

Detaylı

Faktöriyel: 1'den n'ye kadar olan tüm pozitif tamsayıların çarpımına, biçiminde gösterilir. Aynca; 0! = 1 ve 1!=1 1 dir. [Bunlar kabul değildir,

Faktöriyel: 1'den n'ye kadar olan tüm pozitif tamsayıların çarpımına, biçiminde gösterilir. Aynca; 0! = 1 ve 1!=1 1 dir. [Bunlar kabul değildir, 14. Binom ve Poisson olasılık dağılımları Faktöriyeller ve kombinasyonlar Faktöriyel: 1'den n'ye kadar olan tüm pozitif tamsayıların çarpımına, n! denir ve n! = 1.2.3...(n-2).(n-l).n biçiminde gösterilir.

Detaylı

VERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL

VERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL VERİ MADENCİLİĞİ Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL SPRINT Algoritması ID3,CART, ve C4.5 gibi algoritmalar önce derinlik ilkesine göre çalışırlar ve en iyi dallara ayırma kriterine

Detaylı

AVĐVASA da Veri Madenciliği Reşat Fırat ERSĐN Stratejik Planlama ve ĐşGeliştirme Birim Yöneticisi

AVĐVASA da Veri Madenciliği Reşat Fırat ERSĐN Stratejik Planlama ve ĐşGeliştirme Birim Yöneticisi AVĐVASA da Veri Madenciliği Reşat Fırat ERSĐN Stratejik Planlama ve ĐşGeliştirme Birim Yöneticisi AvivaSA Bir emeklilik ve hayat sigortası şirketi 1 Kasım 2007. Ak Emeklilik A.Ş. ve Aviva Hayat ve Emeklilik

Detaylı

VERİ TABANI YÖNETİM SİSTEMLERİ Melih BÖLÜKBAŞI

VERİ TABANI YÖNETİM SİSTEMLERİ Melih BÖLÜKBAŞI VERİ TABANI YÖNETİM SİSTEMLERİ Melih BÖLÜKBAŞI Dersin Hedefleri Veri Tabanı Kullanıcıları Veri Modelleri Veri Tabanı Tasarımı İlişkisel VT Kavramsal Tasarımı (Entity- Relationship, ER) Modeli VT KULLANICILARI

Detaylı

RÜZGAR ENERJİSİ KAYNAĞI VE BELİRSİZLİK

RÜZGAR ENERJİSİ KAYNAĞI VE BELİRSİZLİK 4. İzmir Rüzgâr Sempozyumu // 28-30 Eylül 2017 // İzmir RÜZGAR ENERJİSİ KAYNAĞI VE BELİRSİZLİK Prof. Dr. Barış Özerdem İzmir Ekonomi Üniversitesi Havacılık ve Uzay Mühendisliği Bölümü baris.ozerdem@ieu.edu.tr

Detaylı