T.C. ERCİYES ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ VERİ MADENCİLİĞİNDE GENETİK PROGRAMLAMA TEMELLİ YENİ BİR SINIFLANDIRMA YAKLAŞIMI VE UYGULAMASI

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "T.C. ERCİYES ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ VERİ MADENCİLİĞİNDE GENETİK PROGRAMLAMA TEMELLİ YENİ BİR SINIFLANDIRMA YAKLAŞIMI VE UYGULAMASI"

Transkript

1 T.C. ERCİYES ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ VERİ MADENCİLİĞİNDE GENETİK PROGRAMLAMA TEMELLİ YENİ BİR SINIFLANDIRMA YAKLAŞIMI VE UYGULAMASI Tezi Hazırlayan M. Burak TELCİOĞLU Tezi Yöneten Yrd. Doç. Dr. Lale ÖZBAKIR Endüstri Mühendisliği Anabilim Dalı Yüksek Lisans Tezi Ocak 2007 KAYSERİ

2

3 ii TEŞEKKÜR Bu tezin hazırlanmasında bir çok değerli insanın katkıları olmuştur. Hepsine ayrı ayrı teşekkür etmek istiyorum. Bu tez çalışmasının başarı ile sonuçlanmasını sağlayan değerli danışmanım Yrd. Doç. Dr. Lale ÖZBAKIR a tez çalışmam sırasında her türlü konudaki anlayışı, desteği, motivasyonu ve yardımları için minnettarlıklarımı belirtmek istiyorum. Tez çalışmam süresince her türlü yardımı ve desteği sağlayan değerli müdürüm Tuncer AKTAŞ a sonsuz teşekkür ediyorum. Her türlü yardımlarından dolayı Araştırma Görevlisi Sinem KULLUK a teşekkür ederim. Tez çalışmam sırasında, her zaman bana destek olan eşim Ayşe TELCİOĞLU na her türlü anlayışı ve yardımı için teşekkür ederim. Hayatımın her aşamasında her türlü destek ve anlayışları ile yanımda olan sevgili annem ve babam Gülçin ve Mahmut TELCİOĞLU na ve kardeşim Murat TELCİOĞLU na anlayış ve desteklerinden dolayı sonsuz teşekkürlerimi iletmek istiyorum.

4 iii VERİ MADENCİLİĞİNDE GENETİK PROGRAMLAMA TEMELLİ YENİ BİR SINIFLANDIRMA YAKLAŞIMI VE UYGULAMASI M. Burak TELCİOĞLU Erciyes Üniversitesi, Fen Bilimleri Enstitüsü Yüksek Lisans Tezi, Ocak 2007 Tez Danışmanı: Yrd. Doç. Dr. Lale ÖZBAKIR ÖZET Bu çalışmanın amacı veritabanlarında bulunan veri kümelerinin sınıflandırma sürecini mümkün olduğunca hızlı ve kolay biçimde tamamlayacak bir algoritma tasarlamaktır. Bu algoritmanın diğer çalışmalardan ayrılan iki önemli özelliği çoklu denklem programlama temelli bir kromozom yapısı kullanması ve genetik programlamanın uygunluk değerlendirme aşamasını evrimleştirdiği SQL cümleciklerini kullanarak başarmasıdır. Geliştirilen MEPAR-SQL algoritması çeşitli literatür ve gerçek veri kümelerine uygulanmış, deney tasarımında bulunan parametre düzeyleri kullanılarak bulunan sonuçlar iyi bilinen çeşitli geleneksel algoritmalar ile karşılaştırılmıştır. Karşılaştırma sonucunda MEPAR-SQL algoritması çok iyi sonuçlar bulmuştur. Anahtar Kelimeler: Veri madenciliği, sınıflandırma, genetik programlama, çoklu denklem programlama.

5 iv A NEW GENETIC PROGRAMMING BASED CLASSIFICATION APPROACH IN DATA MINING AND APPLICATION M. Burak TELCİOĞLU Erciyes University, Graduate School of Natural and Applied Sciences M.Sc. Thesis, January 2007 Thesis Supervisor: Assist. Prof. Dr. Lale ÖZBAKIR ABSTRACT The aim of the study is, to design an algorithm that can complete a classification process of datasets resides in databases in a fast and easy manner. This algorithm differs from others by the two distinctions; this algorithm uses a multi expression programming based chromosome structure and it uses SQL scripts for fitness evaluation which is one of the steps of the genetic programming. MEPAR-SQL algorithm is applied to several literature and real datasets and the parameter levels which are found by experimental design are compared with several well known traditional algorithms. According to the comparison it is found that MEPAR-SQL algorithm shows good performance. Keywords: Data mining, classification, genetic programming, multi expression programming.

6 v İÇİNDEKİLER KABUL VE ONAY...i TEŞEKKÜR...ii ÖZET...iii ABSTRACT... iv ŞEKİLLER LİSTESİ... x 1.BÖLÜM... 1 GİRİŞ BÖLÜM... 3 GENEL BİLGİLER Veri Madenciliği Veri Madenciliğine Giriş Veri Madenciliği Nedir? Veri Madenciliği Süreci Problemin Tanımlanması Geçmiş Bilgiler Veri Seçimi Veri Önişleme Analiz ve Yorumlama Raporlama ve Kullanım Veri Madenciliğinin Görevleri Sınıf Betimlemesi Birliktelik Sınıflandırma Tahmin Kümeleme Zaman Serileri Analizi Veri Madenciliğinde Kullanılan Algoritmalar Danışmansız Öğrenme Algoritmaları K-Yol Kümeleme Özdüzenleyici Haritalar (Self Organized Maps) Danışmanlı Öğrenme Algoritmaları... 13

7 vi Regresyon Modelleri K-En Yakın Komşu Yapay Sinir Ağları Yapay Sinir Ağlarının Özellikleri Yapay Sinir Ağlarının Yapısı Karar Ağaçları Evrimsel Algoritmalar Veri Madenciliğinin Kullanım Alanları Veri Madenciliğinde Yapılan Çalışmalar Sınıflandırma Sınıflandırmaya Giriş Sınıflandırma Nedir? Sınıflandırma Kuralları AQ (Ancestral Quest) Algoritması CN2 Algoritması ID3 Algoritması C4.5 Algoritması Evrimsel Algoritmalar Genetik Algoritmalar Genetik Algoritma Çeşitleri Basit Genetik Algoritma İşleyişi Genetik Programlama Evrim Stratejileri Evrimsel Programlama Genetik Programlama Genetik Programlama ve Veri Sınıflandırma Standart Genetik Programlama Hazırlık Adımları Fonksiyon ve Terminal Seti Uygunluk Ölçümü Kontrol Parametreleri Durdurma Kriteri Genetik Programlama Çalışma Adımları... 48

8 vii Standart Genetik Programlama Akış Diyagramı Başlangıç Popülasyonunun Oluşturulması Genetik Programlamanın Ana Nesil Döngüsü Mutasyon Operasyonu Çaprazlama Operasyonu Çoğalma Operasyonu Mimari Değişim Operasyonu Doğrusal Genetik Programlama GEP GEP Akış Diyagramı GEP Gen Yapısı Açık Okuma Çatısı ve Genler GEP Genleri Çoklu Gen Kromozomları Seçim ve Replikasyon Mutasyon Sıra Değişimi ve Sıralı Elemanların Eklenmesi Çaprazlama Çoklu Denklem Programlama MEP Gösterimi MEP Gösterimi ile GP ve GEP Gösterimi Karşılaştırması MEP Çaprazlama MEP Mutasyon Uygunluk Hesaplama Süreci MEP Algoritması Veri Madenciliği ve İlişkisel Veritabanları BÖLÜM YÖNTEM MEPAR-SQL Algoritmasının Geliştirilmesi Fonksiyon ve Terminal Kümeleri Başlangıç Popülasyonu Uygunluk Fonksiyonu Genetik Operatörler... 79

9 viii 3.2. Yazılımın Kullanılması Ön Gereksinimler Yazılımın Çalıştırılması BÖLÜM BULGULAR VE YORUMLAR Test Problemleri Uygun Parametre Kümesinin Belirlenmesi Analiz Sonuçları Hepatitis Veri Kümesi Analiz Sonuçları Adult Veri Kümesi Analiz Sonuçları Iris Veri Kümesi Analiz Sonuçları Lymphograpy Veri Kümesi Analiz Sonuçları Zoo Veri Kümesi Analiz Sonuçları Credit App Veri Kümesi Analiz Sonuçları ENDQ Veri Kümesi Analiz Sonuçları Sonuçların Diğer Çalışmalar ile Karşılaştırması BÖLÜM SONUÇ VE ÖNERİLER KAYNAKLAR EKLER EK-1 ENDQ Veri Kümesi Hakkında Bilgiler EK-2. MINITAB Analiz Grafikleri EK-2.a. Adult Ana Etki Grafiği EK-2.b. Adult Etkileşim Grafiği EK-2.c. Adult Etkileşim Grafiği EK-2.d. Adult Etkileşim Grafiği EK-2.e. Creadit-App Ana Etki Grafiği EK-2.f. Credit-App Etkileşim Grafiği EK-2.g. Credit-App Etkileşim Grafiği EK-2.h. Credit-App Etkileşim Grafiği EK-2.i. Iris Ana Etki Grafiği EK-2.j. Iris Etkileşim Grafiği EK-2.k. Iris Etkileşim Grafiği

10 ix EK-2.l. Iris Etkileşim Grafiği EK-2.m. Lymphography Ana Etki Grafiği EK-2.n. Lymphography Etkileşim Grafiği EK-2.o. Lymphography Etkileşim Grafiği EK-2.p. Lymphography Etkileşim Grafiği EK-2.q. Zoo Ana Etki Grafiği EK-2.r. Zoo Etkileşim Grafiği EK-2.s. Zoo Etkileşim Grafiği EK-2.t. Zoo Etkileşim Grafiği EK-2.u. ENDQ Ana Etki Grafiği EK-2.v. ENDQ Etkileşim Grafiği EK-2.y. ENDQ Etkileşim Grafiği EK-2.z. ENDQ Etkileşim Grafiği EK-3. MEPAR-SQL Sonuç Çıktıları EK-3.a Adult Veri Kümesi Sonuç Çıktısı EK-3.b Credit-App Veri Kümesi Sonuç Çıktısı EK-3.c Iris Veri Kümesi Sonuç Çıktısı EK-3.d Lymphography Veri Kümesi Sonuç Çıktısı EK-3.e Zoo Veri Kümesi Sonuç Çıktısı EK-3.f ENDQ Veri Kümesi Sonuç Çıktısı ÖZGEÇMİŞ

11 1.BÖLÜM GİRİŞ Verilerin dijital ortamda saklanmaya başlanması ile birlikte, yeryüzündeki bilgi miktarının her 20 ayda bir kendini iki katına çıkardığı günümüzde veri tabanlarının sayısı da benzer, hatta daha yüksek bir oranda artmaktadır. Yüksek kapasiteli işlem gücünün ucuzlaması ile, veri saklama hem daha hızlı hem de kolay hale gelmiştir [1]. Veritabanları günümüzde terabyte 1,000,000,000,000 byte tan daha büyük veri, büyüklüklerine ulaşabilmektedir. Bu büyüklükteki veri yığınlarının içinde stratejik öneme sahip gizli bilgiler bulunabilmektedir [2]. Veritabanları değerli hazinelerdir. Bir veritabanı sadece veri saklayıp veri sağlamaz, aynı zamanda çok önemli olabilecek gizli değerli bilgiler de içerir. Bu bilim için yeni bir kanun olabilir, bir hastalığın tedavisi için yeni bir kavrayış olabilir veya milyon dolarlar kazandırabilecek yeni bir pazar eğilimi olabilir. Genelde verilerin analizi elle yapılır. Bir çok gizli ve fayda potansiyeli olan ilişkiler analist tarafından tanınmayabilir. Bugünlerde, bir çok organizasyon büyük miktarlarda veri üretme veya toplama kabiliyetindedir. Mevcut durumda analiz için elde edilebilecek veriler yalın insan aklının kapasitenin çok ötesine geçmiştir. İnsanoğlu bu sorunla başa çıkmak için bilgisayar gücünden faydalanmaya ihtiyaç duymaktadır. Veri madenciliği veya veritabanlarından bilgi keşfi, veritabanlarında gömülü olan altını almak için otomatikleştirilmiş veri eleme sürecidir [3]. Veri madenciliği terimi ile veritabanında bilgi keşfi terimlerinin birbirine yakın anlamları vardır. Veritabanında bilgi keşfi ile elde edilen desen alışılmamış, doğrudan hesaplamalarla elde edilemez ve nihayetinde insan tarafından anlaşılabilir olmalıdır. Veri madenciliği ise veri içinde yararlı desen bulmayı ifade eder. Veritabanında bilgi keşfi etkileşimli ve tekrarlı birkaç adıma sahip bir süreçtir. Veri madenciliği ise bu

12 2 adımlardan biridir. Veri madenciliği KDD sürecinin çekirdeği olduğu için bu iki terim birbirlerinin yerine kullanılabilmektedir [3]. Veri madenciliği, esas olarak veriden bilgi elde etmeyi içeren bir süreçtir. Temel fikir şudur; eğer keşfetme imkanı varsa gerçek-dünya veritabanları karar vermede kullanılacak faydalı ancak gizli bilgiler barındırmaktadır. Örnek olarak, bir şirketin geçmiş satışları hakkındaki veriler satışlarda hangi müşterinin hangi ürünü almaya eğilimi olduğu hakkında gizli bilgiler içerebilir. Bundan dolayı veriler analiz edilerek şirket satışlarını artırma potansiyeli olan bir bilgi keşfedilebilir [4]. Veri madenciliği, veri içerisindeki desenleri ve ilişkileri keşfetmek için çeşitli veri analiz araçlarını kullanarak geçerli tahminler yapmak için kullanılabilecek sürece denir [2]. Veri madenciliği, aslında disiplinler arası bir çalışma alanıdır. Bu alanda başta makine öğrenme ve istatistik olmak üzere ayrı araştırma alanlarından türetilmiş bir çok türde algoritma vardır. Bu algoritmalar veriden bilgi elde etmekte kullanılmaktadır [4].

13 2.BÖLÜM GENEL BİLGİLER 2.1. Veri Madenciliği Veri Madenciliğine Giriş Geçmişte veri madenciliği bilgi yönetimi veya bilgi mühendisliği olarak adlandırılırdı li yıllara kadar daha çok yapay zeka alanında çalışan teorisyenler tarafından tartışılan, anlaşılması güç ve yabancı bir teknoloji idi [5]. Fayyad ve ark. [6] veri madenciliğini; kabul edilebilir etkinlik sınırlarına sahip bilgisayar tekniklerini ihtiva eden, veri üzerinden olağandışı örüntü ve model sıralamaları üreten süreç olarak tanımlanan veritabanlarından bilgi keşfi sürecinin bir adımı olarak tanımlamışlardır. Adriaans ve Zantige [7] ise bir çok araştırmacı tarafından kullanılan daha genel bir tanım kullanarak; veri madenciliğini verinin detayları arasında bilinmeyen örüntü ve eğilimler araştırma süreci olarak tanımlamışlardır. Son yıllarda bilgi toplama çok daha kolay hale gelmiştir, ancak eldeki bilgiler arasındaki ilgi parçacıklarını ortaya çıkarmak için ihtiyaç duyulan çaba özellikle büyük ölçekli veritabanlarında büyük artış göstermiştir [8]. Veri toplama ve depolama teknolojilerindeki hızlı artışı veritabanı, veri ambarı veya WWW gibi diğer depolama türlerindeki verilerin aşırı genişlemesine sebep olmuştur [9]. Buna karşılık bilim adamlarının, mühendislerin ve analistlerin sayısı değişmemektedir [1]. Örnek olarak; klinik tedavi alanında, büyüyen hacimli verilerden bilgi keşfetmede zorluklarla karşılaşılmaktadır. Bugünlerde gözlem altında bulunan hastaların fizyolojik parametrelerinin sürekli olarak toplanması devasa hacimlerdeki bilgilerin ortaya

14 4 çıkmasına sebep olmaktadır. Büyüyen miktarlardaki veri, elle analiz yapan tıp uzmanlarının görevlerini yapmalarını engellemektedir. Bir çok saklı ve potansiyel olarak faydalı ilişkiler analist tarafından fark edilememektedir [10]. Geleneksel teknikler kendi hipotezinizin doğruluğunu kanıtlamanıza izin verir. Şekil 2.1. de görüldüğü gibi bütün ilişkilerin yaklaşık %5 i bu yolla bulunabilir. Veri madenciliği ise kalan %95 lik ilişkilere açılan bir kapıdır. Başka bir deyişle geleneksel teknikler veritabanlarına söz söyleyen bir insana benzetilirse, veri madenciliği tekniği veritabanını dinleyen bir insana benzetilebilir [11]. Geleneksel teknikler %5 Bilinen ilişkiler Veri Madenciliği %95 Saklı ilişkiler Şekil 2.1. İlişkiler Bir çok zaman büyük veritabanları önceden varlığı bilinmeyen veya görülmemiş ilişkiler, eğilimler ve örüntüler için araştırılır. Bu ilişkiler veya eğilimler genelde mühendis, analist veya pazar araştırmacıları tarafından varsayılır, ancak bu ilişkilerin elde edildikleri veriler tarafından ispat edilmesine ihtiyaç duyulmaktadır. Yeni bilgiler kullanıcıların yaptıkları işi daha iyi yapmalarına yardımcı olur [5]. Bunun sonucu olarak, büyük miktarlardaki veriler içerisinden ilginç ve yararlı bilgi keşfetme kabiliyetine sahip güçlü araçlar tesis etmeye karşı ilgi artmıştır [10]. Genel olarak veri madenciliğine ilginin artması aşağıdaki faktörlerle açıklanabilir [7]; lerde şirketler, müşterileri, rakipleri, ürünleri ile ilgili verilerden oluşan veri tabanları oluşturmuşlardır. Bu veri tabanları potansiyel altın madeni gibidir. Sayısı milyonları geçen bu veriler, gizli bilgiler içerirler ve bunlara kolaylıkla SQL (Yapısal Sorgulama Dili) veri tabanı sorgulama dili ya da başka yüzeysel sorgulama dilleri

15 5 kullanılarak ulaşılabilir. SQL sadece bir sorgulama dilidir ve önceden bilinen sınırlamalar altında bilgileri bulmaya yardım eder. Veri madenciliği algoritmaları tipik olarak, veri tabanının alt gruplarında ya da uygun kümelerde belirginleşir. Bir çok durumda tekrarlanabilen SQL sorguları kullanılır ve ortalama sonuçlar elde edilir. Bunu elle yapmak mümkündür fakat oldukça yorucu ve uzun süren bir iştir. 2. Bilgisayarlarda ağ kullanımı gelişmeye devam etmektedir. Bu durumda veri tabanı ile bağlantı kurmak kolaylaşır. Böylece demografik verili dosya ile müşteri dosyası arasında bağlantı kurulabilir ve belirli popülasyon gruplarının kimliklerinin belirlenmesi sağlanabilir. 3. Son birkaç yılda makine öğrenimi teknikleri oldukça gelişmiştir. Sinir ağları, genetik algoritmalar ve diğer basit uygulanabilir öğrenme teknikleri veri tabanlarıyla ilginç bağlantılar kurmayı kolaylaştırır. 4. Müşteri ile hizmet veren arasındaki ilişki, kişisel bilgileri hizmet verenin masasındaki bilgisayardan merkezi bilgi sistemlerine gönderir. Pazarlamacılar ve sigortacılar da bu yeni kazanılan teknikleri kullanmak isterler Veri Madenciliği Nedir? Veri madenciliği veritabanlarından yapılandırılmış bilgilerin otomatik olarak çıkarılma sürecidir. Bu süreç veritabanlarından bilgi keşfi olarak adlandırılan genel sürecin özel bir parçasıdır [12]. Veri madenciliği, çok sayıdaki verinin depolandığı veri tabanlarından elde edilen modeller, örüntüler, ilişkiler, sapmalar ve anlamlı yapılar gibi ilginç bilgilerin keşfedilmesi sürecidir [13]. Veri Madenciliği, organizasyonların karar aşamaları için yeni bilgiler üreten ya da gelecekle ilgili tahminler ve planlar yapmamızı sağlayan bir dizi teknikler ve anlayışlar bütünü olarak da tanımlanabilir [14].

16 6 Veri madenciliği, bilgi keşfetmenin gerekli bir adımı gibi görülmesine rağmen, veri tabanında bilgiyi keşfetmekle eşanlamlı gibi kabul edilir. Bilgi keşfetme işlemi sırasıyla aşağıdaki işlemlerden oluşur [13]; Veri Temizleme: Gürültülü, hatalı, eksik ya da konuyla ilgisi olmayan verilerin dışlanmasıdır. Veri Zenginleştirme: Farklı veri kaynaklarının birleştirilmesidir. Veri Seçimi: Veritabanında yapılacak analiz için kullanılacak bağlantılı verilerin düzeltilmesidir. Veri Kodlama: Verilerin özetlenerek madencilik için uygun olan forma dönüştürülmesi yada birleştirilmesidir. Veri Madenciliği: Veri modellerinin elde edilmesi için uygun yöntemlerin uygulandığı önemli bir işlemdir. Bilgi Sunma: İşlenmiş bilginin çeşitli tekniklerle kullanıcıya sunulmasıdır. Bilgi keşfi süreçlerinin bir adımı olan veri madenciliği son araştırmalarda istatistik, veritabanı, makine öğrenme ve yapay zeka çalışmalarını bir araya toplamıştır. Veritabanları için uygulanan bu sürecin çekirdeğinde makine öğrenme-temelli algoritmalar bulunmaktadır [8]. Büyük miktarlardaki veri araştırılırken örüntülerin ortaya çıkması için etkin bir arama metoduna kullanılması önemlidir [5]. Veri madenciliği tahminde kullanılacak modeller kurarken iyi kurulmuş istatistiksel ve makine öğrenme tekniklerini kullanır. Bugünlerde yukarıda da bahsedildiği gibi teknoloji, madencilik sürecini otomatikleştirmekte, ticari veri ambarlarını bütünleştirmekte ve kullanıcılara faydalı bilgiler sunmaktadır [11] Veri Madenciliği Süreci Veri madenciliği tekrarlanan bir süreçtir. Süreç ilerlerken, verinin kalitesini ve içeriğini ayarlamak için yeni bilgi ve yeni hipotezler üretilmelidir. Bunun anlamı; çalışılan verinin kalitesi veri madenciliği algoritmasının çalışma süresini ve doğruluğunu belirleyecektir, ve eğer algoritma yeterince esnek ise asıl soru tam olarak

17 7 cevaplanmadığı durumda bile problemle ilgili önemli bilgiler bulunabilecektir. Veri madenciliği süreci altı aşamaya sahip bir metodoloji olarak ifade edilebilir. Bu metodoloji; çözüm aranacak problemin tanımlanması, problemle ilgili geçmiş bilgilerin elde edilmesi, kullanılabilir verilerin seçimi, verinin ön işleme tabi tutulması, analiz ve sonuçların yorumlaması ve bu sonuçların kullanılması aşamalarını içerir [5]. Bu aşamalar Şekil 2.2. de görülmektedir. Problemin Tanımlanması Geçmiş Bilgiler Veri Seçimi Veri Önişleme Analiz ve Yorum Raporlama ve Kullanım Şekil 2.2. Veri Madenciliği Süreci Problemin Tanımlanması Problemin tanımlanması safhası veri madenciliği sürecinin ilk aşamasıdır. Bu aşama süresince, belirlenen problem için veri madenciliğinin kullanılmasındaki amaçlar tanımlanır. Veri madenciliği projesinde başlangıç sorusu çoğunlukla üstü kapalı olmalıdır. Çünkü bu durumda veri madenciliği süreci probleme yararı olmayan büyük miktarda veriyi önemsemeyecektir. Bu yolla, veri seçimi ve veri önişleme adımları başta iyice incelenmiş verilerle başlayarak, problemi çözmeye yardımcı olacaktır. Bu safha süresince sonuçların nasıl kullanılacağını bilmek büyük önem taşımaktadır.

18 8 Bu safha veri madenciliği sürecinin beklentilerinin ve standartlarının saptandığı safhadır. Ayrıca çalışılan verilerin kalitesini öğrenmeye yardımcı olur. Eğer çok fazla iterasyona ihtiyaç varsa ve sonuçlar kabul edilemeyecek kadar belirsizlikle sonuçlanıyorsa, problemin tanımı yerine verinin kalitesi üzerinde durulmalıdır Geçmiş Bilgiler Analistin, çalışılan veri üzerindeki muhtemel önyargı ve seçim etkileri hakkında bilgi sahibi olması gerekmektedir. Bu bilgi sayesinde geliştirici ekibe muhtemel kısıtlamalar hakkında bilgi verilebilmektedir. Veri seçimi yapmadan önce bilinmesi gereken bir başka bilgi ise veri üzerinde bulunan tipik gündelik ilişkilerdir. Heckerman [15] bu sorun için Bayesian Ağlarını önermiştir. Böylece, veriden sağlanan sonuç üzerindeki muhtemel kayıplara işaret eden önceki bilgilerle birleşme sağlanabilmektedir. Önceki bilgilerin elde edilmesi bilginin yeniden keşfinin önlenmesini sağlar. Özde, veri madenciliği algoritması, mevcut olan örüntülerin tekrar öğrenilmesini önleyecek birkaç açıklama ile bir sorunun üstesinden gelebilmektedir. Feelders ve ark. [16] kural türetme (rule induction) adını verdikleri bir metot önermişlerdir. Bu metotta analizin bilinen ilişkileri göz önünde bulundurması için kullanıcının rehberliğine ihtiyaç duyulmaktadır. Bilginin edinimi veri madenciliği sürecinde kritik bir role sahiptir. Bu aşama olumlu sonuçlar veren sürece doğrudan zamanında yardımcı olabilir Veri Seçimi Geçmiş bilgiler elde edildikten sonra, veri madenciliği süreci probleme cevap teşkil edecek analizde kullanılacak verilerin seçiminin yapılacağı önemli bir adıma ulaşır. Bu seçim yapılırken geleneksel kalıplardan çıkılmalıdır. Çünkü, veri madenciliğinde insanın görevi problemin çözümünü bulmak değildir, aksine verinin kendi kendine bu sonuçlara yaklaşmasına yardım etmektir. Süreç, geçmiş verilerin eldesi ile zaten uzman kişinin zararlı sonuçlara götürecek eğilimlerinden korunmuş olmaktadır. Subramanian ve ark. [17] ve Yevich [18] potansiyel ilgiye sahip verilerin seçimi için ideal desteği sunan veri ambarı kullanımını önermişlerdir. Ancak, veri ambarı

19 9 halihazırda nadiren bulunabilir. Bu durumda şirketler bu işlemi seçimden önce bir sefer oluşturma sürecinin üzerinden geçmelidirler. Eğer veri ambarı seçim aşamasında hazır değilse, veri madenciliği süreci çok uzun sürelere ihtiyaç duyacaktır. Veri seçimi hayati öneme sahiptir. Önceki aşamaların uygun şekilde tamamlandığını varsaydığımızda veri seçiminin sonraki aşamalarda sonuca ulaşma süresini kısaltıcı etkisi görülecektir Veri Önişleme Veri ambarında bütün ilgili verilerin bulunduğu durumlarda bile analizin yapılabilmesi için önişlemeye sıklıkla ihtiyaç duyulur. Bu aşamada uzman yeni özellikler ekleyebilme özgürlüğüne sahiptir. Bu eklemeler sayesinde veri madenciliği sürecinde algoritmanın varlığını belirlemekte zorlandığı ilişkilerin kurulması sağlanır. Sınıflandırma ağaç algoritması gibi bazı algoritmalar, veri madenciliği süreci için önemli sayılan kesin ilişkileri belirlemekte başarısızlığa uğrayabilir. Diğer algoritmalar çok uzun zaman harcayarak belirlemeleri yapabilir. Eğer uzman halihazırda bu bilgiye sahipse, bunu doğrudan bir özellik olarak eklemesi, algoritmanın belirlemeye çalışmasından daha uygun bir seçim olur. Veritabanlarındaki bire-çok ilişkiler çoğunlukla önişleme aşamasında karşımıza çıkmaktadır. Veri madenciliği algoritması çoğu durumda bir kayıtla ilgili bütün özelliklerin tek bir satırda bulunması varsayımına göre tasarlanmıştır. Şartların sağlanması doğrultusunda algoritma çok büyük tekil bir tablo ile çalışmak zorunda kalabilir. Analist muhtemel özellikleri belirlerken ve kayıtları oluştururken alan bilgisini kullanmalı ve ortak akıl kaidelerine uymalıdır Analiz ve Yorumlama Bu aşamadaki süreç veri madenciliği süresinin en az %70 ini kullanır. Bu aşama esnasında analistin veri madenciliği, veri analizi ve çalışılan alanda tecrübe ve bilgiye sahip olması kritik öneme sahiptir. Çalışılan konu hakkındaki bilgilerin ilk olarak ihtiyaç duyulduğu yer, sonuçların yorumlanma aşamasıdır. Bu bilgiler, ileriki araştırmalarda hangi sonuç veya sonuçların göz önünde bulundurulması gerektiğini muhtemel doğru hareketle yapabilmek için büyük öneme sahiptirler. Veri analizi deneyimi veri üzerinde garip örüntüler bulunduğu zaman açıklama için ve çalışılan

20 10 verinin daha ilginç parçalarına önem göstermek için prensipte ihtiyaç duyulan bir özelliktir. Sonuç olarak, veri madenciliği deneyimi ve uzmanlığı sonuçların teknik olarak yorumlanması için gereklidir. Analiz ve yorumlama aşaması asıl madenciliğin yapıldığı aşamadır. Verinin seçilip, önişleme tabi tutulup ve çözülecek problemin anlaşılmasından sonra bu aşama veriler arasında belirli örüntüler, benzerlikler ve diğer ilginç ilişkileri bulmaya çalışır. Bütün bu örüntüler genellikle veri madenciliği sürecinin son aşamasında kurallara çevrilir Raporlama ve Kullanım Veri madenciliği sürecinin sonuçları çok geniş kullanım alanına sahiptir. Sonuçlar karar ağacı gibi çok basit uygulamalara girdi olabileceği gibi son kullanıcı uygulamasına tam olarak bütünleşmiş uygulamalarda da kullanılabilmektedir. Bu sonuçlar ayrıca karar destek sistemlerinde veya bir bilgi tabanı sisteminde de kullanılabilir. Bu alandaki bir uygulama bilgi tabanlı bir sistemde öğrenmeyi daha hızlı ve etkin kılar. Çünkü uzman kişilerin yanlı etkilerinin ayarlanmasını beklemesine gerek yoktur. Edinilen bilgi bazı koşullarda daha doğru olabilmektedir. Ve eğer süreç içerisinde edinilen geçmiş bilgi güvenilir ise sonuçlarda güvenilir olacaktır Veri Madenciliğinin Görevleri Genel olarak veri madenciliği, tanımlayıcı ve tahminleyici veri madenciliği olmak üzere iki kategoride sınıflandırılır. Betimsel veri madenciliğinde, veri kümesi kısa ve öz bir şekilde tanımlanır ve verilerin ilginç genel özellikleri sunulur. Kestirim veri madenciliğinde ise bir ya da daha fazla modeller kümesi oluşturulup varolan verilerden sonuçlar çıkarılır ve yeni veri kümelerinin davranışları tahmin edilmeye çalışılır [7]. Veri madenciliğinin başlıca görevleri kısaca açıklanmıştır [19] Sınıf Betimlemesi Veri kümesinin kısa bir özetini sağlar ve diğerlerinden farklılığını ortaya koyar. Bir veri kümesinin özetlenmesine sınıf nitelendirmesi denir. İki ya da daha fazla veri kümesinin karşılaştırılmasına ise sınıf karşılaştırması ya da ayrımı denir. Sınıf betimlemesi sadece

21 11 özet özellikleri değil merkezi eğilim ölçüleri ve dağılım ölçüleri gibi özellikleri de içerir. Örneğin Avrupa ya karşı Asya şirketlerinin satışlarını karşılaştırmak, iki sınıfı ayırt edip önemli faktörleri belirlemek ve özet bir bilgi sunmak için sınıf betimlemesi kullanılır Birliktelik Birliktelik, modeller kümesi arasındaki birliktelik ilişkilerini ya da korelasyonları keşfetmektir. Birliktelik analizi, pazarlama yönetimi, katalog planı ve diğer alanlarda karar verme sürecinde geniş ölçüde kullanılır. Son zamanlarda kurulmuş etkin algoritmalı birliktelik analizinde önemli araştırmalar yapılmıştır. Bunlar, düzey-tarz, önsel araştırma, çoklu düzeyde madencilik, çok boyutlu birliktelikler, sayısal, kategorik ve sürekli veri, meta-örüntü, yönelimli yada kısıt temelli madencilik ve madencilik korelasyonları için madencilik birlikteliklerini içerir Sınıflandırma Sınıflandırma çalışılan verilerin kümesini çözümler (sınıf ismi, etiketi bilinen objelerin kümesi) ve verilerin içinde özelliklerine göre sınıflar oluşturup her bir sınıf için bir model kurar. Veritabanındaki her bir sınıfın daha iyi anlaşılması ve daha sonra elde edilen verilerin sınıflandırılması için sınıflama işlemi bir karar ağacı ya da sınıflandırma kurallarının bir kümesini oluşturur. Örneğin, hastalıkların belirtilerine göre hastalıkları sınıflama, hastalık türlerini tahmin etmeye yardım eder. Makine öğrenimi, istatistik, veritabanı, sinir ağları, evrimsel algoritmalar ve diğer alanlarda geliştirilmiş bir çok sınıflandırma yöntemi vardır. Sınıflandırma, müşteri bölümü, iş modelleme ve kredi analizlerinde kullanılır. Sınıflandırma ile ilgili geniş bilgi Bölüm 2.2.'de verilmiştir Tahmin Bu fonksiyon, bazı eksik verilerin muhtemel değerlerini ya da nesnelerin bir kümesinde kesin özelliklerin değer dağılımını ve seçilen nesnelere benzer verilerin kümesini temel alan değer dağılımını tahmin eder. Örneğin, bir işçinin maaşı, çalıştığı yerdeki diğer

22 12 işçilerin maaş dağılımı temel alınarak tahmin edilebilir. Genellikle, regresyon analizi, genelleştirilmiş doğrusal model, korelasyon analizi, karar ağaçları, genetik algoritmalar, sinir ağı modelleri nitelikli bir tahmin için kullanılan yöntemlerdir Kümeleme Kümeleme çözümlemesi, özellikleri birbirine benzeyen objelerin değerlerinin toplanmasından oluşan bir kümede, verilerin içindeki gizli kümeleri belirlemektir. Benzerlik, uzmanlar ya da kullanıcılar tarafından belirlenmiş uzaklık fonksiyonlarıyla tanımlanabilir. İyi bir kümeleme yöntemi, kümeler arası benzerliğin düşük ve küme içi benzerliğin yüksek olduğu nitelikli kümeler meydana getirir. Örneğin, evler, zemin alanı ve coğrafik yerleşime göre kümelenebilir. Veri madenciliği araştırması, büyük veritabanları ve çok boyutlu veri depoları için yüksek nitelikli ve hesaplanabilir kümeleme yöntemlerine odaklanır Zaman Serileri Analizi Zaman-serileri çözümlemesi, benzer seriler ve ardışık örüntülerin madenciliği, periyodikler, eğilimler ve sapmaların araştırılması, ilginç özellikler ve kesin düzenlerin bulunması için zaman serilerinin geniş kümesini çözümler. Örneğin, bir şirketin geçmişteki stok durumuna, iş durumuna, rekabet performansına ve günlük piyasasına bakarak stok değerlerinin eğilimi tahmin edilebilir Veri Madenciliğinde Kullanılan Algoritmalar Veri madenciliği algoritmaları danışmansız ve danışmanlı öğrenme olarak iki ayrı şekilde gerçekleştirilir. Danışmansız öğrenme, veri örüntülerini veri kümesi içindeki bazı mantıksal düzenlerini karakterize ederek bulur. Bu durumda nitelik ilişkileri arasında hiçbir ön varsayım yapılmaz. Danışmanlı öğrenmede ise; denetmen bilinen durumları modele göstererek veya iyi tanımlanmış örüntülerin modele etki etmesini sağlayarak genelleştirmeleri şekillendirir. Uzmanlar bu şekilde aramaya rehberlik eder. Sınıflandırma ise belkide uygulanan en genel danışmanlı veri madenciliği tekniğidir. Bu teknik sınıf bilgileri bulunan öğrenme örnek kümesinden grup kuralları üreterek gelecek örüntüleri sınıflandırmayı içerir [8].

23 13 Sınıflandırma konusu doğası gereği danışmanlı algoritma kullanmaktadır. Bu sebeple danışmanlı algoritmalarla ilgili daha geniş bilgi verilecektir Danışmansız Öğrenme Algoritmaları K-Yol Kümeleme K-yol iyi bilinen kümeleme problemlerini çözebilen en basit danışmansız öğrenme algoritmasıdır. Prosedür, çalışılan veri kümesini, daha önceden belirlenmiş bir sayıda kümeye ulaşıncaya kadar sınıflandırır. İşleyiş bu kadar basittir. Ana fikir her bir küme için bir adet yani K adet merkez tanımlamaktır. Bu merkezlerin yerlerine akıllıca karar verilmelidir, çünkü farklı yerler farklı sonuçlar doğurur. Birbirinden olabildiğince uzak olarak belirlenen merkezlerin daha iyi sonuç verdiği düşünülmektedir. Algoritma adımları şöyledir; 1. K adet noktayı kümelenecek nesnelerin uzayına yerleştir. Bu noktalar başlangıç grup merkezleri olacaktır. 2. Her bir nesneyi en yakın merkeze ata. 3. Bütün nesneler atandığında K merkezin pozisyonunu tekrar hesapla. 4. Merkezler hareketsiz kalana kadar 2. ve 3. ü tekrarla. Bu hesaplama en az mesafeyi hesaplayana kadar nesneleri gruplara bölecektir [20] Özdüzenleyici Haritalar (Self Organized Maps) Özdüzenleyici haritalar, veri görüntüleme tekniğidir. Kendinden örgütlü sinir ağları kullanarak verinin boyutlarını indirger. İnsanın çok yüksek boyutlardaki verileri görememe problemine karşı uygulanmaktadır [21] Danışmanlı Öğrenme Algoritmaları Regresyon Modelleri İstatistik uzun zamandır veri küme modelleri oluşturmak için kullanılmaktadır. Doğrusal regresyon süreci olasılık, veri analizi ve istatistiksel sonuç çıkarma tekniklerini kullanan bir süreçtir. Regresyon analizi yüz yılın başlarında Francis Galton

24 14 tarafından ilk kez ortaya atılmıştır. Veri modellemede ise genellikle verilen bağımsız değişkenlere göre bir bağımlı değişkenin koşullu beklenen değeri için kullanılır [22]. Regresyon modelleri veri madenciliğinde kullanılan en eski ve en fazla bilinen istatistik tekniklerinden biridir. Temel olarak regresyon, nümerik veriyi girdi olarak kabul edip, sonuç olarak matematiksel bir formül verir. Az boyutlu verilerde rahatlıkla uygulanabilir, ancak, kümelerin arasından ilginç olanları seçmek için bazı zamanlarda ileri araştırma programlarına gerek duyulabilir. Doğrusal regresyon modelleri de diğer veri madenciliği araçlarının yaptığı işlerin benzerini yapmaktadır. Regresyon teknikleri koşullu olasılığın bulunduğu durumlarda tahminleme yapmak için kullanılabilir. Tahminleme için kullanılan regresyon modeli doğrusal olasılık modeli olarak adlandırılır. Regresyon modellerinden biri de bütün bağımsız değişkenleri koşulsuz olan logit modeldir. Lojistik regresyon modeli ise logit modeline benzeyen ek olarak sürekli değişkenleri de ihtiva eden bir modeldir. Bir çok tipte regresyon modeli vardır. Verilerin doğrusal fonksiyona kolayca girilemeyeceği durumlarda doğrusal olmayan regresyon ve doğrusal olmayan çoklu regresyon modelleri kullanılabilir. Çeşitli istatistiksel modeller kullanılarak, çoklu ve kısmi korelasyon katsayıları tanımlanabilir [22]. Bu modellerin en büyük kusuru, etkin bir kullanım için zor anlaşılır olmasıdır. Veri madenciliği, veriden anlamlı bilgileri çıkarma süreci olarak tanımlanırken, istatistik veriden anlamlı bilgi çıkarmayı da içeren çalışma alanının bütünüdür. İstatistik uzmanları ile tahmine dayalı modelleme ile ilgilenen diğer uzmanlar arasında çoğu zaman bir duvar vardır. Bir çok profesyonel istatistikte kullanılan terminolojiyi kullanmakta zorlanmaktadır. Daha ötesi, endüstri analistleri geçmiş tarihten bu yana istatistik ile veri madenciliğini birbirinden ayırt etmişler ve veri madenciliğinin istatistikten farklı olduğunu belirtmişleridir. Özel sektördeki profesyoneller için veri madenciliği üzerine yoğunlaşmak daha kolay bir tercihtir. IBM, SPSS ve SAS bu sezgiyi yok etmek için çok yol kat edip, standart istatistik modellerini yapay sinir ağları, karar ağaçları ve veri madenciliği ile bütünleşik diğer tekniklerin yanına eklemişlerdir [22].

25 K-En Yakın Komşu Kayıtlar, bir veri uzayındaki noktalar olarak düşünülürse, birbirine yakın olan kayıtlar, birbirinin civarında (yakın komşu) olur. K-en yakın komşuluğunda temel düşünce komşunun yaptığı gibi yap tır. Eğer belirli bir kişinin davranışı tahmin edilmek isteniyorsa, veri uzayında o kişiye yakın, örneğin on kişinin davranışlarına bakılır. Bu on kişinin davranışlarının ortalaması hesaplanır ve bu ortalama belirlenen kişi için tahmin olur. K-en yakın komşuluğunda, K harfi araştırılan komşuların sayısıdır. 5-en yakın komşuluğunda, 5 kişiye ve 1-en yakın komşuluğunda 1 kişiye bakılır [23]. En yakın komşuluk modelleri yerel modellerin kombinasyonu temeline dayanan veri madenciliği metotlarının esnek bir grubudur. Bu metotların yerel kombinasyonlardan oluşması demek lokal mantıkta çalıştıkları anlamına gelmemektedir. Bunlar bütün veri kümesine uygulanabilen metotlardır ancak, istatistiksel analiz yerel analizlere bölünmüştür. Temel fikir oldukça basittir. Uygun değişkenler, açıklayıcı (x) ve hedef (y) değişkenlere bölünür. Öğrenme verisinden (x,y) formatında gözlemler toplanır. Bu öğrenme verisi için, gözlemdeki x değerleri arasında uzaklık formülü oluşturulur. Bu hesaplama gözlem esnasında oluşan bir komşuluğa en yakın olan her bir gözlem için x değerleri arasında yapılır. Sürekli bir cevap değişkeni için, her bir gözlemin cevabı olan y i için uygun en yakın komşu değeri; 1 y ˆ = (1) i y j k x N ( ) j x i ile tanımlanır. Bu değer, N(x i ) yani x i nin bütün komşularına karşılık gelen x cevap değerlerinin ortalamasıdır. Bunun yanında, k ise daha önceden belirlenmiş olan hesaba dahil edilecek komşu sayısını gösteren değerdir [24]. En yakın komşu metotları tahminsel sınıflandırmada da kullanılmaktadır. Y gözlemini sınıflandırmak için, önce onun komşuluğu belirlenir ve her bir kategorinin yerleştirilmiş olasılıkları komşuluktaki göreceli sıklıklar şeklinde hesaplanır. Sınıflandırmak için en yüksek yerleştirilmiş olasılık seçilir. Ağaç modellerindeki gibi, en yakın komşu modelleri olasılık dağılımına ihtiyaç duymaz. Bu modeldeki can alıcı seçimler uzaklık fonksiyonu ve dahil edilecek komşu sayısı parametresi olan k dır [22].

26 16 Bu modellerin olası dezavantajları özellikle çok fazla açıklayıcı değişken varsa çok fazla hesaplama yükü getirmesidir. Bu durumda komşuluklar ilgisiz noktalarda belirebilir, bu sebepten dolayı ortalamalarını almak anlamlı sonuçlar vermeyebilir Yapay Sinir Ağları Yapay sinir ağlarında amaç fonksiyonu birbirine bağlı basit işlemci ünitelerinden oluşan bir ağ üzerine dağıtılmıştır. Yapay sinir ağlarında kullanılan öğrenme algoritmaları veriden üniteler arasındaki bağlantı ağırlıklarını hesaplar. Yapay sinir ağları istatistiksel yöntemler gibi veri hakkında parametrik bir model varsaymaz yani uygulama alanı daha geniştir ve bellek tabanlı yöntemler kadar yüksek işlem ve bellek gerektirmez [25]. Beynin üstün özellikleri, bilim adamlarını üzerinde çalışmaya zorlamış ve beynin nörofiziksel yapısından esinlenerek matematiksel modeli çıkarılmaya çalışılmıştır. Beynin bütün davranışlarını tam olarak modelleyebilmek için fiziksel bileşenlerinin doğru olarak modellenmesi gerektiği düşüncesi ile çeşitli yapay hücre ve ağ modelleri geliştirilmiştir. Böylece yapay sinir ağları denen yeni ve günümüz bilgisayarlarının algoritmik hesaplama yönteminden farklı bir bilim alanı ortaya çıkmıştır. Yapay sinir ağları; yapısı, bilgi işleme yöntemindeki farklılık ve uygulama alanları nedeniyle çeşitli bilim dallarının da kapsam alanına girmektedir [26]. Genel anlamda yapay sinir ağları, beynin bir işlevi yerine getirme yöntemini modellemek için tasarlanan bir sistem olarak tanımlanabilir. Yapay sinir ağları, yapay sinir hücrelerinin birbirleri ile çeşitli şekillerde bağlanmasından oluşur ve genellikle katmanlar şeklinde düzenlenir. Donanım olarak elektronik devrelerle ya da bilgisayarlarda yazılım olarak tasarlanabilir. Beynin bilgi işleme yöntemine uygun olarak yapay sinir ağları, bir öğrenme sürecinden sonra bilgiyi toplama, hücreler arasındaki bağlantı ağırlıkları ile bu bilgiyi saklama ve genelleme yeteneğine sahip paralel dağılmış bir işlemcidir. Öğrenme süreci, arzu edilen amaca ulaşmak için yapay sinir ağları ağırlıklarının yenilenmesini sağlayan öğrenme algoritmalarını içerir [27]. Yapay sinir ağlarında kullanılan öğrenme algoritmaları veriden üniteler arasındaki bağlantı ağırlıklarını hesaplar. Yapay sinir ağları, sonuçları bilinen belirli veri kümeleri üzerinde algoritmaları çalıştırarak eğitilirler. Bunun sonucunda yapay sinir ağının

27 17 içindeki ağırlık belirlenir. Bu ağırlıklar yeni gelen verilerin işlenmesinde kullanılır. Karmaşık veri tabanları üzerinde daha iyi sonuçlar üretebilirler [23] Yapay Sinir Ağlarının Özellikleri Yapay sinir ağlarının hesaplama ve bilgi işleme gücünü paralel dağılmış yapısından, öğrenebilme ve genelleme yeteneğinden aldığı söylenebilir. Genelleme, eğitim ya da öğrenme sürecinde karşılaşılmayan girişler için de yapay sinir ağlarının uygun tepkileri üretmesi olarak tanımlanır. Bu özellikler yapay sinir ağlarının karmaşık problemleri çözebilme yeteneğini göz önüne çıkarır. Günümüzde birçok bilim alanında yapay sinir ağları, aşağıdaki özellikleri nedeniyle etkin olmuş ve uygulama yeri bulmuştur [26]. 1. Doğrusal Olmama: Yapay sinir ağlarının temel işlem elemanı olan hücre doğrusal değildir. Dolayısıyla hücrelerin birleşmesinden meydana gelen yapay sinir ağları da doğrusal değildir ve bu özellik bütün ağa yayılmış durumdadır. 2. Öğrenme: Yapay sinir ağlarının arzu edilen davranışı gösterebilmesi için amaca uygun olarak ayarlanması gerekir. Bu, hücreler arasında doğru bağlantıların yapılması ve bağlantıların uygun ağırlıklara sahip olması gerektiğini ifade eder. Yapay sinir ağlarının karmaşık yapısı nedeniyle bağlantılar ve ağırlıklar önceden ayarlı olarak verilemez ya da tasarlanamaz. Bu nedenle yapay sinir ağları, istenen davranışı gösterecek şekilde ilgilendiği problemden aldığı eğitim örneklerini kullanarak problemi öğrenmelidir. 3. Genelleme: Yapay sinir ağları, ilgilendiği problemi öğrendikten sonra eğitim sırasında karşılaşmadığı test örnekleri için de arzu edilen tepkiyi üretebilir. Örneğin, karakter tanıma amacıyla eğitilmiş bir yapay sinir ağı, bozuk karakter girişlerinde de doğru karakterleri verebilir ya da bir sistemin eğitilmiş yapay sinir ağı modeli, eğitim sürecinde verilmeyen giriş sinyalleri için de sistemle aynı davranışı gösterebilir. 4. Uyarlanabilirlik: Yapay sinir ağları, ilgilendiği problemdeki değişikliklere göre ağırlıklarını ayarlar. Yani, belirli bir problemi çözmek amacıyla eğitilen yapay sinir ağı, problemdeki değişimlere göre tekrar eğitilebilir, değişimler devamlı ise gerçek zamanda da eğitime devam edilebilir.

28 18 5. Hata Toleransı: Yapay sinir ağları, çok sayıda hücrenin çeşitli şekillerde bağlanmasından oluştuğundan paralel dağılmış bir yapıya sahiptir ve ağın sahip olduğu bilgi, ağdaki bütün bağlantılar üzerine dağılmış durumdadır. Bu nedenle, eğitilmiş bir yapay sinir ağının bazı bağlantılarının hatta bazı hücrelerinin etkisiz hale gelmesi, ağın doğru bilgi üretmesini önemli ölçüde etkilemez. Bu nedenle, geleneksel yöntemlere göre hatayı tolere etme yetenekleri son derece yüksektir. 6. Donanım ve Hız: Yapay sinir ağları, paralel yapısı nedeniyle büyük ölçekli entegre devre teknolojisi ile gerçeklenebilir. Bu özellik, yapay sinir ağlarının hızlı bilgi işleme yeteneğini artırır ve gerçek zamanlı uygulamalarda arzu edilir. 7. Analiz ve Tasarım Kolaylığı: Yapay sinir ağlarının temel işlem elemanı olan hücrenin yapısı ve modeli, bütün yapay sinir ağları yapılarında yaklaşık aynıdır. Dolayısıyla yapay sinir ağlarının farklı uygulama alanlarındaki yapıları da standart yapıdaki bu hücrelerden oluşacaktır Yapay Sinir Ağlarının Yapısı Sinir hücreleri bir grup halinde işlev gördüklerinde ağ olarak adlandırılırlar ve böyle bir grupta binlerce nöron bulunur. Yapay nöronların birbirleriyle bağlantılar aracılığıyla bir araya gelmeleri yapay sinir ağını oluşturmaktadır. Yapay sinir ağıyla aslında biyolojik sinir ağının bir modeli oluşturulmak istenmektedir. Nöronların aynı doğrultu üzerinde bir araya gelmeleriyle katmanlar oluşmaktadır [27]. Katmanların değişik şekilde birbirleriyle bağlanmaları değişik ağ mimarilerini doğurur. Yapay sinir ağları üç katmadan oluşur. Bu katmanlar sırasıyla; Girdi Katmanı: Bu katmandaki proses elemanları dış dünyadan bilgileri alarak ara katmanlara transfer ederler. Bazı ağlarda girdi katmanında herhangi bir bilgi işleme olmaz. Gizli Katman (Ara Katman): Girdi katmanından gelen bilgiler işlenerek çıktı katmanına gönderilirler. Bu bilgilerin işlenmesi gizli katmanlarda gerçekleştirilir. Bir ağ içinde birden fazla gizli katman olabilir.

29 19 Çıktı Katmanı: Bu katmandaki proses elemanları gizli katmandan gelen bilgileri işleyerek ağın girdi katmanından sunulan girdi seti için üretmesi gereken çıktıyı üretirler. Üretilen çıktı dış dünyaya gönderilir. Girdi katmanı, gizli katman ve çıktı katmanı Şekil 2.3. te görülmektedir. Girdi Katmanı Çıktı Katmanı Gizli Katman Şekil 2.3. Yapay Sinir Ağı Modeli Karar Ağaçları Verileri sınıflandırmak ve bu verilerle tahminleme yapmak, birbirleriyle çok yakın bağlantılı işlemlerdir. Bu işlemler karar ağaçlarıyla daha iyi görülebilir. Örnek olarak; belirli bir müşterinin, belirli bir davranışı gösterip göstermeyeceği kestirilmek istenebilir. Bu durumda müşterinin, belirli bir müşteri sınıfında yer aldığı ve bundan dolayı da belirli bir davranışı göstereceği açıktır. Karar ağacı, ağaç yapısında olan bir akış şeması şeklindedir. Her düğüm, bir nitelik üzerindeki test işlemini temsil eder. Her dallanma test işleminin sonucunu temsil eder, ve sonuç olarak ağaç sınıflar ile son bulur [23].

30 20 Tümevarım algoritmaları, büyük veri kümelerini çok iyi analiz eder ve tümevarım algoritmaları ile kurulan karar ağacı ile karar süreci kolaylaştırılır. Yapılan kestirimler de daha iyi sonuçlar verir [28]. İstatistiksel yöntemlerde veya yapay sinir ağlarında veriden bir fonksiyon öğrenildikten sonra bu fonksiyonun insanlar tarafından anlaşılabilecek bir kural olarak yorumlanması oldukça zordur. Karar ağaçları ise veriden oluşturulduktan sonra kökten yaprağa doğru inilerek kurallar yazılabilir; IF <Koşul> THEN < Tahmin (sınıf)> Bu şekilde kural çıkarma, veri madenciliği çalışmasının sonucunun doğrulanmasını sağlar. Bu kurallar uygulama konusunda uzman bir kişiye gösterilerek sonucun anlamlı olup olmadığı denetlenebilir. Sonradan başka bir teknik kullanılacak bile olsa karar ağacı ile önce bir kısa çalışma yapmak, önemli değişkenler ve yaklaşık kurallar konusunda analiste bilgi verir ve daha sonraki analizler için yol gösterici olabilir [25]. Tahmin edici ve tanımlayıcı özelliklere sahip olan karar ağaçları, veri madenciliğinde, kuruluşlarının ucuz olması, yorumlanmalarının kolay olması, veri tabanı sistemleri ile kolayca entegre edilebilmeleri, güvenilirliklerinin daha iyi olması nedenleri ile sınıflama modelleri içerisinde en yaygın kullanıma sahip algoritmalardır [29]. Karar ağacı algoritmasının yaygın olarak kullanıldığı sahalar, Belirli bir sınıfın muhtemel üyesi olacak elemanların belirlenmesi, Çeşitli vakaların yüksek, orta, düşük risk grupları gibi çeşitli kategorilere ayrılması, Gelecekteki olayların tahmin edilebilmesi için kurallar oluşturulması, Parametrik modellerin kurulmasında kullanılmak üzere çok miktardaki değişken ve veri kümesinden faydalı olacakların seçilmesi, Sadece belirli alt gruplara özgü olan ilişkilerin tanımlanması, Kategorilerin birleştirilmesi ve sürekli değişkenlerin kesikli hale dönüştürülmesidir Evrimsel Algoritmalar Veri madenciliğinde arama süreci genel zayıf metotları ve alan spesifik güçlü metotları içeren çeşitli tekniklerle yapılabilir. 4 çeşit evrimsel algoritmadan bahsedilebilir;

31 21 Genetik Algoritmalar (GA), Genetik Programlama (GP), Evrim Stratejileri (ES), Evrimsel Programlama (EP). Evrimsel algoritmalar ile ilgili daha geniş bilgi 4. Bölümde verilmiştir Veri Madenciliğinin Kullanım Alanları Günümüzde veri madenciliğinin başlıca ilgi alanları olarak aşağıdakiler sayılabilir [30]; 1. Pazarlama Müşteri segmentasyonu, Müşterilerin demografik özellikleri arasındaki bağlantıların kurulması, Çeşitli pazarlama kampanyaları, Mevcut müşterilerin elde tutulması için geliştirilecek pazarlama stratejilerinin oluşturulması, Pazar sepeti analizi, Çapraz satış analizleri, Müşteri değerlemesi, Müşteri ilişkileri yönetimi, Çeşitli müşteri analizleri, Satış tahminleri. 2. Bankacılık Farklı finansal göstergeler arasındaki gizli korelasyonların bulunması, Kredi kartı dolandırıcılıklarının tespiti, Müşteri segmentasyonu, Kredi taleplerinin değerlendirilmesi, Usulsüzlük tespiti, Risk analizleri, Risk yönetimi. 3. Sigortacılık Yeni poliçe talep edecek müşterilerin tahmin edilmesi,

32 22 Sigorta dolandırıcılıklarının tespiti, Riskli müşteri tipinin belirlenmesi. 4. Perakendecilik Satış noktası veri analizleri, Alış-veriş sepeti analizleri, Tedarik ve mağaza yerleşim optimizasyonu. 5. Borsa Hisse senedi fiyat tahmini, Genel piyasa analizleri, Alım-satım stratejilerinin optimizasyonu. 6. Telekomünikasyon Kalite ve iyileştirme analizleri, Hisse tespitleri, Hatların yoğunluk tahminleri. 7. Sağlık ve İlaç Test sonuçlarının tahmini, Ürün geliştirme, Tıbbi teşhis, Tedavi sürecinin belirlenmesi. 8. Endüstri Kalite kontrol analizleri, Lojistik, Üretim süreçlerinin optimizasyonu. 9. Bilim ve Mühendislik

33 23 Ampirik veriler üzerinde modeller kurarak bilimsel ve teknik problemlerin çözümlenmesi Veri Madenciliğinde Yapılan Çalışmalar Tzu-Liang ve ark. [31], CNC tezgahlarında işlem görmüş parçaların kabulünün tahminindeki kalite güvence problemini çözmek için yeni bir yaklaşım sunmuşlardır. Gerçek yüzey pürüzlülük değerinin tahmini yerine, işlem görmüş parçaların kalite kabulü üzerinde odaklanmışlardır. Sunulan kural bileşimi algoritmasını ve kural onaylama prosedürünü, işletmenin uzun yıllar boyu topladığı geçmiş veriler üzerinde test etmişlerdir. Sonuçlar geliştirdikleri tekniğin, yüzey pürüzlülüğünün kabul edilebilirliğinin tahmini açısından istatistiksel tekniklerden (çoklu nominal regresyon ve genel diskriminant) çok daha doğru sonuçlar verdiğini göstermiştir. Menon ve ark. [32] yaptıkları çalışmada, kalite ve güvenirliliği iyileştirmek için metinsel veri madenciliğini araç olarak kullanmışlardır. Literatürdeki ürün geliştirme süreci ile ilgili yapılan çoğu çalışma sayısal veritabanları üzerine yoğunlaştığından, metinsel veritabanları ile ilgili çalışmalara ihtiyaç olduğunu vurgulamışlar ve bu sebepten dolayı metinsel veritabanları üzerinde yoğunlaşmışlardır. Metinsel veri madenciliğinin uygulanabileceği tüketici ve son ürünler için genel ürün geliştirme süreci alanlarını belirtmişlerdir. Ayrıca iki büyük çok uluslu işletmede metinsel veri madenciliğinin başarılı uygulamalarını sunmuşlardır. M. C. Jothishankar ve ark. [33], basılmış devre levhalarının akış lehimlenmesi sırasındaki hataların oluşumuna etki eden faktörlerle birlikte problemin tanımını vermişlerdir. Önemli olan faktörleri belirlemek için gerekli olan veri madenciliği yaklaşımlarını sunmuşlardır. Bununla birlikte sonuçlarını önerilen iyileştirmelerle birlikte ortaya koymuşlardır. Mark Last ve ark. [34] yeni, algı-tabanlı Otomatik Algı Ağı: APN -Automated Perceptions Network- adını verdikleri metodu, yüksek derecede gürültülü veri kümelerinden özlü ve yorumlanabilir modellerin otomatik kurulumu için geliştirmişlerdir. Yöntemlerini iki yarı iletken ürünün gelir verilerinde

YAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ

YAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ YAPAY SİNİR AĞLARI Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ İÇERİK Sinir Hücreleri Yapay Sinir Ağları Yapısı Elemanları Çalışması Modelleri Yapılarına Göre Öğrenme Algoritmalarına Göre Avantaj ve

Detaylı

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

VERİ KAYNAKLARI. Bilgi sisteminin öğelerinden biride veri

VERİ KAYNAKLARI. Bilgi sisteminin öğelerinden biride veri VERİ KAYNAKLARI YÖNETİMİ İ İ 5. ÜNİTE GİRİŞ Bilgi sisteminin öğelerinden biride veri yönetimidir. Geleneksel yada çağdaş, birinci yada ikinci elden derlenen veriler amaca uygun veri formlarında tutulur.

Detaylı

GENETİK ALGORİTMALAR. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ

GENETİK ALGORİTMALAR. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ GENETİK ALGORİTMALAR Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ GENETİK ALGORİTMALAR Genetik algoritmalar, Darwin in doğal seçim ve evrim teorisi ilkelerine dayanan bir arama ve optimizasyon yöntemidir.

Detaylı

Sistem Geliştirme Yaşam Döngüsü (The Systems Development Life Cycle) (SDLC)

Sistem Geliştirme Yaşam Döngüsü (The Systems Development Life Cycle) (SDLC) Sistem Geliştirme Yaşam Döngüsü (The Systems Development Life Cycle) (SDLC) Sistem analistlerinin ve kullanıcı faaliyetlerinin spesifik döngüsünün kullanılmasıyla En iyi geliştirilmiş sistemin oluşmasını

Detaylı

2011 Third International Conference on Intelligent Human-Machine Systems and Cybernetics

2011 Third International Conference on Intelligent Human-Machine Systems and Cybernetics 2011 Third International Conference on Intelligent Human-Machine Systems and Cybernetics Özet: Bulanık bir denetleyici tasarlanırken karşılaşılan en önemli sıkıntı, bulanık giriş çıkış üyelik fonksiyonlarının

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing

Detaylı

MEÜ. SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ DERS TANIMI FORMU

MEÜ. SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ DERS TANIMI FORMU MEÜ. SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ DERS TANIMI FORMU Dersin Adı-Kodu: BİS 601 Örnek Genişliği ve Güç Programın Adı: Biyoistatistik Dersin düzeyi Doktora Ders saatleri ve Teori Uyg. Lab. Proje/Alan Çalışması

Detaylı

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri Veri modelleri, veriler arasında ilişkisel ve sırasal düzeni gösteren kavramsal tanımlardır. Her program en azından bir veri modeline dayanır. Uygun

Detaylı

Tedarik Zinciri Yönetiminde Yapay Zeka Teknikler

Tedarik Zinciri Yönetiminde Yapay Zeka Teknikler Tedarik Zinciri Yönetiminde Yapay Zeka Teknikler Doç.Dr.Mehmet Hakan Satman mhsatman@istanbul.edu.tr İstanbul Üniversitesi 2014.10.22 Doç.Dr.Mehmet Hakan Satmanmhsatman@istanbul.edu.tr Tedarik Zinciri

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan

Detaylı

BSM 532 KABLOSUZ AĞLARIN MODELLEMESİ VE ANALİZİ OPNET MODELER

BSM 532 KABLOSUZ AĞLARIN MODELLEMESİ VE ANALİZİ OPNET MODELER BSM 532 KABLOSUZ AĞLARIN MODELLEMESİ VE ANALİZİ OPNET MODELER Yazılımı ve Genel Özellikleri Doç.Dr. Cüneyt BAYILMIŞ Kablosuz Ağların Modellemesi ve Analizi 1 OPNET OPNET Modeler, iletişim sistemleri ve

Detaylı

FMEA. Hata Türleri ve Etkileri Analizi

FMEA. Hata Türleri ve Etkileri Analizi FMEA Hata Türleri ve Etkileri Analizi 2007 FMEA Tanımı FMEA (HTEA), bir ürün veya prosesin potansiyel hatalarını ve bunların sonucu olabilecek etkilerini tanımlama, değerlendirme, potansiyel hatanın ortaya

Detaylı

VERİ MADENCİLİĞİNE BAKIŞ

VERİ MADENCİLİĞİNE BAKIŞ VERİ MADENCİLİĞİNE BAKIŞ İçerik Veri Madenciliği Neden Veri Madenciliği? Veri ve Veri Madenciliğinin Önemi Günümüzde Kullanılan Veri Madenciliğinin Çeşitli İsimleri Veri Madenciliği Nedir? Neden Veri Madenciliği?

Detaylı

TANIMLAYICI İSTATİSTİKLER

TANIMLAYICI İSTATİSTİKLER TANIMLAYICI İSTATİSTİKLER Tanımlayıcı İstatistikler ve Grafikle Gösterim Grafik ve bir ölçüde tablolar değişkenlerin görsel bir özetini verirler. İdeal olarak burada değişkenlerin merkezi (ortalama) değerlerinin

Detaylı

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI ÖNSÖZ İÇİNDEKİLER III Bölüm 1 İSTATİSTİK ve SAYISAL BİLGİ 11 1.1 İstatistik ve Önemi 12 1.2 İstatistikte Temel Kavramlar 14 1.3 İstatistiğin Amacı 15 1.4 Veri Türleri 15 1.5 Veri Ölçüm Düzeyleri 16 1.6

Detaylı

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara Veri Madenciliğine Genel Bir Bakış Veri Madenciliğinin Görevleri Sınıflama Seri Sınıflama Algoritmaları Paralel Sınıflama

Detaylı

KALİTE SİSTEM YÖNETİCİSİ EĞİTİMİ

KALİTE SİSTEM YÖNETİCİSİ EĞİTİMİ FMEA-HATA TÜRLERİ VE ETKİ ANALİZİ Tanımlama Mevcut veya olası hataları ortaya koyan, bu hataların yaratabileceği etkileri göz önünde bulunduran ve etkilerine göre hataları önceliklendirerek oluşmalarının

Detaylı

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI 10 Aralık 2011, Cumartesi Fen ve Mühendislik Alanlarındaki Çeşitli Araştırma Projelerinden Örneklemeler İçerik

Detaylı

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37 İÇİNDEKİLER BÖLÜM 1 Değişkenler ve Grafikler 1 İstatistik 1 Yığın ve Örnek; Tümevarımcı ve Betimleyici İstatistik 1 Değişkenler: Kesikli ve Sürekli 1 Verilerin Yuvarlanması Bilimsel Gösterim Anlamlı Rakamlar

Detaylı

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veri Modelleri

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veri Modelleri Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veri Modelleri Konular Veritabanı Tasarım Aşamaları Veri Modeli Nedir? Veri Modeli Temel Bileşenleri İş Kuralları (Business Rules) İş Kurallarını Veri

Detaylı

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı ARAŞTIRMA MODELLİLERİNDE KULLANILACAK İSTATİSTİKLERİ BELİRLEME ÖLÇÜTLERİ Parametrik mi Parametrik Olmayan mı? Kullanılacak İstatistikleri Belirleme Ölçütleri Değişken Sayısı Tek değişkenli (X) İki değişkenli

Detaylı

TOPLAM KALİTE YÖNETİMİ

TOPLAM KALİTE YÖNETİMİ SAKARYA ÜNİVERSİTESİ TOPLAM KALİTE YÖNETİMİ Hafta 13 Yrd. Doç. Dr. Semra BORAN Bu ders içeriğinin basım, yayım ve satış hakları Sakarya Üniversitesi ne aittir. "Uzaktan Öğretim" tekniğine uygun olarak

Detaylı

PROF. DR. ŞAKİR ESNAF IN BİTİRME PROJESİ KONULARI

PROF. DR. ŞAKİR ESNAF IN BİTİRME PROJESİ KONULARI PROF. DR. ŞAKİR ESNAF IN TEORİK ÇALIŞMA BAŞLIKLARI Ø Coğrafi Çoklu Tesis Yeri Seçimi (Weber) Probleminin Çözümü için Sezgisel ve Metasezgisel Algoritmalar Ø Çoklu Tesis Yeri Seçimi (Pmedyan) Probleminin

Detaylı

Neden Endüstri Mühendisliği Bölümünde Yapmalısınız?

Neden Endüstri Mühendisliği Bölümünde Yapmalısınız? Lisansüstü Eğitiminizi Neden Endüstri Mühendisliği Bölümünde Yapmalısınız? Uludağ Üniversitesi Mühendislik-Mimarlık Fakültesi Endüstri Mühendisliği Bölümü, 1990 yılında kurulmuş ve ilk mezunlarını 1994

Detaylı

Veritabanı, Veri Madenciliği, Veri Ambarı, Veri Pazarı

Veritabanı, Veri Madenciliği, Veri Ambarı, Veri Pazarı Veritabanı, Veri Madenciliği, Veri Ambarı, Veri Pazarı Başkent Üniversitesi Bilgisayar Mühendisliği Yönetim Bilişim Sistemleri (Bil 483) 20394676 - Ümit Burak USGURLU Veritabanı Veri tabanı düzenli bilgiler

Detaylı

Kural Motoru. www.paperwork.com.tr

Kural Motoru. www.paperwork.com.tr Kural Motoru www.paperwork.com.tr İş Kuralı Örnekleri Aşağıda iş kurallarına çeşitli örnekler verilmiştir; : İş Kuralı Nedir? T üm işletmeler kural merkezli çalışırlar. Kurallar hangi fırsatların takip

Detaylı

Gezgin Satıcı Probleminin İkili Kodlanmış Genetik Algoritmalarla Çözümünde Yeni Bir Yaklaşım. Mehmet Ali Aytekin Tahir Emre Kalaycı

Gezgin Satıcı Probleminin İkili Kodlanmış Genetik Algoritmalarla Çözümünde Yeni Bir Yaklaşım. Mehmet Ali Aytekin Tahir Emre Kalaycı Gezgin Satıcı Probleminin İkili Kodlanmış Genetik Algoritmalarla Çözümünde Yeni Bir Yaklaşım Mehmet Ali Aytekin Tahir Emre Kalaycı Gündem Gezgin Satıcı Problemi GSP'yi Çözen Algoritmalar Genetik Algoritmalar

Detaylı

SİSTEM ANALİZİ VE TASARIMI

SİSTEM ANALİZİ VE TASARIMI SİSTEM ANALİZİ VE TASARIMI BİLGİ SİSTEMİ GELİŞTİRME SÜRECİ Sistem Geliştirme Süreci ve Modelleri Sistem Geliştirme Yaşam Döngüsü Bilgi sistemlerinin geliştirilmesi için izlenen sürece Sistem Geliştirme

Detaylı

İŞLETME VE ORGANİZASYON STAJI UYGULAMA ESASLARI

İŞLETME VE ORGANİZASYON STAJI UYGULAMA ESASLARI İŞLETME VE ORGANİZASYON STAJI UYGULAMA ESASLARI ENDÜSTRİ MÜHENDİSLİĞİ BÖLÜMÜ İŞLETME VE ORGANİZASYON STAJI UYGULAMA ESASLARI 2014 İŞLETME VE ORGANİZASYON STAJI UYGULAMA ESASLARI Açıklama Staj yapılan işletmelerde

Detaylı

UZAKTAN EĞİTİM MERKEZİ

UZAKTAN EĞİTİM MERKEZİ ÜNİTE 2 VERİ TABANI İÇİNDEKİLER Veri Tabanı Veri Tabanı İle İlgili Temel Kavramlar Tablo Alan Sorgu Veri Tabanı Yapısı BAYBURT ÜNİVERSİTESİ UZAKTAN EĞİTİM MERKEZİ BİLGİSAYAR II HEDEFLER Veri tabanı kavramını

Detaylı

WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ

WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ Doç.Dr Erhan Akyazı Marmara Üniversitesi Bilişim Bölümü eakyazi@marmara.edu.tr Şafak Kayıkçı Marmara Üniversitesi Bilişim Bölümü safak@safakkayikci.com

Detaylı

Öğr.Gör.İnan ÜNAL Tunceli Üniversitesi Bilgisayar Mühendisliği Bölümü

Öğr.Gör.İnan ÜNAL Tunceli Üniversitesi Bilgisayar Mühendisliği Bölümü Öğr.Gör.İnan ÜNAL Tunceli Üniversitesi Bilgisayar Mühendisliği Bölümü Büyük miktardaki veriler içerisinden önemli olanlarını bulup çıkarmaya veri Madenciliği denir. Veri madenciliği bir sorgulama işlemi

Detaylı

MAK 210 SAYISAL ANALİZ

MAK 210 SAYISAL ANALİZ MAK 210 SAYISAL ANALİZ BÖLÜM 6- İSTATİSTİK VE REGRESYON ANALİZİ Doç. Dr. Ali Rıza YILDIZ 1 İSTATİSTİK VE REGRESYON ANALİZİ Bütün noktalardan geçen bir denklem bulmak yerine noktaları temsil eden, yani

Detaylı

İÇİNDEKİLER İÇİNDEKİLER KODLAB

İÇİNDEKİLER İÇİNDEKİLER KODLAB İÇİNDEKİLER IX İÇİNDEKİLER 1 GİRİŞ 1 Kitabın Amacı 1 Algoritmanın Önemi 2 Bilgisayarın Doğuşu ve Kullanım Amaçları 3 Programlama Dili Nedir? 3 Entegre Geliştirme Ortamı (IDE) Nedir? 4 2 ALGORİTMA VE AKIŞ

Detaylı

MÜŞTERİ İLİŞKİLERİ YÖNETİMİ (PZL208U)

MÜŞTERİ İLİŞKİLERİ YÖNETİMİ (PZL208U) DİKKATİNİZE: BURADA SADECE ÖZETİN İLK ÜNİTESİ SİZE ÖRNEK OLARAK GÖSTERİLMİŞTİR. ÖZETİN TAMAMININ KAÇ SAYFA OLDUĞUNU ÜNİTELERİ İÇİNDEKİLER BÖLÜMÜNDEN GÖREBİLİRSİNİZ. MÜŞTERİ İLİŞKİLERİ YÖNETİMİ (PZL208U)

Detaylı

1 PAZARLAMA ARAŞTIRMASI

1 PAZARLAMA ARAŞTIRMASI İÇİNDEKİLER ÖNSÖZ III Bölüm 1 PAZARLAMA ARAŞTIRMASI 11 1.1. Pazarlama Araştırması Kavramı ve Kapsamı 12 1.2. Pazarlama Araştırmasının Tarihçesi 14 1.3. Pazarlama Araştırması Pazarlama Bilgi Sistemi ve

Detaylı

Sosyal Bilimler İçin Veri Analizi El Kitabı

Sosyal Bilimler İçin Veri Analizi El Kitabı 292 Dicle Üniversitesi Ziya Gökalp Eğitim Fakültesi Dergisi, 18 (2012) 292-297 KİTAP İNCELEMESİ Sosyal Bilimler İçin Veri Analizi El Kitabı Editör Doç. Dr. Şener BÜYÜKÖZTÜRK Dilek SEZGİN MEMNUN 1 Bu çalışmada,

Detaylı

Makine Öğrenmesi 3. hafta

Makine Öğrenmesi 3. hafta Makine Öğrenmesi 3. hafta Entropi Karar Ağaçları (Desicion Trees) ID3 C4.5 Sınıflandırma ve Regresyon Ağaçları (CART) Karar Ağacı Nedir? Temel fikir, giriş verisinin bir kümeleme algoritması yardımıyla

Detaylı

BLG4146 - Sistem Analizi ve Tasarımı. Öğr. Grv. Aybike ŞİMŞEK

BLG4146 - Sistem Analizi ve Tasarımı. Öğr. Grv. Aybike ŞİMŞEK BLG4146 - Sistem Analizi ve Tasarımı Öğr. Grv. Aybike ŞİMŞEK Tasarım Evresi Analiz evresinde sorulan NE sorusuyla elde edilen bilgilerin NASIL yapılacağı, NASIL gerçekleştirileceğinin ortaya konulduğu

Detaylı

AVĐVASA da Veri Madenciliği Reşat Fırat ERSĐN Stratejik Planlama ve ĐşGeliştirme Birim Yöneticisi

AVĐVASA da Veri Madenciliği Reşat Fırat ERSĐN Stratejik Planlama ve ĐşGeliştirme Birim Yöneticisi AVĐVASA da Veri Madenciliği Reşat Fırat ERSĐN Stratejik Planlama ve ĐşGeliştirme Birim Yöneticisi AvivaSA Bir emeklilik ve hayat sigortası şirketi 1 Kasım 2007. Ak Emeklilik A.Ş. ve Aviva Hayat ve Emeklilik

Detaylı

Pazarlama araştırması

Pazarlama araştırması Pazarlama araştırması Etkin bir pazarlama kararı alabilmek için gerekli olan enformasyonun ve bilginin toplanması ve kullanılmasıdır. Bu sayede, pazarla ilgili risk ve belirsizlik azalacak ve başarı artacaktır.

Detaylı

ULUSLARARASI ANTALYA ÜNİVERSİTESİ ENDÜSTRİ MÜHENDİSLİĞİ BÖLÜMÜ DERS KATALOĞU

ULUSLARARASI ANTALYA ÜNİVERSİTESİ ENDÜSTRİ MÜHENDİSLİĞİ BÖLÜMÜ DERS KATALOĞU ULUSLARARASI ANTALYA ÜNİVERSİTESİ ENDÜSTRİ MÜHENDİSLİĞİ BÖLÜMÜ DERS KATALOĞU ZORUNLU DERSLER IE 201 - Operasyon Modelleme Karar vermedeki belirsizlik rolü de dahil olmak üzere işletme kararlarının matematiksel

Detaylı

2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21

2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21 İçindekiler Önsöz İkinci Basım için Önsöz Türkçe Çeviri için Önsöz Gösterim xiii xv xvii xix 1 Giriş 1 1.1 Yapay Öğrenme Nedir?......................... 1 1.2 Yapay Öğrenme Uygulamalarına Örnekler...............

Detaylı

Merkezi Eğilim ve Dağılım Ölçüleri

Merkezi Eğilim ve Dağılım Ölçüleri Merkezi Eğilim ve Dağılım Ölçüleri Soru Öğrencilerin derse katılım düzeylerini ölçmek amacıyla geliştirilen 16 soruluk bir test için öğrencilerin ilk 8 ve son 8 soruluk yarılardan aldıkları puanlar arasındaki

Detaylı

PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Veri Madenciliği Yöntemleri Dr. Yalçın ÖZKAN -II-

PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Veri Madenciliği Yöntemleri Dr. Yalçın ÖZKAN -II- Dr. Yalçın ÖZKAN Dr. Yalçın ÖZKAN PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Ankara Caddesi, Prof. Fahreddin Kerim Gökay Vakfı İşhanı Girişi, No: 11/3, Cağaloğlu (Fatih)/İstanbul Tel

Detaylı

Endüstri Mühendisliğine Giriş

Endüstri Mühendisliğine Giriş Endüstri Mühendisliğine Giriş 5 ve 19 Aralık 2012, Şişli-Ayazağa, İstanbul, Türkiye. Yard. Doç. Dr. Kamil Erkan Kabak Endüstri Mühendisliği Bölümü,, Şişli-Ayazağa, İstanbul, Türkiye erkankabak@beykent.edu.tr

Detaylı

8 Haziran 2007 TBD İstanbul Bilişim Kongresi

8 Haziran 2007 TBD İstanbul Bilişim Kongresi Finansal Uygulamalarda Veri Madenciliği Ali Alkan ali.alkan@infora.com.tr 1/48 Gündem 1. Neden veri madenciliği? 2. Veri madenciliği türleri 3. Veri madenciliği teknikleri 4. Veri madenciliği uygulamaları

Detaylı

UNIVERSAL BİLGİ TEKNOLOJİLERİ

UNIVERSAL BİLGİ TEKNOLOJİLERİ UNIVERSAL BİLGİ TEKNOLOJİLERİ Coğrafi Bilgi Sistemleri (CBS) ile Bilgisayar Destekli Tasarım (CAD) Sistemleri Arasındaki Temel Farklar Universal Bilgi Teknolojileri Ltd. Şti. 2010. Tüm hakları saklıdır.

Detaylı

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı cse@akdeniz.edu.tr Antalya, 2015 2 Özet Akdeniz Üniversitesi tanıtım filmi Neden Bilgisayar Mühendisliği Bilgisayar Mühendisi

Detaylı

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Yrd. Doç. Dr. Emre ATILGAN 1 RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Olasılığa ilişkin olayların çoğunluğunda, deneme sonuçlarının bir veya birkaç yönden incelenmesi

Detaylı

VERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL

VERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL VERİ MADENCİLİĞİ Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL SPRINT Algoritması ID3,CART, ve C4.5 gibi algoritmalar önce derinlik ilkesine göre çalışırlar ve en iyi dallara ayırma kriterine

Detaylı

SİSTEM ANALİZİ ve TASARIMI. ÖN İNCELEME ve FİZİBİLİTE

SİSTEM ANALİZİ ve TASARIMI. ÖN İNCELEME ve FİZİBİLİTE SİSTEM ANALİZİ ve TASARIMI ÖN İNCELEME ve FİZİBİLİTE Sistem Tasarım ve Analiz Aşamaları Ön İnceleme Fizibilite Sistem Analizi Sistem Tasarımı Sistem Gerçekleştirme Sistem Operasyon ve Destek ÖN İNCELEME

Detaylı

Konular. VERİ MADENCİLİĞİ Giriş. Problem Tanımı. Veri Madenciliği: Tarihçe. Veri Madenciliği Nedir? Bilgi Keşfi

Konular. VERİ MADENCİLİĞİ Giriş. Problem Tanımı. Veri Madenciliği: Tarihçe. Veri Madenciliği Nedir? Bilgi Keşfi VERİ MADENCİLİĞİ Giriş Yrd. Doç. Dr. Şule Gündüz Öğüdücü 1 2 Problem Tanımı Veri Madenciliği: Tarihçe teknolojinin gelişimiyle bilgisayar ortamında ve veritabanlarında tutulan veri miktarının da artması

Detaylı

VERİ TABANI SİSTEMLERİ

VERİ TABANI SİSTEMLERİ VERİ TABANI SİSTEMLERİ 1- Günümüzde bilgi sistemleri Teknoloji ve bilgi. 2- Bilgi sistemlerinin Geliştirilmesi İşlevsel Gereksinimleri 1.AŞAMA Gereksinim Belirleme ve Analiz Veri Gereksinimleri Gereksinimler

Detaylı

ULUSLARARASI TİCARET VE FİNANS TEZSİZ YÜKSEK LİSANS PROGRAMI DERS MÜFREDATI

ULUSLARARASI TİCARET VE FİNANS TEZSİZ YÜKSEK LİSANS PROGRAMI DERS MÜFREDATI ULUSLARARASI TİCARET VE FİNANS TEZSİZ YÜKSEK LİSANS PROGRAMI DERS MÜFREDATI I. Yarıyıl II. Yarıyıl Seçmeli (4 ders) 32 AKTS ULTF 570 Seminer 4 AKTS III. Yarıyıl ULTF 560 Bitirme Projesi 14 AKTS Seçmeli

Detaylı

LOGO İş Zekası çözümü ile kurumsal raporlama ve analizler. Cem Yılmaz Genel Müdür LOGOBI Yazılım

LOGO İş Zekası çözümü ile kurumsal raporlama ve analizler. Cem Yılmaz Genel Müdür LOGOBI Yazılım LOGO İş Zekası çözümü ile kurumsal raporlama ve analizler Cem Yılmaz Genel Müdür LOGOBI Yazılım Hakkımızda LOGOBI Yazılım A.Ş. iş zekası alanında faaliyet gösteren, Türkiye de sahip olduğu yüzlerce müşterinin

Detaylı

COĞRAFİ BİLGİ SİSTEMLERİNİN İNŞAAT ALANINDAKİ UYGULAMALARI

COĞRAFİ BİLGİ SİSTEMLERİNİN İNŞAAT ALANINDAKİ UYGULAMALARI COĞRAFİ BİLGİ SİSTEMLERİNİN İNŞAAT ALANINDAKİ UYGULAMALARI Ali Baran AKGÜN Egemen ÇAKIR Melike ERSOY Özlem PALABIYIK Danışman: Y. Doç. Dr. Esin ERGEN 1 İçerik CBS nedir? CBS nin inşaatta kullanım alanları

Detaylı

Bil101 Bilgisayar Yazılımı I. M. Erdem ÇORAPÇIOĞLU Bilgisayar Yüksek Mühendisi

Bil101 Bilgisayar Yazılımı I. M. Erdem ÇORAPÇIOĞLU Bilgisayar Yüksek Mühendisi Bil101 Bilgisayar Yazılımı I Bilgisayar Yüksek Mühendisi Kullanıcıdan aldığı veri ya da bilgilerle kullanıcının isteği doğrultusunda işlem ve karşılaştırmalar yapabilen, veri ya da bilgileri sabit disk,

Detaylı

Bilgisayar Mühendisliği. Bilgisayar Mühendisliğine Giriş 1

Bilgisayar Mühendisliği. Bilgisayar Mühendisliğine Giriş 1 Bilgisayar Mühendisliği Bilgisayar Mühendisliğine Giriş 1 Mühendislik Nedir? Mühendislik, bilim ve matematiğin yararlı cihaz ve sistemlerin üretimine uygulanmasıdır. Örn: Elektrik mühendisleri, elektronik

Detaylı

CMMI. CMMI ve Çevik Yöntemler. Orhan KALAYCI Haziran 2007. Yazılım Süreç Kalitesi ve Yönetim Danışmanlığı. www.nitelik.

CMMI. CMMI ve Çevik Yöntemler. Orhan KALAYCI Haziran 2007. Yazılım Süreç Kalitesi ve Yönetim Danışmanlığı. www.nitelik. CMMI ve Çevik Yöntemler Orhan KALAYCI Haziran 2007 http:// CMMI 2 1 XP 3 CMMI nedir? 1. Seviye 2. Seviye 3. Seviye 4 2 XP Nedir? MSF XP Şelale RUP 5 CMM XP İlişkisi 6 3 PROJE YONETİMİNİ İMİNİN EVRİMSEL

Detaylı

BENZETİM. Prof.Dr.Berna Dengiz. 4. Ders Modelleme yaklaşımları Benzetim yazılımlarında aranan özellikler M/M/1 Kuyruk Sistemi benzetimi

BENZETİM. Prof.Dr.Berna Dengiz. 4. Ders Modelleme yaklaşımları Benzetim yazılımlarında aranan özellikler M/M/1 Kuyruk Sistemi benzetimi Prof.Dr.Berna Dengiz 4. Ders Modelleme yaklaşımları Benzetim yazılımlarında aranan özellikler M/M/1 Kuyruk Sistemi benzetimi BENZETİM DİLLERİNDE MODELLEME YAKLAŞIMLARI Tüm benzetim dilleri; ya olay-çizelgeleme

Detaylı

İş Analitiği'ne Netezza ile Yüksek Performans Katın

İş Analitiği'ne Netezza ile Yüksek Performans Katın İş Analitiği'ne Netezza ile Yüksek Performans Katın Umut ŞATIR İleri Analitik Çözüm Mimarı 2012 IBM Corporation Netezza and IBM Business Analytics Baştan sona bir İş Analitiği çözümü Performans Kolaylık

Detaylı

Konut Fiyatlarının Belirlenmesinde Coğrafi Bilgi Sistemleri'nin (CBS) Kullanılması: Ankara Örneği

Konut Fiyatlarının Belirlenmesinde Coğrafi Bilgi Sistemleri'nin (CBS) Kullanılması: Ankara Örneği 18. ESRI Kullanıcılar Toplantısı 07-08 Ekim 2013 ODTÜ, Ankara Konut Fiyatlarının Belirlenmesinde Coğrafi Bilgi Sistemleri'nin (CBS) Kullanılması: Ankara Örneği Tarık Türk a, Olgun Kitapçı b, Murat Fatih

Detaylı

Bir yazılım geliştirme metodolojisi aşağıdaki adımlardan meydana gelir; Yazılım geliştirme sürecine destek verecek araçlar, modeller ve yöntemler.

Bir yazılım geliştirme metodolojisi aşağıdaki adımlardan meydana gelir; Yazılım geliştirme sürecine destek verecek araçlar, modeller ve yöntemler. Yazılım Mühendisliği kapsamındaki Yazılım Geliştirme Metodolojileri, bir bilgi sistemini geliştirme sürecinin yapımını, planlamasını ve kontrolünü sağlayan bir framework tür. Her farklı framework güçlü

Detaylı

İstatistiksel Süreç Kontrol KAZIM KARABOĞA

İstatistiksel Süreç Kontrol KAZIM KARABOĞA İstatistiksel Süreç Kontrol KAZIM KARABOĞA KALİTENİN TARİHSEL KİMLİK DEĞİŞİMİ Muayene İstatistiksel Kalite Kontrol Toplam Kalite Kontrol Toplam Kalite Yönetimi İSTATİSTİKSEL KALİTE KONTROL İstatistiksel

Detaylı

Varlık davranış modeli: Bu aşama her entity ye etki eden durumların tanımlandığı, modellendiği ve dokümante edildiği süreçtir.

Varlık davranış modeli: Bu aşama her entity ye etki eden durumların tanımlandığı, modellendiği ve dokümante edildiği süreçtir. Yapısal Sistem Analiz ve Tasarım Metodu SSADM waterfall model baz alınarak uygulanan bir metottur. İngiltere de kamusal projelerde 1980 lerin başında kullanılan sistem analizi ve tasarımı konularındaki

Detaylı

Faktöriyel: 1'den n'ye kadar olan tüm pozitif tamsayıların çarpımına, biçiminde gösterilir. Aynca; 0! = 1 ve 1!=1 1 dir. [Bunlar kabul değildir,

Faktöriyel: 1'den n'ye kadar olan tüm pozitif tamsayıların çarpımına, biçiminde gösterilir. Aynca; 0! = 1 ve 1!=1 1 dir. [Bunlar kabul değildir, 14. Binom ve Poisson olasılık dağılımları Faktöriyeller ve kombinasyonlar Faktöriyel: 1'den n'ye kadar olan tüm pozitif tamsayıların çarpımına, n! denir ve n! = 1.2.3...(n-2).(n-l).n biçiminde gösterilir.

Detaylı

Marmara Üniversitesi Lojistik & Tedarik Zinciri Yönetimi Sertifika Programı Marmara University Logistics & Supply Chain Management Certificate Program

Marmara Üniversitesi Lojistik & Tedarik Zinciri Yönetimi Sertifika Programı Marmara University Logistics & Supply Chain Management Certificate Program Marmara Üniversitesi Lojistik & Tedarik Zinciri Yönetimi Sertifika Programı Marmara University Logistics & Supply Chain Management Certificate Program Amaç Değişen ve gelişen müşteri isteklerinin en verimli

Detaylı

İŞLETMELERDE İŞ SÜREÇ YÖNETİMİ (BPM) UYGULAMASI. Hazırlayanlar Fatma Didem GÜRKAN Endüstri Mühendisi Ahmet Alper ÇALIŞKAN Endüstri Mühendisi

İŞLETMELERDE İŞ SÜREÇ YÖNETİMİ (BPM) UYGULAMASI. Hazırlayanlar Fatma Didem GÜRKAN Endüstri Mühendisi Ahmet Alper ÇALIŞKAN Endüstri Mühendisi İŞLETMELERDE İŞ SÜREÇ YÖNETİMİ (BPM) UYGULAMASI Hazırlayanlar Fatma Didem GÜRKAN Endüstri Mühendisi Ahmet Alper ÇALIŞKAN Endüstri Mühendisi 4 Haftalık Ajanda 1. Hafta: Örneklerle BPM-ERP İlişkisi 2. Hafta:

Detaylı

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması 1 Emre DANDIL Bilecik Ş. Edebali Üniversitesi emre.dandil@bilecik.edu.tr +90228 214 1613 Sunum İçeriği Özet Giriş

Detaylı

Bir bölgede başka bir bölgeye karşılıklı olarak, veri veya haberin gönderilmesini sağlayan.sistemlerdir.

Bir bölgede başka bir bölgeye karşılıklı olarak, veri veya haberin gönderilmesini sağlayan.sistemlerdir. 1.1.3. Scada Yazılımından Beklenenler Hızlı ve kolay uygulama tasarımı Dinamik grafik çizim araçları Çizim kütüphaneleri Alarm yönetimi Tarih bilgilerinin toplanması Rapor üretimi 1.1.4. Scada Sistemleri

Detaylı

1 ÜRETİM VE ÜRETİM YÖNETİMİ

1 ÜRETİM VE ÜRETİM YÖNETİMİ İÇİNDEKİLER ÖNSÖZ III Bölüm 1 ÜRETİM VE ÜRETİM YÖNETİMİ 13 1.1. Üretim, Üretim Yönetimi Kavramları ve Önemi 14 1.2. Üretim Yönetiminin Tarihisel Gelişimi 18 1.3. Üretim Yönetiminin Amaçları ve Fonksiyonları

Detaylı

Öğr. Gör. Serkan AKSU http://www.serkanaksu.net. http://www.serkanaksu.net/ 1

Öğr. Gör. Serkan AKSU http://www.serkanaksu.net. http://www.serkanaksu.net/ 1 Öğr. Gör. Serkan AKSU http://www.serkanaksu.net http://www.serkanaksu.net/ 1 JavaScript JavaScript Nedir? Nestcape firması tarafından C dilinden esinlenerek yazılmış, Netscape Navigator 2.0 ile birlikte

Detaylı

SPSS & AKILLI KURUMLAR. Dr. Tülin GÜZEL ÖZDEMİR SPSS Türkiye Genel Müdür tguzel@spss.com.tr

SPSS & AKILLI KURUMLAR. Dr. Tülin GÜZEL ÖZDEMİR SPSS Türkiye Genel Müdür tguzel@spss.com.tr SPSS & AKILLI KURUMLAR Dr. Tülin GÜZEL ÖZDEMİR SPSS Türkiye Genel Müdür tguzel@spss.com.tr Tarihte Yaşanan Devrimler Tarımsal Kalkınma Devrimi Tarihte Yaşanan Devrimler Endüstriyel Kalkınma Devrimi Tarihte

Detaylı

ISL 201 Pazarlama İlkeleri. Doç. Dr. Hayrettin ZENGİN

ISL 201 Pazarlama İlkeleri. Doç. Dr. Hayrettin ZENGİN ISL 201 Pazarlama İlkeleri Doç. Dr. Hayrettin ZENGİN Pazarlama Bilgi Sistemi (PBS) Bir işletmenin pazarlama ile ilgili kararlarının alınmasına yardımcı olacak bilgilerin toplanması, işlenmesi, saklanması

Detaylı

Akdeniz Üniversitesi

Akdeniz Üniversitesi F. Ders Tanıtım Formu Dersin Adı Öğretim Dili Akdeniz Üniversitesi Bilgi Teknolojileri Kullanımı Türkçe Dersin Verildiği Düzey Ön Lisans ( ) Lisans (x) Yüksek Lisans( ) Doktora( ) Eğitim Öğretim Sistemi

Detaylı

Ders 1 Minitab da Grafiksel Analiz-I

Ders 1 Minitab da Grafiksel Analiz-I ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI Ders 1 Minitab da Grafiksel Analiz-I İstatistik Nedir? İstatistik kelimesi ilk olarak Almanyada devlet anlamına gelen status kelimesine dayanılarak kullanılmaya

Detaylı

Algoritma ve Akış Diyagramları

Algoritma ve Akış Diyagramları Algoritma ve Akış Diyagramları Bir problemin çözümüne ulaşabilmek için izlenecek ardışık mantık ve işlem dizisine ALGORİTMA, algoritmanın çizimsel gösterimine ise AKIŞ DİYAGRAMI adı verilir 1 Akış diyagramları

Detaylı

GİRİŞ. Mehmet Sait Andaç. e-posta: mandac@meliksah.edu.tr. İnşaat Mühendisi ve Endüstri Mühendisi. www.meliksah.edu.tr/mandac.

GİRİŞ. Mehmet Sait Andaç. e-posta: mandac@meliksah.edu.tr. İnşaat Mühendisi ve Endüstri Mühendisi. www.meliksah.edu.tr/mandac. GİRİŞ Mehmet Sait Andaç İnşaat Mühendisi ve Endüstri Mühendisi e-posta: mandac@meliksah.edu.tr www.meliksah.edu.tr/mandac Oda No: 417 Giriş Bölüm I:Teorik Kısım (1.-6. Haftalar) (Proje, Proje Yönetimi,

Detaylı

Zaman Serileri Tutarlılığı

Zaman Serileri Tutarlılığı Bölüm 3 Zaman Serileri Tutarlılığı Ulusal Sera Gazı Envanterleri Uygulamalı Eğitim Çalıştayı - IPCC Kesişen Konular 4-5-6 Kasım 2015, Ankara Türkiye Giriş Çok yıllı sera gazı (GHG) envanterleri, emisyonların

Detaylı

Tablo (2): Atıştırma Sayısı ve Günlük Sınav Sayısı Atıştırma Sınav Sayısı (X) 0 0.07 0.09 0.06 0.01

Tablo (2): Atıştırma Sayısı ve Günlük Sınav Sayısı Atıştırma Sınav Sayısı (X) 0 0.07 0.09 0.06 0.01 Ortak Varyans ve İstatistiksel Bağımsızlık Bir rassal değişken çifti istatistiksel olarak bağımsız ise aralarındaki ortak varyansın değeri 0 dır. Ancak ortak varyans değerinin 0 olması, iki rassal değişkenin

Detaylı

DAHA HIZLI, DAHA PRATİK. LABORATUVAR İÇ VE DIŞ KALİTE KONTROLLERİNİN UYGULAMASI VE TAKİBİ

DAHA HIZLI, DAHA PRATİK. LABORATUVAR İÇ VE DIŞ KALİTE KONTROLLERİNİN UYGULAMASI VE TAKİBİ DAHA HIZLI, DAHA PRATİK. LABORATUVAR İÇ VE DIŞ KALİTE KONTROLLERİNİN UYGULAMASI VE TAKİBİ %100 web tabanlı İNTERQC, programı ile laboratuarlarınızın kalite kontrollerini istediğiniz yerden ve istediğiniz

Detaylı

ĐSTATĐSTĐK. Okan ERYĐĞĐT

ĐSTATĐSTĐK. Okan ERYĐĞĐT ĐSTATĐSTĐK Okan ERYĐĞĐT Araştırmacı, istatistik yöntemlere daha işin başında başvurmalıdır, sonunda değil..! A. Bradford Hill, 1930 ĐSTATĐSTĐĞĐN AMAÇLARI Bilimsel araştırmalarda, araştırmacıya kullanılabilir

Detaylı

GALATASARAY ÜNİVERSİTESİ BİLİMSEL ARAŞTIRMA PROJELERİ MÜHENDİSLİK VE TEKNOLOJİ FAKÜLTESİ ÖĞRETİM ÜYELERİ TARAFINDAN YÜRÜTÜLEN PROJELER (2008-2011)

GALATASARAY ÜNİVERSİTESİ BİLİMSEL ARAŞTIRMA PROJELERİ MÜHENDİSLİK VE TEKNOLOJİ FAKÜLTESİ ÖĞRETİM ÜYELERİ TARAFINDAN YÜRÜTÜLEN PROJELER (2008-2011) 08.401.001 08.401.002 08.401.003 Dikkat Seviyesindeki Değişimlerin Elektrofizyolojik Ölçümler İle İzlenmesi PFO(Patent Foramen Ovale) Teşhisinin Bilgisayar Yardımı İle Otomatik Olarak Gerçeklenmesi ve

Detaylı

Bilgisayar Mühendisliğine Giriş. Yrd.Doç.Dr.Hacer KARACAN

Bilgisayar Mühendisliğine Giriş. Yrd.Doç.Dr.Hacer KARACAN Bilgisayar Mühendisliğine Giriş Yrd.Doç.Dr.Hacer KARACAN İçerik Dosya Organizasyonu (File Organization) Veritabanı Sistemleri (Database Systems) BM307 Dosya Organizasyonu (File Organization) İçerik Dosya

Detaylı

PROGRAMLAMAYA GİRİŞ. Öğr. Gör. Ayhan KOÇ. Kaynak: Algoritma Geliştirme ve Programlamaya Giriş, Dr. Fahri VATANSEVER, Seçkin Yay.

PROGRAMLAMAYA GİRİŞ. Öğr. Gör. Ayhan KOÇ. Kaynak: Algoritma Geliştirme ve Programlamaya Giriş, Dr. Fahri VATANSEVER, Seçkin Yay. PROGRAMLAMAYA GİRİŞ Öğr. Gör. Ayhan KOÇ Kaynak: Algoritma Geliştirme ve Programlamaya Giriş, Dr. Fahri VATANSEVER, Seçkin Yay., 2007 Algoritma ve Programlamaya Giriş, Ebubekir YAŞAR, Murathan Yay., 2011

Detaylı

VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Birliktelik Kurallarının Tanımı Destek ve Güven Ölçütleri Apriori Algoritması Birliktelik Kuralları (Association

Detaylı

Street Smart Marketing

Street Smart Marketing Tek bir hedef için tasarlanmış kamu hizmeti şirket programları. Başarı. Street Smart Marketing Müşterilerinizi cezbeden pazarlama kampanyaları 30 yıllık deneyim Tasarlarız. Yakalarız. İlerleriz. 1.4 milyon

Detaylı

Veri Madenciliği Karar Ağacı Oluşturma

Veri Madenciliği Karar Ağacı Oluşturma C4.5 Algoritması Veri Madenciliği Karar Ağacı Oluşturma Murat TEZGİDER 1 C4.5 Algoritması ID3 algoritmasını geliştiren Quinlan ın geliştirdiği C4.5 karar ağacı oluşturma algoritmasıdır. ID3 algoritmasında

Detaylı

İş Zekâsı Sistemi Projesi

İş Zekâsı Sistemi Projesi BI İş Zekâsı Sistemi Projesi Ulaş Kula, Bilişim Ltd. Esinkap 5. Ar-Ge Proje Pazarı 31 Mayıs 2012 Bilişim Ltd. 1985 te kurulan Bilişim Ltd, Türkiye nin üstün başarıyla sonuçlanmış önemli projelerine imza

Detaylı

Tedarik Zinciri Yönetimi

Tedarik Zinciri Yönetimi Tedarik Zinciri Yönetimi -Tedarik Zinciri Ağı Tasarımı- Yrd. Doç. Dr. Mert TOPOYAN Ağ tasarımı, tedarik zinciri açısından üç karar düzeyini de ilgilendiren ve bu düzeylerde etkisi olan bir konudur. Zincirin

Detaylı

GENCAY KARAMAN. gencay@gencaykaraman.com gencaykaraman@gmail.com. DBA & Data Mining/Business Intelligence Specialist

GENCAY KARAMAN. gencay@gencaykaraman.com gencaykaraman@gmail.com. DBA & Data Mining/Business Intelligence Specialist Veri Madenciliği ile Çapraz Satış ve Risk Yönetimi Churn analyse, Cross selling, Fraud Detection, Risk Management, Customer Segmentation, Targeted ads, Sales Forecast GENCAY KARAMAN gencay@gencaykaraman.com

Detaylı

Tesisat Mühendisliğinde Dijital Uygulamalar. Dr. Ahmet Selami ÇALIŞKAN TEKHNELOGOS Genel Müdürü

Tesisat Mühendisliğinde Dijital Uygulamalar. Dr. Ahmet Selami ÇALIŞKAN TEKHNELOGOS Genel Müdürü Tesisat Mühendisliğinde Dijital Uygulamalar Dr. Ahmet Selami ÇALIŞKAN TEKHNELOGOS Genel Müdürü E-Proje Bilgisayar katkısını maksimize etmeyi amaçlayan bir meta formattır. Mantıksal ve teknik bütünlüğü,

Detaylı

ZAMAN SERİLERİNDE AYRIŞTIRMA YÖNTEMLERİ

ZAMAN SERİLERİNDE AYRIŞTIRMA YÖNTEMLERİ ZAMAN SERİLERİNDE AYRIŞTIRMA YÖNTEMLERİ 1 A. GİRİŞ Gözlemlerin belirli bir dönem için gün, hafta, ay, üç ay, altı ay, yıl gibi birbirini izleyen eşit aralıklarla yapılması ile elde edilen seriler zaman

Detaylı

CETP KOMPOZİTLERİN DELİNMELERİNDEKİ İTME KUVVETİNİN ANFIS İLE MODELLENMESİ MURAT KOYUNBAKAN ALİ ÜNÜVAR OKAN DEMİR

CETP KOMPOZİTLERİN DELİNMELERİNDEKİ İTME KUVVETİNİN ANFIS İLE MODELLENMESİ MURAT KOYUNBAKAN ALİ ÜNÜVAR OKAN DEMİR CETP KOMPOZİTLERİN DELİNMELERİNDEKİ İTME KUVVETİNİN ANFIS İLE MODELLENMESİ MURAT KOYUNBAKAN ALİ ÜNÜVAR OKAN DEMİR Çalışmanın amacı. SUNUM PLANI Çalışmanın önemi. Deney numunelerinin üretimi ve özellikleri.

Detaylı

BMÜ-421 Benzetim ve Modelleme Kesikli Olay Benzetimi. İlhan AYDIN

BMÜ-421 Benzetim ve Modelleme Kesikli Olay Benzetimi. İlhan AYDIN BMÜ-421 Benzetim ve Modelleme Kesikli Olay Benzetimi İlhan AYDIN KESİKLİ-OLAY BENZETİMİ Kesikli olay benzetimi, durum değişkenlerinin zaman içinde belirli noktalarda değiştiği sistemlerin modellenmesi

Detaylı

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız. Örnek Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız. i. ii. X 1 2 3 4 1 2 3 4 Y 2 3 4 5 4 3 2 1 Örnek Aşağıdaki veri

Detaylı