KNIME ORNEK UYGULAMA

Benzer belgeler
Örnek 02: Amaç: Şekil Wizard yardımıyla yeni proje açılması.

2.BÖLÜM: KNIME ORTAMINI TANIMA VE BASİT UYGULAMALAR

CEN 416 DATA MINING DERSİ PROJESİ ÖĞRENCİLER AHMET AKAN MEHMET BAKAN

IPACK LADDER. Arayüz Dökümantasyonu

GÖRÜNTÜ SINIFLANDIRMA

Web Labaratuar Modulu

SPSS (Statistical Package for Social Sciences)

Microsoft Excel 1.BÖLÜM

DENEME SINAVI. ECDL BAŞLANGIÇ Hesap Tablosu

SATIŞ EKRANININ KULLANIMI:

7 Temmuz Đlgili Versiyon/lar : ETA:SQL, ETA:V.8-SQL. Đlgili Modül/ler : Raporlar

FATURA ŞABLONU TASARLAMA KILAVUZU

EĞİTİM-ÖĞRETİM YILI BİLİŞİM TEKNOLOJİLERİ VE YAZILIM DERSİ 6. SINIF 2. DÖNEM 2. SINAV ÇALIŞMA NOTLARI

VERİ TABANI YÖNETİM SİSTEMLERİ II. 9. FORMLAR ve ORACLE FORMS PROGRAMINDA FORM OLUŞTURMA

LUCA BİLGİSAYARLI MUHASEBE PROGRAMI DERS NOTLARI

BÖLÜM 1 GİRİŞ 1.1 GİRİŞ

TABLO ve HÜCRE SEÇİMİ

WEB SAYFASI KULLANIM KILAVUZU

TAKIM YOLU DÜZENLENMESİ (TOOLPATH EDITOR)

TRAKYA BİRLİK WEBSİTE YÖNETİM PANELİ. Kullanıcı Dokümantasyonu

AHTAPOT Güvenlik Duvarı Yönetim Sistemi Kullanımı

MICROSOFT WORD Word 2000/II TAB AYARLARI :

Bölüm 4 Microsoft Power Point Sunum Hazırlama

AGSoft Okul Aidat Takip Programı Kullanım Kılavuzu

Kod Listeleri Genel Yapısı

MPLAB IDE ve ISIS ile ASSEMBLY DİLİNDE UYGULAMA GELİŞTİRMEK

MICROSOFT WORD Şekil 1 TABLO HAZIRLAMA : Word 2002/II TAB AYARLARI :

EKOM WEB DESIGNER PROGRMI KULLANMA KILAVUZ. 1 - Web Sayfası Tasarımı Oluşturma / Var Olan Tasarımı Açma:

Barkod, Tebligat ve Tebliğ Masrafı Yönetimi

DENEME SINAVI CEVAP ANAHTARI

AKS SOFT V4.0 KULLANMA KILAVUZU. Geçiş Kontrol Yönetimi Personel Tanımlama Geçiş Kontrol Raporları Ziyaretçi Yönetimi

1) HĐZMET TAKĐP EŞLEŞTĐRME

Düzen Laboratuvarlar Grubu

Opera V2 Kurulum Klavuzu V0.01

YBS Ansiklopedi. Müşteri Memnuniyetinin İncelenmesi(Investigation of Customer Satisfaction) Tuğçe AKIN. 1. Giriş

Android Ders Notları

VisionLink Unified Suite

CJ1W-PRM21 ile GRT1- PRT Uzak I/O Modülüne Bağlanmak (Profibus)

BTU 100 Bilgisayar okuryazarlığı BTU 100 BİLGİSAYAR OKURYAZARLIĞI. Veri Tabanı Uygulamaları: Ms Access 2/2

MUĞLA SITKI KOÇMAN ÜNİVERSİTESİ MUWİS. Web İçerik Sistemi. Bilgi İşlem Daire Başkanlığı-WEB GRUBU

Mühendislikte Veri Tabanları Dersi Uygulamaları (ArcGIS-SQL)

LUCA NET BANKA EKSTRELERİ MODÜLÜ

Klinik veya poliklinik defterinde ilgili hasta bilgileri ekrandayken alt butonlardan Reçete butonuna basarak reçete formuna erişin.

Luca Fatura Aktarım İşlemi

FRONT PAGE EĞİTİM NOTLARI BAŞLANGIÇ. 1- Open araç çubuğu düğmesinin yanındaki aşağı oku tıklayarak, web seçeneğini işaretleyin

BÜYÜK VERI UYGULAMALARı DERS 7. Doç. Dr. Yuriy Mishchenko

Ana Sayfaya Git. Yukarıdaki adrese tıklayıp, sizlere e-posta ile iletilen, «Kullanıcı adı» ve «Şifre» bilgileriniz ile giriş yapınız.

5. HAFTA MS OFFICE EXCEL 2016 ÇUKUROVA ÜNİVERSİTESİ BİLGİSAYARDA VERİ ANALİZİ VE RAPORLAMA

1. MİCROSOFT EXCEL 2010 A GİRİŞ

WORD KULLANIMI

MICROSOFT EXCEL 2000 GİRİŞ:

DesignCad Basit İmalat Adımları

MY PANEL METER KULLANIM KILAVUZU

Proje Takip Platformu Kullanım Kılavuzu

Flash ile Etkileşimli Öğretim Materyali Hazırlama Semineri

WINDOWS VE PARDUS İÇİN İMZAGER KURULUM TALİMATI

POWER POINT SUNU PROGRAMI

LUCA BİLGİSAYARLI MUHASEBE PROGRAMI DERS NOTLARI

MS Outlook Programında İmzamatik Kullanımı

SUPERVISOR (YETKİLİ KULLANICI) KAMPANYA YÖNETİMİ EĞİTİM DOKÜMANI

4.4. Hazır bir veritabanı kullanılarak amacına yönelik sorgulama yapar ve yorumlar.

Elektra Raporlama Sistemi Sunumu

ArcGIS DE LAYOUT ĐŞLEMLERĐ

BİLGİSAYAR PROGRAMLAMA. Yrd. Doç. Dr. Beytullah EREN

VİSİONLİNK PROGRAMINDA S O S YAĞ ANALİZ UYARISI NASIL OLUŞTURULUR?

MICROSOFT EXCEL 2002

EĞİTİM-ÖĞRETİM YILI BİLİŞİM TEKNOLOJİLERİ VE YAZILIM DERSİ 6. SINIF 2. DÖNEM 2. SINAV ÇALIŞMA NOTLARI

KOCAELİ TEKNİK LİSESİ ELEKTRİK ELEKTRONİK BÖLÜMÜ OTOMASYON ATÖLYESİ EKTS (Elektrik Kumanda Teknikleri Simülatörü ) DERS NOTU. Kaynak :

TÜRKİYE ESNAF VE SANATKARLARI KONFEDERASYONU Online İşlemler (Basılı Evrak Stok Takip Sistemi ) Kullanma Kılavuzu

Teknik Doküman. Autodesk Revit Building te yeni ölçü tipleri yaratmak

SQL Uyarı Programı Kurulum ve Kullanımı

Ekle Menüsü İşlevleri ÜNİTE 10. Bu üniteyi çalıştıktan sonra; Ekle Menüsü Tablolar Resimler ve Çizimler Bağlantılar Metin ve Simgeler Media Flash

Hukuk Parter Rapor Modülü (Q-Biz Viewer) Kullanım Klavuzu

1- adresine girilir. Buradan Adobe Photoshope 5.0 programı bilgisayara indirilip, kurulur.

AYDES PROJESİ DESTEK İL FORMU EĞİTİM DOKÜMANI

İÇİNDEKİLER. Birim Modülü

SGB.NET SİSTEMİ ÜZERİNDEN OPERASYONEL PLAN GİRİŞİ

Docmage.exe dosyasını çalıştırılır ve karşımıza Şekil-1 deki ekran gelecektir.

GÖRÜNÜM OLAYLAR KALEM

BM 102 Bilgisayar Programlama II. Windows Form Application

"Her zaman düzeltme öner" seçeneği işaretliyse solda bulunan pencerenin "Öneriler" bölümünde düzeltme önerir.

TABLOSAL VERĐLERĐ EDĐTLEME YENĐ SUTUN EKLEME

PALET TEYİT EKRANI EĞİTİM NOTU

Temel Bilgisayar Dersi

SLCM Program Müfredatlarının (Gereksinim Kataloğu) yaratılması

Bo lu m 7: Hesap Tabloları

Yürürlük Tarihi: 12/09/ Kodu: ED Rev. No/Tarihi: 00 1 / 22

Excel 2007 Çalışma Soruları

MİCROSOFT OFFİCE POWER POİNT SORULARI

7 Temmuz Đlgili Versiyon/lar : ETA:SQL, ETA:V.8-SQL. Đlgili Modül/ler : Raporlar

SIMMAG Kullanım Kılavuzu. Adem Ayhan Karmış. Ana Ekran

Temel Bilgisayar Dersi

DIŞ LİNK ÜZERİNDEN TEDARİKÇİ TESCİL İSTEĞİ TANIMLAMA

TEMEL SUNUM İŞLEMLERİ SUNUMA SES, VIDEO EKLEME SUNUM TASARIMI ANİMASYONLAR SLAYT GEÇİŞİ KÖPRÜ KAYDETME SUNUM TASARIM TEKNİKLERİ ETKİNLİKLER

ELEKTRONİK BELGE YÖNETİM SİSTEMİ KULLANICI GİRİŞ VE E-İMZA İŞLEMLERİ KLAVUZU

C# Programının çalıştırılması, Program yazma ve Çalıştırma

BİLİŞİM TEKNOLOJİLERİ VE YAZILIM DERSİ EXCEL Microsoft Excel

WEKA ile Veri Önişleme

2 Server 1 Storage üzerinde HyperV Cluster kurulumu ve dikkat edilmesi noktalar aşağıdaki gibidir.

Transkript:

KNIME ORNEK UYGULAMA Amaç: auto-mpg datasını kullanarak knime açık kaynak kodlu yazılımla sınıflandırma, kümeleme ve diğer modellerinin kullanımı anlatılacaktır. Veri URL: https://archive.ics.uci.edu/ml/datasets/auto+mpg Auto-mpg.data içerisinde bir araca dair şu bilgiler bulunmaktadır: Rowkey Cylinders Displacement Horsepower Weight Acceleration model year class:mpg Kullanılan Yazılım: KNIME 2.6.3 UYGULAMA ADIMLARI 1.Adım: Knime açık kaynak kodlu yazılım çalıştırılır ardından yeni bir proje oluşturulur.wizard yardımıyla New Knime Project seçilip next tusuna basılır. Ardından yeni proje ismi verilerek proje oluşturulur.

Şekil-1 : Yeni bir proje oluşturulması 2.Adım: Bu islemin ardından çalışmalarımızı tanımlayacağımız workflow ekranları gelir. Çalısma yaptığımız veriler CSV dosya formatında oldukları için çalısma alanlarından IO > Read sekmesi içerisinde yer alan CSV Reader nesnesini proje çalısma alanına sürükle bırak yönetimi ile yada çift tıkayarak eklenir.

Şekil-2 : CSV Reader çalışma alanına eklenmesi 3.Adım: CSV Reader çift tıklayarak ya da mouse sağ tuş -> Configure yapılarak konfigürasyon tarafı görülür. Burada önce dosya seçilir,ardından dosyadadaki veriler arasında virgül,noktalı virgül gibi hangisi ile ayrıldı ise bunu ikinci durumda giriyoruz. Has Row Header seçili ise seçimi kaldırıp OK tuşuna basılır.

Şekil-3 : CSV Reader Configure edilmesi(datanın seçimin yapıldığı ve buna bağlı işlemlerin yapıldığı yer) 4.Adım: CSV Reader execute yapılır ve burada tüm datalar görünür. Şekil-4 : CSV Reader Execute edildiği durum 5.Adım: Datadaki verilerin başlık adlarını değiştirmek için ekrana bir Column Rename eklenir. Şekil-5 : Column Rename çalışma alanına eklendi. 6.Adım:

Column Rename -> Sağ tuş Configure tıklanır.gelen ekranda data da var olan data başlıkları bulunur. rowkey alanının yanında chane tıklanır,yanında bulunan alan aktif hale gelir. Burada data da bulunan başlık yerine sizin görmek istediğiniz başlık yazılır. 7.Adım: Şekil-6 : Column Rename configure alanı Çalışma alanına data da bulunan kayıp veriler için bir tane Missing Value eklenir. 8.Adım: Şekil-7 : Missing Value, çalışma alanına eklenmesi

Çalışma alanına eklenen Missing Value seçilir ve çift tıklanır ya da fare ile sağ tuş configure tıklanarak.gelen konfigürasyon ekranın olmayan verilerin nasıl düzeltilmesini sorar bize. Burada integer,double,string ve bilinmeyen kolunları nasıl düzeltilmesini soruyor. Integer alanında Do Nothing : hiçbirşey yapma, Remove Row : satırı sil, Min : Genel toplamda minimum değere çevir aynı şekilde Max : genel toplamda en yüksek değere çevirir, Mean : Ortalama değer yapar. Bu işlemler diğer veri tipleri içinde yapılabilir.burada amaç kayıp veri yerine daha düzgün bir veriye erişmek. Şekil-8 : Missing Value, konfigürasyon alanı

9.Adım: Missing Value seçimler yapıldıktan sonra OK tuşuna basılır ve Missing Value,Execute edilir. Sonuç şekil-9 da görüldüğü gibidir. 10.Adım: Şekil-9 : Missing Value,configure edildikten sonra execute sonrası düzeltilmiş datalar. Kümeleme modellemesi dair ekrana bir tane k-means eklenir.kümelemede asıl amaç verileri gruplandırıp bunları çeşidine göre analiz yapmak.örneğin bir toplulukta bulunan insanları ten renglerine göre gruplandırmak isterseniz bunları beyaz,sarışın,zenci şeklinde gruplandırmak yapılan işlemleri daha da kolaylaştırır.

Şekil-10 : Missing Value,configure edildikten sonra execute sonrası düzeltilmiş datalar. 11.Adım: k-means çift tıklayarak gelen ekranda number of cluster da bulunan kaçarlı küme olarak ayıracaksın diye soruyor.burada ben üçlü kümeleme yaptım.3 sayısı öylesine verilen bir sayı değil aksine yapılan kümelemede üç sayısının kümelenen veriler arasında daha orantılı bir şekilde orantıladığı için bu sayı verilmiştir. 12.Adım: Şekil-11 : k-means Properties k-means çalıştırıldığında şekil-12 de görülen ekran geliyor.burada dikkat edilmesi gereken bu işlem sonrası en sona bir sütun ekleyip verileri hangi kümeye dair olduğunu gösteriyor. Bunlar şunlardır:

Cluster_0 Cluster_1 Cluster_2 Şekil-12 : k-means execute görünüm 13.Adım: k-means kümeleerinin filtrelenmesi için ekrana üç tane Row Filter ekliyoruz.üç tane olmasının sebebi üç kümemizin olmasıdır.

Şekil-13 : Row-Filter,çalışma alanına eklendi. 14.Adım: Row Filter çift tıklayarak use pattern matching altında bulunan pattern alanına ilk row filter a cluster_0,ikincisine cluster_1,üçüncü row filter a cluster_2 olarak seçiyoruz.ardından row filter lar execute edilir.

Şekil-14 : Row-Filter,kümelerin seçilmesi. 15.Adım: Row Filter alara üç tane Numeric Binner ekliyoruz.bunlar bizim verdiğimiz değerler arasındaki datada bulunan alanlara bizim belirlediğimiz türleri yazılmasını sağlıyor. Çalışma alanında her row filter a bir tane Numeric Binner eklendi.

Şekil-15 : Numeric Binner çalışma alanına eklendi. 16.Adım: Numeric Binner çift tıklayarak properties erişilir.burada biz sıfırdan yüz kilometeye araçların kaç dakika çıktıklarına göre isimlendirdik. Eğer 0-10 ise en hizli, 10-20 hizli,20 üzerinde ise araç için yavaş yazacak.bu işlemleri yaptıktan sonra Numeric Binner lar Execute edilir.

Şekil-16 : Numeric Binner properties alanı 17.Adım: Numeric Binner execute dildiğinde şekil-17 deki gibi en sona bir sutun eklenip bu bizim belirlediğimiz şekilde görünüyor.

Şekil-17 : Numeric Binner execute görünüm 18.Adım: Numeric Binner ların her birine birer tane Decision Tree Learner ekliyoruz.burada karar ağaçları, elde edilen verinin analizi yapıyor.çalışma alanımızda üç tane Decision Tree Learner eklendi.

Şekil-18 : Decision Tree Learner çalışma alanına eklendi. 19.Adım: Decision Tree Learner çift tıklayıp properties kısmında hangi alana göre analiz yapılmasını sorar.buradaki class clolumn alanları string türünde olmalıdır.biz araçın hızlanmasına göre analiz yapmasını istiyoruz.bunun için class column alanında hizlanmasi seçiyoruz.diğer alanlar, Min number records per node alanı: minimum değer,bir altındaki alan ise kaç kayıdın görünmesini bize soruyor.daha sonra OK tıklanır. Şekil-19 : Decision Tree Learner properties kısmı 20.Adım:

Decision Tree Learner çalıştırılır.ekrana şekil-20 de bulunan ekran gelir.bu işlemleri diğer iki decision tree learner içinde yapılıyor. Şekil-20 : Decision Tree Learner execute edildiğinde 21.Adım: k-means den sonrasına bir partioning ekliyoruz.bu nun özelliği datanızı parçalayabilme özelliğinin olmasıdır.

Şekil-21 : partioning,çalışma alanına eklenmesi 22.Adım: Partioning çift tıklayarak properties alanına eriştiğimizde datalarımız nasıl bölmemeizi soruyor.şekil-22 de görüldüğü gibi. Relative alanında %70 oranında bölüyoruz.daha sonra ok deyip ardından execute ediyoruz.partitioning bir bacağını Row filtera diğer bacağını ise birazdan yapacağımız Decision Tree Predictor a bağlıyoruz.

Şekil-22 : partioning,properties alanı 23.Adım: Çalışma alanına üç tane Decision Tree Predictor ekliyoruz.bunların bir bacağı(burda kastedilen veriyi alacağı alanlardan bir tanesi) Decision Tree Learner diğer Partitioning. Decision Tree Predictor ların properties leri yoktur.bunları execute direk edebiliriz.bunlar %70,%30 oranında böldüğümüz data üzerinden bize analiz sonucunu gösterecektir.

Şekil-23 : Decision Tree Predictor, çalışma sayfasına eklenmesi ve ilişkilendirilmesi. 24.Adım: Decision Tree Predictor, execute edildiğinde analiz sonuçlarını Şekil-24 gibi gösterecektir.burada hizli diye bizim tarif ettiklerimizin %91.8 hizli,diğerlerinin yavaş,bunun da beygir gücü ve diğerleriyle ilgili analiz sonucunu gösteriyor.

Şekil-24 : Decision Tree Predictor, execute edildikten sonra analiz sonucu SONUC: Bu çalışmada 24 adımda Knıme Open source uygulamasında modelleme,karar ağaçlarının kullanımı,veriyi filtreleme ve bozuk olan datanın nasıl düzeltileceği anlatılmıştır.

NOT: Çalışmanın en son halidir.