VERİ MADENCİLİĞİ YÖNTEMLERİ İLE DIABETES MELLITIUS HASTALIĞINA SEBEP OLAN FAKTÖRLERİN TESPİTİ

Benzer belgeler
VERİ MADENCİLİĞİ YÖNTEMLERİ İLE DİYABET HASTALIĞINA SEBEP OLAN FAKTÖRLERİN TESPİTİ

WEKA ile Veri Önişleme

DÜNYA BÖBREK GÜNÜ ETKİNLİĞİ ANALİZİ

Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Bir Veri Seti Üzerinden Karşılaştırılması

Diyabet nedir? Ensülin nedir?

SPSS (Statistical Package for Social Sciences)

DİYABET NEDİR? Özel Klinik ve Merkezler

Dr. Semih Demir. Tez Danışmanı. Doç.Dr.Barış Önder Pamuk

DİYABET ŞEKER HASTALIĞI

Adım Adım SPSS. 1- Data Girişi ve Düzenlemesi 2- Hızlı Menü. Y. Doç. Dr. İbrahim Turan Nisan 2011

Giriş Düzeyinde Örnek Bir Veri Madenciliği Projesi-1

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması

Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması

KANSER HASTALARINDA ANKSİYETE VE DEPRESYON BELİRTİLERİNİN DEĞERLENDİRİLMESİ UZMANLIK TEZİ. Dr. Levent ŞAHİN

Demografik Özelliklerin Koroner Arter Hastalığına Etkisinin Analizi

Hipertansiyon ve Kronik Böbrek Hastalığı

Dünyada ve Türkiye de Kronik Hastalıklar. Prof. Dr. H. Erdal Akalın, FACP, FRCP, FIDSA Hacettepe Üniversitesi emekli Öğretim Üyesi

ÇALIŞMANIN AMACI: Türkiye de erişkinlerde ( 20 yaş) metabolik sendrom sıklığını tespit etmektir.

Gebelikte diyabet taraması. Prof. Dr. Yalçın Kimya

Diyabet Nedir? Diyabetin iki tipi vardır:

Yüz Tanımaya Dayalı Uygulamalar. (Özet)

YENİ DİYABET CHECK UP

Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması

Dünyanın En Önemli Sağlık Sorunu: Kronik Hastalıklar. Dr. H. Erdal Akalın, FACP, FIDSA, FEFIM (h)

Çocukların. Büyüme ve Gelişmesinde. Hareketli Yaşamın Önemi

Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi. Hazırlayan: Nury Amanmadov

HCV POZİTİF RENAL TRANSPLANT HASTALARINDA POSTTRANSPLANT DİYABET GELİŞİMİ RİSKİ ARTMIŞ MIDIR?

WEEK 11 CME323 NUMERIC ANALYSIS. Lect. Yasin ORTAKCI.

e-tartı LTR3 Firmware Upgrade Yazılım Güncelleme Moduler Connection LTR3 Firmware Upgrade / LTR3 Yazılım Güncelleme v1.0.

Nazlı Deniz ERGÜÇ 1, Hamza EROL 2, Bekir Yiğit YILDIZ 3, Vedat PEŞTEMALCI 4

DIABETES MELLITUS NEDİR? NEDENLERİ VE SONUÇLARI. Mümkün olduğunca normal bir yaşam. Lilly Deutschland GmbH Werner-Reimers-Straße Bad Homburg

Veri ve Metin Madenciliği

Veri ve Metin Madenciliği. Zehra

DİYABETES MELLİTUS. Uz. Fzt. Nazmi ŞEKERC

Glisemik kontrolün ölçütleri ve prognozla ilişkisi. Dr. Gülay Aşcı Ege Üniversitesi Tıp Fakültesi Nefroloji Bilim Dalı İzmir

Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Karşılaştırılması

Yüksekte Çalışması İçin Onay Verilecek Çalışanın İç Hastalıkları Açısından Değerlendirilmesi. Dr.Emel Bayrak İç Hastalıkları Uzmanı

Blackboard Learn üzerinde oluşturulan ÖDEV, SINAV, NOT ve DEVAM DURUMUNUN ARŞİVLENMESİ

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

Obez Çocuklarda Kan Basıncı Değişkenliği ve Subklinik Organ Hasarı Arasındaki İlişki

Argumentative Essay Nasıl Yazılır?

Metabolik Sendrom ve Diyabette Akılcı İlaç Kullanımı. Dr Miraç Vural Keskinler

ÖZET Amaç: Yöntem: Bulgular: Sonuçlar: Anahtar Kelimeler: ABSTRACT Rational Drug Usage Behavior of University Students Objective: Method: Results:

Gestasyonel Diyabette Nötrofil- Lenfosit Oranı, Ortalama Platelet Hacmi ve Solubıl İnterlökin 2 Reseptör Düzeyi

K.K.T.C`DE DİYABETİN EPİDOMİYOLOJİSİ. UZM.HEM. AYNUR BAYKAL Dr.Burhan Nalbantoğlu Devlet Hastanesi Endokrinoloji ve Metabolizma Hastalıkları Merkezi

Basın bülteni sanofi-aventis

Tükürük kreatinin ve üre değerleri kullanılarak çocuklarda kronik böbrek hastalığı tanısı konulabilir mi? Dr. Rahime Renda

VERİ MADENCİLİĞİ YÖNTEMLERİ KULLANILARAK ÇOK-BANTLI UYDU GÖRÜNTÜ VERİLERİNİN SINIFLANDIRILMASI İÇİN ALGORİTMA SEÇİMİ

ABSTRACT $WWLWXGHV 7RZDUGV )DPLO\ 3ODQQLQJ RI :RPHQ $QG $IIHFWLQJ )DFWRUV

T.C. ÇANAKKALE ONSEKİZ MART ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ İLERİ VERİTABANI SİSTEMLERİ DERSİ RAPORUN SUNULDUĞU TARİH

raşitizm okul çağı çocuk ve gençlerde diş çürükleri büyüme ve gelişme geriliği zayıflık ve şişmanlık demir yetersizliği anemisi

Unlike analytical solutions, numerical methods have an error range. In addition to this

DİABETES MELLİTUS YRD. DOÇ.DR. KADRİ KULUALP

ÇOCUKLARDA ŞEKER HASTALIĞININ BELİRTİLERİ NELERDİR?

KARBOHİDRAT METABOLİZMASI BOZUKLUKLARI DİYABET

Diyabetik Hasta Takibi. Dr. Hasan Onat PHD Diyabet Çalışma Grubu İnece ASM, Kırklareli

E-DEFTER GÖRÜNTÜLEYİCİ

KAN ŞEKERİ ÖLÇÜMÜ VE CİHAZ (GLUKOMETRE) KULLANIMI

Kalp Hastalıklarından Korunma

Duvar İnşa Edilmesinde Verimliliği Etkileyen Faktörlerin Apriori Veri Madenciliği Yöntemi Kullanılarak Analizi

Türkiye Kronik Böbrek Hastalığı Prevalansı Araştırması Chronic REnal Disease In Turkey CREDIT

1.BÖLÜM: GİRİŞ VE KURULUM

Şeker düşürücü ilaçlar

SPSS (Statistical Package for Social Sciences)

Koordinat Dönüşümleri (V )

Türkiye KBH Prevalansı Araştırması 5

ICubes Giriş. adresinden sisteme girilir. Açılan sayfaya kullanıcı adı ve şifre yazılarak platforma giriş yapılır

4. Bölüm Programlamaya Giriş

WEKA Yazılımında k-ortalama Algoritması Kullanılarak Konjestif Kalp Yetmezliği Hastalarının Teşhisi

R ile Programlamaya Giriş ve Uygulamalar

BÜYÜK VERI UYGULAMALARı DERS 7. Doç. Dr. Yuriy Mishchenko

Özel Bir Hastanede Diyabet Polikliniğine Başvuran Hastalarda İnsülin Direncini Etkileyen Faktörlerin Araştırılması

MERVE SAYIŞ TUĞBA ÇINAR SEVİM KORKUT MERVE ALTUN

ENROUTEPLUS TA YAPILMASI GEREKENLER

Bulanık Mantık Tabanlı Uçak Modeli Tespiti

DİYABETİK DİYALİZ HASTALARINDA GLİSEMİK DALGALANMA

Doç. Dr. Ahmet ALACACIOĞLU

Havadan Suya Isı Pompası Seçim Programı / ver.1.4

Kansızlık Tanısına İlişkin Bir Veri Madenciliği Uygulaması

Prediyabetik ve Tip 2 Diyabetik Kadınlarda Kardiyovasküler Risk: Gerçekten Erkeklerden Daha Yüksek Mi?

TIBBIN HAFIZASI KURTARILACAK

Önsöz. İçindekiler Algoritma Algoritma Nasıl Hazırlanır? Yazılımda Algoritma Mantığı Nedir? 1.2. Algoritma Örnekleri ve Sorular

Kronik böbrek hastalığı adeta bir salgın halini almıģ olan önemli bir halk sağlığı sorunudur.

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

Sivas İl Merkezinde Yaşlı Nüfusta Bazı Kronik Hastalıkların Prevalansı ve Risk Faktörleri

İMZAGER PROGRAMI İLE UZUN DÖNEM İMZA TİPİNDE ELEKTRONİK İMZALI BELGE OLUŞTURMA

MPLAB IDE ve ISIS ile ASSEMBLY DİLİNDE UYGULAMA GELİŞTİRMEK

Gıdaların İn Vitro Glisemik İndekslerinin Belirlenmesi

Bütünüyle doğal, tadıyla özel atıştırmalıklar...

Tip 2 Diyabetli Hastalarda Metabolik Sendrom Prevalansı

Apriori Algoritması. Konu İçeriği. Giriş. Tarihçesi. Apriori Nedir? Örnekler. Algoritma. Açıklama. Weka İle Kullanımı. Kaynakça.

Türkiye de Klinik Kalite Çalışmaları

MELLİTUS HASTALIGI VE HEMŞİRELİK BAKıMı

DİYABETTE İLAÇ VE İNSÜLİN TEDAVİSİ


PERİTON DİYALİZİ YAPAN HASTALARDA İKODEXTRİN KULLANIMININ METABOLİK SENDROM VE DİĞER KARDİOVASKÜLER RİSK FAKTÖRLERİ İLE İLİŞKİSİ

VAY BAŞIMA GELEN!!!!!

İ.K.Ç.Ü ATATÜRK EĞİTİM ve ARAŞTIRMA HASTANESİ DİYABET EĞİTİM HEMŞİRESİ SEVİL İŞLİ

ICubes Giriş. adresinden sisteme girilir. Açılan sayfaya kullanıcı adı ve şifre yazılarak platforma giriş yapılır

ÖZGEÇMİŞ. Yabancı Dil: İngilizce. Uluslararası dergilerde yayınlanan makaleler

Transkript:

VERİ MADENCİLİĞİ YÖNTEMLERİ İLE DIABETES MELLITIUS HASTALIĞINA SEBEP OLAN FAKTÖRLERİN TESPİTİ Gizem Betül Şahin 1, Tuba Gökhan 2, Aydın Çetin 3 1 2 3 gb.sahin56@gmail.com, tubagokhan@gazi.edu.tr, acetin@gazi.edu.tr Özet: Diabetes Mellitus (Diyabet hastalığı-dm); pankreasın yeterli insülin üretememesi veya vücudun ürettiği insülini etkili bir şekilde kullanamaması sonucu oluşan kronik bir hastalıktır. Uzun sürede kalp damar hastalıkları, göz hastalıkları, böbrek hastalıkları gibi ciddi komplikasyonlar ortaya çıkarabilen bu hastalık, tedavi harcamalarının yüksekliği ve iş gücü kaybı nedeni ile hastaya sosyoekonomik yük getirmesinden dolayı diyabet önemli bir sağlık sorunudur. Diyabet, günümüzde yetişkinlerin yanı sıra küçük yaş gruplarında da sıklıkla ortaya çıkmaya başlamıştır. Bu durumda erken tanı birçok hastalıkta olduğu gibi diyabette de önem arz etmektedir. Tanı için idrar ve kanda çeşitli kimyasal testler yapılmaktadır. Bu çalışma kan testi ve kişiye ait fiziksel özellikler kullanarak veri madenciliği yöntemleri kullanılarak kişilerin diyabet hastası olup olmadıklarının belirlenmesi amacıyla gerçekleştirilmiştir. Yapılan bu çalışmada 392 kadın Dünya Sağlık Örgütü(WHO) kriterlerine göre test edilip veri seti haline getirilmiştir. Bu veri seti açık kaynak kodlu veri madenciliği yazılımlarından olan WEKA aracının farklı sınıflandırma algoritmaları karşılaştırılarak en iyi sonucu veren algoritma ile bu verilere göre diyabet hastası olup olmadıkları belirlenmiştir. Sonuç olarak elde edilen veriler, belirtilen değerlerin diyabetin tanısı konusunda kısmen yetersiz kalsa da azımsanmayacak derecede de önemli rol oynadığını göstermiştir. Anahtar sözcükler: Veri madenciliği, WEKA, Sınıflandırma Algoritmaları, Diyabet, Şeker hastalığı Abstract: Diabetes Mellitus (Diabetes Mellitus); Is a chronic disease in which the pancreas can not produce enough insulin or can not use the body's insulin effectively. Diabetes is a major health problem because it can cause serious complications such as cardiovascular diseases, eye diseases and kidney diseases for a long time, the high cost of treatment and the socioeconomic burden on the patient due to the loss of work power. Diabetes is now common in adults as well as in younger age groups. In this case, early diagnosis is as important as many diseases. There are various chemical tests for urine and calorie for diagnosis. This study was conducted to determine if people were diabetic by using data mining methods using blood tests and physical characteristics of the person. In this paper, 392 women were tested according to World Health Organization (WHO) criteria and data set. This data set is compared with the different classification algorithms of open source data mining software WEKA and it is determined whether or not they have diabetes according to this algorithm with the best result giving algorithm. The resulting data show that the values mentioned play an important role in the diagnosis of diabetes, even if it is partially inadequate. Keywords: Data mining, WEKA, Classification Algorithms, Diabetes, Diabetes Mellitus 1.Giriş Diyabet kan şekeri seviyesinin yükselmesi ile ortaya çıkan kronik olan metabolik bit hastalıktır. Dünya Sağlık Örgütüne (WHO) verilerine göre dünyada 422 milyon yetişkinin diyabet hastalığı(şeker hastalığı) taşımaktadır. Diyabetin 2 tipi bulunmaktadır. Tip 1 diyabet insülin hormonunu vücudunda hiç salgılayamayan hastaların diyabet türüdür. Genellikle çocuk veya gençlerde görülmektedir. Tip 2 diyabet ise daha çok yetişkinlerde görülmektedir. İnsülini vücudun düzenli ve yeterli kullanamaması durumlarında ortaya çıkmaktadır. Tip 2 diyabet dünyada en sık rastlanan diyabet tipidir [1] [2] [3] [4]. Diyabetin tanısı için idrar ve kanda kimyasal testler yapılmaktadır. Kanda yapılan testlerde, normal

sağlıklı kişilerde açlık kan şekeri 90 mg/dl altında, tokluk kan şekeri 2. Saatte 140 mg/dl nin altında, açlık insülin hormon düzeyi 10 un altında olmalıdır. Sağlıklı bir bireyin diastolik kan basınç değeri (küçük tansiyon) 80 mmhg olmalıdır. Dünya Sağlık Örgütü referans aralığına göre 18,5-24.99 arası değerler normal sayılır. vücut kitle endeksi değeri 30'un üzerinde obezite olarak kabul edilir. Kişinin bu gibi değerleri ele alınarak diyabet hastalığı bulunup bulunmadığına karar verilmektedir. [5] [6] Bu çalışmada da, US Uluslararası Diyabet, Sindirim ve Böbrek Hastalıkları Enstitüsü tarafından toplanmış veriler üzerinde WEKA yazılımı kullanılarak sınıflandırma yapılmıştır. Veri seti 392 kadının bilgilerinden oluşmaktadır. Çalışmada WEKA yazılımının sınıflandırma algoritmaları kullanılmıştır. 2.Veri Seti Veri madenciliği işlemlerinde veri önişleme önemli bir aşamadır. Bu aşamada veri temizleme, veri dönüşümü, veri birleştirme ve veri azaltma yapılabilir. Bu çalışmada US Uluslararası Diyabet, Sindirim ve Böbrek Hastalıkları Enstitüsü tarafından toplanmış bir veri seti kullanılmıştır. Bu veri seti 8 adet nitelikten 768 kadın örnekten oluşan Şekil-1 deki gibi.csv uzantılı bir excel dosyasıdır. Fakat daha sonra yapılan veri önişlemlerinde veri setinde boş görünen değerler silinmiştir. Sonuçta oluşan veri seti WEKA aracında kullanılmak üzere.arff uzantılı Şekil-2 deki gibi bir dosya ya dönüştürülmüştür. özellikler sayısal olduğu için.arff dosyasında numeric olarak tanımlanmıştır. Şekil-2:Diabetes veri setinin.arff uzantılı dosyasının görünümü Çalışmada veri setinin %66 sı Cross-validation(k katlamalı çapraz doğrulama) yöntemi ile eğitim amaçlı kullanılmış kalan %33 lük kısmı ise test amacıyla kullanılmıştır. 3. WEKA Yazılımı Yeni Zelanda Waikato Üniversitesi nde geliştirilen WEKA (Waikato Environment for Knowledge Analysis), açık kaynak kodlu bir veri madenciliği yazılımıdır. Java programlama dili ile geliştirilmiştir. WEKA, sınıflandırma, kümeleme, birliktelik analizi gibi yöntemlerin algoritmalarını içeren hazır bir yazılımdır. [7] Bu algoritmaların yanı sıra veri ön işleme, görselleme işlemlerini de gerçekleştirebilmektedir. WEKA aracını kullanmak için programlama bilmek gerekmemektedir. Programı çalıştırdığımızda karşımıza gelecek olan ekran Şekil-3 deki gibidir; Şekil-1:Diabetes veri setinin.csv uzantılı dosya görünümü

verilerinden oluşmaktadır. Explorer ile bu kadınların verilerini yüklediğimizde Şekil-4 deki Preprocess ekranı karşımıza gelmektedir. Şekil-3: Weka yazılımı arayüz ekranı. Karşımıza gelen Preprocess (önişleme) sekmesinde veri dosyaları yüklenir. WEKA ile bir veri seti üzerinde çalışacağımız zaman Explorer seçeneğinde Open File ile çalışacağımız dosyayı seçebiliriz. Fakat burada dosyayı seçebilmemiz için WEKA nın desteklediği formatta bir dosya türü kullanmalıyız. Genellikle kullanılan dosya formatı.arff uzantılı olan dosyalardır. Şekil-4: Explorer ekranında veri seti Explorer ekranında Visualize All butonuna basıldığı zaman veri setinin grafiksel gösterimi karşımıza gelmektedir. Bu grafiksel gösterim Şekil- 5 te görüldüğü gibidir. Classify (Sınıflandırma) sekmesi sınıflandırma algoritmalarının kullanılabildiği kısımdır. Sınıflandırma sekmesinden Choose butonu ile kullanacağımız sınıflama algoritmasını seçebiliriz. Test Options seçeneği ile veriyi nasıl parçalayacağımızı ayarlanabiliriz. Alt seçeneklerde bulunan Use Training set seçeneği ile veri setinin tamamı kullanılarak sınıflandırma yapılır. Supplied test set seçeneği ile eğitim için kullanılacak veri setini dışarıdan seçilebiliriz. Cross Validation seçeneği ile veri seçimi yapılabilmektedir. Percentage Split seçeneği ile veri setinin yüzde kaçının eğitim için kullanılacağını seçebiliriz. Start butonu ile de yazılımımızı çalıştırabiliriz. Bu çalışma için de WEKA aracının sınıflandırma algoritmaları kullanılacaktır. Ayrıca WEKA aracında Cluster (kümeleme), Associate (birliktelik kuralları), Select Attibute (nitelik seçme) ve Visualize (görselleştirme) sekmeleri de bulunmaktadır. 4. Sınıflandırma Bu çalışmada, US Uluslararası Diyabet, Sindirim ve Böbrek Hastalıkları Enstitüsü tarafından toplanmış veriler üzerinde sınıflandırma çalışması yapılmıştır. Veri seti 392 kadının kan testi ve fiziksel Şekil-5: Visualize ekranı(grafikler) Yapılan sınıflandırma çalışmasında J48, SimpleCart, J48graft ve LMT sınıflandırma algoritmaları denenmiş olup içlerinde en başarılı olan J48 algoritması ele alınmıştır. Bu algoritmada oluşan karar ağacı yapısı Şekil-6 da görülmektedir. Bu ağaçta da görüldüğü gibi Glukoz parametresi diyabet hastalığını etkileyen en önemli faktördür.

Algoritma Hasta Olanlar için TP oranı Hastalık Tanısı Konulmamışlar için TP oranı Doğru sınıflandırma Yüzdesi J48 0.594 0.901 %82.70 DecisionStump 0.750 0.832 %81.20 HoeffdingTree 0.625 0.861 %80.45 LMT 0.500 0.921 %81.95 Tablo-1:Sınıflandırma algoritmalarının başarı kıyaslaması 5. Sonuçlar Şekil-6: Oluşan Karar Ağacı. Şekil-7 de Karar ağacının yapısı sayısal olarak gösterilmiştir. Bu çalışmada WEKA aracı ile Diyabet Hastalığının sınıflandırma çalışması gerçekleştirilmiştir. Veri setinin gerçek verilerden oluşmasından dolayı sınıflandırma başarılarının yeteri kadar yüksek olduğu söylenebilir. Yapılan çalışma, Glukoz değerinin diyabet için en önemli kriter olduğunu göstermektedir. Sınıflandırma algoritmaları veri seti üzerinde başarı kıyaslaması yapıldığında J48 algoritmasının diğer algoritmalara göre daha yüksek başarıya sahip olduğu söylenebildiği Tablo- 1 görülmektedir. İleriki çalışmalarda diyabet tipleri üzerinde bir sınıflandırma çalışması yapılması insan sağlığı alanına daha fazla destek olacağından daha uygun olacaktır. Kaynaklar [1] T.C. Sağlık Bakanlığı, 2016. [Çevrimiçi]. http://diyabet.gov.tr/index.php?lang=tr&pag e=25. Şekil-7: Sayısal gösterim Diğer sınıflandırma algoritmaları da aynı veri setine aynı şartlar altında denenmiş olup Tablo-1 deki sonuçlar elde edilmiştir. [2] T.C. Sağlık Bakanlığı, 2016. [Çevrimiçi]. http://diyabet.gov.tr/index.php?lang=tr&pag e=36. [3] World Health Organization, 2016. [Çevrimiçi]. http://www.who.int/diabetes/en/. [4] World Health Organization, [Çevrimiçi]. http://www.who.int/diabetes/globalreport/en/. [5] M. Orata, 2016. [Çevrimiçi]. http://www.endokrinoloji.org/tr/endokrinol

oji4.asp?m2=6&m3=26&m4=169. [6] T. Kovankaya, DAHİLİYE POLİKLİNİKLERİNE BAŞVURAN HASTALARDA DİYABET VE DİSLİPİDEMİ İLİŞKİSİNİN DEĞERLENDİRİLMESİ, İstanbul: İSTANBUL GÖZTEPE EĞİTİM VE ARAŞTIRMA HASTANESİ, 2008. [7] G. Demir ve K. Zengin, «Weka Yazılımı Kullanılarak Anemi (Kansızlık) Hastalığı,» %1 içinde EEB 2016 Elektrik-Elektronik ve Bilgisayar Sempozyumu, Tokat, 2016.