SÖZLÜ BİLDİRİ TÜRKİYE DEKİ HASTANELERİN VERİ MADENCİLİĞİ YÖNTEMLERİ KULLANILARAK GRUPLANDIRILMASI

Benzer belgeler
VERİ MADENCİLİĞİNE BAKIŞ

HAM VERİNİN NİTELİKLİ BİLGİYE DÖNÜŞTÜRÜLME SÜRECİ

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 5072

Apriori Algoritması ile Teknik Seçmeli Ders Seçim Analizi

APRİORİ ALGORİTMASI İLE TEKNİK SEÇMELİ DERS SEÇİM ANALİZİ SELECTION BEHAVIOR ANALYSIS OF TECHNICAL ELECTIVE COURSES USING APRIORI ALGORITHM

2012/2013 Yılı İstatistiki Verileri

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, Nisan 2009, ODTÜ, Ankara

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

T.C.DİCLE ÜNİVERSİTESİ HASTANELERİ 1 / 63 ACİL TIP ANABİLİM DALI BAŞKANLIĞI

VERİ MADENCİLİĞİ İLE DEPREM VERİLERİNİN ANALİZİ

Veri Ambarları ve Veri Madenciliği (ISE 350) Ders Detayları

Tıbbi Sarf Malzemelerin Sınıflandırılması Medikal Depo Sınıflandırma Çalışmaları Diş Hekimi Suna OK Danışman

VERI TABANLARıNDA BILGI KEŞFI

HAM VERİNİN NİTELİKLİ BİLGİYE DÖNÜŞTÜRÜLME SÜRECİ

Üniversite Öğrencilerinin Đnterneti Eğitimsel Amaçlar Đçin Kullanmalarını

Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan. blog.mustafabaydogan.

Öğrencilerin Staj Verileri Üzerine Uygulanan Apriori Algoritması ile Birliktelik Kurallarının Çıkarılması ve Staj Eğiliminin Belirlenmesi

T.C. Muhsin Özgür DOLGUN. Biyoistatistik Programı DOKTORA TEZİ

Web Madenciliği (Web Mining)

T. C. SAĞLIK BAKANLIĞI KEÇİÖREN EĞİTİM ve ARAŞTIRMA HASTANESİ TELEFON REHBERİ

Zamansal Veri Madenciliği ve Anomali Tespiti için Bir Uygulama

VERİ MADENCİLİĞİNDE KARAR AĞACI ALGORİTMALARI İLE BİLGİSAYAR VE İNTERNET GÜVENLİĞİ ÜZERİNE BİR UYGULAMA

2012-TUS İLKBAHAR DÖNEMİ GENEL YERLEŞTİRME SONUÇLARINA GÖRE EN KÜÇÜK VE EN BÜYÜK PUANLAR (YABANCI UYRUKLU)

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 2 ( yılı öncesinde birinci

T.C. İstanbul Üniversitesi Cerrahpaşa Tıp Fakültesi Türkçe ve İngilizce Tıp Programları

Mesleki Terminoloji II Veri Madenciliği

İÇİNDEKİLER Sayfa Atatürk ün Gençliğe Hitabesi... 1 Hekimlik Andı... 2 Önsöz... 3 Misyonumuz Vizyonumuz... 4 Bugüne Kadar Görev Alan Fakülte

TABLO-24: TÜRKİYE'DEKİ HASTANELERDE GÖREVLİ UZMAN HEKİMLERİN YILLARA VE KURUMLARA GÖRE DAĞILIMI,

İleri Veri Madenciliği (COMPE 506) Ders Detayları

Tanımı Amacı Özellikleri Kullanım Alanları Varsayımları Yöntemleri Uygulama aşamaları. Neleri göreceğiz?

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

İZMİR DE YENİ DEVLET ÜNİVERSİTESİ

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

CBS ve Coğrafi Hesaplama

AMAÇ. Finansal Performans Ölçümü İĞİ RLENMESİ. Kamu Hastanelerinde Finansal Perspektif

BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR

Yönetim Bilişim Sistemleri (Karma) - 1. yarıyıl Hukukun Temelleri Fundamentals of Law TR

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması

Cerrahpaşa Tıp Fakültesi nde Ders Programlarının Yeniden Yapılandırılması

MÜFREDAT DERS LİSTESİ

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

T.C. ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ EĞİTİM ÖĞRETİM YILI DERS KATALOĞU

DENİZ HARP OKULU BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

PERSONEL TEMİN PLANI

Kümeleme Algoritmaları. Tahir Emre KALAYCI

ASİSTAN SAYILARINDAKİ AZALMA VE FAKÜLTEMİZ ÜZERİNE ETKİLERİ

APRIORI ALGORİTMASI İLE ÖĞRENCİ BAŞARISI ANALİZİ

KARAR AĞAÇLARI SÜMEYYE ÖZKAN BAHAR BAKAR İZEL KOLCU

T.C. DÜZCE ÜNİVERSİTESİ TIP FAKÜLTESİ EĞİTİM ÖĞRETİM YILI AKADEMİK TAKVİMİ YATAY GEÇİŞ BAŞVURULARI TEMMUZ 2017

Çok fazla bilgiden gizli kalmış örüntüleri ortaya çıkarma sürecine Veri Madenciliği denir.

DENİZ HARP OKULU BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

ANKARA ÜNİVERSİTESİ A ÖĞRENCİ İŞLERİ DAİRE BAŞKANLIĞI

YZM 3217 YAPAY ZEKA DERS#10: KÜMELEME

VERİ MADENCİLİĞİ F A T M A İ L H A N

T.C. İSTANBUL ÜNİVERSİTESİ İstanbul Tıp Fakültesi Dekanlığı

MEÜ. SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ DERS TANIMI FORMU

ÇANKAYA BELEDİYESİNİN ÖZEL HASTANELERLE YAPMIŞ OLDUĞU PROTOKOLLERLE ALINAN İNDİRİM ORANLARI

Veri Madenciliği Yöntemleriyle İGDAŞ Çağrı Merkezi Veri Analizi VE Kalite Fonksiyon Yayılımı Yöntemiyle Süreç İyileştirme Çalışması

Birliktelik Kuralları Analizi. Yard. Doç. Dr. Derya BİRANT Prof. Dr. Alp KUT

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir

2015-TUS SONBAHAR DÖNEMİ GENEL YERLEŞTİRME SONUÇLARINA GÖRE EN KÜÇÜK VE EN BÜYÜK PUANLAR (GENEL)

1. Sınıf Yıllık Ders Yükü Toplamı

BLM 4811 MESLEKİ TERMİNOLOJİ II Salı , D-109 Dr. Göksel Biricik

T.C. SÜLEYMAN DEMİREL ÜNİVERSİTESİ TIP FAKÜLTESİ EĞİTİM ÖĞRETİM YILI DERSLER VE KREDİLERİ

BİLGİ VE BELGE YÖNETİMİ BÖLÜMÜ LİSANS EĞİTİM BAHAR DÖNEMİ PROGRAMI

ÖZGEÇMİŞ. 1. Adı Soyadı : Kamile ŞANLI KULA İletişim Bilgileri : Ahi Evran Üniversitesi, Fen Edebiyat Fakültesi, Adres Matematik Bölümü, KIRŞEHİR

2013-TUS İLKBAHAR DÖNEMİ GENEL YERLEŞTİRME SONUÇLARINA GÖRE EN KÜÇÜK VE EN BÜYÜK PUANLAR (GENEL)

Sağlık Bakanlığı Eğitim ve Araştırma Hastanelerine Alınacak Asistan Sayıları

Endüstri Mühendisliği - 1. yarıyıl. Academic and Social Orientation Fizik I Physics I TR

T.C. BÜLENT ECEVİT ÜNİVERSİTESİ Sağlık Uygulama ve Araştırma Merkezi Hemşirelik Hizmetleri Müdürlüğü

T.C. ÇUKUROVA ÜNİVERSİTESİ Balcalı Hastanesi Başhekimliği PERSONEL İŞLERİ BİRİMİNE

Program Kodu Eğitim Süresi Puan Türü (1) (2) (3) (4) (5) (6) (7)

Web Madenciliği (Web Mining)

BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

Veri Madenciliği İle Lise Öğrenci Performanslarının Değerlendirilmesi. Assessment of High School Students Performance by Means of Data Mining

VERİ MADENCİLİĞİ MODELLERİ VE UYGULAMA ALANLARI

KALİTE YÖNETİM BİRİM ÇALIŞMA TALİMATI

Veri Madenciliği. Veri Madenciliği ve Makina Öğrenmesi

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 1 ( yılı ve sonrasında birinci

S. Ü. TIP FAKÜLTESİ HASTANESİ EĞİTİM BİRİMİ

Veri Madenciliği - Giriş. Erdem Alparslan

VERİ MADENCİLİĞİ VE ANADOLU ÜNİVERSİTESİ AÇIKÖĞRETİM SİSTEMİNDE BİR UYGULAMA

Konferans. Panelist. Konferans. Konferans. Konferans. Panelist. Panelist. Konferans. Panelist. Panelist. Konferans. Panelist. Konferans.

VERİ MADENCİLİĞİ: KARAR AĞACI ALGORİTMALARI VE İMKB VERİLERİ ÜZERİNE BİR UYGULAMA *

KOCAELİ ÜNİVERSİTESİ TIP FAKÜLTESİ DÖNEM Eğitim Öğretim Yılı Akademik Takvimi

Uzman Doktorlar. Akay Hastanesi nin tıbbi kadrosu, alanında uzmanlaşmış, bilgili, deneyimli, yenilikleri takip eden doktorlardan oluşmaktadır.

TÜRKİYE'DE YAYINLANAN DERGİLER

T.C. SAĞLIK BAKANLIĞI SAĞLIK İSTATİSTİKLERİ YILLIĞI 2015 YAYINLANDI Müge ÜNAL

ÖĞRENCİ SEÇME SINAVINDA (ÖSS) ÖĞRENCİ BAŞARIMINI ETKİLEYEN FAKTÖRLERİN VERİ MADENCİLİĞİ YÖNTEMLERİYLE TESPİTİ

Sağlık Kurum ve Kuruluş Türüne Göre Değerlendirilecek Bölüm/Standart Listesi

KALİTE İYİLEŞTİRMEDE VERİ KÜMELEME: DÖKÜM ENDÜSTRİSİNDE BİR UYGULAMA

Tablo 2 Üniversitelerdeki Tıpta Uzmanlık Eğitimi Yapılacak Programlar ve Kontenjanları*

Başlıca Ürün-Bilgi Sistemleri

T.C. DÜZCE ÜNİVERSİTESİ TIP FAKÜLTESİ EĞİTİM ÖĞRETİM YILI AKADEMİK TAKVİMİ. Yeni Hali YATAY GEÇİŞ BAŞVURULARI TEMMUZ 2018

KAÇKAR DEVLET HASTANESİ EK:2 HEKİM AYLIK ÇALIŞMA TABLOSU EKİM 2014 tarihleri arası UZMANLIK TARİH

2. SÜREKLİ DENETİME İLİŞKİN GENEL BİLGİLER

Algoritmalar (MCS 401) Ders Detayları

Transkript:

SÖZLÜ BİLDİRİ TÜRKİYE DEKİ HASTANELERİN VERİ MADENCİLİĞİ YÖNTEMLERİ KULLANILARAK GRUPLANDIRILMASI CLASSIFICATION OF TURKISH HOSPITALS BY USING DATA MINING TECHNIQUE Mehmet UĞURLU 1, M.Özgür DOLGUN 2, S.Yavuz SANİSOĞLU 3, Tülin GÜZEL ÖZDEMİR 4, R.Murat AYDIN 5, Selim DELİLOĞLU 2, Mesut AKYOL 6 1 :Aile Hekimliği Uzmanı, T.C. Sağlık Bakanlığı 2 :Uzm., SPSS Türkiye 3 :Doç.Dr.,TC Sağlık Bakanlığı 4 : Dr., SPSS Türkiye 5 :T.C. Sağlık Bakanlığı 6 :GATA Biyoistatistik BD Adres : Çankaya Mah. Mahmut Yesari Sok. No:8/5 Çankaya-ANKARA Tel :(312) 439 6031, e-mail : o_dolgun@yahoo.com ÖZET Veri madenciliği büyük veri yığınlarında gizli olan örüntüleri ve ilişkileri ortaya çıkarmak için istatistik ve yapay zeka kökenli çok sayıda ileri veri çözümleme yönteminin tercihen görsel bir programlama ara yüzü üzerinden kullanıldığı bir süreçtir. Bu çalışma ile T.C. Sağlık Bakanlığı na bağlı hastanelerin performans değerlendirmesine esas olacak sınıflandırılması amaçlanmıştır. Bu veri madenciliği uygulaması sonucunda, tüm hastanelerin gruplanmış listesi görsel olarak incelendiğinde tecrübelerimizle çok büyük oranda örtüşen sonuçlar elde edilmiştir. Anahtar Kelimeler: Veri madenciliği, karar ağacı, kümeleme, T.C. Sağlık Bakanlığı ABSTRACT Data mining is a process in which multiple advanced data processing methods originating from statistics and artificial intelligence are used preferably through a visual programming interface to set out patterns and relations hidden in large data masses. By means of this study, classification of the MoH-affiliated hospitals which will serve as a basis for the performance evaluation is aimed. As a result of this data mining implementation, when the grouped list of the hospitals is reviewed visually, it has been seen that the results obtained overlap with our experiences to a large extent. 1

GİRİŞ 1. Veri Madenciliği Yapılan tahminlere göre, birkaç yıl içerisinde dünya üzerindeki tüm veritabanlarında tutulan veri, insanlık tarihi boyunca üretilen verilerden çok daha fazla olacaktır. Fiziksel olarak çok büyük kapasiteli veri ambarları ve veritabanlarının mevcut olması bu veri yığının içinden kullanışlı bilgiyi elde etmede çokda yeterli olmayacaktır. Saklı ve işlenmemiş bilgiye olan ihtiyaç Veritabanlarında Bilgi Keşfi (VTBK) ve Veri Madenciliği (VM) gibi yeni alanların ortaya çıkarılması sonucunda anlaşılabilir ve yorumlanabilir bir hale gelmiştir. Bilgisayar ve bu yeni alanların kullanımı ile madencilikte altın damarının bulunması gibi binlerce veri yıkıntısı arasından bilgi damarı otomatik olarak keşfedilmektedir. Veri madenciliği büyük veri yığınlarında gizli olan örüntüleri ve ilişkileri ortaya çıkarmak için istatistik ve yapay zeka kökenli çok sayıda ileri veri çözümleme yönteminin tercihen görsel bir programlama ara yüzü üzerinden kullanıldığı bir süreçtir. Veri madenciliği algoritmaları; istatistiksel algoritmalar, matematiksel algoritmalar ve yapay zeka algoritmalarını (sinir ağları, karar ağaçları, kohonen ağlar, birliktelik kuralları vb.) bir arada içerir [1,3,8]. 1.1. Veri Madenciliği Metodolojisi CRISP-DM (Cross Industry Standard Processing for Data Mining); SPSS Inc., OHRA, NCR, Daimler Chrysler ve Teradata firmaları tarafından geliştirilen açık bir veri madenciliği metodolojisidir. CRISP-DM metodolojisi, iki yüz veri madenciliği kuruluşu tarafından desteklenmektedir. Metodolojinin amacı; veri madenciliği projelerinin, kullanılan programdan bağımsız olarak belli bir metodu kullanmasıdır. CRISP-DM metodolojisine göre bir veri madenciliği projesi; 1. İş İhtiyaçlarının Anlaşılması, 2. Verinin Anlaşılması, 3. Verinin Hazırlanması, 4. Modelleme, 5. Modelin Değerlendirilmesi, 6. Modelin Uygulanması ve 7. Güncelleme adımlarından oluşmaktadır [2]. Literatürde ve uygulamalarda görülmektedir ki, 2. ve 3. aşama olan Verinin Anlaşılması ve Verinin Hazırlanması bir projenin zamansal olarak % 75 ile % 80 ini içermektedir. Bu da bize veriye erişimin ve verinin kalitesinin ne kadar önemli olduğunu göstermektedir [3]. 2

2. Veri Madenciliğinde Kullanılan Yöntemler Bu çalışmada kullanılan veri madenciliği yöntemleri şunlardır: 2.1. Karar Ağaçları Adından da anlaşılabileceği gibi sonuçların ağaç görünümünde sunulduğu belirli bir durumu kestirme amaçlı yöntemlerdir. Karar ağacı yöntemini kullanarak verinin sınıflanması iki basamaklı bir işlemdir. İlk basamak öğrenme basamağıdır. Öğrenme basamağında önceden bilinen bir eğitim verisi, model oluşturmak amacı ile sınıflama algoritması tarafından çözümlenir. Öğrenilen model, sınıflama kuralları veya karar ağacı olarak gösterilir. İkinci basamak ise sınıflama basamağıdır. Sınıflama basamağında test verisi, sınıflama kurallarının veya karar ağacının doğruluğunu belirlemek amacı ile kullanılır. Eğer doğruluk kabul edilebilir oranda ise, kurallar yeni verilerin sınıflanması amacı ile kullanılır. Karar ağaçları yöntemi bir danışmanlı öğrenme yöntemi olarak değerlendirilir. Bu yöntemde, bir grup girdi (bağımsız) değişkenleri ile çıktı (bağımlı) değişkenin/değişkenlerin kestirilmesi amaçlanır. Karar ağaçlarında en sık kullanılan algoritmalar; C5.0, C&R Tree (The Classification and Regression Tree), QUEST (Quick, Unbiased, Efficient Statistical Tree) ve CHAID (Chi-squared Automatic Interaction Detection) şeklinde sıralanmaktadır [1,3,8]. 2.2. Kümeleme Yöntemleri Nesnelerin (gözlemlerin) kendilerini ya da diğer nesnelerle (gözlemlerle) olan ilişkilerini kullanarak gruplara ayırma işlemine kümeleme denir. Kümelemede amaç; nesneleri (gözlemleri) kendi içinde homojen, kendi aralarında heterojen olacak şekilde gruplar oluşturmaktır. Kümeleme analizi benzer gruplar oluşturmak için kullanılmakla birlikte aykırı değerlerin tespiti için de kullanılmaktadır. Kümeleme yöntemlerinde grupları belirlemede hiyerarşik kümeleme ve hiyerarşik olmayan kümeleme yaklaşımları kullanılır. Bu çalışmada kullanılan yöntem, bir hiyerarşik olmayan kümeleme yöntemi olan K-Means tir. Bu yöntemde ilk olarak çözümleyicinin iş bilgisine ve tecrübesine dayanılarak karar verilen küme sayısı belirlenir. Daha sonra her kümenin tipik bir gözlemi seçilir. Benzer gözlemler, tipik gözlemin etrafında birer birer kümelendirilir. Küme içi varyansın minimum ve kümeler arası varyansın maksimum olduğu gruplara ulaşılıncaya kadar işlemler devam eder [1,5]. Bu çalışma ile T.C. Sağlık Bakanlığı na bağlı hastanelerin performans değerlendirmesine esas olacak sınıflandırılması amaçlanmıştır. 3

GEREÇ ve YÖNTEM Çalışmada T.C. Sağlık Bakanlığı na bağlı 863 hastanenin Temmuz 2007 ye ait toplam 193 değişken kullanılarak; Acil servisler açısından, Çocuk hastalıkları klinik servisleri açısından, Dahili hastalıklar klinik servisleri açısından (iç hastalıkları, göğüs hastalıkları, kardiyoloji, enfeksiyon ve onkoloji), Cerrahi genel hastalıkları klinik servisleri açısından (genel cerrahi, beyin cerrahisi, kalp damar, plastik cerrahi, ortopedi ve kbb), Kadın hastalıkları klinik servisleri açısından, hastanelerin gruplanması ve bunların karşılaştırılması amaçlanmış ve bunun için veri madenciliğine karar verilmiştir. Veri madenciliği programı olarak SPSS Clementine 11.1 (SPSS Inc., Chicago, USA) paket programı kullanılmıştır. Analiz edilecek veriler farklı veri kaynaklarında yer aldıklarından bu kaynaklar merge işlemcisi ile birleştirilerek tek bir veri kaynağı haline getirilmiştir (Şekil 1). Analize başlamadan önce Data Audit ile verinin genel yapısı incelenmiş; min, max, ortalama ve geçerli kayıt sayıları tespit edilmiştir. Sınıflama için yukarıdaki beş ana başlık tespit edilmiştir. Genel bir sınıflama yapabilmek için her bir kliniğe ilişkin branşı ilgilendiren birimlerden birim skorları, birim skorlarından genel skorlar elde edilmiş ve bu genel skorlar da kümeleme analizinde kullanılmıştır. Örnek olarak; cerrahi genel hastalıklar kliniği birim skoru için ameliyathane, diğer tıbbi cihaz, görüntüleme cihaz ve hizmetleri, hizmet durumu ve personel bilgileri ile ilişkili değişkenler kullanılmıştır (Şekil 2). 4

Şekil 1. Verilerin Hazırlanması çalışmaları şeması Şekil 2. Klinik Skorları İçin Uygulanan Süreç Modelleme için yukarıda anlatılan yöntemler kullanılmıştır. Bunlar; skorları ve genel skorları elde edebilmek için karar ağaçları (C&RT), bu genel skorlardan grupları elde edebilmek için ise kümeleme yöntemidir (K-Means). 5

Beş ana başlık altında bulunan bölümler için karar ağacı ve kümele analizi sonuçları Şekil 3. Şekil 11. de verilmiştir. Şekil 2. de de ifade edildiği gibi klinik skorlarını elde etmek için uygulanan süreç Şekil 3. de yer alan karar ağacı gibi tek bir yapı değildir. Her bir bölüm için karar ağacı sonuçlarının bir kısmı bu bildiride verilmiştir. Acil Servisler İçin Karar Ağacı Şekil 3. de de görüldüğü gibi acil servislerde muayene sayısını etkileyen en önemli değişken (görüntüleme cihazları açısından) faal olarak kullanılan tomografi cihazı olarak belirlenmiştir. Faal tomografi cihazı olmayan hastanelerde en önemli değişken faal seyyar röntgen iken, faal tomografi cihazı bulunan hastanelerde en önemli değişken faal röntgen cihazıdır. İşaretli işlemcinin (ağaç şeklinde sağ alt köşede) yorumu şu şekildedir; faal tomografi cihazı bulunan ve beşin üzerinde faal röntgen cihazı bulunan hastanelerde acil muayene sayısı 19764,816 dır. Şekil 3. Görüntüleme Cihazı Değişkenine Göre Karar Ağacı Sonucu (Acil Servis) 6

Çocuk Hastalıkları Klinik İçin Karar Ağacı Şekil 4. Görüntüleme Cihazı Değişkenine Göre Karar Ağacı Sonucu (Çocuk Hastalıkları) Çocuk hastalıkları kliniklerinde muayene sayısını etkileyen en önemli değişken (görüntüleme cihazları açısından) faal olarak kullanılan usg cihazı olarak belirlenmiştir. Faal usg cihazı üçün üzerinde olduğu hastanelerde en önemli değişken faal çok kollu röntgen cihazıdır. İşaretli işlemcinin (ağaç şeklinde sağ alt köşede) yorumu şu şekildedir; faal usg cihazı üçün üzerinde olduğu ve faal çok kollu röntgenin olduğu hastanelerde çocuk hastalıkları kliniklerindeki muayene sayısı 130,688 dir (Şekil 4.). 7

Dahili Hastalıklar Klinik İçin Karar Ağaçları Şekil 5. Ameliyathane Değişkenine Göre Karar Ağacı Sonucu (Dahili Hastalıklar) Dahili hastalıkları kliniklerinde muayene sayısını etkileyen en önemli değişken (ameliyathane değişkeni açısından) anestezi cihazı olarak belirlenmiştir. Aneztezi cihazının yedinin altında veya üstünde olduğu hastanelerde en önemli değişken aktif salon sayısıdır. İşaretli işlemcinin (ağaç şeklinde sol alt köşede) yorumu şu şekildedir; anestezi cihazı yedinin altında olduğu ve aktif salon sayısının dördün altında olduğu hastanelerde dahili hastalıklar kliniklerindeki muayene sayısı 44,102 dir (Şekil 5.). 8

Cerrahi Genel Hastalıkları Klinik Servisleri İçin Karar Ağaçları Şekil 6. Ameliyathane Değişkenine Göre Karar Ağacı Sonucu (Cerrahi Genel Hastalıklar) Cerrahi genel hastalıkları kliniklerinde muayene sayısını etkileyen en önemli değişken (ameliyathane değişkeni açısından) aktif salon olarak belirlenmiştir. Aktif salon sayısının altının altında veya üstünde olduğu hastanelerde en önemli değişken ameliyat masası sayısıdır. İşaretli işlemcinin (ağaç şeklinde sol alt köşede) yorumu şu şekildedir; aktif salon sayısının altının altında olduğu ve amaliyat masası sayısının dördün altında olduğu hastanelerde cerrahi genel hastalıkları kliniklerindeki muayene sayısı 40,592 dir (Şekil 6.). 9

Kadın Hastalıkları Klinik Servisleri İçin Karar Ağaçları Kadın hastalıkları kliniklerinde muayene sayısını etkileyen en önemli değişken (ameliyathane değişkeni açısından) anestezi cihazı olarak belirlenmiştir. Aneztezi cihazının ikinin altında olduğu hastanelerde en önemli değişken aktif salon sayısıdır. İşaretli işlemcinin (ağaç şeklinde sol alt köşede) yorumu şu şekildedir; anestezi cihazının ikinin altında olduğu ve aktif salon sayısının birin altında olduğu hastanelerde kadın hastalıklar kliniklerindeki muayene sayısı 13,376 dır (Şekil 7.). Şekil 7. Ameliyathane Değişkenine Göre Karar Ağacı Sonucu (Kadın Hastalıkları) 10

Kümeleme Analizi Şekil 8. Kümeleme Analizinde İzlenen Süreç Daha önceki bölümlerde de anlatıldığı gibi, kümeleme analizinden önce klinikler için skorlar elde edilmiş ve daha sonra bu skorlar kullanılarak kümeleme analizi yapılmıştır. Kümeleme analizinin detaylarına girilmediği bu çalışmada elde edilen kümelerden bazıları ve kümelerde bulunan hastaneler aşağıdaki tablolarda örnek olarak sunulmuştur. Şekil 9. Birinci Kümede Yer Alan Hastaneler 11

Şekil 10. Beşinci Kümede Yer Alan Hastanelerin Bazıları Şekil 11. Kümelerde Bulunan Hastane Sayıları 12

SONUÇ ve TARTIŞMA Bu veri madenciliği uygulaması sonucunda, tüm hastanelerin gruplanmış listesi görsel olarak incelendiğinde tecrübelerimizle çok büyük oranda örtüşen sonuçlar elde edilmiştir. Şöyle ki; en yüksek kapasiteye sahip hastaneler grubunda Şekil 9. da da görülen Eğitim ve Araştırma Hastaneleri ile Antalya ve Denizli Devlet Hastaneleri gibi büyük hastaneler yer almaktadır. Buna karşılık Şekil 10. da verilen hastanelerin ise genelde daha düşük kapasiteyle çalışan hastaneler olduğu saptanmıştır. Bulgularda Kadın Hastalıkları Kliniği incelemesinde Iğdır Kadın Doğum ve Çocuk Hastanesi Kliniklerinin ilk kümesinde yer alması iş bilgisi ile çelişki oluşturmaktaydı. Bu durum Data Audit çalışmasının önemini vurgulamakla beraber yapılan incelemelerde ismi geçen hastanenin kayıtlarında hata olduğu tespit edilmiş ve doğru veriler elde edildikten sonra tüm analizler tekrarlanmıştır. KAYNAKLAR [1] Adriaans, P., Zantinge, D., Data Mining, Harlow: Addison Wesley Longman Limited, 159p; 1996. [2] CRISP-DM, http://www.crisp-dm.org [3] Dolgun, M.Ö., Zor, İ., Bir Alışveriş Merkezinden Yapılan Satışlar İçin Sepet Analizi, Bilişim 06 2006. [4] Dolgun, M.Ö., Büyük Alışveriş Merkezleri İçin Veri Madenciliği Uygulamaları (Yüksek Lisans Tezi). Ankara: Hacettepe Üniversitesi Fen Bilimleri Enstitüsü; 2006. [5] Han, J., Kamber, M., Data Mining: Concepts and Techniques, San Francisco: Morgan Kaufmann Publishers; 2001. [6] Mackinnon, M.J., Glick, N., Data Mining and Knowledge Discovery in Databases-An Overview, Australian & New Zealand Journal of Statistics, 1999, 41, 3, 255-275. [7] Shaw, M.J., Subramaniam, C., Tan, G.W., Welge, M.E., Knowledge management and data mining for marketing, Decision Support Systems, 2001, 31, 127-137. [8] Güzel Özdemir, T., Dolgun, M.Ö., Şatır, U., Deliloğlu, S., Korkmaz, H.E., 2005 Yılı Öğrenci Seçme Sınavı (ÖSS) Verileri Kullanılarak Öğrenci Profilinin Belirlenmesi, 5. İstatistik Kongresi, 2007. 13