Firma Başarısızlığı Tahminlemesi: Makine Öğrenmesine Dayalı Bir Uygulama

Benzer belgeler
2005 Gazi Üniversitesi Endüstriyel Sanatlar Eğitim Fakültesi Dergisi Sayı:16, s31-46

Makine Öğrenmesi 10. hafta

ÇOKLU REGRESYON MODELİ, ANOVA TABLOSU, MATRİSLERLE REGRESYON ÇÖZÜMLEMESİ,REGRES-YON KATSAYILARININ YORUMU

ARAŞTIRMA MAKALESİ/RESEARCH ARTICLE TEK ÇARPIMSAL SİNİR HÜCRELİ YAPAY SİNİR AĞI MODELİNİN EĞİTİMİ İÇİN ABC VE BP YÖNTEMLERİNİN KARŞILAŞTIRILMASI ÖZ

NİTEL TERCİH MODELLERİ

Korelasyon ve Regresyon

ENDÜSTRİNİN DEĞİŞİK İŞ KOLLARINDA İHTİYAÇ DUYULAN ELEMANLARIN YÜKSEK TEKNİK EĞİTİM MEZUNLARINDAN SAĞLANMASINDAKİ BEKLENTİLERİN SINANMASI

KIRMIZI, TAVUK VE BEYAZ ET TALEBİNİN TAM TALEP SİSTEMİ YAKLAŞIMIYLA ANALİZİ

Bulanık Mantık ile Hesaplanan Geoid Yüksekliğine Nokta Yüksekliklerinin Etkisi

Kar Payı Politikası ve Yaşam Döngüsü Teorisi: İMKB İmalat Sektöründe Ampirik Bir Uygulama

Şiddet-Süre-Frekans Bağıntısının Genetik Algoritma ile Belirlenmesi: GAP Örneği *

YÖNETİM VE EKONOMİ Yıl:2006 Cilt:13 Sayı:1 Celal Bayar Üniversitesi İ.İ.B.F. MANİSA

FARKLI REGRESYON YÖNTEMLERİ İLE BETA KATSAYISI ANALİZİ

Doğrusal Korelasyon ve Regresyon

PARÇALI DOĞRUSAL REGRESYON

Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi Pamukkale University Journal of Engineering Sciences

Muhasebe ve Finansman Dergisi

BANKACILIKTA ETKİNLİK VE SERMAYE YAPISININ BANKALARIN ETKİNLİĞİNE ETKİSİ

DEĞİŞKEN DÖVİZ KURLARI ORTAMINDA GLOBAL BİR ŞİRKETTEKİ ESNEKLİĞİN DEĞERİ VE OPTİMUM KULLANIMI

HAFTA 13. kadın profesörlerin ortalama maaşı E( Y D 1) erkek profesörlerin ortalama maaşı. Kestirim denklemi D : t :

PÜRÜZLÜ AÇIK KANAL AKIMLARINDA DEBİ HESABI İÇİN ENTROPY YÖNTEMİNİN KULLANILMASI

Hasar sıklıkları için sıfır yığılmalı kesikli modeller

HİSSE SENETLERİNİN BEKLENEN GETİRİ VE RİSKLERİNİN TAHMİNİNDE ALTERNATİF MODELLER

TÜRKİYE DEKİ ÖZEL BANKALARIN FİNANSAL PERFORMANSLARININ KARŞILAŞTIRILMASI: DÖNEMİ. Fatih ECER *

kadar ( i. kaynağın gölge fiyatı kadar) olmalıdır.

Meteorolojik Verilerin Yapay Sinir Ağları Đle Modellenmesi

AHP AND GRA INTEGRATED APPROACH IN INNOVATION PERFORMANCE REVIEW PROCESS: AN APPLICATION IN DAIRY INDUSTRY

Prof. Dr. Nevin Yörük - Yrd. Doç. Dr. S. Serdar Karaca Yrd. Doç. Dr. Mahmut Hekim - Öğr. Grv. İsmail Tuna

PROJE SEÇİMİ VE KAYNAK PLANLAMASI İÇİN BİR ALGORİTMA AN ALGORITHM FOR PROJECT SELECTION AND RESOURCE PLANNING

UYUM ĐYĐLĐĞĐ TESTĐ. 2 -n olup. nin dağılımı χ dir ve sd = (k-1-p) dir. Burada k = sınıf sayısı, p = tahmin edilen parametre sayısıdır.

a IIR süzgeç katsayıları ve N ( M) de = s 1 (3) 3. GÜRÜLTÜ GİDERİMİ UYGULAMASI

TÜKETİCİ TATMİNİ VERİLERİNİN ANALİZİ: YAPAY SİNİR AĞLARI ve REGRESYON ANALİZİ KARŞILAŞTIRMASI

TOPSIS ÇOK KRİTERLİ KARAR VERME SİSTEMİ: TÜRKİYE DEKİ KAMU BANKALARI ÜZERİNE BİR UYGULAMA

UYGULAMA 2. Bağımlı Kukla Değişkenli Modeller

BIST da Demir, Çelik Metal Ana Sanayii Sektöründe Faaliyet Gösteren İşletmelerin Finansal Performans Analizi: VZA Süper Etkinlik ve TOPSIS Uygulaması

FARKLI VERİ YAPILARINDA KULLANILABİLECEK REGRESYON YÖNTEMLERİ

AYLIK ORTALAMA GÖL SU SEVİYESİNİN BULANIK-OLASILIK YAKLAŞIMI İLE GÖZLENMİŞ ZAMAN SERİSİNDEN TAHMİNİ

Tuğla Duvardaki ve Tesisattaki Isı Kaybının Yapay Sinir Ağları İle Belirlenmesi

TAŞIMACILIK SEKTÖRÜNÜN İŞLEYİŞ SÜRECİ, BULANIK DAĞITIM PROBLEMİNİN TAMSAYILI DOĞRUSAL PROGRAMLAMA MODEL DENEMESİ

Türkiyede ki ĠĢ Kazalarının Yapay Sinir Ağları ile 2025 Yılına Kadar Tahmini

İyi Tarım Uygulamaları Ve Tüketici Davranışları (Logit Regresyon Analizi)(*)

BULANIK AKIŞ TİPİ ÇİZELGELEME PROBLEMİ İÇİN ÇOK AMAÇLI GENETİK ALGORİTMA

X, R, p, np, c, u ve diğer kontrol diyagramları istatistiksel kalite kontrol diyagramlarının

LOJİSTİK REGRESYON VE CART ANALİZİ TEKNİKLERİYLE SOSYAL GÜVENLİK KURUMU İLAÇ PROVİZYON SİSTEMİ VERİLERİ ÜZERİNDE BİR UYGULAMA. Zeynep Burcu KIRAN

Journal of Engineering and Natural Sciences Mühendislik ve Fen Bilimleri Dergisi

Asimetri ve Basıklık Ölçüleri Ortalamalara dayanan (Pearson) Kartillere dayanan (Bowley) Momentlere dayanan asimetri ve basıklık ölçüleri

ALGILANAN HİZMET KALİTESİ VE LOJİSTİK REGRESYON ANALİZİ İLE HİZMET TERCİHİNE ETKİSİNİN BELİRLENMESİ. Özet

Sistemde kullanılan baralar, klasik anlamda üç ana grupta toplanabilir :

ROTASYON ORMAN ALGORİTMASI İLE YÜKSEK ÇÖZÜNÜRLÜKLÜ MULTİSPEKTRAL UYDU GÖRÜNTÜLERİNİN SINIFLANDIRILMASI

Antalya Đlinde Serada Domates Üretiminin Kâr Etkinliği Analizi

Öğretim planındaki AKTS TASARIM STÜDYOSU IV

Atatürk Üniversitesi İktisadi ve İdari Bilimler Dergisi, Cilt: 25, Sayı: 1,

K-Ortalamalar Yöntemi ile Yıllık Yağışların Sınıflandırılması ve Homojen Bölgelerin Belirlenmesi *

SEK Tahmincilerinin Arzulanan Özellikleri. SEK Tahmincilerinin Arzulanan Özellikleri. Ekonometri 1 Konu 9 Sürüm 2,0 (Ekim 2011)

SEK Yönteminin Güvenilirliği Sayısal Bir Örnek. Ekonometri 1 Konu 11 Sürüm 2,0 (Ekim 2011)

4.5. SOĞUTMA KULELERİNİN BOYUTLANDIRILMASI İÇİN BİR ANALIZ

KURUMSAL FİRMALAR İÇİN BİR FİNANSAL PERFORMANS KARŞILAŞTIRMA MODELİNİN GELİŞTİRİLMESİ

Deney No: 2. Sıvı Seviye Kontrol Deneyi. SAKARYA ÜNİVERSİTESİ Dijital Kontrol Laboratuvar Deney Föyü Deneyin Amacı

Bulanık TOPSIS ve Bulanık VIKOR Yöntemleriyle Alışveriş Merkezi Kuruluş Yeri Seçimi ve Bir Uygulama

Yapay Sinir Ağı ve Bulanık-Yapay Sinir Ağı Yöntemleri Kullanılarak Tava Buharlaşma Tahmini

KENTSEL ALANDA ET TALEP ANALİZİ: BATI AKDENİZ BÖLGESİ ÖRNEĞİ. Dr. Ali Rıza AKTAŞ 1 Dr. Selim Adem HATIRLI 2

Söke İşletme Fakültesi Priene Uluslararası Sosyal Bilimler Dergisi

TEDARİKÇİ SEÇİMİNDE ANALİTİK HİYERARŞİ PROSESİ VE HEDEF PROGRAMLAMA YÖNTEMLERİNİN KOMBİNASYONU: OTEL İŞLETMELERİNDE BİR UYGULAMA

EMG İşaretlerinin K-Ortalama Algoritması Kullanılarak Öbekleştirilmesi. EMG Signal Analysis Using K-Means Clustering

DEÜ MÜHENDİSLİK FAKÜLTESİ MÜHENDİSLİK BİLİMLERİ DERGİSİ Cilt: 16 Sayı: 48 sh Eylül 2014 KRİL SÜRÜSÜ ALGORİTMASI İLE ATÖLYE ÇİZELGELEME

YARIPARAMETRİK KISMİ DOĞRUSAL PANEL VERİ MODELLERİYLE ULUSLAR ARASI GÖÇ

Çok ölçütlü karar verme yaklaşımlarına dayalı tedarikçi seçimi: elektronik sektöründe bir uygulama

BÖLÜM 1 1.GİRİŞ: İSTATİSTİKSEL DOĞRUSAL MODELLER

dir. Bir başka deyişle bir olayın olasılığı, uygun sonuçların sayısının örnek uzaydaki tüm sonuçların sayısına oranıdır.

Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ

GRİ İLİŞKİSEL ANALİZ YÖNTEMİNE GÖRE FARKLI SERTLİKLERDE OPTİMUM TAKIM TUTUCUSUNUN BELİRLENMESİ

Şehiriçi Karayolu Ağlarının Sezgisel Harmoni Araştırması Optimizasyon Yöntemi ile Ayrık Tasarımı *

Bulanık Analitik Hiyerarşi Süreci ve İdeal Çözüme Yakınlığa Göre Sıralama Yapma Yöntemleri ile Tekstil Sektöründe Finansal Performans Ölçümü

Kİ KARE ANALİZİ. Doç. Dr. Mehmet AKSARAYLI Ki-Kare Analizleri

Sıklık Tabloları ve Tek Değişkenli Grafikler

Kısa Vadeli Sermaye Girişi Modellemesi: Türkiye Örneği

DOĞRUSAL HEDEF PROGRAMLAMA İLE BÜTÇELEME. Hazırlayan: Ozan Kocadağlı Danışman: Prof. Dr. Nalan Cinemre

MESLEK SEÇİMİ PROBLEMİNDE ÇOK ÖZELLİKLİ KARAR VERME VE ÇÖZÜME YÖNELİK GELİŞTİRİLEN BİREYSEL KARİYER PLANLAMA PROGRAMI

YAYILI YÜK İLE YÜKLENMİŞ YAPI KİRİŞLERİNDE GÖÇME YÜKÜ HESABI. Perihan (Karakulak) EFE

Farklı Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = σ i2. Eşit Varyans. Hata. Zaman

Dersin Yürütülmesi Hakkında. (Örgün / Yüz Yüze Eğitim için) (Harmanlanmış Eğitim için) (Uzaktan Eğitim için)

AN IMPLEMENTATION OF INTEGRATED MULTI-CRITERIA DECISION MAKING TECHNIQUES FOR ACADEMIC STAFF RECRUITMENT

Akademik Sosyal Araştırmalar Dergisi, Yıl: 4, Sayı: 30, Eylül 2016, s

TEKNOLOJĐK ARAŞTIRMALAR

Toplam Eşdeğer Deprem Yükünün Hesabı Bakımından 1975 Deprem Yönetmeliği İle 2006 Deprem Yönetmeliğinin Karşılaştırılması

Sabit Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = s 2

A İSTATİSTİK. 4. X kesikli rasgele (random) değişkenin moment çıkaran. C) 4 9 Buna göre, X in beklenen değeri kaçtır?

PROJE PLANLAMASINDA BULANIK HEDEF PROGRAMLAMA YAKLAŞIMI. Müh. Ramadan VATANSEVER

Farklı Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = s 2 Eşit Varyans

Metin Madenciliği ile Soru Cevaplama Sistemi

FAKTÖR A ALĐZ SKORLARI KULLA ILARAK KARAYAKA KUZULARI DA CA LI AĞIRLIK TAHMĐ Đ

Kİ-KARE TESTLERİ. şeklinde karesi alındığında, Z i. değerlerinin dağılımı ki-kare dağılımına dönüşür.

Çok Kriterli Karar Verme Teknikleriyle Lojistik Firmalarında Performans Ölçümü

TEKNOLOJİ, PİYASA REKABETİ VE REFAH

Makine Öğrenmesi 6. hafta

Basel II Geçiş Süreci Sıkça Sorulan Sorular

Tek Yönlü Varyans Analizi

Hisse Senedi Fiyatları ve Fiyat/Kazanç Oranı Đlişkisi: Panel Verilerle Sektörel Bir Analiz *

Çarpımsal Ceza Modeli İle Tamsayılı Programlama

Mut Orman İşletmesinde Karaçam, Sedir ve Kızılçam Ağaç Türleri İçin Dip Çap Göğüs Çapı İlişkileri

Transkript:

BİLİŞİM TEKOLOJİLERİ DERGİSİ, CİLT: 9, SAY: 1, OCAK 016 1 Frma Başarısızlığı Tahmnlemes: Makne Öğrenmesne Dayalı Br Uygulama T. Şükrü YAPRAKL 1, Hamt ERDAL * 1 Atatürk Ünverstes, İİBF, İşletme Bölümü, Erzurum, Türkye Atatürk Ünverstes, Sosyal Blmler Ensttüsü, Üretm Yönetm ve Pazarlama Blm Dalı, Erzurum, Türkye sukruyaprakl@ataun.edu.tr, hamt_erdal@hotmal.com (Gelş/Receved: 1.0.015; Kabul/Accepted: 5.09.015) DO: 10.17671/btd.1000 Özet Frma rsk proflnn belrlenmes, lteratürde frma başarısızlığı kavramlarıyla ncelenmektedr. Bu konu üzernde, özellkle 199 büyük buhranı sonrasında çok öneml çalışmalar yapılmıştır. Başlarda, rskl ve başarılı frmaların fnansal göstergeler arasındak farklılıklara yoğunlaşılırken, özellkle blşm teknololerndek gelşmlere paralel olarak son yıllarda blşm sstemlernden elde edlen verler frma başarısızlığı tahmnlemesnde en öneml bleşenlernden br olmuştur. Özellkle, makne öğrenmes yöntemlernn bu alanda kullanılmaya başlanmasıyla frma başarısızlığının tahmn edlmesnde öneml yol kat edlmştr. Bu çalışmada Erzurum lnde 3 yıldır faalyet gösteren nşaat malzemeler toptancısı br frmanın müşterlernn vadel borçlarını ödeme/ödememe rskler frma başarısızlığı kapsamında ele alınmış ve frma başarısızlığının tahmnnde uygun br makne öğrenmes yöntem araştırılmıştır. Probleme etk eden değşkenler Temel Bleşenler Analz (TBA) le ortaya konulmuştur. Son yıllarda makne öğrenmesnde oldukça gelşmekte olan Yapay Snr Ağları () ve Destek Vektör Makneler () nn TBA yöntemyle beraber kullanımıyla oluşturulan hbrt modellern bu tahmnde uygulanablrlğ ncelenmş ve tahmn performansları yalın ve ler le karşılaştırılmıştır. TBA le bütünleşk olarak kullanılan hbrt modellern tahmn başarısının yalın ve lere oranla daha tatmn edc sonuçlar verdğ görülmüştür. Özellkle modelnn frma başarısızlığı tahmnlemesnde alternatf br yöntem olarak etkn br şeklde kullanılableceğ sonucuna varılmıştır. Anahtar Kelmeler Frma Başarısızlığı, Makne Öğrenmes, Sınıflandırma, Temel Bleşenler Analz, Yapay Snr Ağları, Destek Vektör Makneler Frm Falure Predcton: A Case Study Based On Machne Learnng Abstract The determnaton of frm rsk profle s nvestgated n lterature wth the concepts of frm falure. Regardng ths ssue, especally after the great depresson of 199, crucal studes were performed. n the begnnng, whle concentrate on dfferences between fnancal ndcators of rsky and successful frms, the data obtaned from nformaton technologes partcularly were one of the prmary components of frm falure predcton n parallel wth developments n nformaton technologes. Especally, sgnfcant way on frm falure predcton has got over dependng on usng machne learnng methods n ths area. n ths study, payment/non-payment ordnary hazards about tme loans of customers of a buldng materal wholesaler frm whch has been n servce for 3 years n Erzurum, handled the subect wthn scope of frm falure and a sutable machne learnng method has been nvestgated n frm falure predcton. The varables that have an effect on the problem was determned wth Prncpal Components Analyss (PCA). n recent years, rather developng machne learnng methods; Artfcal eural etworks (A) and Support Vector Machnes (SVMs) s applcabltes for the predcton, handled n ths study, are beng nvestgated wth generatng hybrd models by usng PCA and obtaned results are compared wth the stand-alone A and s. t s obtaned that predcton success of hybrd methods, generated wth PCA, have been found more satsfactory than stand-alone A and s. t s concluded that especally the PCA-SVM hybrd model can be used effectvely as an alternatve method n frm falure predcton. Keywords Frm Falure, Machne Learnng, Classfcaton, Prncpal Components Analyss, Artfcal eural etworks, Support Vector Machnes

BİLİŞİM TEKOLOJİLERİ DERGİSİ, CİLT: 9, SAY: 1, OCAK 016 1. GİRİŞ (TRODUCTO) Frma rskllğnn ncelenmesnde frmaların fnansal ve operasyonel verler, yapılacak rsk analzlernn grdsn oluşturmaktadır. Bu verlern gerek sektör bazında br araya getrlerek sektör eğlmler hakkında, gerekse frma bazında ncelenmesyle frmaların olası davranışları hakkında blg ednmek mümkündür. Günümüzde frmaların müşter sayılarının hızla artmış olması bu frmaların değerlendrme sürecnde gerçekleştrlen breysel analzlern yerne statstksel ve daha ler makne öğrenmes yöntemler kullanılarak daha obektf, hızlı ve tutarlı kararlar alınabldğ gözlenmştr. Özellkle Çek Kanununda Değşklk Yapılmasına Dar Kanun un 03.0.01 tarhnde yürürlüğe grmesyle beraber karşılıksız çeke lşkn haps cezası kaldırılmış (madde 5), caydırıcılık vasfının azalmasıyla da frmaların müşter değerlendrmeler son derece öneml br hal almıştır. Bu çalışmada, Erzurum lnde 3 yıldır faalyet gösteren br nşaat malzemeler toptancısı frmanın müşters 157 frmanın verler kullanılarak,,, ve yöntemler le borçlarını ödeme ve ödememe olasılıkları frma başarısızlığı kapsamında ele alınmış ve hang müşterlere vadel satış yapılmasına karar verleblmes çn frma başarısızlığı tahmnlemes gerçekleştrlmştr. Burada dkkat edlmes gereken en öneml konu vadel satış yapılacak frmanın borcunu ödeyeceğnn veya ödemeyeceğnn olasılık olarak blnmes ve ödememe rsk yüksek olan frmalara vadel satış yapılmaması, aynı zamanda ödeme olasılığı olduğu halde vadel satış yapmamak arasındak dengenn doğru kurulması gerekmektedr. Brnc durum Tp-1 hata, knc durum se Tp- hata olarak blnmektedr. Tp-1 hatayı mnmze etmek çn çok keskn davranmak potansyel müşterlere satış yapmamaya neden olacaktır. Tp- hatanın yüksek olması se potansyel olarak, kâr edleblecek müşterlern kaçırılmasına neden olacaktır. Bu çalışmada; statstk, makne öğrenmes ve snr ağlarından çeştl teknkler brleştren ler le nsan beynnn snr sstemnn çalışma şeklnn smüle edlmesyle blg şleme fonksyonundan esnlenerek gelştrlen ların, frma başarısızlığı tahmnlemesnde kullanılablrlğ araştırılmıştır. Probleme tesr ettğ değerlendrlen faktörler çn TBA analz gerçekleştrlerek ver setnn boyutları, ver çersnde var olan değşmler mümkün olduğunca korunarak daha az boyuta ndrgenmştr. Bu kapsamda gelştrlen ve hbrt modeller le daha fazla tatmn edc tahmn sonuçları elde edlmş ve bu dört yöntemle elde edlen sonuçlar karşılaştırılmıştır. Çalışmanın yöntemn oluşturan ve ler el yazısı tanıma, ses tanıma, yüz tanıma, obe tanıma, bonformatk, fnansal tahmn gb pek çok alanda başarıyla kullanılmaktadır.. LİTERATÜR TARAMAS (LTERATURE REVEW) Frmaların fnansal başarısızlıklarının tahmn htyacı, özellkle son yıllarda meydana gelen küresel frmaların flası ve Basel Anlaşmasının getrdğ kred rskne bağlı sermaye yeterllğ ölçütüyle beraber büyük önem kazanmıştır [1]. Frma başarısızlığının tahmnne yönelk çabaların uzun zamandır devam etmesne rağmen, frmaların neden başarısız olduklarına dar genel kabul gören kuramsal br altyapı henüz oluşturulamamıştır. Wlcox [], kuramsal çerçeve eksklğnn, frmalarla lgl yeterl ve doğru blg elde edlememesne yol açtığını ve doğal olarak doğru br genelleme yapılamadığını öne sürmektedr. Bu kapsamda, frma başarısızlığının tahmnnde kullanılacak değşkenlern belrlenmesnde daha çok amprk özellkler öne çıkmaktadır. Reel sektör frmalarında başarısızlığın önceden tahmn edlmes htyacı ve başarısızlığın tahmnne yönelk erken kaz modellernn tasarımı yolunda en erken çabalar, 199 büyük buhranından sonra ortaya çıkmıştır. 194 yılında Merwn tarafından başarısız frmaların fnansal oranlarının başarılılardan farklı olduğunu ortaya konmuştur. 1966 da Beaver sonrak çalışmalara öneml br temel teşkl edecek Tek Değşkenl Analz gelştrmştr. Beaver a göre tek değşkenl analz orta sevyede br tahmn başarısı göstereblmektedr. Ertes yıl 1967 de eter başarısızlığın tahmnnde çok değşkenl br modellemenn daha doğru sonuçlar vereceğn savunmuş ve tek değşkenl analzn frma başarısızlığının tahmnne yönelk değşkenler belrleyebldğn fakat lntl rsk ölçmeye yönelk br ölçek sunamadığını belrtmştr [3]. Frma başarısızlığının modellenmesnde çığır açan lk çalışma, Altman [4] ın Çoklu Ayırım Analzdr. Bu çalışmada kullanılan örneklemn küçüklüğü çalışmanın genelleneblrlğne gölge düşürdüğünden Altman vd. [5] tarafından daha genelleneblr br ayırım analz model olan ZETA modeln gelştrlmştr. ZETA model br çok farklı sektörden her ölçektek frmaya uygulanabldğnden, ayırım analz brçok çalışmaya esn kaynağı olmuştur. Ayırım analz le başlayan tahmnleme çalışmaları; Meyer ve Pfer [6] n Regresyon Analz, Martn [7] n Logt Regresyonu, Ohlson [] un Lostk Regresyon, Zmewsk [9] nn Probt Analz ve West [10] n Faktör-Lostk Analz gb statstksel yöntemler le devam etmştr.

BİLİŞİM TEKOLOJİLERİ DERGİSİ, CİLT: 9, SAY: 1, OCAK 016 3 İlerleyen yıllarda bu yöntemlern yanına karar ağaçları eklenmş ve söz konusu statstksel yöntemlerden daha fazla tahmn başarısı elde edlmeye çalışılmıştır. Frydman vd. [11] başarısızlık sınıflandırmasında ynelemel bölümleme yöntemyle br ayırım ağacı gelştrmştr. Messer ve Hansen [1] karar ağacı teknğ le benzer br başarısızlık tahmn model önermştr. Sınıflandırma problemlernde makne öğrenmes yöntemlernn kullanılmaya başlanması ve yapay zekanın başat araştırma yöntemlernden br halne gelmesyle beraber yazarlar tarafından başarısızlık tahmn modellernde makne öğrenmes yöntemler etkn olarak kullanılmaya başlamıştır. Dmtras vd. [13], 193-1994 yılları arasında frma başarısızlığı konusunda yapılan çalışmaları taramıştır. Yazarlar frma başarısızlığı konusunda statstksel yöntemler arasında en fazla kullanılanların çoklu ayırım analz (multple dscrmnant analyss-mda) ve lostk regresyon analz (logstc regresson analyss-logt) olduğunu raporlamıştır. Lteratürde statstksel yöntemler arasında en fazla kullanılan bu k yöntemn sınıflandırma başarısı olarak benzer sonuçlar sunduğu Lo [14] ve Wu vd. [15] tarafından raporlanmıştır. Hammer [16] se LRA nın daha az kısıtlayıcı varsayım çermes nedenyle üstünlüğünü, Chartou vd. [17] se yne LRA nın frma başarısızlığını hesaplama yeteneğnn üstünlüğünü raporlamıştır. Lteratürde yakın geçmşte ve daha kapsamlı br tarama Rav Kumar ve Rav [1] tarafından yapılmıştır. Yazarlar, çalışmalarında 196-005 yılları arasında yapılan çalışmaları taramıştır. Çalışmalarında frma başarısızlığı tahmnlemes üzerne artık geleneksel statstksel yöntemlern tek başına kullanılmadığını, araştırmacıların daha çok yen makne öğrenmes yöntemlern kullanmaya başladığını raporlamıştır. Shn ve Lee [19] de sınıflandırma problemlernde, yen ve parametrk olmayan yöntemlern, özellkle ların geleneksel statstksel yöntemlern yern aldığını vurgulamıştır. Rav Kumar ve Rav [1] yaptıkları lteratür taramasında frma başarısızlığı lteratürünü; (1) statstksel yöntemler ve () uzman sstemler olmak üzere yöntemlerne göre k kategorye ayırmıştır. İstatstksel yöntemler arasında; doğrusal ayırma analz (lnear dscrmnant analyss- LDA), parametrk olmayan çoklu ayırım analz (nonparametrc multple dscrmnate analyss-pda), çok değşkenl ayırım analz (multvarate dscrmnate analyss-mda), karesel ayırım analz (quadratc dscrmnant analyss-qda), logt ve faktör analz (factor analyss-fa) yöntemlern ncelemştr. Uzman sstemler arasında se; yapay snr ağları- (artfcal neural networks-a), karar ağaçları-ka (decson trees), durum tabanlı çıkarsama (case-based reasonng-cbr), evrmsel yöntemler (evolutonary approaches), kaba küme teors (rough set theory-rst), hbrt uzman sstemler- HUS (soft computng veya hybrd ntellgent systems), yöneylem araştırması veya doğrusal programlama (operatonal research technques veya lneer programmng-lp), ver zarflama analz-vza (data envelopment analyss-dea), genetk algortma-ga (genetc algorthms-gas), gr lşk analz (grey relatonal analyss-gra), destek vektör makneler- (support vector machnes-svms) ve son olarak bulanık mantık (fuzzy logc-fl) yöntemlern ncelemştr. Lteratürde frma başarısızlığı tahmnleme çalışmalarında makne öğrenmes yöntemlernden; ve lern, doğrusal ve parametrk olmayan ver setler le de yüksek tahmn başarısı sundukları blnmektedr. Br çok çalışmada (ör; [0-1]) ların ve (ör; [- 4]) lern dğer geleneksel statstksel yöntemler ve makne öğrenmes yöntemlerne nazaran üstünlüğü raporlanmıştır. Tablo 1 de frma başarısızlığı konusunda lteratürde farklı yöntemlern kullanıldığı çalışmalardan örnekler sunulmuştur. Tablo 1. Frma başarısızlığı lteratürü (lterature of frm falure) Çalışma Örneklem Örneklem Yöntem Büyüklüğü Peryodu Altman vd. [5] 111 1969-1975 ZETA West [10] 1900 190-19 FA, Logt DA+DA, LRA+LRA, Back vd. [5] 74 196-199 GA+, DA+, LRA+ Barnv vd. [6] 37 190-1991, PDA, Logt Ahn vd. [7] 400 1994-1997 DA,, DA+ Ban ve Bulanık RST+, 37 - Mazlack [] bulanık Celen vd. [9] 366 1994-1996 LP+DA, VZA Yp [30] 44 1991-001 CBR, DA Andres vd. [31] 36 - LDA, Logt,, bulanık mantık Hua vd. [3] 10 1999-004 +Logt Ln vd. [33] 30 1999-006 CBR,RST,GRA Youn and Gu [34] 10 000-005 Logt, Chaudhur ve De [35] 50 001-00 Bulanık, L ve Sun [36] 135 007-010 CBR, Benhayoun vd. [37] 0 009-011 Gordn [3] 3100 - Logt,, GA Belková vd. [39] 160 1993-01 DA,Logt,KA Xu vd. [40] 40 000-01,,Logt 3. YÖTEM (METHOD) Bu bölümde, frma başarısızlığı tahmnlemesnde kullanılacak TBA, ve ler hakkında kısa açıklayıcı blgler sunulacaktır. 3.1. Temel Bleşenler Analz (Prncple Component Analyss) TBA, br ver setnn varyans-kovaryans yapısını, değşkenlern doğrusal brleşmler yardımıyla

4 BİLİŞİM TEKOLOJİLERİ DERGİSİ, CİLT: 9, SAY: 1, OCAK 016 açıklayarak, boyut ndrgemes ve yorumlanmasını sağlayan br, çok değşkenl statstksel yöntemdr [41]. TBA çok sayıda brbr le lşkl değşkenler çeren ver setnn boyutlarını ver çersnde varolan değşmlern mümkün olduğunca korunarak daha az boyuta ndrgenmesn sağlar [4]. Bu yönüyle TBA verdek gerekl özntelkler ortaya çıkarmada oldukça etkl br yöntemdr. Yüksek boyutlu verlerdek genel özellkler bularak boyut sayısının azaltılmasını ve vernn sıkıştırılmasını sağlar. Boyut azalmasıyla bazı özellkler kaybedleblr ama amaçlanan, bu kaybolan özellklern ver set hakkında çok az blg çeryor olmasıdır [43]. Benzer şeklde, aykırı değerlern varlığı, TBA yöntemnn vermllğn olumsuz yönde etkleyebleceğ söyleneblr [41]. Yöntem, eldek very daha az sayıda değşkenle fade edeblecek en y dönüşümü belrlemey amaçlar. Dönüşüm sonrasında elde edlen değşkenler lk değşkenlern temel bleşenler olarak adlandırılır. İlk temel bleşen varyans değer en büyük olandır ve dğer temel bleşenler varyans değerler azalacak şeklde sıralanır. Gürültüye karşı düşük hassasyet, bellek ve kapaste htyaçlarının azalması, az boyutlu uzaylarda daha etkn çalışması TBA nın temel avantaları arasında sıralanablr [43]. TBA nın uygulama adımları Stanmrova vd. [41] ve Sangün [44] ün çalışmalarında kapsamlı olarak ele alınmıştır. 3.. Yapay Snr Ağları (Artfcal eural etworks) nsan beynnn çalışma şeklnn smüle edlmesyle blg şleme fonksyonundan esnlenerek gelştrlmştr. İlk model 1943 yılında W. McCulloch ve W. Ptts tarafından sunulmuştur [45]. 194 yılında Wener Cybernetcs sml esernde, snrlern şlev ve çalışma prensplern, 1949 da se Hebb, Organzaton of Behavor sml esernde öğrenme le lgl temel teory ele almıştır. Hebb esernde, öğreneblen ve uyum sağlayablen snr ağları model çn temel oluşturacak Hebb Kuralı nı ortaya koymuştur [46]. 1957 yılında se F. Rosenblatt ın, nsan beynnn şlevlern modelleyeblmek amacıyla gelştrdğ tek katmanlı, eğtleblen ve tek çıkışlı br ağ model olan Perceptron dan sonra, le yapılan çalışmalar artış göstermştr [46]. da grd değerler le çıktı değerler arasındak fark aşağıda sunulan hata fonksyonu le elde edlr [47] ( : hedeflenen sonuç, E p 1 ( d p o o p ) : gerçekleşen sonuç). d (1) Ağırlıkları yenden düzenlemek çn hata fonksyonunun farkı kullanılır. p p E w. () w Bu denklemde η sabt (öğrenme oranı) çn herhang br değer atanablr. Ağırlıkların yenden düzenlenmes w ( t 1) w ( t).. (3) şeklnde yapılır. Bu denklemde w (t) : ağırlık, : düğümünün sonuç değer olableceğ gb, : düğümünün hata term de olablr. Br çıkış düğümü çn hata term ( ); o.1 o. d o (4) olarak elde edlr. hata term se ( o. 1 o düğümü br gzl düğüm olmak üzere ) ; k k w k olarak düzenlenr. Br moment termnn (α) eklenmes le ağırlık değşmler üzerne etk edleblr. w( t 1) w( t).( d o )..( w( t) w( t 1)) (6) 3.3. Destek Vektör Makneler (Support Vector Machnes) 1960 larda Vapnk tarafından teork temeller atılan ler, lk defa 1995 yılında br sınıflandırma problemnn çözümünde kullanılmıştır. ler en bast fadesyle sınıflandırma (classfcaton) ve regresyon (regresson) problemlernn analznde kullanılan br öğrenen maknedr [47]. ler esas olarak k grup örneklem arasındak mesafey maksmze eden optmum ayıraç hperdüzlem (hyperplane) le kl (bnary) sınıflandırma yaparlar. Hperdüzlemn sınırlarına (margns) en yakın grup elemanlarına destek vektörler (support vectors) denr [4]. ler fnans ve ekonomden [19,49] mühendslk uygulamalarına [50,51] kadar pek çok farklı alanda etkn olarak kullanılmaktadır. İk ayrı sınıfa (gruba) at toplam n sayıda elemanı olan br eğtm kümes Denklem (7) de sunulmuştur [47]. ( 1 1 n x, y ),...,( x n, y ), d x R, 1, 1 (5) y (7)

BİLİŞİM TEKOLOJİLERİ DERGİSİ, CİLT: 9, SAY: 1, OCAK 016 5 Eğtm kümesn kl sınıflandırablecek hperdüzlem formülü w. x b 0 şeklnde gösterleblr. Hperdüzlemn sınırları se Denklem (9) da fade edldğ gbdr. w. x b 1, y 1 w. x b 1, y 1 Denklem (9) aşağıdak gb genelleştrleblr. y ( w. x b) 1, 1,..., () (9) (10) Bu denklemde w ağırlık vektörü ve b eşk değer fade eder. Optmal ayıraç hperdüzlemn bulunması çn hperdüzlem sınırlarının maksmze edlmes gerekr. Bunun çn w (d) ağırlık vektörünün normu olan mnmze etmek çn lagrange çarpanları teorem kullanılır. d (11) w 1 L( w, b, ) w y ( w. x b) 1 (1) 1 Lagrange çarpanları teorem gereğ L( w, b, ) fonksyonunun uç noktaları, fonksyonun ve değerlerne göre türevlernn sıfıra eştlenmes le bulunur. 1 w 0 0, 1,..., (13) y 1 0 y x 0, 1,..., (14) olduğu noktalar destek vektörlerdr. KKT koşulları teorem kullanılarak Denklem (10) eştszlğnn 0 olduğu noktalarda aşağıdak eştlğe dönüştürülür. y ( w. x b) 1 0, 1,..., (15) 1 L( ) y y ( x x ) (16) 1 J 1 1 Denklem (14) ve (15), Denklem (1) de yerne konularak tekrar düzenlenrse, Denklem (16) elde edlr. L( ) fonksyonu, Denklem (13) e bağlı olarak maksmze edlerek çözüm bulunur. w w b İşlem yükünü azaltmak çn hartalama şlemnde çekrdek fonksyonları kullanılır. Çekrdek fonksyonu k parametreye sahptr. Bunlar; karmaşıklık parametres (the complexty parameter) C ve çekrdeğn üstellk değer (the exponent value) p dr. C ve p, lern doğruluk oranına etk eden k parametredr, aldıkları değerlere bağlı olarak sınıflandırma performansına etk ederler. Bu nedenle en y tahmn başarısını sunan C ve p parametrelernn bulunması çn çapraz-geçerllk uygulaması yapılır. 4. VERİ SETİ VE AALİZ (DATA SET AD AALYSS) Bu bölümde, öncelkle frma başarısızlığı tahmnlemes çn elde edlen ver set tanıtılacak, daha sonra uygulanan prosedürler açıklanarak analzler gerçekleştrlecek ve elde edlen sonuçlar yorumlanacaktır. Bu çalışmada frma başarısının tahmnlenmes çn önerlen metodolonn adımları Şekl 1.'de şematk olarak sunulmuştur. değşkenl ver set 3 değşkenl ver set TBA le ver set boyutunun azaltılması Şekl 1. Önerlen metodolonn şematk gösterm (Schematc representaton of the proposed methodology) 4.. Ver Set (Data Set) tahmnlemes tahmnlemes tahmnlemes tahmnlemes Tahmn sonuçlarının karşılaştırıl ması Bu çalışmada kullanılan ver set, Erzurum lnde 3 senedr faalyet yürüten br nşaat malzemeler toptancısı frmanın 157 müştersnn 006-013 yılları arasındak gerçek verler le oluşturulmuştur. Ver set hazırlanırken kayıp vers olmayan 157 müşternn verlernden yararlanılmıştır. 157 frmanın 1 zaman çersnde ödeme güçlüğüne düşmüş ve borçlarını ödeyememş müşterlerden oluşmaktadır. Lteratürde genellkle, kayıp verlerden kaynaklanan problemler gdermek çn kayıp verlern yerne değşkenlern ortalamalarının en yakın tamsayı değerler koyulduğu ve bu sorunun ortadan kaldırıldığı gözlenmektedr. Bu çalışmada se tahmn başarısının hassasyet bakımından kayıp verler barındıran örneklemler ver setne dahl edlmemştr.

6 BİLİŞİM TEKOLOJİLERİ DERGİSİ, CİLT: 9, SAY: 1, OCAK 016 Çalışmada frma başarısızlığının tahmnne yönelk olarak başlangıçta değşkenn kullanılması planlanmıştır. Bu değşkenlern belrlenmes sürecnde frma başarısızlığı lteratüründe kullanılan değşkenlern tarandığı Rav Kumar ve Rav [1] nn çalışmasından faydalanılmıştır. Yazarlar, çalışmalarında 196-005 yılları arasında yapılan 6 çalışmada kullanılan değşkenler ortayakoymuştur. Çalışmada değerlendrmeye alınması planlanan değşkenler Tablo de görüldüğü gbdr. Farklı değşkenlern farklı kombnasyonlarının değerlendrldğ lteratürdek çalışmalar le bzm çalışmamız arasında problem etkleyen değşkenler bakımından farklılık oluşması doğaldır. Bu nedenle verlern analznde, lk olarak, değşkenler daha sağlıklı br şeklde belrlemek amacıyla, ver azaltımına gtmek çn TBA uygulanmasına karar verlmştr. Tablo. Değşkenler(Varables) Değşken Frekans % Frma Sahbnn -37 55 35 Yaşı 3-47 51 3,5 (FSY) 4-57 36,9 (Yıl) 5-67 9 5,7 6 ve üzer 6 3, Frma Sahbnn Eğtm Düzey (FSED) Frma Sahbnn Memleket (FSM) Frma Yaşı (FY) (Yıl) Sparş Sıklığı (SS) (Adet/Yıl) Ortalama Sparş Tutarı Aralığı (OST) (TL) Toplam Aralığı (TBA) (TL) Vades Toplam Aralığı (VTBA) (TL) Borç Geçen Borç Frma Başarısı (B) Br okul btrmeyen 6 3, İlkokul mezunu 37 3,6 Ortaokul mezunu 1 13,4 Lse mezunu 43 7,4 Yüksek öğretm mezunu 50 31, Erzurumlu değl 39 4, Erzurumlu 11 75, 6 ve daha az 5 33,1 7-1 63 40,1 13-1 5 15,9 19-4 10 6,4 5 ve üzer 7 4,5 ve daha az 33 1 9-16 7 55,4 17-4 31 19,7 5-3 5 3, 33 ve üzer 1 0,6 999 ve daha az 5 3, 1.000-4.999 44 5.000-9.999 1 13,4 10.000-14.999 3 4, 15.000 ve üzer 49 31, 19.999 ve daha az 45,7 0.000-39.999 5 36,9 40.000-59.999 4 15,3 60.000-79.999 17 10, 0.000 ve üzer 13,3 999 ve daha az 119 75, 1.000-4.999 14 5.000-9.999 1,3 10.000-14.999 7 4,5 15.000 ve üzer 7 4,5 Başarısız 1 13,4 Başarılı 136 6,6 Ver setnn TBA çn uygun olduğuna KMO örnekleme yeterllğ (0,657) ve Barlett s küresellk testler (k²=394,69 ve p=0.000) sonucunda karar verlmştr. Bu çalışmada TBA, açık kaynak kodlu WEKA 3.7.7. yazılımıyla uygulanmıştır. WEKA yazılımı le öncelkle değşkenlern belrlenmes çn kullanılan özdeğerler (egen value), varyans % s (açıklama oranı) ve brkml varyans % s değerler hesaplanmıştır. Hesaplama sonuçları Tablo 3. te sunulmuştur. Analz çıktıları ncelendğnde temel bleşenden sadece 3 ünün özdeğer 1 den büyüktür. Özdeğer 1 den büyük olan temel bleşenler, vernn temel boyutlarını ortaya çıkarmak çn yeterl olduklarından, very açıklayacak oranda blg çermektedrler. Bu 3 faktörün tümü toplam varyansın % 65,0 n açıklamaktadır. Brnc temel bleşen toplam değşkenlğn % 3.60 sn, knc temel bleşen % 0.44 ünü, üçüncü temel bleşen se % 1.36 sını açıklamaktadır. Faktör o. Tablo 3. Analz sonuçları (Analyss results) Özdeğer Varyans % s Brkml Varyans % s 1,610 3,60 3,60 1,634 0,44 53,044 3 1,07 1,36 65,0 4 0,967 1,09 77,969 5 0,711,4 6,5 6 0,500 6,44 93,097 7 0,43 5,479 9,576 0,114 1,44 100,000 Bu 3 temel bleşenn; yüksek açıklama oranlarıyla beraber, her br değşkenn bu bleşenlerde aldıkları ağırlıklar dkkate alındığında, frma başarısızlığının tahmnnde varsaydığımız faktörler temsl edebleceğ görülmüştür. Bu nedenle çalışmanın bundan sonrak aşamasında uygulaması gerçekleştrlecek ve hbrt yöntemlernde Frma Yaşı, Vades Geçen Toplam Borç Aralığı ve Ortalama Sparş Tutarı değşkenler esas alınarak tahmnleme gerçekleştrlecektr. Bu aşamada belrtlmes gereken dğer br husus da temel bleşen yükler matrsnn sadece değşkenlern temel bleşenlerdek ağırlıklarını vermekle kalmadığı, aynı zamanda bu ağırlıkların yönünü de belrtebldğdr. Temel bleşen yükü negatf değer almış se, zıt yönde br lşk; poztf değer almış se, aynı yönde br lşk mevcuttur. Buna göre brnc temel bleşende frma başarısızlığına poztf yönde katkısı en fazla olan değşken Frma Sahbnn Eğtm Durumu, negatf yönde en fazla katkı sağlayan değşken se Frma Sahbnn Yaşı değşkendr. İknc temel bleşende se poztf yönde en fazla katkı sağlayan değşken Toplam Borç Aralığı, negatf yönde en fazla katkı sağlayan değşken se Frma Sahbnn Eğtm Durumu değşkendr. Üçüncü temel bleşende se sırasıyla, Frma Sahbnn Yaşı ve Frma Sahbnn Eğtm Durumu değşkenlerdr. 4.. Analz(Analyss) Bu çalışmada ve yöntemleryle yapılan tahmnlemeler açık kaynak kodlu WEKA 3.7.7. programı

BİLİŞİM TEKOLOJİLERİ DERGİSİ, CİLT: 9, SAY: 1, OCAK 016 7 le gerçekleştrlmştr. Gerek, gerekse yöntemlernde eğtm ve test aşamaları çn çaprazgeçerllk (cross-valdaton) yöntem kullanılmıştır. Yöntem gereğ ver kümes k adet alt kümeye rassal olarak bölünmekte ve k-1 adet kümede eğtm yapıldıktan sonra kalan kümede test yapılmaktadır. Bu şlem en y sonucun bulunması çn bütün alt kümeler çn yapılmaktadır. Çapraz geçerllk yöntemnn seçlmesndek en öneml sebep ver kümesnn tamamının rassal olarak dağıtılıp, yen alt kümeler oluşturularak ekstremum noktalarına takılmaktan kurtulmakta gösterdğ başarıdır. Bu çalışmada çaprazgeçerllk yöntem kullanarak model oluşturulmuştur (-1: Çapraz-geçerllk çn alt küme sayısı k=10 ; -: Çapraz-geçerllk çn alt küme sayısı k=0 ). Br çok tp bulunmakla brlkte, en çok kullanılan snr ağı yapısı, çok katmanlı ler beslemel ger yayılımlı dır [5]. Velldo vd. [53] lteratürünü taradıkları çalışmalarında, şletme ve fnans uygulamalarının (halka açılma, portföy yönetm, hsse sened pyasalarını tahmn, kred değerlendrmes) %75 nde ger yayılım (back propagaton) algortmasının kullanıldığını belrtmştr. Bu çalışmada da benzer şeklde model olarak, çok katmanlı ler beslemel ger yayılımlı kullanılmıştır. Ağ, üç nörondan oluşan br grd katmanına, üç nörondan oluşan br gzl katmana ve tek nörondan oluşan br çıktı katmanına sahptr. Grd katmanında hperbolk tanant, gzl katmanda se softmaks fonksyonu, aktvasyon fonksyonu olarak kullanılmıştır. Ağın grd katmanı öncek bölümde elde edlen üç faktörden, çıktısı se frmanın başarılı olup olmadığını gösteren kl değşkenden oluşmaktadır. Gelştrlen modeller çn terasyon sayısı.000 olarak sabt tutularak, farklı öğrenme oranları ve farklı moment değerler le gelştrlen modellern performansları ölçülmüştür. yöntemyle en y sonucu ortaya çıkaracak parametrelern (h, α ve η) seçlmes çn sırasıyla η ve α çn 0., 0.3 ve 0.4; h çn 1,, 3, 4, 5, 10 ve 15 denenmş, en y tahmn başarısı η=0., α=0. ve h=1 değerler le sağlanmıştır. modeller çn de öncelkle, en y sonucu ortaya çıkaracak parametreler (çekrdek fonksyonu, C ve p) seçlmştr. Bu kapsamda; nn çekrdek fonksyonu çn polnom, radyal tabanlı fonksyon, pearson V (PUK) ve normalleştrlmş polnom çekrdek fonksyonları sırasıyla denenmştr. Her br model çn brçok farklı denemeden sonra, çn normalleştrlmş polnom çekrdek fonksyonu seçlmş ve parametrelern optmzasyonu çn çapraz-geçerllk yöntem uygulanmıştır. ormalleştrlmş polnom fonksyonu, ver setnn normalleştrlmes yerne polnom çekrdek fonksyonuna at matematksel fadenn normalleştrlmes amacıyla Graf ve Borer [54] tarafından önerlmştr. ormalleştrlmş polnom çekrdek fonksyonu, polnom çekrdek fonksyonunun genelleştrlmş br hal olduğu söyleneblr. Seçlen çekrdek fonksyonu çn en uygun parametre yukarıda da belrtldğ gb çapraz-geçerllk yaklaşımı le gerçekleştrlmştr. Bunu sonucunda; p değer çn.0, karmaşıklık katsayısı C çn de.0 değer en yüksek doğruluğu sağlamıştır. Çekrdeğn üstellk değer (p) artırıldığında, modelnn karmaşık hale gelmes netcesnde sınıflandırma şlemnn öneml derecede uzadığı ve sınıflandırma doğruluğunun negatf yönde etklendğ gözlenmştr. Yapılan tahmnlern başarı krter olarak doğru sınıflama oranı (DSO), Tp-1 ve Tp- hata, ortalama mutlak hata (mean absolute error-mae), ortalama hata karekök (root mean squared error-rmse), bağıl mutlak hata (relatve absolute error-rae) ve bağıl hata karekök (relatve squared root error-rse) esas alınmıştır. 5. BULGULAR (RESULTS) Bu çalışmada frma başarısızlığı tahmnlemes çn uygun br makne öğrenmes yöntem araştırılmıştır. Bu kapsamda öncelkle -1 ve - çn yalın ve yöntemlernn tahmn başarısı değerlendrlmştr. Her ne kadar yalın modeller le tahmn başarıları çn tatmn edc sonuçlar elde edlmş olsa da daha y sonuçlar elde edlememesnn ver boyutundan kaynaklandığı değerlendrlmş, ver set boyutunun azaltılması ve tahmn performansının artırılması çn se TBA uygulanmıştır. TBA kullanılarak oluşturulan hbrt modellern tahmn başarısını artırdığı gözlenmştr. Benzer şeklde -1 ve - çn hbrt modellern performansları da karşılaştırılmıştır. Bu çalışmada kullanılan yöntemlern tahmn başarısı DSO, Tp-1 ve Tp- hata oranları kullanılarak karşılaştırmıştır. Ayrıca kullanılan yöntemlern performanslarını ölçmek çn hata kavramını temel alan ve yaygın olarak kullanılan MAE, RMSE, RAE ve RSE ölçütler de sunulmuştur. Böylece doğru tahmn oranı aynı olsa ble yöntemlern brbrleryle karşılaştırılablmes sağlanmıştır. n, frmaları gerçektek durumlarına göre (başarılı-başarısız) doğru şeklde bulması doğru sınıflama (DS) olarak ntelendrlr. Bu durumdak frma sayısının toplam frma sayısına bölünmes doğru sınıflama oranını (DSO) vermektedr. Br frma gerçekte borcunu ödemşken modeln onu ödemeyecekmş gb tahmn etmes br hatadır. Bu durumdak frma sayısının borcunu ödemş frma sayısına oranı Tp-1 hata olarak ntelendrlr. Benzer şeklde borcunu ödememş br frmanın borcunu ödeyecekmş gb tahmn edlmes se başka br hatadır. Bu durumda olan frma sayısının borcunu ödememş frma sayısına oranı se Tp- hatayı verecektr. MAE, ölçüm değerler le model tahmnler arasındak mutlak hatayı sorgular. MAE değer ne kadar sıfıra yaklaşırsa, modelnn tahmn yeteneğnn o kadar y olduğu sonucu çıkar [55].

BİLİŞİM TEKOLOJİLERİ DERGİSİ, CİLT: 9, SAY: 1, OCAK 016 1 MAE 1 o t (17) Aşağıda Tablo 5 te se yöntemler le modellern Tp-1 ve Tp- hata oranları, sınıflandırma özet matrsnde sunulmuştur. RMSE, ölçüm değerler le model tahmnler arasındak hata oranını belrlemek amacıyla kullanılmaktadır. RMSE değernn sıfıra yaklaşması modeln tahmn kablyetnn artması anlamına gelmektedr [55]. RMSE 1 ( o t ) (1) RAE ölçüm değerler le model tahmnler arasındak görel mutlak hatayı yüzdesel olarak sorgular. RAE değer ne kadar % sıfıra yaklaşırsa, modelnn tahmn yeteneğnn o kadar y olduğu sonucu çıkar [55]. RAE(%) 1 ( o t ) o x100 (19) RSE ölçüm değerler le model tahmnler arasındak görel hata oranını belrlemek amacıyla kullanılmaktadır. RMSE değernn % sıfıra yaklaşması modeln tahmn kablyetnn artması anlamına gelmektedr [55]. o t RSE(%) ( ) x100 (0) o 1 Bu çalışmada DSO, Tp-1 ve Tp- hata, MAE, RMSE, RAE ve RSE ölçütler dkkate alınarak,, ve yöntemlernn tahmn başarıları karşılaştırılmıştır. İstatstksel ölçütlern hesaplanan değerler Tablo 4 te sunulmuştur. Yönte m Tablo 4. Analz sonuçlarının karşılaştırılması (Comparson of the analyss results) -1-1 -1-1 - - - - DS 150 151 151 15 151 15 15 153 DSO (%) 95.5 4 96.1 96.1 96. 96.1 96. 96. 97.4 5 MA E 0.04 7 0.03 0.04 43 0.03 1 0.04 00 0.03 46 0.03 6 0.0 55 RMS E 0.1 0 0.174 5 0.17 9 0.17 0.17 4 0.17 5 0.174 0.159 6 RAE (%) 0.05 16.19 45 1.7 3 13.49 54 16.9 6 16.19 45 15.63 56 10.1 61 RSE (%) 55,06 1 53.455 55.179 7 5.40 9 50.64 7 53.405 4 51.73 9 46.70 6 Tablo 4 ve 5 e göre tahmn başarısı en yüksek yöntem hbrt, model se - olarak belrlenmştr. hbrt yöntem le 136 başarılı frmanın 136'sı da doğru şeklde sınıflandırılmış ve doğru sınıflama yüzdes % 100 olarak gerçekleşmştr. Dğer yandan 1 başarısız frmanın 17's doğru bçmde sınıflandırılmış ve doğru sınıflama yüzdes % 0.5 olarak gerçekleşmştr. Bu yöntem çn toplam sınıflandırma başarısı düzey % 97.45 olarak saptanmıştır. Aynı şeklde Tp-1 hata % 0 ve Tp- hata da % 19.05 olarak belrlenmştr. Yöntem Tablo 5. Sınıflandırma özet matrs (Classfcaton summary matrx) Mod Frma Gözlem Tahmn sonucu el sayısı Başarısız Başarılı M-1 M- M-1 M- M-1 M- M-1 M- Başarısız 1 19 %9,5 %90.4 (Tp- hata) Başarılı 136 5 131 %3,6 (Tp-1 hata) %96.3 Başarısız 1 19 %90.4 %9,5 Başarılı 136 4 13 %3,04 %96.96 Başarısız 1 16 5 %76.19 %3.1 Başarılı 136 1 135 %0.74 %99.6 Başarısız 1 16 5 %76.19 %3.1 Başarılı 136 0 136 %0 %100 Başarısız 1 19 %90.4 %9,5 Başarılı 136 4 13 %3,04 %96.96 Başarısız 1 19 %90.4 %9,5 Başarılı 136 3 133 %.1 %97.79 Başarısız 1 17 4 %0.5 %19.05 Başarılı 136 1 135 %0.74 %99.6 Başarısız 1 17 4 %0.5 %19.05 Başarılı 136 0 136 %0 %100-1 çn en düşük Tp-1 hata oranı ve yöntemler le en düşük Tp- hata oranı se ve yöntemler le elde edlmştr. - çn se yne en düşük Tp-1 hata oranı ve yöntemler le en düşük Tp- hata oranı se ve yöntemler le elde edlmştr. -1 ve - sonuçlarına göre hbrt modeller le yalın modellere göre daha y sonuçlar elde edlmş, benzer şeklde dört farklı tahmn yöntem çnde -

BİLİŞİM TEKOLOJİLERİ DERGİSİ, CİLT: 9, SAY: 1, OCAK 016 9 le daha y sonuçlar elde edlmştr. Yalın ve ler model performanslarına göre karşılaştırıldığında hem -1, hem de - çn lerın daha tatmn edc tahmn sonuçları sunduğu, hbrt yöntemler çnde benzer şeklde hem -1, hem de - çn hbrt yöntemnn daha tatmn edc tahmn sonuçları sunduğu görülmüştür. 6. SOUÇ VE TARTŞMA (COCLUSO AD DSCUSSO) Bu çalışmada Erzurum lnde 3 yıldır faalyet gösteren nşaat malzemeler toptancısı br frmanın müşterlernn vadel borçlarını ödeme/ödememe rskler frma başarısızlığı kapsamında ele alınmış ve frma başarısızlığının tahmnnde uygun br makne öğrenmes yöntem araştırılmıştır. Yalın ve yöntemler le gerçekleştrlen tahmnlemelerde frma başarısızlığına etk eden farklı değşken ve vernn eğtm le test vers olarak ayrılması çn farklı model kullanılmıştır. Yalın ve ler, model performanslarına göre karşılaştırıldığında hem -1, hem de - çn lerden daha tatmn edc tahmn sonuçları elde edlmştr. Hbrt yöntemler çnse frma başarısızlığına etk eden değşkenlern belrlenmes ve ver setnn boyutunun ve gürültünün azaltılması çn TBA le değşken sayısı 3 e ndrgenmştr. Benzer şeklde karşılaştırma yapablmek amacıyla bu değşkenler le de vernn eğtm ve test vers olarak ayrılması çn aynı farklı model kullanılmıştır. -1 ve - sonuçlarına göre hbrt modeller le yalın modellere göre daha y sonuçlar elde edlmştr. Bu sayede hbrt yöntemlern tahmn başarısını arttırdığı tespt edlmştr. Hbrt yöntemlern model performanslarına göre karşılaştırıldığında se yne hem -1 hem de - çn hbrt yöntem le daha tatmn edc tahmn sonuçları elde edlmştr. Sonuç olarak, TBA le bütünleşk olarak kullanılan hbrt modellern, yalın ve lere göre üstünlüğü ortaya koyularak; söz konusu yöntemlern genelde çok boyutlu doğrusal olmayan tahmn problemlernde, özelde se frma başarısızlığı tahmnlemesnde başarılı brer yöntem olduğu tespt edlmştr. Bu çalışmada kullanılan ver set özelnde se hbrt yöntemnn frma başarısızlığı tahmnlemesnde alternatf br yöntem olarak etkn br şeklde kullanılableceğ sonucuna varılmıştır. Lteratürde frma başarısızlığı tahmnlemes çn farklı statstksel ve makne öğrenmesne dayalı yöntemler kullanılmıştır. Kullanılan bu yöntem ve algortmalardan hangsnn daha üstün olduğu üzerne pek çok çalışma yapılmış, yapılan bu çalışmalarda farklı veya benzer sonuçlar elde edlmştr. Bunun en öneml neden tahmn başarısının, kullanılan ver setne, ver üzernde yapılan önşlemlere ve algortma parametrelernn seçmne bağlı olmasıdır. Farklı yazarlar tarafından, farklı veya aynı ver setler üzernde, farklı parametrelerle yapılan çalışmalarda farklı veya benzer sonuçlar oluşması doğaldır. Bu çalışmada lteratürde yapılan öncek pek çok çalışmanın [56-59] sonuçlarına benzer şeklde yöntemnn üstünlüğü tespt edlmştr. Benzer şeklde lteratürde [60-6], bu çalışmada olduğu gb önşlem sürecnde TBA'nn kullanılması sonucunda tahmn başarısında artış gözlenmştr. Lteratürde frma başarısızlığı üzerne yapılan çalışmaların brçoğunda klask statstksel yöntemler ve makne öğrenmes yöntemlernden 'nın kullanıldığı düşünüldüğünde, bu çalışmada uygulanan yöntemnn ve hbrt yaklaşımının alternatf brer yöntem olarak kullanılmasının sağlayableceğ faydalar ortaya konulmuştur. Lteratürde frma başarısızlığının tahmnlenmes çn tahmn performansının ölçülmesnde genelde doğru sınıflandırma veya ortalama sınıflandırma performansları ncelenmştr. Bu çalışmada se başta DSO, Tp-1 ve Tp- hatalar olmak üzere MAE, RMSE, RAE ve RSE ölçütler de dkkate alınmıştır. Benzer şeklde lteratürde pek çok çalışmada ver setnn boyutlarının azaltılması çn doğrusal azaltma yöntemler kullanılmıştır. Az sayıda çalışmada se bu çalışmada olduğu gb doğrusal olmayan ver azaltımı yöntemler (TBA, SOMAP vb.)' nden TBA yöntem kullanılmıştır. Her çalışmada olduğu gb bu çalışmada belrl kısıtlar altında ortaya konulmuştur. İlerde yapılacak çalışmalarda algortmaların hızı ve hafıza kullanım oranları da karşılaştırılarak algortmaların performansları da karşılaştırılablr. Yne, farklı tahmnleme yöntem ve algortmaları da kullanılarak sonuçlar karşılaştırılablr. KAYAKLAR (REFERECES) [1] E.. Altman, Corporate Dstress Predcton s n Turbulent Economc and Basel Envronment, http://pages.stern.nyu.edu/~ealtman/corp-dstress.pdf, 00. []J. Wlcox, A predcton of busness falure usng accountng data, Emprcal Research n Accountng,, 163-179, 1973. [3] T. Sung,. Chang, ve G. Lee, Dynamcs of modelng n data mnng: nterpretve approach to bankruptcy predcton, Journal of Management nformaton Systems, 16(1), 63-5, 1999. [4] E.. Altman, Fnancal ratos, dscrmnant analyss and the predcton of corporate bankruptcy, Journal of Fnance, 3(3), 59-609, 196. [5] E.. Altman, R. Haldeman ve P. arayanan, ZETA analyss: A new model to dentfy bankruptcy rsk of corporatons, Journal of Bankng and Fnance, 1(1), 9-54, 1977. [6] P.A. Meyer ve H.W. Pfer, Predcton of bank falures, The Journal of Fnance, 5( 4), 53-6, 1970. [7] D. Martn, Early warnng of bank falure: A logt regresson approach, Journal of bankng and fnance, 1(3), 49-76, 1977.

30 BİLİŞİM TEKOLOJİLERİ DERGİSİ, CİLT: 9, SAY: 1, OCAK 016 [] J. Ohlson, Fnancal ratos and the probablstc predcton of bankruptcy, Journal of Accountng Research, 1(1), 109-131, 190. [9] M.E. Zmewsk, Methodologcal ssues related to the estmaton of fnancal dstress predcton models, Journal of Accountng Research, 59-, 194. [10] R.C. West, A factor analytc approach to bank condton,journal of Bankng and Fnance, 9, 53-66, 195. [11] H. Frydman, E.. Altman ve D. Kao, ntroducng recursve parttonng for fnancal classfcaton: The case of fnancal dstress,journal of Fnance, 40(1), 69-91, 195. [1] W.F. Messer. ve J. Hansen, nducng rules for expert system development: An example usng default and bankruptcy data, Management Scence, 34(1), 1403-1415, 19. [13] A.. Dmtras, S.H. Zanaks ve C. Zopounds, A survey of busness falures wth an emphass on predcton methods and ndustral applcatons, European Journal of Operatonal Research, 90(3), 47-513, 1996. [14]A.W. Lo, Logt versus dscrmnant analyss: a specfcaton test and applcaton to corporate bankruptces, Journal of Econometrcs, 31(), 151-17, 196. 15. W. Wu, V.C.S. Lee ve T.Y. Tan, Data preprocessng and data parsmony n corporate falure forecast models: evdence from Australan materals ndustry, Accountng and Fnance, 46(), 37-345, 006. [16]M.M. Hamer, Falure predcton: senstvty of classfcaton accuracy to alternatve statstcal methods and varable sets, Journal of Accountng and Publc Polcy,, 9-307, 193. [17] A. Chartou, E. eophytou ve C. Charalambous, Predctng corporate falure: emprcal evdence for the UK, European Accountng Revew, 13(3), 465-497, 004. [1]P. Rav Kumar ve V. Rav Bankruptcy predcton n banks and frms va statstcal and ntellgent technques A revew, European Journal of Operatonal Research, 10(1), 1-, 007. [19]K.S. Shn, T.S. Lee ve H.J. Km, An applcaton of support vector machnes n bankruptcy predcton model, Expert Systems wth Applcatons, (1), 17-135, 005. [0]G.P. Zhang, M.Y. Hu, E.B. Patuwo ve D.C. ndro, Artfcal neural networks n bankruptcy predcton: General framework and crossvaldaton analyss,european Journal of Operatonal Research, 116(1), 16-3, 1999. [1]F. Camp ve. Gordn, Small enterprse default predcton modelng through artfcal neural networks: An emprcal analyss of talan small enterprses,journal of Small Busness Management, 51(1), 3-45, 013a. []S.H. Mn ve J. Lee, Bankruptcy predcton usng support vector machne (SVM) wth optmal choce of kernel functon parameters,expert System wth Applcatons,, 603-614, 005. [3]S.H. Mn, J. Leeve. Han, Hybrd genetc algorthms and support vector machnes for bankruptcy predcton, Expert System wth Applcatons, 31, 65-660, 006. [4]H.S. Km ve S.Y. Sohn, Support vector machnes for default predcton of SMEs based on technology credt,european Journal of Operatonal Research, 01, 3-46, 010. [5]B. Back, T. Latnen ve K. Sere, eural network and genetc algorthm for bankruptcy predcton, Expert Systems wth Applcatons, 11(4), 407-413, 1996. [6]R. Barnv, A. Anurag ve R. Leach, Predctng the out come followng bankruptcy flng: A three state classfcaton usng, nternatonal Journal of ntellgent Systems n Accountng Fnance and Management, 6, 177-194, 1997. [7]B.A. Ahn, S.S. Cho ve C.Y. Km, The ntegrated methodology of rough set theory and artfcal neural network for busness falure predcton, Expert Systems wth Applcatons, 1, 65-74, 000. []H. Ban ve L. Mazlack, Fuzzy-rough nearest neghbour classfcaton approach, n: nd nternatonal Conference of the orth Amercan Fuzzy nformaton Processng Socety, (AFPS 003) Proceedngs Chcago, 500-505, 003. [9]A. Celen, L. Peeters ve K. Vanhoof, Bankruptcy predcton usng a data envelopment analyss,european Journal of Operatonal Research, 154, 56-53, 004. [30]A.Y.. Yp, Predctng busness falure wth a case-based reasonng approach, lecture notes n computer scence, n: M.G. egota, R.J. Howlett, L.C. Jan (Eds.), Knowledge-Based ntellgent nformaton and Engneerng Systems, th nternatonal Conference, (KES 004), Wellngton, ew Zealand, 0-5 Eylül 004. [31]J.D. Andres, M. Landaove P. Lorca, Forecastng busness proftablty by usng classfcaton technques: A comparatve analyss based on a Spansh case, European Journal of Operatonal Research, 167, 51-54, 005. [3]Z. Hua, Y. Wang, X. Xu, B. Zhang ve L. Lang, Predctng corporate fnancal dstress based on ntegraton of support vector machne and logstc regresson, Expert Systems wth Applcatons,33(), 434-440, 007. [33]R.H. Ln, Y.T. Wang, C.H. Wu ve C.L. Chuang, Developng a busness falure predcton model va RST, GRA and CBR,Expert Systems wth Applcatons, 36(), 1593-1600, 009. [34]H. Youn ve Z. Gu, Predctng Korean lodgng frm falures: An artfcal neural network model along wth a logstc regresson model, nternatonal Journal of Hosptalty Management, 9, 10-17, 010. [35]A. Chaudhur ve K. De, Fuzzy support vector machne for bankruptcy predcton,appled Soft Computng, 11(), 47-46, 011. [36]H. L ve J. Sun, On performance of case-based reasonng n Chnese busness falure predcton from senstvty, specfcty, postve and negatve values,appled Soft Computng, 11(1), 460-467, 011. [37]. Benhayoun,. Char, A. El Gonnoun ve A. Lyhyaou, Fnancal ntellgence n predcton of frm's credtworthness rsk: Evdence from support vector machne approach,proceda Economcs and Fnance, 5, 103-11, 013. [3]. Gordn, A genetc algorthm approach for SMEs bankruptcy predcton: Emprcal evdence from taly,expert Systems wth Applcatons, 41, 6433-6445, 014. [39]T. Belková, T. Bányová ve A. Pterková, Predcton technques of agrculture enterprses falure,proceda Economcs and Fnance, 1, 4-56, 014. [40]W. Xu, Z. Xao, X. Dang, D. Yang ve X. Yang, Fnancal rato selecton for busness falure predcton usng soft set theory, Knowledge-Based Systems, 63, 59-67, 014.

BİLİŞİM TEKOLOJİLERİ DERGİSİ, CİLT: 9, SAY: 1, OCAK 016 31 [41]. Stanmrova, M. Daszykowskve B. Walczak, Dealng wth values and outlers n prncpal component analyss, Talanta, 7(1), 17-17, 007. [4]M. Çll, İnsan hareketlernn modellenmes ve benzeşmnde temel bleşenler analz yöntemnn kullanılması, Doktora Tez, Hacettepe Ünverstes, Sağlık Blmler Ensttüsü, 007. [43]P. Berkhn, Survey of clusterng data mnng technques, Accrue Softwarenc., San Jose, Calforna, USA, 00. [44]L. Sangün, L., Temel bleşenler analz, ayırma analz, kümeleme analzler ve ekolok verlere uygulanması üzerne br araştırma, Doktora Tez, Çukurova Ünverstes, Fen Blmler Ensttüsü, 007. [45]Hassoun, M.H., Fundamentals of artfcal neural networks, MT press, USA, 1995. [46]Graupe, D., Prncples of artfcal neural networks, World Scentfc, 6.Baskı, 007. [47] Erdal, H., Makne Öğrenmes Yöntemlernn İnşaat Sektörüne Katkısı: Basınç Dayanımı Tahmnlemes. Pamukkale Ünverstes Mühendslk Blmler Dergs, 1(3), 109-114, 015. [4]nternet: Cornell Ünverstes Resm İnternet Sayfası, Support Vector Machnes,www.math.cornell. Edu/~numb3rs/kostyuk/num19.htm, 16.11. 014. [49]X. Xu, C. Zhou ve Z. Wang, Credt scorng algorthm based on lnk analyss rankng wth support vector machne,expert Systems wth Applcatons, 36(), 65-63, 009. [50]S. Lucey, Enforcng non-postve weghts for stable support vector trackng, Computer Vson and Pattern Recognton, CVPR 00. EEE Conference on, 1-, 3- Hazran 00. [51]W.C. Hong, Chaotc partcle swarm optmzaton algorthm n a support vector regresson electrc load forecastng model,energy Converson and Management, 50(1), 105-117, 009. [5]S. Pramuthu, Fnancal credt-rsk evaluaton wth neural neurofuzzy systems, European Journal of Operaton Research, 11(), 310-31, 1999. [53] A. Velldo, P.J.G. Lsboa ve J. Vaughan, eural networks n busness: a survey of applcaton (199-199), Expert System Wth Applcaton, 17, 51-70, 1999. [54]A.B. Graf ve S. Borer, ormalzaton n support vector machnes, n Pattern Recognton, Sprnger Berln Hedelberg, 77-, 001. [55]Aydogmus, H., Eknc, A., Erdal, H. and Erdal, H., Optmzng the monthly crude ol prce forecastng accuracy va baggng ensemble models, Journal of Economcs and nternatonal Fnance, 7(5), 17-136, 015. DO: 10.597/JEF014.069. [56]A. Chaudhura ve K. Deb, Fuzzy Support Vector Machne for bankruptcy predcton, Appled Soft Computng, 11, 47-46, 011. [57]B. Rbero, C. Slva,. Chen, A. Vera vej.c. Das eves, Enhanced default rsk models wth SVM+, Expert Systems wth Applcatons, 39, 10140-1015, 01. [5]K.S. Shn, T.S. Lee veh.j. Km, An applcaton of support vector machnes n bankruptcy predcton model, Expert System Wth Applcaton,, 17-135, 005. [59]Y.S. Dng, X.P. Song vey.m. Zen, Forecastng fnancal condton of Chnese lsted companes based on support vector machne, Expert Systems wth Applcatons, 34, 301-309, 00. [60]C.F. Tsa, Feature selecton n bankruptcy predcton, Knowledge-Based Systems,, 10-17, 009. [61]. Benhayouna,. Chara, A. El Gonnouna vea. Lyhyaoua, Fnancal ntellgence n Predcton of Frm s Credtworthness Rsk: Evdence from Support Vector Machne Approach, Proceda Economcs and Fnance, 5, 103-11, 013. [6]D. Delen, C. Kuzey vea. Uyar, Measurng frm performance usng fnancal ratos: A decson tree approach, Expert Systems wth Applcatons, 40, 3970-393, 013.