Akademik Sosyal Araştırmalar Dergisi, Yıl: 4, Sayı: 22, Mart2016, s. 385-394 Yüksel YURTAY 1 Oğuz YAVUZYILMAZ 2 Nihal Zuhal BACINOĞLU 3 MOBİLYA PERAKENDE SATIŞ SEKTÖRÜNDE VERİ MADENCİLİĞİ UYGULAMASI Özet Gülşah AK 4 Günümüzde bilgisayar sistemlerinin hızlı bir şekilde gelişmesinden dolayı veriler doğrudan sayısal olarak toplanıp saklanabilmektedir. Verilerin yığınla artması ve anlamlı çıkarımlar elde etme ihtiyacı arttıkça veri madenciliği kavramı ortaya çıkmıştır. Veri madenciliğinin temel amacı, veriler arasında bulunan ilişkiler, örüntüler, değişiklikler, sapma ve eğilimler, belirli yapılar gibi bilgilerin matematiksel teoriler ve bilgisayar algoritmaları kombinasyonları ile ortaya çıkartılması ve bunların yorumlanarak değerli bilgilerin elde edilmesidir. Veri madenciliği sınıflama, kategorize etme, tahmin etme ve görüntüleme dört ana başlıktan oluşmaktadır. Veri madenciliği yöntemleriyle çok büyük verilerden, anlamlı sonuçlar elde edilmektedir. Bu anlamlı sonuçların ortaya çıkarılmasında kullanılan yöntemlerden biri de birliktelik analizidir. Bu çalışmada bir mobilya firmasının bölge bayiliğinden alınan 10762 satış verisi gerekli dönüşüm ve ayrıştırmalar yapılarak, veri madenciliğinde birliktelik analizi çıkarım algoritmalarından biri olan, apriori algoritması için uygun hale getirilmiş ve sonuçlar irdelenmiştir. Anahtar Kelimeler: Veri Madenciliği, Apriori Algoritması, Birliktelik Analizi, Perakende Satış 1 Sakarya Üniversitesi, Bilgisayar ve Bilişim Bi.Fak. Bilgisayar Müh. Böl.,Sakarya, yyurtay@sakarya.edu.tr 2 Öğr. Gör., Kocaeli Üniversitesi, Gazanfer Bilge MYO, İşletme Yönetimi Bölümü,,Kocaeli oguz.yavuzyilmaz@kocaeli.edu.tr 3 Sakarya Üniversitesi, Bilgisayar ve Bilişim Bi.Fak. Bilgisayar Müh. Böl. 4 Sakarya Üniversitesi, Bilgisayar ve Bilişim Bi.Fak. Bilgisayar Müh. Böl.
Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak 386 A DATA MINING PRACTICE ON the RETAIL FURNITURE INDUSTRY Abstract Today, due to the rapid development of computer systems, the data can be stored and collected directly as numeric. Increases of needs abaout data and meaningful inferences has emerged the concept of data mining. The main purpose of Data Mining is that; the relationships patterns between data, changes, deviations and trends, specific structures, such as with a combination of computer algorithms and the mathematical theory of informations. And also interpreting them to obtain valuable information by bringing it to light. Data mining consists of four major titles as classification, categorizing, and estimating and imaging. In recent years, data from very large data mining methods with began to discover meaningful patterns. Association analysis is a method used in the discovery of this meaningful patterns. This study was made in a furniture company data received from the sale of franchises 10762 of the necessary transformation and separation are performed in the Data Mining algorithms suitable for apriori inference algorithm, which is one of the association analysis and the results were analyzed. Keywords: Data Mining, Apriori Algorithm, Association Analysis, Retail Trade GİRİŞ Veri madenciliği tanımı itibariyle büyük ölçekli veriler arasından değeri olan bilgiyi elde etme tekniğidir. Veri ambarlarındaki gizlenmiş, potansiyel olarak faydalı bilgileri ortaya çıkarma; daha sonra bu bilgileri karar verme ve uygulama aşamasında kullanma sürecidir. Bu teknik sayesinde ileriye yönelik kestirimlerde bulunmak mümkündür. Başka bir ifade ile veri madenciliği, bir kurumda üretilen tüm verilerin belirli yöntemler kullanarak var olan; ya da gelecekte ortaya çıkabilecek gizli bilgiyi su yüzüne çıkarma süreci olarak değerlendirilir (Özkan,2008). Veri madenciliği teknikleri, tanımlayıcı ve tahmin edici teknikler olmak üzere ikiye ayrılır: Tanımlayıcı teknikler, karar vermeye yardım edecek verilerin tanımlanmasını sağlar. Birliktelik kuralları (associationrules) ve kümeleme (clustering) tanımlayıcı tekniklere örnek olarak verilebilir. Bunlar tahmin edici teknikler ise sonuçları bilinen verileri kullanarak sonuçları bilinmeyen veri kümelerinin sonuçlarının tahmin edilmesini sağlar (Küçüksille,2009). Literatürde birliktelik analizi ile ilgili birçok çalışma yapılmıştır. Koç ve diğerleri (2011), bilgisayar öğretmenliği bölümü öğrencilerinin sosyal ağları kullanma seviyeleri incelenmiş ve sosyal ağların öğrencileri ne derecede etkilediği tespit edebilmek amacıyla öğrencilere bir anket formu yöneltip elde edilen verilere birliktelik kurallarını uygulamıştır. Yurtay ve diğerleri(2013) tarafından yapılan çalışmada bilgisayar mühendisliği bölümü öğrencilerinin teknik seçmeli ders seçimlerindeki nedenlerin belirlenmesi amaçlanmıştır. Perakendecilik, üretici ve tüketici arasında malların naklini sağlayan aracılık hizmetleridir. Başka bir deyişle mal ve hizmetlerin ticari bir amaçla kullanma ve tekrar satmama, kişisel gereksinimleri için kullanma koşuluyla, doğrudan doğruya son tüketiciye pazarlanmasıyla ilgili faaliyetlerin bütünüdür (Öztürk, 2006:69).
387 Mobilya Perakende Satış Sektöründe Veri Madenciliği Uygulaması Perakende sektörü son tüketiciye yönelik olduğu için çok fazla sayıda kişiye hitap etmektedir. Her bireyin mevcut ya da potansiyel bir son tüketici olduğu düşünüldüğünde ; sektörün hedef kitlesinin dünya nüfusu ile orantılı olduğu görülmektedir. Özellikle 21. Yüzyılda gelişen teknolojiler ve satış teknikleri ile perakendecilikte mevcut müşteri sayısı milyarlar ile ifade edilmektedir. Bu büyüklükteki bir sektörde; satışları, müşterileri, müşteri bilgilerini v.b. verileri analiz etmek klasik yöntemler ile pek mümkün değildir. Bu sebeple çok fazla sayıda bilgi ve veri yığınlarından anlamlı bir sonuç elde etmek için kullanılan veri madenciliği ; perakende sektöründe elde bulunan veriye uygun olarak belirlenecek algoritmalar ile geniş bir uygulama alanına sahiptir. Bu çalışmada mobilya perakende satış sektörü satış verileri analizi için; gerçek veriler üzerinden tanımlayıcı tekniklerden biri olan birliktelik kuralı çıkarım algoritmalarından Apriori algoritması üzerinde durulmuştur. Apriori algoritması incelenmiş ve uygulama detayları verilmiştir. Metot Birliktelik kuralları analizi, yaygın olarak kullanılan veri madenciliği yöntemlerinden birisidir. Veriler arasındaki birlikteliklerin, ilişkilerin ve bağıntıların kurallar halinde bulunması işlemidir. Veri nesneleri arasındaki ilginç ilişkiler ve eş zamanlı gerçekleşen durumlar araştırılır. Bir birliktelik kuralına örnek olarak X ve Y ürününü satın alan müşterilerin %80 olasılıkla C ürününü de satın alması verilebilir. Bu tür birliktelik kuralları, söz konusu nesneler ile ilgili durumun sıklıkla tekrarlanması durumunda anlamlıdır. Birliktelik kuralları analizi; ticaret, finans, mühendislik, fen ve sağlık sektörlerinin birçok alanlarında kullanılmaktadır. Örneğin, pazar sepet analizlerinde sıklıkla birlikte satılan ürünleri tespit etmek, web sayfalarında ziyaretçilerin hangi sayfaları birlikte tıkladığını araştırmak, bağıntılı olarak geçirilen hastalıkları belirlemek için kullanılabilmektedir (Birand,2010). Özellikle işletme alanındaki uygulamalarda, satış analizleri uygulamalarında; mevcut satışlar üzerinden veri madenciliği tekniği ile satışları analiz edip, yeni satış stratejileri oluşturmak oldukça fayda sağlamaktadır. Bu çalışmada da Mobilya Perakende sektörü satış verileri analizi için birliktelik kuralları analizi gerçekleştirilmiştir. Birliktelik kuralının matematiksel modeli Agrawal, Imielinski ve Swami tarafından1993 yılında sunulmuştur (Agrawal vd., 1993) Birliktelik kuralı çıkarım algoritmaları içerisinde Apriori, en fazla bilinen algoritmadır. Bu algoritmada sık geçen öğe kümelerini bulmak için birçok kez veritabanını taramak gerekir. İlk taramada bir elemanlı minimum destek metriğini sağlayan sık geçen öğe kümeleri bulunur. İzleyen taramalarda bir önceki taramada bulunan sık geçen öğe kümeleri aday kümeler adı verilen; yeni potansiyel sık geçen öğe kümelerini üretmek için kullanılır. Aday kümelerin destek değerleri tarama sırasında hesaplanır ve aday kümelerinden minimum destek metriğini sağlayan kümeler o geçişte üretilen sık geçen öğe kümeleri olur. Sık geçen öğe kümeleri bir sonraki geçiş için aday küme olurlar. Bu süreç yeni bir sık geçen öğe kümesi bulunmayana kadar devam eder (Alataş,2003). Örnek Veri ve Verinin Hazırlanması Çalışmada, Marmara bölgesinde faaliyet gösteren bir mobilya perakende satış firmasının verileri incelenerek, 15 aylık satış verileri üzerindeki birliktelik kuralları araştırıldı. Veriler üzerinde çalışmanın yapılabilmesi için, öncelikle verilerdeki hata, eksik ve bozuk kayıtlar temizlenerek, işlenebilir hale getirilmiştir.
Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak 388 1.Verinin Tanıtılması Bölge Bayiliğinden alınan kayıtlar Sipariş Tarihi, Sipariş No, Teslim Tarihi, Cadde, Sokak, İlçe, Bölge kodu, Tel no, Stok kodu, Stok ismi, Depo, Miktar, Birim fiyat, Net fiyat, Tutar, Kdv li Tutar, Sorumluluk merk.adı, İrsaliye no, Fatura tarihi olmak üzere 19 sütundan oluşmaktadır. 2.Verinin Temizlenmesi 15 aylık toplam verilere bakıldığında eksik, gereksiz ve ortak olmayan sütunlar çıkarılmış ve uygulamaya alınmamıştır. Ortak sütun adları belirlenerek apriori uygulamasında kullanılabilecek 7 sütuna indirgenmiştir. Bu sütunlar Ürün Adı, Ay, İl, Depo, Miktar, Bölge ve Kdv' li Tutar dır. 3.Verinin Dönüştürülmesi Daha anlamlı bir çalışma ortaya çıkarabilmek adına Ürünler sütununa göre veri seti iki bölüme ayrılmıştır. İlk bölüm ve ikinci bölümde yer alan ürünler aşağıdaki tabloda gösterildiği gibidir. İlk Bölüm Alez Banyo Ürünleri Beyaz Ev Tekstili Ev Dekorasyon Ürünü Ev Tekstil Ürünü Alez, Uyku Pedi, Yatak Pedi, Yastık Koruyucu Havlu, Bornoz Yastık, Yorgan Koltuk Örtüsü, Kırlent, Minder, Lamba Döşemelik Kumaş, Battaniye, Nevresim Takımı, Yatak Örtüsü, Çarşaf, Uyku Seti İkinci Bölüm Başlık Baza/Karyola Bebek Seti Büfe Dolap Kanepe/Koltuk Komidin/Konsol/Şifonyer Köşe Takımı/Oturma Grubu/Modül
389 Mobilya Perakende Satış Sektöründe Veri Madenciliği Uygulaması Masa (Yemek Masası, Çalışma Masası) Sandalye/Puf Tamamlayıcılar (Sehpa, Kitaplık, TV Ünitesi) Yatak İl : Veriler içerisinde bulunan cadde, mahalle ve ilçe sütunları birleştirilerek il sütununa dönüştürülmüştür. 1. Ankara 2. Antalya 3. Bilecik 4. Bingöl 5. Bolu 6. Bursa 7. Çanakkale 8. Düzce 9. İstanbul 10. İzmir 11. Kayseri 12. Kocaeli 13. Konya 14. Kütahya 15. Sakarya 16. Yalova 17. Zonguldak Depo :
Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak 390 1. Adapazarı 2. Bölge 3. Düzce 4. Ereğli 5. Karakamış 6. Outlet 7. Plaza 8. Satış Sonrası Miktar : 1 olanlar Tekli Satışlar ve 1 den fazla olanlar Toplu Satışlar olmak üzere 2 sütuna ayrılmıştır. 1. Tekli Satışlar 2. Toplu Satışlar Bölge 1. Adapazarı 2. Bölge 3. Düzce 4. Ereğli 5. Merkez 6. Plaza 7. Satış Sonrası KDV li Tutar : 0 ile 43.300 arasındaki değerler ilk veri seti için 50 lik, ikinci veri seti için 250 lik şekilde gruplandırılmıştır. Uygulama-1 Toplam 4845 kayıt içerisinde %15 Destek değeri ile 726 alt sınır olarak belirlenmiştir. Güven değeri ise %60 belirlenerek algoritma uygulanmıştır.
391 Mobilya Perakende Satış Sektöründe Veri Madenciliği Uygulaması Tablo 1: Birinci uygulamada elde edilen birliktelik kuralları ORTAYA ÇIKAN KURALLAR kdv_tutar değeri 100, depo değeri ADAPAZARI, urun_adi değeri Ev Tekstil Ürünü depo değeri ADAPAZARI urun_adi değeri Beyaz Ev Tekstili depo değeri ADAPAZARI urun_adi değeri Beyaz Ev Tekstili kdv_tutar değeri 100, depo değeri ADAPAZARI, kdv_tutar değeri 50,, bolge =ADAPAZARI % 99,593 depo =ADAPAZARI % 89,077 bolge =ADAPAZARI % 99,796 il =SAKARYA % 99,491 il =SAKARYA % 99,324 depo = SAKARYA % 81,369 urun_adi değeri Beyaz Ev Tekstili, depo =ADAPAZARI % 76,466 kdv_tutar değeri 100,, depo = ADAPAZARI % 65,391 kdv_tutar değeri 50,, Uygulama-2 urun_adi = Beyaz Ev Tekstili % 61,597 Toplam 5917 kayıt içerisinde %5 Destek değeri ile 296alt sınır olarak belirlenmiştir. Güven değeri ise %70 belirlenerek algoritma uygulanmıştır.
Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak 392 Tablo 2: İkinci uygulamada elde edilen birliktelik kuralları ORTAYA ÇIKAN KURALLAR urun_adi değeri Yatak kdv_tutar değeri 500 urun_adi değeri Baza kdv_tutar değeri 750 kdv_tutar değeri 1000 urun_adi değeri Koltuk bolge değeri PLAZA urun_adi değeri Yatak ay değeri Ocak İl değeri SAKARYA kdv_tutar değeri 1250 İl değeri SAKARYA ay değeri Aralık İl değeri SAKARYA il =SAKARYA % 95,512 il =SAKARYA % 94,686 il =SAKARYA % 92,92 il =SAKARYA % 92,371 il =SAKARYA % 92,241 il =SAKARYA % 91,327 il =SAKARYA % 90,439 bolge =ADAPAZARI % 75,145 bolge =ADAPAZARI % 71,768 bolge =ADAPAZARI % 70 Elde edilen birliktelik kurallarında, örnek olarak ürün adı, bölge ve depo açısında değerlendirildiğinde, aktivitenin ürün açısından o bölgedeki depo üzerinde optimize edilebilmesi açısından fikir vermektedir. Kuralların tümü incelendiğinde tahmin edilen birliktelikler olmasının yanında, farkına varılamayan birlikteliklerin de görülmesi ve ortaya çıkarılması önemlidir. Bu çalışmada da ortaya çıkan kurallar ilgili taraflar ile değerlendirilmiştir.
% 393 Mobilya Perakende Satış Sektöründe Veri Madenciliği Uygulaması Ürün Grupları 120 100 80 60 40 20 0 1 2 3 4 5 6 7 8 9 UYGULAMA 1 99,593 89,077 99,796 99,491 99,324 81,369 76,466 65,391 61,597 UYGULAMA 2 95,512 94,686 92,92 92,371 92,241 91,327 90,439 75,145 71,768 Grafik: Ürün Grupları (Uygulama-1 ve Uygulama-2) arasındaki değişim Ürün gruplarının seçiminde, veriler arasındaki özelliklerin doğru seçimi birliktelik kuralları arasındaki oranı etkilemektedir. Sonuç Bu çalışmada, birliktelik kuralı çıkarım algoritmalarından Apriori algoritmasının kullanılmasına ilişkin bir uygulama gerçekleştirilmiştir. Apriori algoritması uygulaması, firmanın veri seti üzerinde uygulandığında farklı zaman dilimlerinde ürünler arasında birlikte satın alınma bağıntıları ortaya çıkarılıp, bayilerde satılan ürünlerin miktarı ve tutarı, satıldığı ay, satışın gerçekleştirildiği il, depo ve bölge niteliklerinin birbirleriyle ilişkileri incelenmiştir ve güven değerinin üzerinde çıkan birliktelikler kabul edilmiştir. Çalışma sadece belirli bir bölge bayiliğinden alının verilerde yer alan ürünler ile gerçekleştirilmiştir. Elde edilen sonuçlar bölge satışlarına göre müşterilerin ihtiyacı olan ürünlerin değişiklik gösterebilmesinden dolayı araştırmanın yapıldığı zaman aralığına göre de farklılık gösterebilir. Yapılan çalışma sonuçları bölge bazında yapılacak ürün satışlarında verimlilik elde edilmesine yardımcı olacaktır. Aynı zamanda analiz sonucunda elde edilen birliktelik bilgileri satış stratejilerinde kullanılabilir. Bu verilere göre birlikte satış yoğunluğu olan ürün grupları belirlenip; bunlara yönelik olarak kampanya ve tutundurma faaliyetleri gerçekleştirmek; başarılı satış sonuçları ortaya çıkarabilecektir. Gelecekte yapılacak çalışmalarda, daha fazla satış verileri ve müşteri profilleri arasındaki ilişkinin kullanılması, daha net sonuçların ortaya çıkacağı değerlendirmelerine de sebep olmuştur.
Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak 394 KAYNAKLAR AGRAWAL, R.,IMİELİNSKİ, T. ve SWAMİ, A., (1993), Mining Association Rules Between Sets of Items in Large Databases, In Proceedings of the ACM SIGMOD International Conference on Management of Data ACMSIGMOD 93), 207-216,Washington, USA, 207-216. ALATAŞB,(2003) Nicel Birliktelik Kurallarının Keşfinde Bulanık Mantık ve Genetik Algoritma Yaklaşımı Fırat Ünv. Fen Bilimleri Enstitüsü Yüksek Lisans Tezi, Elazığ, BİRANT, D., Kut, A., VENTURA, M., ALTINOK, H., ALTINOK, B., ALTINOK, E., &IHLAMUR, M. İş Zekası Çözümleri için Çok Boyutlu Birliktelik Kuralları Analizi. Akademik Bilişim 10, 256. GÜNGÖR, E.,YALÇIN, N., &YURTAY, N. (2013). Apriori Algoritması ile Teknik Seçmeli Ders Seçim Analizi. Akademik Bilişim KOÇ, M.,&KARABATAK, M. (2011). Sosyal Ağların Öğrenciler Üzerindeki Etkisinin Veri Madenciliği Kullanılarak İncelenmesi INVESTIGATION OF THE EFFECT OF SOCIAL NETWORKS ON STUDENTS BY USING DATA MINING KÜÇÜKSİLLE, E.(2009), Veri Madenciliği Süreci Kullanılarak Portföy Performansının Değerlendirilmesi ve IMKB Hisse Senetleri Piyasasında Bir Uygulama, Süleyman Demirel Üniversitesi Sosyal Bilimler Enstitüsü, Doktora Tezi, Isparta ÖZTÜRK, İlknur (2006), Türkiye de Perakende Sektörü, Çağ Üniversitesi Sosyal Bilimler Dergisi, Cilt:3, Sayı.1, Haziran 2006. YALÇIN Ö.(2008). Veri Madenciliği Yöntemleri, Papatya Yayıncılık.