Denetim Etkinliğini Artırmada Verinin Analizi Benford Analizi Uygulama Mayıs, 2016 Antalya
1. Uygulama TANIMLAYICI İSTATİSTİKLER VE ÖRNEKLEM BAĞIMSIZLIK TESTLERİ
Örneklemlerin Bağımsızlık Analizleri (Grupların Bağımsızlığı) Oluşturulan Örneklemlerin Bağımsızlık Analizleri (Grupların Bağımsızlığı) Bir Örnekleme Ait Testler İki Örneklem Ararsında Bağımsızlığın Analizi Karşılaştırılacak Grup Sayısı: Üç+ (K ÖRNEKLEM TESTLERİ) Parametrik Test Varsayımlarına Uygun Örnek Parametrik Test Varsayımlarına Uygun olmayan Örnek Parametrik Test Varsayımlarına Uygun Örnek Parametrik Test Varsayımlarına Uygun Olmayan Örnek Parametrik Test Varsayımlarına Uygun Örnek Parametrik Test Varsayımlarına Uygun Olmayan Örnek Ortalamanın Geçerlilik Testi (t veya z testi) İşaret Testi Ortalamalar Arasındaki Farkın Analizi (Student's t Testi) Mann Whitney U Testi Tek Yönlü Varyans Analizi (ANOVA) Medyanlar Arasındaki Farkın Analizi Kruskal Wallis
ÇAĞRI MERKEZİ VERİLERİ-SPSS
Verilerin Tanımlayıcı İstatistikleri Descriptive Statistics- Tanımlayıcı İstatistikler N Mean Std. Deviation Minimum Maximum EVRAK TAKİBİ 34517.03.178 0 1 BİLGİLENDİRME 34517.81.392 0 1 ŞİKAYET 34517.02.145 0 1 SORGULAMA 34517.12.323 0 1 İLKO 34517.04.199 0 1 OO 34517.04.189 0 1 LL 34517.03.184 0 1 YO 34517.02.137 0 1 CİNSİYET 34517.74.439 0 1
Kantile Göre Tanımlayıcı İstatistik Descriptive Statistics- Tanımlayıcı İstatistikler Percentiles N 25th 50th (Median) 75th EVRAK TAKİBİ 34517 0.00 0.00 0.00 BİLGİLENDİRME 34517 1.00 1.00 1.00 ŞİKAYET 34517 0.00 0.00 0.00 SORGULAMA 34517 0.00 0.00 0.00 İLKO 34517 0.00 0.00 0.00 OO 34517 0.00 0.00 0.00 LL 34517 0.00 0.00 0.00 YO 34517 0.00 0.00 0.00 CİNSİYET 34517 0.00 1.00 1.00 Bu tanımlayıcı istatistikte verilerin normal dağılmadığı yönünde bilgi görülmektedir. Medyana göre dağılım bilgisini sağlar. İlk ve son (%25-%75) dışında tutarsak, verilerin %50 kısmının bu aralıkta olmasını bekleriz. Bu sınırın dışında kalanların denetim açısından incelenmesi beklenir.
Tanımlayıcı İstatistikler-Toplu Gösterim Descriptive Statistics- Tanımlayıcı İstatistikler Std. N Range Minimum Maximum Mean Deviation Variance Skewness Kurtosis Statistic Statistic Statistic Statistic Statistic Std. Error Statistic Statistic Statistic Std. Error Statistic Std. Error SURE 34517 23.59 0.00 23.59 14.2747.02194 4.07627 16.616 -.114.013.739.026 EVRAK TAKİBİ BİLGİLENDİRME 34517 1 0 1.03.001.178.032 5.239.013 25.449.026 34517 1 0 1.81.002.392.154-1.582.013.502.026 ŞİKAYET 34517 1 0 1.02.001.145.021 6.599.013 41.547.026 SORGULAMA 34517 1 0 1.12.002.323.104 2.361.013 3.574.026 İLKO 34517 1 0 1.04.001.199.040 4.615.013 19.302.026 OO 34517 1 0 1.04.001.189.036 4.904.013 22.050.026 LL 34517 1 0 1.03.001.184.034 5.068.013 23.685.026 YO 34517 1 0 1.02.001.137.019 7.017.013 47.246.026 CİNSİYET 34517 1 0 1.74.002.439.192-1.095.013 -.802.026 VALİD N (LİSTWİSE) 34517 SURE : Çağrılar için görüşme süresi EVRAK TAKİBİ: Arama konusu (1,000) BİLGİLENDİRME: Arama konusu (0,1,00) ŞİKAYET :Arama konusu (001,0) SORGULAMA :Arama konusu (0001) İLKO: İlk okul OO: Ortaokul LL: Lise YO: Yüksek Okul CİNSİYET: Cinsiyeti (Bayan-Erkek) t değeri- statistic/standard error Genel olarak +-1,96 dan büyük oldukları için anlamlı istatistiksel değerlere sahiptir. (-) olunca sola, (+) olunca sağa çarpık olur. Kuyruk yapısına göre, uzun süreleri çağrıların etkisi kısa sürelilere göre daha fazladır.
Density Verinin Yapısı Normal Dağılım ile Kıyaslama 3,500 3,000 Series: SURE Sample 1 34517 Observations 34517 2,500 2,000 1,500 1,000.10 Mean 14.27466 Median 14.14000 Maximum 23.59000 Minimum 0.000000 Std. Dev. 4.076273 Skewness -0.114250 Kurtosis 3.738534 SURE 500 0.08 0 2 4 6 8 10 12 14 16 18 20 22.0624 Jarque-Bera 859.5378 Probability 0.000000 Süre değişkeninin normal dağılmadığı görülmektedir. Sağa çarpık ve sivri bir yapısı vardır..04.02.00-4 0 4 8 12 16 20 24 28 32 Histogram Normal
Ki-Kare Testi
BİLGİLENDİRME Observed N Expected N Residual 0 6553 17258.5-10705.5 1 27964 17258.5 10705.5 Total 34517 ŞİKAYET Observed N Expected N Residual 0 33775 17258.5 16516.5 1 742 17258.5-16516.5 Total 34517 SORGULAMA Observed N Expected N Residual 0 30427 17258.5 13168.5 1 4090 17258.5-13168.5 Total 34517 İLKO Observed N Expected N Residual 0 33094 17258.5 15835.5 1 1423 17258.5-15835.5 Total 34517 OO Observed N Expected N Residual 0 33239 17258.5 15980.5 1 1278 17258.5-15980.5 Total 34517 Ki Kare Test Sonuçları LL Observed N Expected N Residual 0 33312 17258.5 16053.5 1 1205 17258.5-16053.5 Total 34517 YO Observed N Expected N Residual 0 33856 17258.5 16597.5 1 661 17258.5-16597.5 Total 34517 CiNSİYET Observed N Expected N Residual 0 8973 17258.5-8285.5 1 25544 17258.5 8285.5 Total 34517 Test Statistics Her bir değişkenin bilgileri EVRAK TAKİBİ BİLGİLEN DİRME ŞİKAYET SORGULA MA İLKO OO LL YO CiNSİYET Chi- 30126,286 13281,308 31612,802 20095,535 29059,659 29594,273 29865,268 31923,633 a a a a a a a a Square 7955,443 a df 1 1 1 1 1 1 1 1 1 Asymp. Sig. 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 a. 0 cells (0,0%) have expected frequencies less than 5. The minimum expected cell frequency is 17258,5. Test İstatistikleri ele alınan her bir birimin birbirinden bağımsız olduğunu göstermektedir. Değişkenlerin biri birinden farklı (ayrık) olduğunu ifade etmektedir.
Örneklem Bağımsızlığının Testi EVRAK TAKİBİ BİLGİLENDİRME ŞİKAYET SORGULAMA Independent Samples Test Levene's Test for Equality of Variances F Sig. t df t-test for Equality of Means Sig. (2- tailed) Mean Std. Error Difference Difference 95% Confidence Interval of the Difference Lower Upper Equal variances assumed 336.778.000-9.229 34515.000 -.020.002 -.024 -.016 Equal variances not assumed -8.150 12883.990.000 -.020.002 -.025 -.015 Equal variances assumed 97.363.000 5.024 34515.000.024.005.015.034 Equal variances not assumed 4.912 15087.180.000.024.005.015.034 Equal variances assumed 43.631.000 3.291 34515.001.006.002.002.009 Equal variances not assumed 3.525 17959.412.000.006.002.003.009 Equal variances assumed 227.471.000-7.668 34515.000 -.030.004 -.038 -.023 Equal variances not assumed -7.295 14409.581.000 -.030.004 -.039 -.022 Varyansın normal dağılımdan farklı olup olmadığını test eder. T değerleri anlamlı çıktığından varyansların farklı olduğunu ifade etmektedir. Bu bilgi diğer test sonuçları ile tutarlıdır.
Gruplar Arası Örneklem Bağımsızlığı Testi Pair 1 EVRAK TAKİBİ - BİLGİLENDİRME Paired Samples Test Mean Paired Differences Std. Std. Error Deviation Mean 95% Confidence Interval of the Difference Lower Upper t df Sig. (2- tailed) -.777.489.003 -.782 -.772-295.451 34516 0.000 Pair 2 Pair 3 Pair 4 Pair 5 Pair 6 ŞİKAYET - SORGULAMA SORGULAMA - İLKO SORGULAMA - OO SORGULAMA - LL SORGULAMA - YO -.097.361.002 -.101 -.093-49.868 34516 0.000.077.375.002.073.081 38.300 34516 0.000.081.372.002.078.085 40.711 34516 0.000.084.366.002.080.087 42.417 34516 0.000.099.349.002.096.103 52.870 34516 0.000 Gruplar arası ortalamanın farklı olup olmadığını test etmek amacıyla kullanılır. Test sonucuna göre değişken gruplarının ortalamasının diğer gruplardan farklı olduğunu ifade eder.
T İstatistiği One-Sample Test Test Value = 0 t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference Lower Upper EVRAK TAKİBİ 34.257 34516.000.033.03.03 BİLGİLENDİRME 383.787 34516 0.000.810.81.81 ŞİKAYET 27.537 34516.000.021.02.02 SORGULAMA 68.115 34516 0.000.118.12.12 İLKO 38.525 34516 0.000.041.04.04 OO 36.429 34516.000.037.04.04 LL 35.335 34516.000.035.03.04 YO 25.959 34516.000.019.02.02 CİNSİYET 313.463 34516 0.000.740.74.74 Ortalamalar arası farklılık olup olmadığını gösterir. Varsayımsal olarak belirlenen ortalamaya göre (normal dağılıma göre) farklılık olup olmadığını test eder. Buna göre, örneğimizde değişkenler ortalamaya göre normal dağılımdan farklılık göstermektedir.
Varyans Eşitliği Testleri EVRAK TAKİBİ Equal variances assumed BİLGİLENDİRME Equal variances assumed ŞİKAYET Equal variances assumed SORGULAMA Equal variances assumed Levene's Test for Equality of Variances Independent Samples Test F Sig. t df t-test for Equality of Means Sig. (2- tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper 336.778.000-9.229 34515.000 -.020.002 -.024 -.016 97.363.000 5.024 34515.000.024.005.015.034 43.631.000 3.291 34515.001.006.002.002.009 227.471.000-7.668 34515.000 -.030.004 -.038 -.023 Varyansların farklı olup olmadığının test edilmesidir. Varyanslarının farklı olmasına bağlı olarak bağımsız değişkenler olduğu dikkate alınabilir.
ANOVA Testi ANOVA Table Sum of Squares df Mean Square F Sig. Between Groups (Combined) EVRAK TAKİBİ *.035 1.035 1.099.294 LL Within Groups 1097.644 34515.032 Total 1097.679 34516 BİLGİLENDİRM E * LL ŞİKAYET * LL SORGULAMA * LL Between Groups (Combined) 2.529 1 2.529 16.450.000 Within Groups 5306.394 34515.154 Total 5308.923 34516 Between Groups (Combined).030 1.030 1.425.233 Within Groups 726.020 34515.021 Total 726.049 34516 Between Groups (Combined) 4.361 1 4.361 41.802.000 Within Groups 3601.005 34515.104 Total 3605.366 34516 Grup içi ve gruplar arası varyansların bir birinden farklı olup olmadığının analizi yapılmaktadır.
2. Uygulama BENFORD YASASI FİNANSAL TABLO ANOMALİ ANALİZİ
Benford Yasasının Teoriden Pratiğe Geçiş Süreci 1881 Simon Newcomb 1938 Frank Benford 1961 Roger Pinkham 1992 Mark Nigrini Çok basamaklı sayıların 1 ile başlama olasılığı diğerlerinden yüksektir. Çok basamaklı sayıların 1, 2, 3 ile başlama olasılığı 4,5,6 vb dan yüksektir. Benford değerleri ölçeğe göre değişmez. İnsan tercihleri rastsal değildir ve uydurma rakamlar Benford yasasına uymaz.
Benford Yasası Uygulama Alanları Risk Esaslı Planlama Suistimal Önleme Programı Benford Analizi Finansal Tablo Anomalileri
Benford Yasasına Göre Dijitlerin Beklenen Değerleri Kaynak: Nigrini, 1996
Benford Analizini Nasıl Kullanabilirim? Uygunluk Kriterleri Veri setindeki birimlerin benzer nitelikte olması Büyük veri seti olması (500 ve üstü) Önceden tanımlanmış maksimum ve minimum değerler olmaması Örnek İnceleme Konuları Alacaklar Kredi kartı işlemleri Cari hesap hareketleri Ödemeler Stok fiyatları Yevmiye defteri kayıtları Kredi ödemeleri Satın alma talepleri Hisse fiyatları Gider hesapları
Benford Analizi Nasıl Yapılabilir? Benford Analizi Türleri 1. dijit testi 2. dijit testi İlk 2 dijit testi İlk 3 dijit testi Son 2 dijit testi
Benford Analizi Öncelikli olarak kaç dijitle çalışılacağına karar verilmelidir. Örneğin 193.543 sayısının ilk rakamı 1 birinci dijittir ve bunun seçilmesi durumunda, birinci düzeyden Benford Analizi yapılmış sayılır. Eğer söz konusu rakamın ilk iki rakamı seçilirse bu ikinci dereceden dijittir. Ve bu seçilirse ikinci düzeyden Benford analizi yapılmış olur.
Benford Analizinde Dijit Seçimi Dijit seçimine denetçi karar verir. Doğrudan detay bilgilere dayalı bir inceleme yapılacaksa dijit sayısı daha yüksek seçilebilir. Ancak bu durumda farklı dijit değerlerindeki incelenmesi gereken bilgi gözden kaçabilir. Bunun için önereceğimiz önemli yaklaşım genelden özele doğru gitmektir. Birinci dijitle başlayıp, incelenmesi gereken hesap veya hesaplar tespit edildikten sonra birinci düzeyden Benford tekniği uygulanır. Böylece her inceleme konusu olan hesap kalemleri içinde yer alan en sorunlu hesap kalemleri yakalanır. Söz konusu teknik bugünkü bilgisayarlar yoluyla ve geliştirilecek algoritma ile yazılımlar yoluyla milyonlarca bilginin analizinde de kullanılabilir.
Benford Analizi- Uygulama Adımları Dijit sayısına karar verildikten sonra belirlenen dijit sayıları, küçükten büyüğe sıralanır. Bu sıralanan sayıların alt toplamları alınır. Birinci düzeyden Benford analizinde 9 adet ara toplam vardır. Çünkü hangi sayı olursa olsun ilk rakamı 1 den 9'a kadardır. Böylece ilk rakamı 1 olan 25 sayı varsa ilk ara toplam 25 olur. 2 olan 10 sayı varsa ilk ara toplam 20 olur vb..
Benford Analizi- Uygulama Adımları Bu ara toplam sayıların toplamı alınır. Bu durumda her bir ara toplam incelenen verideki ilk basamakta yer alan sayıların sıklığı veya frekansı olur. Bu frekanslar söz konusu toplama bölündüğünde bir dağılım elde edilir. Bu dağılım ile Benford un dağılımı karşılaştırılırsa incelenmesi gereken bilgiler elde edilebilir.
Verilerde Suistimal Olasılığı Söz konusu örneklemden elde edilen dağılımın Benford dağılımından farklılaşıp farklılaşmadığının analizi ile de söz konusu incelenen verilerde bir fraud/ suiistimal olasılığı da ortaya konmuş olacaktır.
Benford Analizi-1. dijit tablosu örnek örnek oranı bendford oranı 1 Toplam 1 544 0.118 0.3010 2 Toplam 2 898 0.195 0.1761 3 Toplam 3 606 0.132 0.1249 4 Toplam 4 656 0.143 0.0969 5 Toplam 5 675 0.147 0.0792 6 Toplam 6 282 0.061 0.0669 7 Toplam 7 385 0.084 0.0580 8 Toplam 8 304 0.066 0.0512 9 Toplam 9 252 0.055 0.0458 4602
Benford Hesaplama Yöntemi P(D 1 =d 1 )= log(1 + 1/ d 1 ) d 1 {1, 2,...,9}. P(D 1 D 2 =d 1 d 2 )= log(1 + 1/d 1 d 2 ) d 1 d 2 {10, 11, 12,..., 99}; Formülleri yardımıyla hesaplanmaktadır. Buradaki d1 dijitleri ifade eder. Örneğin P(D 1 =d 1 )=log(1+(1/1))=0.3010 vs Yukarıdaki örnek oranı ile benford oranı, sırasıyla gözlenen örnek frekansı ile beklenen frekansa karşılık gelmektedir. Bu açıdan gözlenen frekansın beklenen frekansa uygunluğu veya farklılaşması olası fraud veya suistimaller hakkında bilgi verecektir.
Ki-Kare Testi Buna göre X 2 =n* (örnek oranı-benford oranı) 2 / benford oranı=349.95 (prob=0.000) buna göre örnek dağılımı beklenen dağılımdan farklıdır. Bu da suiistimal bilgisinin olduğu yönünde bir bilgidir. Hesaplanan değer ki kare tablo değerinden büyüktür. ( prob oranı 0.05 den küçük olduğu için )
Benford Analizi-1. Dijit 0,350 0,300 0,250 0,200 0,150 örnek oranı bendford oranı 0,100 0,050 0,000 1 2 3 4 5 6 7 8 9 Yukarıdaki test sonucu farklılığı gösterdiği gibi bu farklılaşma grafikten de anlaşılmaktadır. Grafik özellikle 4 5 7 basamaklı değerlere sahip hesaplarda bir sorun olduğu yönünde bilgi vermektedir.
Benford Analizi-2. Dijit 0,07 0,06 0,05 0,04 0,03 0,02 2. derceden örneklem Benford Dağılım 0,01 0 1 3 5 7 9 11131517192123252729313335373941434547495153555759616365676971737577798183858789
Aktif katılımınız için TEŞEKKÜRLER