Veri Madenciliği İle Lise Öğrenci Performanslarının Değerlendirilmesi. Assessment of High School Students Performance by Means of Data Mining

Benzer belgeler
VERİ MADENCİLİĞİNE BAKIŞ

Veri Madenciliği Yaklaşımı ile Mesleki Yönlendirme Sistemi

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Öğrenci Performansının Veri Madenciliği İle Belirlenmesi

The Study of Relationship Between the Variables Influencing The Success of the Students of Music Educational Department

Veri Ambarları ve Veri Madenciliği (ISE 350) Ders Detayları

Örüntü Tanıma (EE 448) Ders Detayları

ÜNİVERSİTE ÖĞRENCİLERİNİN BAŞARILARI ÜZERİNE ETKİ EDEN BAZI FAKTÖRLERİN ARAŞTIRILMASI (MUĞLA ÜNİVERSİTESİ İ.İ.B.F ÖRNEĞİ) ÖZET ABSTRACT

İZMİR İLİ MLO OKULLARINDA BİYOLOJİ DERSLERİNDE EĞİTİM TEKNOLOJİSİ UYGULAMALARININ (BİLGİSAYARIN) ETKİLİLİĞİ ÜZERİNE BİR ARAŞTIRMA

ÇEVRESEL FAKTÖRLERİN ÜNİVERSİTE ÖĞRENCİLERİNİN BAŞARI DÜZEYİNE ETKİLERİ Renan ŞEKER 1 Derya ÇINAR 2 Abdulkadir ÖZKAYA 1

VERİ MADENCİLİĞİ F A T M A İ L H A N

Örüntü Tanıma (COMPE 467) Ders Detayları

VERİ MADENCİLİĞİ İLE DEPREM VERİLERİNİN ANALİZİ

KÜLTÜREL MUHİTİN ÖĞRENCİ BAŞARISINA ETKİSİ ÜZERİNE BİR ARAŞTIRMA

TARİHLİ EĞİTİM KOMİSYONU KARARLARI

İNŞAAT MÜHENDİSLİĞİNDE LİSANS SONRASI AKADEMİK EĞİTİM: SAYILARLA TÜRKİYE DEKİ MEVCUT DURUM

Veri Ambarından Veri Madenciliğine

BARTIN ORMAN FAKÜLTESİ NİN DİĞER ORMAN FAKÜLTELERİ İLE BAZI KRİTERLERE GÖRE KARŞILAŞTIRILMASI

Gevşek Hesaplama (COMPE 474) Ders Detayları

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 5072

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN

KALKINMANIN SÜREKLİLİĞİ KALİTELİ BEŞERİ SERMAYE İLE MÜMKÜN

APRİORİ ALGORİTMASI İLE TEKNİK SEÇMELİ DERS SEÇİM ANALİZİ SELECTION BEHAVIOR ANALYSIS OF TECHNICAL ELECTIVE COURSES USING APRIORI ALGORITHM

daha çok göz önünde bulundurulabilir. Öğrencilerin dile karşı daha olumlu bir tutum geliştirmeleri ve daha homojen gruplar ile dersler yürütülebilir.

2.1 Gri Düzey Eş Oluşum Matrisi ( GLCM) Gri düzey eş oluşum matrisi Haralick tarafından öne sürülmüştür [1]. Đstatistiksel doku analizi yöntemidir.

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı

FEN BİLGİSİ ÖĞRETMEN ADAYLARININ FEN BRANŞLARINA KARŞI TUTUMLARININ İNCELENMESİ

İleri Veri Madenciliği (COMPE 506) Ders Detayları

Eğitim ve Öğretim Araştırmaları Dergisi Journal of Research in Education and Teaching Kasım 2017 Cilt: 6 Sayı: 4 ISSN:

Apriori Algoritması ile Teknik Seçmeli Ders Seçim Analizi

Makine Öğrenmesi 2. hafta

MESLEK YÜKSEKOKULLARINA SINAVLI VE SINAVSIZ GEÇİŞ SİSTEMİ İLE YERLEŞEN ÖĞRENCİLERİN PERFORMANSLARININ KARŞILAŞTIRILMASI

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi

MATEMATİK VE FEN BİLİMLERİ EĞTİMİ ANABİLİM DALI MATEMATİK EĞİTİMİ BİLİM DALI TEZLİ YÜKSEK LİSANS PROGRAMI

İleri Bilgisayar Mimarileri (COMPE 532) Ders Detayları

Okut. Yüksel YURTAY. İletişim : (264) Sayısal Analiz. Giriş.

Sınavlı ve Sınavsız Geçiş İçin Akademik Bir Karşılaştırma

Naive Bayes Yöntemi ile Spam Mail Teşhisi Kübra KURNAZ

2015 Tercih Dönemi Üniversite Kontenjanları Analizi

TEMEL EĞİTİMDEN ORTAÖĞRETİME GEÇİŞ ORTAK SINAV BAŞARISININ ÇEŞİTLİ DEĞİŞKENLER AÇISINDAN İNCELENMESİ

Amaç: C programlama dilini tanıtma, C programlama dilinde program yazma

VERI TABANLARıNDA BILGI KEŞFI

SAĞLIK HİZMETLERİ MESLEKİ EĞİTİMİNDE SINAVSIZ GEÇİŞ SORUN MU? *

Bilişim Sistemleri. Modelleme, Analiz ve Tasarım. Yrd. Doç. Dr. Alper GÖKSU

Web Madenciliği (Web Mining)

Kredi Limit Optimizasyonu:

MÜHENDİSLİK ve MİMARLIK FAKÜLTESİ. Sanayi ile entegre, araştırmacı ve yenilikçi bir mühendislik eğitimi

ONLİNE EĞİTİM ALAN ÖĞRENCİ BAŞARISININ BELİRLENMESİ. Özet

SÖZLÜ BİLDİRİ TÜRKİYE DEKİ HASTANELERİN VERİ MADENCİLİĞİ YÖNTEMLERİ KULLANILARAK GRUPLANDIRILMASI

KABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN

Akademik Kurul Toplantısı

Sayı 6 Haziran BİLGİ TEKNOLOJİLERİNDEN YARARLANMA DÜZEYLERİ ÜZERİNE BİR ARAŞTIRMA: HATAY İLİ ÖRNEĞİ Fikriye KANATLI 1 Sinan SCHREGLMAN 2 ÖZET

İstatistik Giriş ve Temel Kavramlar. BBY606 Araştırma Yöntemleri Güleda Doğan

Programı başarıyla tamamlayan öğrencilere GIDA MÜHENDİSLİĞİ YÜKSEK LİSANS DERECESİ verilecektir.

A)GENEL BİLGİLER I)TANIMLAR

YABANCI DİLLER MESLEKİ İTALYANCA (AYAKKABI) MODÜLER PROGRAMI (YETERLİĞE DAYALI)

Eğitim Bağlamında Oyunlaştırma Çalışmaları: Sistematik Bir Alanyazın Taraması

LİSE VE FEN LİSESİ BAŞARI BURSU YÖNETMELİĞİ

Amaç: Ekonometrinin tanımını, temel kavramlarını ve diğer alanlarla ilişkisini öğretmektir

BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR

LİSE VE FEN LİSESİ BAŞARI BURSU YÖNETMELİĞİ

Dr. Ergün AKGÜN Kimdir?

Aygil TAKIR ÖZGEÇMİŞ

2014-LİSANS YERLEŞTİRME SINAVLARI (2014-LYS) SONUÇLARI. 27 Haziran 2014

BÖLÜM 2 VERİ SETİNİN HAZIRLANMASI VE DÜZENLENMESİ

PROGRAM TASARIM SÜRECİ ÖRNEĞİ

Sayısal Yöntemler (COMPE 350) Ders Detayları

DEVAMSIZLIĞA KARŞI SÜREKLİ BAŞARI İÇİN AİLE ZİYARETLERİ

ÖĞRETMEN ADAYLARININ PROBLEM ÇÖZME BECERİLERİ

Sistem Yazılımının Sınanması ve Geçerlenmesi (SE 344) Ders Detayları

Mimari Anlatım Teknikleri II (MMR 104) Ders Detayları

Sosyal Bilimlerde İstatistik ve Araştırma Yöntemleri I (KAM 209) Ders Detayları

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

KİŞİSEL GELİŞİM VE EĞİTİM LİDERLİK EĞİTİMİ MODÜLER PROGRAMI (YETERLİĞE DAYALI)

Sivil Yaşam Derneği. 4. Ulusal Gençlik Zirvesi Sonuç Bildirgesi

Available online at

K En Yakın Komşu Methodu (KNearest Neighborhood)

ORTAOKUL SINAVLARINDA SON DURUM

T.C. DUMLUPINAR ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ LİSANSÜSTÜ EĞİTİM ÖĞRETİM BAŞVURU VE ÖĞRENCİ KABUL KOŞULLARI YÖNERGESİ

T.C. İSTANBUL ÜNİVERSİTESİ AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ MÜFREDAT FORMU Ders İzlencesi

The International New Issues In SOcial Sciences

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü. Bilgisayar Mühendisliği

ENDÜSTRİ MÜHENDİSLİĞİ DOKTORA PROGRAM BİLGİLERİ

Ortaokul Öğrencilerinin Sanal Zorbalık Farkındalıkları ile Sanal Zorbalık Yapma ve Mağdur Olma Durumlarının İncelenmesi

Üniversite Öğrencilerinin Akademik Başarılarını Etkileyen Faktörler Bahman Alp RENÇBER 1

2014 Tercih Dönemi Üniversite Kontenjanları Analizi

BİLİŞİM TEKNOLOJİLERİ ALANI

Ekonometri. yöneylem araştırması ile ilgili temel kavramları öğrenebilecekler. bazı yöneylem araştırması tekniklerini uygulamayı öğrenebilecekler.

KUYUMCULUK VE TAKI TASARIMI PROGRAMI ÖĞRENCĐLERĐNĐN OKULDAN BEKLENTĐLERĐ VE MESLEKĐ GELECEKLERĐNĐN DEĞERLENDĐRĐLMESĐ

ENDÜSTRİ MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

ULUDAĞ ÜNİVERSİTESİ EĞİTİM FAKÜLTESİ BEDEN EĞİTİMİ ve SPOR BÖLÜMÜ ÖĞRENCİLERİNİN ÖSS ve ÖZEL YETENEK SINAVI PUANLARINA GÖRE GENEL AKADEMİK BAŞARILARI

AHŞAP TEKNOLOJİSİ BİLGİSAYAR DESTEKLİ PROJE ÇİZİMİ (AUTOCAD) MODÜLER PROGRAMI (YETERLİĞE DAYALI)

Bilgisayar Bilimleri ve İ.T.Ü. Bilgisayar Mühendisliği. Yard.Doç.Dr.Tolga Ovatman

Bilgi Teknolojileri Hizmetlerinde Temeller (ISE 405) Ders Detayları

YÖK tarafından ülkemizdeki yükseköğretim kurumlarının akademik ve idari hizmetlerinin kalite düzeylerinin iyileştirilmesine yönelik olarak

Hemşirelik Anabilim Dalı Yüksek Lisans Genel Bilgi Amaç ve Hedefler Amaç: Hedef: Verilen Derece: Düzeyi Bazı Kabul Koşulları Kabul Koşulları:

ORGANİK KİMYADA STEREOKİMYA KONUSUNUN PROGRAMLI ÖĞRETİMİ

Eğitim Fakültesi Dergisi. Endüstri Meslek Lisesi Öğrencilerinin Yetenek İlgi ve Değerleri İle Okudukları Bölümler Arasındaki İlişki

Transkript:

Veri Madenciliği İle Lise Öğrenci Performanslarının Değerlendirilmesi Semra Yurdakul1, Taner Topal2 1 Kırıkkale Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği, Kırıkkale 2 Kırıkkale Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Kırıkkale semrayurdakul@gmail.com, ttopal@kku.edu.tr Özet: Büyük veri hacimleri arasında tutulan, anlamı daha önce keşfedilmemiş, potansiyel olarak faydalı ve anlaşılır bilgilerin çıkarılmasında veri madenciliği teknikleri önemli yer tutmaktadır. Bu çalışma, Kırıkkale İli Anadolu Liselerinde okuyan 11.sınıf öğrencilerine uyguladığımız anket sonucu elde edilen verilerden yararlanarak gerçekleştirilmiştir. Lise öğrencilerine ait 231 adet veri kullanılmıştır. Öğrenci performansına etki eden faktörler belirlenip, başarı ya da başarısızlığa etki eden faktörlerin birbiri ile olan ilişkisi araştırılmıştır. Ayrıca başarıyı artıracak bilgiler verilmesi amaçlanmıştır. Uygulama Weka 3.7 programı ile yapılmıştır. Anahtar Kelimeler: Veri Madenciliği, Öğrenci Performansı, Yapay Sinir Ağı, Çok Katmanlı Algılayıcı Assessment of High School Students Performance by Means of Data Mining Abstract: Data mining techniques play an important role in extracting information which are held in large information volumes, not discovered before and potentially useful and understandable. This study was carried out according to data which are collected in the Anatolian High Schools by surveying with 11. grade students. 231 data were used related to high school students. The factors which influence the performance of the students were determined and the relationship between the factors which has an impact on succes and failure were analyzed. Beside, it is aimed to give information about succes enhancement. Implementation is made by Weka 3.7 program. Key words: Data Mining, Student Performance, Artificial Neural Network, Multilayer Perceptron 1. Giriş Bilgisayar ve iletişim teknolojilerindeki gelişmelere paralel olarak donanımın ucuzlaması, verilerin uzun süre depolanmasına dolayısıyla da büyük kapasiteli veri tabanlarının oluşmasına neden olmuştur. Veriler, çeşitli istatistiksel metotlarla analiz edilerek kurumların karar verme sürecinin etkinliğini ve yeni stratejiler geliştirmesine katkı sağlamaktır. Bu nedenle büyük veri tabanlarında istenilen anlamlı, kullanılabilir ve ilginç bilgilere erişmek, yeni bir disiplin olan Veri madenciliğinin doğmasına sebep olmuştur. Veri madenciliği dünyanın anlaşılabilirliğine önemli ölçüde destek olan bir kavramdır. Gelişen bilgi toplama, depolama ve işleme yetkinlikleri, giderek artan bir şekilde mevcut verilerin incelenerek, anlamlı sonuçlar elde edilmesine olanak sağlamaktadır [1]. Veri madenciliğinin uygulandığı birçok alanda olduğu gibi, eğitimde de anlamlı ilişkilerin araştırılabileceği ve faydalı bilginin türetilebileceği veriler mevcuttur. Eğitim alanındaki veri madenciliği çalışmaları, eğitim sistemlerinde yer alan veri tabanlarında öğrencilere, akademik sorumlulara ve eğitimcilere faydalı olabilecek henüz keşfedilmemiş bilginin mevcut olduğu olgusundan yola çıkmaktadır [2]. Günümüze kadar eğitim alanında yapılmış olan veri madenciliği çalışmaları aşağıda kısaca özetlenmiştir; 2003 yılında Konya Selçuk Üniversitesi nde, hazırlık sınıfı, birinci sınıf ve mezun durumunda olan öğrenciler üzerinde, üniversite veri tabanındaki veriler kullanılarak; öğrencilerin başarılarını etkileyen etmenler, başarı düzeyleri, üniversiteyi kazanan öğrenci profilleri ve mezun olamayan öğrencilerin okulu bitirmelerini etkileyen etmenler üzerinde çalışmalar gerçekleştirilmiştir [3]. 2005 yılında gerçekleştirilen bir çalışmada Maltepe üniversitesi öğrencilerinin belirleyici özellikleri K-Means algoritması kullanılarak kümelenmiştir. 2003 yılına ait 722 öğrenci verisini kullanıldığı bu çalışmada öğrencilerin üniversiteye giriş sınav sonuçları ile başarıları arasındaki ilişki, kümeleme analizi ve K-Means algoritması teknikleri kullanılarak incelenmiştir [4]. 2007 yılında Y. Ziya Ayık ve arkadaşları tarafından yapılan çalışmada, Atatürk Üniversitesi öğrencilerinin mezun oldukları lise türleri ve lise mezuniyet dereceleri ile kazandıkları fakülteler arasındaki ilişki, veri madenciliği teknikleri kullanılarak incelenmiştir. Çalışma sonucunda, lise türünün arzu edilen bir fakültenin kazanılmasında çok büyük öneminin olduğu, yine lise başarısının da 288

aynı derecede önemli olduğu tespit edilmiştir [5]. 2012 yılında Çağdaş Kurt, O. Ayhan Erdem tarafından yapılan bir diğer çalışmada öğrencilerin başarılarına etki edebilecek faktörler farklı veri madenciliği algoritma ve modelleriyle incelenmiştir. Ekonomik, sosyal, kişisel, çevresel değişkenler üzerinde yapılan araştırmada bazı sonuçlar saptanmış ve bunlara ait öneriler sunulmuştur [6]. 2014 yılında Sevil Özarslan ve Necaattin Barışçı tarafından yapılan çalışmada Kırıkkale Üniversitesi öğrenci bilgi sisteminden alınan veriler kullanılarak uzaktan eğitim yönteminin kullanılabilirliği araştırılmıştır. J48 algoritması ile yapılan sınıflandırma sonucunda %82,22 ve Çok Katmanlı Algılayıcı ile yapılan sınıflandırma sonucunda %80,74 başarı yakalanmıştır [7]. Bu çalışma ile öğrenci performansına etki eden faktörler belirlenip, başarı ya da başarısızlığa etki eden faktörlerin birbiri ile olan ilişkisi araştırılmıştır. Öğrenci başarısına etki eden faktörler belirlenirken daha önce eğitim alanında yapılan çalışmalar incelenmiştir. Araştırma dahilinde Kırıkkale İli nde bulunan 5 farklı Anadolu Lisesinde eğitim gören 231 öğrenciyle yapılan anket sonucunda elde edilen veriler kullanılmıştır. Veri madenciliğinin eğitim ve öğretimin kalitesini ve verimliliğini artırmak için nasıl kullanılabileceği irdelenmiş ve yapılacak sonraki çalışmalar için öneriler sunulmuştur. 2. Materyal ve Yöntem Veri madenciliği farklı disiplinlerden faydalanırken kendi içerisinde de bir takım süreçlere de sahiptir. Bu süreçlerin doğru uygulanması elde edilen bilgilerin doğruluğunu ve kalitesini artıracaktır. Bu süreçlerin standart hale getirilmesi için yapılan yoğun çalışmalar sonucunda veri madenciliği süreçlerinden en yaygın olarak kullanılanı, veri madenciliği araçlarını satan firmalardan bazılarının ve veri madenciliği uygulamalarını işletme faaliyetlerine uyarlayan ilk kuruluşların 1996 yılında oluşturduğu bir konsorsiyum tarafından geliştirilen, CRISP-DM (Cross Industry Standard Process for Data Mining) / (Çapraz Endüstri Veri Madenciliği Standart Süreci) dir. CRISP-DM, bilgi keşfi için veri madenciliğinin temel adımlarını tanımlayan kademeli bir süreçtir [8]. Veri madenciliği projelerinin hızlı, daha verimli ve daha az maliyetli gerçekleştirilmesi için geliştirilmiş olan bu süreç altı adımdan oluşmaktadır. Veriyi anlama Veri hazırlama Modelleme Değerlendirme Yayma Veri madenciliğinde kullanılan modeller, tahmin edici (Predictive) ve tanımlayıcı (Descriptive) olmak üzere iki ana başlık altında incelenmektedir [9]. Tahmin edici modellerde, sonuçları bilinen verilerden hareket edilerek bir model geliştirilmesi ve kurulan bu modelden yararlanılarak sonuçlan bilinmeyen veri kümeleri için sonuç değerlerin tahmin edilmesi amaçlanmaktadır [10]. Tanımlayıcı modellerde ise karar vermeye rehberlik etmede kullanılabilecek mevcut verilerdeki örüntülerin tanımlanması sağlanmaktadır [11]. Bu çalışmanın amacı, veri madenciliği teknikleri kullanılarak, Kırıkkale ili Anadolu Liselerinde okuyan 11. sınıf öğrencilerine ait veriler yardımıyla öğrenci performansına etki eden faktörleri belirlemektir. 2.1. İş ve İş Ortamını Anlama Yapılan çalışmada aynı ilde bulunan eşdeğer liselerde okuyan öğrencilerin başarı ya da başarısızlıklarına etki eden faktörlerin birbirleri ile olan ilişkisini bulup, başarıyı artıracak bilgiler verilmesi hedeflenmiştir. Materyal olarak Kırıkkale ili Anadolu Liselerinde okuyan 231 adet 11. Sınıf öğrencisine uygulanan anket sonucu elde edilen verileri ve genel not ortalamaları kullanılmıştır. 2.2. Veriyi Anlama Öncelikle literatür taraması yapılarak öğrencinin başarısına etkisi muhtemel faktörler; öğrencinin cinsiyeti, öğrencinin sağlık durumu, kardeş sayısı, anne baba eğitim durumu, anne baba yaşı, anne baba hayatta olma durumu, ailenin öğrencinin ders dışı aktivitelere katılmasını destekleme durumları, ailenin öğrencinin okul hayatıyla ilgilenme durumları, ailenin ekonomik durumu, çocuğun kendisine ait odasının olup olmadığı, öğrencinin öğretmenleriyle ve arkadaşlarıyla olan ilişkisi olarak belirlenmiştir. Sonraki aşamada lise öğrencilerine uygulanmak üzere başarıya etki eden bu faktörlerin incelenebileceği bir anket hazırlanmıştır. İşi ve iş ortamını anlama 289

2.3. Veriyi Hazırlama Bu çalışmada materyal olarak Kırıkkale ilinde bulunan Anadolu Liselerinde okuyan 11.sınıf öğrencilerine uygulanan anket sonucu elde edilen veriler kullanılmıştır. Anket sonucu elde edilen veriler tek tek girilerek bir veri seti oluşturulmuştur. Çoğu öğrencinin boş bıraktığı alanlar tespit edilmiş ve bu alanlar temizlenmiştir. Eksik verisi bulunan öğrenciler de çalışmaya dahil edilmemiştir. Veri temizleme sonucunda çalışmaya dahil edilmek üzere 231 adet veriden 210 adet veri kalmıştır. Veri temizlemeden sonra verilerin rahat modellenebilmesi için bazı alanların yapısı değiştirilmiştir, veri dönüşümü sağlanmıştır. Aşağıdaki tablolarda yapılan dönüşümler görülmektedir. Tablo 2. Çalışmada Kullanılan Kardeş Sayısının Veri Dönüşümü Tablo 3. Anne Baba Hayatta Olma Durumunun Veri Dönüşümü Tablo 1. Çalışmada Kullanılan Başarı Notunun Veri Dönüşümü Tablo 4. Anne Baba Yaşının Veri Dönüşümü 2.4. Modelleme Veriyi anlama ve hazırlama adımından sonraki adım modelleme adımıdır. Veriler WEKA programında farklı algoritmalar kullanılarak test edilmiştir. Doğruluğu en yüksek olan model seçilmiştir. Çalışmada kullanılan verilere ilişkin tanımlanan değişkenler Şekil 1. de gösterilmiştir. Şekil 1. Çalışmada Kullanılan Verilere Ait Değişkenler 290

Bu çalışmada tahmin edici modeller (sınıflama, karar ağaçları, yapay sinir ağları, k-en yakın komşu) kullanılmıştır. Sınıflama: Bir veri maddesini önceden belirlenmiş sınıflardan birine eşleyen, öğrenen bir fonksiyondur. Sınıflama bölümsel değerlerin tahmin edilmesinde kullanılmaktadır. Tahminler öğrenme verisine dayanmaktadır [11]. Karar Ağaçları: Veri madenciliğinde kuruluşunun ucuz olması, yorumlanmasının kolay olması, veri tabanı sistemleri ile kolayca entegre edilebilmesi ve güvenilirliğinin iyi olması nedenleri ile sınıflama modelleri içerisinde en yaygın kullanıma sahip, adından da anlaşılacağı gibi ağaç görünümünde, tahmin edici bir tekniktir [12]. Karar ağacı tekniğini kullanarak verinin sınıflanması iki basamaklı bir işlemdir [13]. İlk basamak öğrenme basamağıdır. İkinci basamak ise sınıflama basamağıdır. Yapay Sinir Ağları: İnsan beyninin sinir sistemi ve çalışma ilkelerinden ilham alınarak geliştirilmiş, ağırlıklı bağlantılar denilen tek yönlü iletişim kanalları vasıtası ile birbirleriyle haberleşen, her biri kendi hafızasına sahip birçok işlem elemanından oluşan paralel ve dağıtık bilgi işleme yapılarıdır. İnsan beyninin öğrenme yoluyla yeni bilgiler üretebilme, keşfedebilme, düşünme ve gözlemlemeye yönelik yeteneklerini, yardım almadan yapabilen sistemler geliştirmek için tasarlanmışlardır. Yapay sinir ağları tekrarlanan girdiler sayesinde kendi yapısını ve ağırlığını değiştirir. Yapay sinir ağları aynen canlıların sinir sistemi gibi adapte olabilen bir yapıya sahiptir [14]. k-en Yakın Komşu: En yakın komşu sınıflandırıcıları benzerlik yöntemi ile öğrenmeyi esas alır. Eğitim örnekleri n-boyutlu sayısal nitelik ile tanımlanırlar. Her bir örnek n-boyutlu uzayda bir noktayı temsil eder. Bu şekilde tüm eğitim örnekleri n-boyutlu uzayda depolanır. Bilinmeyen bir örnek geldiğinde, bir k-en yakın komşu sınıflandırıcısı bilinmeyen örneğe en yakın k eğitim örneğini bulmak için örüntü uzayını tarar. K eğitim örnekleri bilinmeyen örneğin k-en yakın komşularıdır. Bilinmeyen örnek, örüntü uzayında kendisine en yakın eğitim örnekleri kümesine atanır. Tüm Eğitim örneklerini depoladıkları için örnek tabanlıdır [13]. 2.5. Değerlendirme Bu aşamaya gelindiğinde kurulmuş bir model vardır. Bu aşama, modelin nihai olarak sunulmasından önce modeli yoğun olarak değerlendirilmesi ve iş hedefleri ile uyumlu olup olmadığının kontrol edilmesini amaçlar. 2.6. Yayma Modelin tamamlanmış olması projenin nihai sonucu değildir. Modelin amacı veriler hakkında bilinenleri artırmak dahi olsa, elde edilen veri kullanılacak biçimde organize edilmeli ve sunulmalıdır. 3. Bulgular Yapılan çalışmada sınıflama analizine ait birçok algoritma denenmiştir. Doğruluk derecesi en yüksek olan algoritmalar Tablo 5. de gösterilmiştir. Tablo 1. Çalışmada Kullanılan Başarı Notunun Veri Dönüşümü Şekil 2. de sınıflama algoritmalarından Multilayer Perceptron algoritması ile oluşturulmuş veri modellemesi ve sonuç ekranı görülmektedir. Hata matrisi ve doğruluk tablosu bu ekranda işaretlenmiş olarak gösterilmektedir. 291

Şekil 2. Multilayer Perceptron algoritması ile oluşturulmuş modelin sonuç ekranı Şekil 2. deki çıkış ekranı incelendiğinde; 210 kaydın %66 sı olan 139 adet kayıt modelin eğitimi için kullanılmıştır. Geriye kalan 71 kayıt ise test amaçlı kullanılmıştır. Çıkış ekranında görülen Hata Matrisine göre (Confusion Matrix) 71 adet kayıta ait Hata Matrisi Tablo 6. da de görüldüğü gibidir. Tablo 6. Multilayer Perceptron algoritması için hata matrisi Şekil 2. deki sınıflandırıcı çıkış ekranındaki 71 adet verinin detaylı doğruluk tablosu Tablo 7. de verilmiştir. Tablo 7. Multilayer Perceptron için detaylı doğruluk tablosu 292

WEKA Programı ile Elde Edilen Görsel Sonuçlar Öğrencilerin sağlık problemleri ile başarı durumları arasındaki ilişkisel grafik Şekil 3. de raporlanmıştır. Bu rapora göre sağlıklı öğrencilerin başarı durumlarının başarılı ve ortalama ağırlıklı olduğu, sağlık problemi olan öğrencilerin ise başarı durumlarının daha çok ortalama ve başarısız düzeyde olduğu görülmüştür. Şekil 3. Sağlık problemine göre başarı durumu Şekil 4. de öğrencinin öğretmenleriyle iletişimi ile başarı durumu arasındaki ilişkisel grafik raporlanmıştır. Bu rapora göre öğretmenleriyle iletişimi iyi olan öğrencilerin başarı durumları başarılı ve ortalama düzeyde iken öğretmenleriyle iletişimi kötü olan öğrencilerin başarı durumları daha çok ortalama ve başarısız düzeydedir. Şekil 4. Öğrencinin öğretmenlerle olan iletişimine göre başarı durumu 293

4. Sonuç Dünyadaki teknolojik gelişmelere paralel olarak ülkemizde de veri madenciliği uygulamaları gittikçe artmaktadır. Veri madenciliğinin eğitim alanındaki kullanımını artırarak, etkili eğitim politikalarının geliştirilebilmesi, eğitim ve öğretim için kullanılabilecek materyallerin tespitinin yapılması, müfredat dışı öğrenme aktivitelerinin verimliliği sınanarak öğrencilerin bu aktivitelere teşvik edilmesi gibi çalışmalarla eğitim ve öğretim süreçlerine katkı sağlanabileceği ve verimliliğin artırılabileceği öngörülmektedir. Bu çalışmada öğrencinin başarısına etki eden faktörler hep birlikte ve ayrı ayrı ele alınıp kıyaslamalar yapılmıştır. Öğrencinin başarılı olmasına etki eden faktörlerin desteklenmesi, başarısızlığa neden olan faktörlerin ise çözümlenmesi hedeflenmiştir. Çalışma kapsamında Kırıkkale ilinde bulunan farklı Anadolu Liselerinde okuyan öğrencilere uygulanan anket sonucu elde edilen veriler kullanılmıştır. Uygulama WEKA 3.7. programı kullanılarak gerçekleştirilmiştir. WEKA programı kullanılarak elde edilen sonuçlara göre; Öğrencinin öğretmenlerle ve arkadaşlarıyla olan iletişiminin iyi olması, kendisine ait çalışma odasının olması arasında başarıyı artıran bir ilişki bulunmaktadır. Öğrencinin kardeş sayısının az olması, anne eğitim durumunun üniversite ve üstü olması, ailenin aktivitelere destek vermesi arasında başarıyı artıran bir ilişki bulunmaktadır. Yapılan incelemede Multilayer Perceptron algoritması ile yapılan sınıflama sonucunda %88,73, JRip algoritması ile yapılan sınıflama sonucunda % 87,32, IBk algoritması ile yapılan sınıflama sonucunda % 85,91, J48 algoritması ile yapılan sınıflama sonucunda % 84,50, Naive Bayes algoritması ile yapılan sınıflama sonucunda % 81,69 başarı yakalanmıştır. Çalışma neticesinde elde edilen sonuçlara göre, ailenin eğitim seviyesi ve ekonomik durumu öğrenci başarısına yüksek oranda etki etmektedir. Ancak bu kriterlerin yanı sıra öğrenci başarısına etki eden pek çok etken vardır. Ailenin eğitim seviyesi ilkokul, ortaokul düzeyinde ve ekonomik durumu kötü olsa dahi öğrencinin ders dışı aktivitelere katılımı desteklendiğinde, öğrenciye uygun çalışma ortamı sağlandığında ve ailenin öğretmenlerle iletişimde olduğu durumlarda öğrenci başarısının arttığı gözlemlenmiştir. Başarısızlığa neden olan değiştirilemez faktörlerin etkisinin, başarıya katkı sağlayacak diğer faktörler üzerinde iyileştirilmeye gidildiğinde önemli oranda yok edilebileceği gözlemlenmiştir. Bugüne kadar yapılan çalışmalara ek olarak incelenen faktörlerin başarıya etkisinin yanı sıra, veri madenciliği programı olan WEKA kullanılarak bu kriterlerin birbiri üzerindeki etkisi birden fazla boyutta incelenerek başarısızlığa neden olan faktörlerin çözümlenmesi için bilgiler paylaşılmıştır. Yapılan çalışmada aynı ilde bulunan farklı Anadolu Liselerinde okuyan öğrencilere ait veriler kullanılmıştır. Öğrencilerin bu okullara yerleştirildikleri yılın taban ve tavan puanları incelendiğinde farklılıklar gözlemlenmiştir. Ancak öğrenciler aynı türdeki okullarda okuduklarından ortak dersler aldıkları düşünülürse yerleştirme puanlarında gözlemlenen farklılık, bulunulan dönemdeki başarı ortalamaları karşılaştırıldığında gözlemlenmemiştir. Bu çalışma geliştirilerek öğrencilerin üniversitelere yerleştirme sınavında aldıkları puanlar da çalışmaya dahil edilerek liselere yerleştirilme sınavında alınan puanın üniversiteye yerleştirme sınavında alınacak olan puanın tahmin edilmesinde ne derece etkili olacağı incelenebilir. Bu çalışmada bulunan sonuçlar da işe koşularak öğrencilerin üniversitelere yerleştirilme sınavında başarıyı yakalama oranı artırabilir. Kaynaklar [1] S. Akyokuş, Veri Madenciliği Yöntemlerine Genel Bakış, 2006 [2] S. Aydın, Veri Madenciliği ve Anadolu Üniversitesi Uzaktan Eğitim Sisteminde Bir Uygulama, Doktora Tezi, Anadolu Üniversitesi Sosyal Bilimleri Enstitüsü, Sayısal Yöntemler Anabilim Dalı, 2007 [3] O. İnan, Veri Madenciliği, Yüksek Lisans Tezi, Selçuk Üniversitesi, Fen Bilimleri Enstitüsü, 2003 [4] Ş. Z. Erdoğan ve M. Timor, A Data Mining Application in a Student Database, Journale of Aeronautics and Space Technologies, 2(2) : 53-57, 2005 [5] Y. Z. Ayık, A. Özdemir ve U. Yavuz, Lise Türü ve Lise Mezuniyet Başarısının, Kazanılan Fakülte İle İlişkisinin Veri Madenciliği Tekniği İle Analizi, Sosyal Bilimler Enstitüsü Dergisi, 10(2): 441-454, 2007 [6] Ç. Kurt, O. A. Erdem, Öğrenci Başarısını Etkileyen Faktörlerin Veri Madenciliği Yöntemleriyle İncelenmesi, Politeknik Dergisi, 15(2): 111-116, 2012 [7] S. Özarslan, N. Barışçı, Öğrenci Performansının Veri Madenciliği ile Belirlenmesi, ISITES 2014, Karabük Üniversitesi, 1958-1965, 294

2014 [8] E. Küçüksille, Veri Madenciliği Süreci Kullanılarak Portföy Performansının Değerlendirilmesi ve İMKB Hisse Senetleri Piyasasında Bir Uygulama, Doktora Tezi, Süleyman Demirel Üniversitesi, Sosyal Bilimler Enstitüsü, İşletme Anabilim Dalı, Isparta, 2009 [9] Methodologies for Knowledge Discovery and Data Mining: Third Pacific-Asia Conference, Pakdd-99, Beijing, China, April 26-28, 1999 [10] N. Zhong, L. Zhou, Proceedings, Springer Verlag, 1999 [11] F. Aydoğan, E-Ticarette Veri Madenciliği Yaklaşımlarıyla Müşteriye Hizmet Sunan Akıllı Modüllerin Tasarımı ve Gerçekleştirimi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü Yüksek Lisans Tezi, Ankara, 17, 2003 [12] M.J.A. Berry, G.S. Linoff, Mastering Data Mining: The Art and Science of Customer Relationship Management, John Wiley Sons, 1st Ed., 1999 [13] J. Han, M. Kamber, Data Mining, Concepts and Techniquea, Morgan Kaufmann, Multiscience Press, San Francisso, 2006 [14] O. A. Erdem, E. Uzun, Yapay Sinir Ağları ile Türkçe Times New Roman, Arial ve Elyazısı Karakterleri Tanıma, Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 20(1):13, 2005 295