Yapay Sinir Ağları İle Doğru Meslek Seçimi Dilara BOZYILAN 1 Faruk BULUT 2 1 Ġstanbul KabataĢ Erkek Lisesi KabataĢ, ĠSTANBUL 2 Bilgisayar Mühendisliği Bölümü Elektrik-Elektronik Fakültesi Yıldız Teknik Üniversitesi, DavutpaĢa, ĠSTANBUL Email: dilarabozyilan@hotmail.com Özet Meslek seçimi insan hayatını etkileyen bir karardır. Hatalı tercihler bireyi yaşam boyu mutsuz eder. Yapılan araştırmalarda Türkiye de ve dünyada yaygın olarak yanlış meslek seçimi yapıldığı görülmüştür. Bu çalışmada doğru meslek seçimine yardımcı olmak amacıyla yapay zekâ uygulamalarından yararlanılmıştır. Geliştirilen karar destek sisteminde, hata toleranslı, eğitilebilen, deneyime dayalı özgün bir Yapay Sinir Ağları (YSA) mekanizması kullanılmıştır. Değişik sektörlerde çalışan ve mesleğinde memnun olan kişilerden elde edilen verilerle bir eğitim seti oluşturulmuştur. Bu eğitim seti, YSA ya aktarılarak sistem eğitilmiştir. Yapılan çapraz geçerleme işlemlerinde ve uygulamalarda başarılı sonuçlar elde edilmiştir. 1. Giriş Meslek seçimi, bireyin yaģamında çok önemli bir yere sahiptir. KiĢi, yetenek, ilgi ve istekleri doğrultusunda doğru bir meslek seçimi yaparsa baģarılı, verimli ve mutlu olur. Buna karģılık bir kiģi kiģisel özelliklerini ve yeteneklerini göz önünde tutmadan meslek seçimi yaptığında da baģarısız, verimsiz ve mutsuz olur [1]. Bu nedenle birey, meslek seçerken, kendi özellikleri ile seçeceği mesleğin nitelikleri arasında uygunluk olmasına dikkat etmelidir. AraĢtırma bulgularına göre, yetenek, beceri, ilgi ve ideallerine uygun meslek seçmiģ olanların sayısı az, iģ veya mesleğinden Ģikâyet edenlerin sayısı çoktur [2]. Meslek seçiminin ne denli büyük bir sorun olduğu ile alakalı geniģ kapsamlı bir araģtırma yapılmıģtır. Uğur Kariyer Merkezi nin yaptığı bir araģtırmada insanların %85 inin hatalı meslek seçimi yaptığı görülmüģtür[2]. TRT nin 1000 kiģi üzerinde yaptığı bir anket çalıģmasında benzer sonuçlar elde edilmiģtir. Bireylerin %32,9 unun kendilerine uygun olmayan bir f0110303@std.yildiz.edu.tr meslekte çalıģtıklarını; %42,3 ünün ise mesleklerinden memnun olmadıklarını tespit etmiģlerdir [3]. YanlıĢ meslek seçiminin üniversite sınavı öncesi yapıldığı da bir gerçektir. Bu nedenle orta öğretim sıralarında öğrencilerin seçimlerine yardımcı olacak bir karar destek sistemi üzerinde çalıģılması amaçlanmıģtır. Bu çalıģma beģ ana bölümden oluģmaktadır. Ġlk olarak çalıģmada kullanılacak olan veri setinin nasıl oluģturulduğu anlatılmıģtır. Daha sonra YSA nın mimari yapısının nasıl olacağı belirlenmiģtir. En son olarak elde edilen deneysel sonuçlar ve yorumlara yer verilmiģtir. 2. Veri Setini Hazırlanması Sistemin doğru sonuçlar vermesi için, eğitim setimizin güvenilir olması gerekmektedir. Bu amaçla iyi bir anketin hazırlanması için meslek seçiminde etkili olan tüm faktörler analiz edildi. Bu konu ile ilgili birçok makale tarandı [1-4] ve 50 kadar soru ankete ilave edildi. 8.Ek Anket Soruları baģlığı altında verilen her bir soru bireyin kiģisel özelliklerini irdeleyen ve mesleklere olan yatkınlığını analiz eden bir yapıdadır. Hazırlana anket soruları değiģi meslek gruplarında çalıģan bireylere uygulandı. ÇalıĢmada meslekler 5 kategoriye ayrılmıģtır. Bunlar hukuk, tıp, mühendislik, sosyal bilimler ve medya sektörüdür. Kategorilerin sayısının kısıtlıdır ve meslek türleri detaylı olarak belirtilmemiģtir. Bunun nedeni çok sınıflı bir eğitim setinde sınıflandırma baģarısının düģük çıkacak olmasındandır. Her kategoriden belirli kurumlarla görüģüp resmi izin alınmıģtır. Ġzin aldığımız kurumlar arasında TRT, Ġstanbul Barosu, Büyükçekmece Ġlçe Milli Eğitim Müdürlüğü, Bilgisayar Mühendisleri Odası ve ATV- Sabah Medya firması gibi kurumlar bulunmaktadır. - 117 -
Tablo 1 de görüldüğü gibi 202 kiģiyle anket yapılmıģtır. Fakat eğitim setine sadece mesleğinden memnun 56 kiģi dâhil edilmiģtir. çözebildiğinden katman sayısını ġekil 2 de görüldüğü gibi 3 te sabit tutulmuģtur [6]. Meslekler Anket Yapılan KiĢi Sayısı Mesleğinden Memnun Olan KiĢi Sayısı Hukuk 40 11 Tıp 47 8 Mühendislik 63 16 Sanat 33 9 Medya 19 12 Tablo 1. Eğitim Seti 3.YSA Oluşturma ve YSA nın Eğitimi ÇalıĢmamızda YSA nın eğitilmesi için Perceptron öğrenme algoritması kullanılmıģtır. Bu bölümde YSA nın çalıģma prensibine, yapısına ve kullanılan aktivasyon fonksiyonuna yer verilmiģtir. 3.1. YSA nın Çalışma Prensibi Yapay Sinir Ağları, hata üzerine dayandırılmıģ bir öğrenme algoritmasıdır. Temel iki iģlevi, karar vermek ve öğrenmektir. Bunu da ağırlıklar, aktivasyon fonksiyonu ve bias sayesinde yapar. Ağırlıklar, her cevabın değerlendirmeye gitmeden önce çarpıldığı katsayıdır. Tüm cevaplar, kendilerine ait ağırlıklarla çarpılarak toplanır. Daha sonra aktivasyon fonksiyonuna bu değerin gönderilmesi sonucu ortaya çıkan cevap, mekanizmanın kararı olur. Bias ise, kullanıcıdan kullanıcıya, mekanizmanın çalıģma Ģekline veya amacına göre değiģebilen, kullanıcı tarafından eklenen kat sayıdır. ġekil 1 de yapay bir sinir ağının çalıģması gösterilmiģtir [5]. Şekil 1. Yapay Sinir Ağları OluĢturulan YSA nın çalıģma prensibi, ġekil 1 de görüldüğü gibidir. Ġlk katmanda (input layer), bir test girdisine ait tüm özellikler (attribute), w i ağırlığıyla çarpılarak toplanır. Elde edilen değer bias katsayısı ile çarpılarak aktivasyon fonksiyonuna ve gizli katmana (hidden layer) iletilerek son katmandan (output layer) çıktı alınır [7]. 3.2. Katman Sayısı ve Bias Eğitim setinde bulunan veri sayısı öğrenme ve sınıflandırma baģarısını doğru orantılı bir Ģekilde etkilenektedir. Etiketli verilerin toplanması esnasında karģılaģılan güçlüklerden ötürü az sayıda veri eğitim setine eklenebilmiģtir. YSA sisteminin güvenilirliği ve sınıflandırma performansını artırmak amacıyla bir takım değiģiklikler yapılmıģtır. Katman sayısı, her katmandaki perceptron sayısı, bias katsayısının değeri, eğitimdeki iterasyon sayısı sayısın ve en iyi aktivasyon fonksiyonunun seçilmesi ile YSA sistemi özgünleģtirildiği gibi sınıflandırma performansı da artırılmıģtır. Bunun için birçok deneme yapılarak bias için en ideal katsayın 0.7 olduğu görülmüģtür. 3 katmanlı bir YSA, en karmaģık problemleri bile Şekil 2. YSA Katmanları ve Bias 3.3. Aktivasyon Fonksiyonu Kullanılabilecek pek çok aktivasyon fonksiyonu vardı. Eğitim seti 5 sınıf etiketli yani 5 boyutlu bir uzay olduğu için iyi bir seçim yapılmalıdır. Doğru ve hassas sonuçların elde edilebilmesi için Sigmoid aktivasyon fonksiyonu tercih edilmiģtir. Fonksiyonun çalıģma prensibi ġekil 3 te; formülü ise (1) nolu formülde görülmektedir [7-8]. f x = 1 1 + e x (1) - 118 -
Bu tablodan YSA sisteminin elde edilen ile doğruluk (accuracy) oranı 0.75 dir. Sınıflandırıcının her bir sınıf üzerindeki baģarısı için Netlik, Hassasiyet ve F1 Skoru metrikleri kullanılmıģtır. Şekil 3. Sigmoid Aktivasyon Fonksiyonu 4. Deneysel Sonuçlar Deneysel sonuçların elde edilebilmesi için C programlama dili ve Weka programı kullanılmıģtır. YSA nın özgünleģtirilebilmesi için C de yazdığımız kodlardan yararlanılmıģtır. ÇalıĢmanın doğruluk ve performans analizini yapmak amacıyla çapraz geçerleme iģlemi yapılmıģtır. Birini DıĢarıda Bırak (Leave One Out) yöntemi ile yaptığımız çapraz geçerleme iģleminden confusion matrix tablosu elde edildi. Bu yöntem, sırasıyla eğitim setinden bir veriyi test girdisi olarak kullanıp, geride kalan eğitim seti ile yeni bir YSA oluģturmayı amaçlar. Tüm veri seti için yapılan bu uygulama ile her bir test verisinin sonucu Confusion Matrix tablosuna aktarılır. Eğitim setinde bulunan 56 kiģiden bulunmaktadır. Bunların 9 tanesi hukukçu, 10 tanesi tıpçı, 11 tanesi mühendis, 12 tanesi de sözelci ve 8 tanesi de medya sektöründe çalıģan kiģilerden oluģmaktadır. Tablo 2 de kendi YSA kodlarımızla oluģturduğumuz Confusion Matrix tablosu görülmektedir. Bu tabloda yatay olarak değerler toplandığında gerçekte var olan her bir sınıfın kaçar adet örneği olduğu görülür. Dikey olarak bakıldığında ise sınıflandırıcı algoritmanın her bir örnek için verdiği kararın ne olduğu gösterilir. Tablo 2: ConfusionMatrix Tablosu Hukuk Tıp Mühendislik Sanat Medya Hukuk 8 0 0 1 2 Tıp 0 6 1 0 1 Mühendislik 1 1 12 0 2 Sanat 1 0 0 7 1 Medya 1 0 1 1 9 Netlik (Presicion): Netliği hesaplamak için doğru tahmin edilenleri tüm tahminlerin sayısına bölünür (2). Her bir sınıf etiketi için ayrı ayrı hesap yapılmalıdır. Bunun nedeni sınıflandırıcının her bir sınıftaki netliğini hesaplamak içindir. P = Doğru Tahmin Edilenler Tahmin Sayısı (2) Hassasiyet (Recall): Doğru tahmin edilenlerin gerçek değere oranıdır ve (3) numaralı formül ile bulunur. R = Doğru Tahmin Gerçek Değer (3) F1 Skoru: Netlik ve hassasiyetin harmonik ortalamasıdır ve (4) numaralı formül ile bulunur. P R F1 = 2 P + R (4) Her bir sınıf etiketi için elde edilen P, R ve F1 değerleri ġekil 4 te görüldüğü gibidir. 100 90 80 70 60 50 40 Hukuk Tıp Müh. Sanat Medya Presicion Recall F1-Score Şekil 4. P,R ve F1 değerleri ġekil 5 te diğer sınıflandırma yöntemleriyle YSA yönteminin karģılaģtırılması yapılmıģtır. Destek Vektör Makinesi (SVM), Karar Ağacı (Decision Tree), k En Yakın KomĢuluk algoritması (k-nn) ve Naive Bayes sınıflandırıcısı gibi sınıflandırıcılarla Weka programı kullanılarak karģılaģtırıldı. SVM sınıflandırıcısı iki sınıflı eğitim setlerinde kullanılabildiği için eğitim setimizden sadece tıp ve mühendislik etiketindeki verilerden yeni bir veri seti oluģturularak uygulama yapıldı. Ayrıca yapılan çalıģmalar sonucunda, çevrim (epoch) sayısını artırdığımızda doğruluk oranının arttığı görüldü. Veri - 119 -
seti ile yapılan eğitimde çevrim sayısının belirli bir düzeye kadar artırılmasının sistemin doğruluğunu doğru oranda etkilediği gözlemlendi. 500 den sonra artırdığımız değerler için doğruluk oranında bir artıģ olmadı. Bu nedenle çevrim sayısını 500 de tutmayı tercih edildi. YSA sınıflandırıcısı önerildi. Önerilen sistem ile diğer sınıflandırıcıların performansları kıyaslandı. 6.Teşekkür Anket çalıģması yapabilmemiz için bize resmi izin veren, destekleyen, hoģ gören Ġstanbul Ġl Milli Eğitim Müdürü Dr. Muammer YILDIZ a, Ġstanbul B.çekmece Anadolu Lisesi ne, Ġstanbul Ġl Sağlık Müdürlüğüne, Ġstanbul Çapa Eğitim ve AraĢtırma Hastanesine, Ġstanbul Bilgisayar Mühendisleri Odasına, Ġstanbul Baro suna ve ATV Ana Haber Spikeri Cem ÖĞRETĠR e teģekkürlerimizi bir borç bilir, saygı ve sevgilerimizi sunarız. 7. Kaynaklar Şekil 5. Sınıflandırıcıları karşılaştırma Bu veri setinde YSA algoritmamızın doğruluk değerinin beklenildiği kadar yüksek düzeyde çıkmadığı görüldü. Doğruluk oranının düģme sebeplerinin Ģu nedenlerden olduğu düģünülmektedir: Denetimli öğrenme için etiketli örneklerin (instance) yeteri sayıda olmayıģı, Eğitim setindeki özellik (feature) sayısının fazla olması, Eğitim setinde 5 sınıf türünün bulunması. Bütün bunlar uzayın seyrek bir yapı (sparce) meydana getirmesine sebep olmuģtur. Özellik sayısının, PCA (Principal Component Analysis) ve Faktör Analizi gibi yöntemler kullanılarak azaltılması sınıflandırma baģarısını artırmaktadır. Ġleri uygulamalarda bu tür yöntemler kullanılabileceği gibi bütçeli, komisyonlu çalıģmalar yapılarak daha güvenilir bir YSA mekanizması oluģturulabilir. Bu sayede üniversite tercihlerinden önce bireyin en sağlıklı tercih yapması sağlanabilir. 5.Değerlendirme Üzerinde çalıģtığımız projede insan psikolojisi, insana ait kabiliyetler ve bir takım insansı özellikler sayısallaģtırılarak yapay bir karar destek sistemi geliģtirildi. Bu sistemde mesleğinden memnun bireylerden elde edilen verilerle yeni ve özgün bir [1] RAZON N. "Meslek seçiminde gençlere nasıl yardım edebiliriz? "Aile ve Çocuk Dergisi II. Grafik Sanatlar Matbaası, Ġstanbul 1982, http://www.ekipnormarazon.com Alınma Tarihi: 18.09.2013 [2] Uğur Kariyer Merkezi, Meslek Seçimi AraĢtırması, Ġstanbul, 2010. [3] TRT'nin YapmıĢ Olduğu "1000 KiĢiye Sorduk" adlı çalıģmalarından biri: "Türkiye'de ve Dünya da YanlıĢ Meslek Seçimi", http://tvarsivi.com/player.php?y=446&z=2013-08-22%2012:47:00, Alınma Tarihi: 22.10.2013 [4] KIYAK S. Lise Öğrencilerinin Meslek Seçimi Yaparken Temel Aldığı Kriterler, TC. Yeditepe Üniversitesi Sosyal Bilimler Enstitüsü, 2006. [5] Prof. Dr. Çetin ELMAS. Yapay Zeka Uygulamaları. Seçkin Yayıncılık, 2010. s. 50-87 [6] KUBRICK, S. Artificial Intelligence Kitabı, 2009. S. 90-91. [7] Nebiyev V. Yapay Zeka Problemler- Yöntemler- Algoritmalar,2013. Seçkin Yayıncılık. S. 100-110. [8] RUSELL, Stuart. Artificial Intelligence: A Modern Approach, Prentice Hall, 3 Ed., 2009. S. 71-72. 8. Ek - Anket soruları AĢağıdaki 50 adet anket sorusundan ilk 43 tanesinin cevabı evet ve hayır Ģeklindedir. Eğitim setine evet cevabı 1 olarak; hayır cevabı 0 olarak kaydedilmiģtir. 44-50 arasındaki soruların cevapları ise Ģıklıdır. Bu sorular sisteme nominal (string) olarak aktarılmıģtır. Anketteki soruların her biri YSA nın giriģ katmanı için özellik (attribute) olarak alınmıģtır. - 120 -
1. Ġnsanların sorunlarına çözüm aramayı sever 2. Ġnsanlara karģı empati yapabilir 3. Sabırlı mısınız? 4. Size dertlerini anlatan insanları dinlerken onlara karģı dürüst olur musunuz? 5. BaĢkalarını dinlemeyi sever 6. Çevrenizde fikirleri kabul edilen biri 7. Anlatmayı sever 8. Yapılan bir haksızlık karģısında müdahale eder 9. Etkileyici konuģma yeteneğiniz var mı? 10. Olayları farklı bakıģ açılarıyla yorumlar mısınız? 11. Küçüklüğünüzde oynadığınız oyunlarda lider olur muydunuz? 12. Sorumluluk alır mısınız? 13. Çekingen misinizdir? 14. Disiplinli 15. Kararsız mısınız? 16. Hafızanız kuvvetli midir? 17. Nasıl baģarılı olunur gibi kitaplar okur musunuz? 18. Hayatınızı plan program dâhilinde yaģar mısınız? 19. Ekonomik geliģmeleri takip eder 20. Gazete veya haberleri takip eder 21. Hayatınızda hiç satıģ yaptınız mı? (limonata, kurabiye, oyuncaklarınız vs.) 22. Etrafınızda olup biten olayların aslını öğrenmek için garip bir merak duyar mısınız? 23. Makine ve malzemeler ile çalıģmaktan hoģlanır mısınız? 24. Etrafınızda gördüğünüz nesnelerin nasıl çalıģtığını merak eder 25. Elektronik aletlere merak duyar mısınız? 26. Yeni bir nesne gördüğünüzde bu nesneyi detaylı inceler 27. Ġnsanları yönetmeyi sever 28. Kitap okumayı sever 29. Tarih kitapları okumaktan hoģlanır mısınız? 30. Ġnsan ve evrenin niçin yaratıldığını düģünür müsünüz? 31. Bilim-teknik türü dergiler okur musunuz? 32. Bulmaca çözmeyi sever 33. Harita üzerinde farklı ülkelerin yerlerini bulmayı sever 34. Gördüğünüz ilginçliklerin fotoğraflarını çeker 35. Rekabetten hoģlanır mısınız? 36. Aldığınız olumsuz eleģtiriler sizi kızdırır mı? 37. Bilmediğiniz bir kelime için sözlüğe bakar mısınız? 38. Sanat sergilerini gezmeyi sever 39. Bir iģi bitirmeden baģka bir iģe baģlar mısınız? 40. Canlıların fizyolojik iģleyiģini incelemeyi sever 41. Hayvanları sever 42. Uzun süre masa baģında çalıģmaya sabredebilir 43. Doğayla iç içe olmaktan hoģlanır mısınız? 44. Küçüklüğünüzde aģağıdaki oyuncaklardan hangisiyle daha fazla zaman geçirdiniz? a) Top b) PelüĢ hayvan c) Uzaktan kumandalı araba d) Müzik aletleri e) Kukla 45. Matematik soruları mı, edebiyat metinleri mi? a) Matematik soruları b) Edebiyat metinleri 46. Grup çalıģması mı, bireysel çalıģmalar mı? a) Grup çalıģması b) Bireysel çalıģma 47. Bilginin mi deneyimin mi gücüne inanırsınız? a) Bilgi b) Deneyim 48. Mantığınız mı sizin için ön plandadır, duygularınız mı? a) Mantık b) Duygular 49. Size ait hangi özelliğinizle öne çıkmak istersiniz? a) Zekâmla b) Paramla c) Sanatımla 50. Ne sıklıkla hayal kurarsınız? a) Genellikle kurarım b) Arada bir kurarım c) Hiç kurmam - 121 -