CS 553 INTELLIGENT DATA ANALYSIS PROJECT WORKSHOP ORHUN ALP ORAL



Benzer belgeler
daha çok göz önünde bulundurulabilir. Öğrencilerin dile karşı daha olumlu bir tutum geliştirmeleri ve daha homojen gruplar ile dersler yürütülebilir.

T.C. İSTANBUL AYDIN ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ BİREYSEL DEĞERLER İLE GİRİŞİMCİLİK EĞİLİMİ İLİŞKİSİ: İSTANBUL İLİNDE BİR ARAŞTIRMA

THE ROLE OF GENDER AND LANGUAGE LEARNING STRATEGIES IN LEARNING ENGLISH

First Stage of an Automated Content-Based Citation Analysis Study: Detection of Citation Sentences

T.C. SÜLEYMAN DEMİREL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ISPARTA İLİ KİRAZ İHRACATININ ANALİZİ

ANALYSIS OF THE RELATIONSHIP BETWEEN LIFE SATISFACTION AND VALUE PREFERENCES OF THE INSTRUCTORS

THE IMPACT OF AUTONOMOUS LEARNING ON GRADUATE STUDENTS PROFICIENCY LEVEL IN FOREIGN LANGUAGE LEARNING ABSTRACT

TÜRKiYE'DEKi ÖZEL SAGLIK VE SPOR MERKEZLERiNDE ÇALIŞAN PERSONELiN

LisE BiRiNCi SINIF ÖGRENCiLERiNiN BEDEN EGiTiMi VE SPORA ilişkin TUTUM ÖLÇEGi ii


Yarışma Sınavı A ) 60 B ) 80 C ) 90 D ) 110 E ) 120. A ) 4(x + 2) B ) 2(x + 4) C ) 2 + ( x + 4) D ) 2 x + 4 E ) x + 4

A Comparative Analysis of Elementary Mathematics Teachers Examination Questions And SBS Mathematics Questions According To Bloom s Taxonomy

TÜRKİYE DE BİREYLERİN AVRUPA BİRLİĞİ ÜYELİĞİNE BAKIŞI Attitudes of Individuals towards European Union Membership in Turkey

Pazarlama Araştırması Grup Projeleri

Implementing Benchmarking in School Improvement

ULUDAĞ ÜNİVERSİTESİ EĞİTİM FAKÜLTESİ BEDEN EĞİTİMİ ve SPOR BÖLÜMÜ ÖĞRENCİLERİNİN ÖSS ve ÖZEL YETENEK SINAVI PUANLARINA GÖRE GENEL AKADEMİK BAŞARILARI

PROFESSIONAL DEVELOPMENT POLICY OPTIONS

AİLE İRŞAT VE REHBERLİK BÜROLARINDA YAPILAN DİNİ DANIŞMANLIK - ÇORUM ÖRNEĞİ -

Determinants of Education-Job Mismatch among University Graduates

KANSER HASTALARINDA ANKSİYETE VE DEPRESYON BELİRTİLERİNİN DEĞERLENDİRİLMESİ UZMANLIK TEZİ. Dr. Levent ŞAHİN

ÖZET YENİ İLKÖĞRETİM II. KADEME MATEMATİK ÖĞRETİM PROGRAMININ İSTATİSTİK BOYUTUNUN İNCELENMESİ. Yunus KAYNAR

ÖNSÖZ. beni motive eden tez danışmanım sayın Doç. Dr. Zehra Özçınar a sonsuz

Arş. Gör. Dr. Mücahit KÖSE

LEARNING GOALS Human Rights Lessons

BBM Discrete Structures: Final Exam Date: , Time: 15:00-17:00

HACETTEPE ÜNivERSiTESi SPOR BiLiMLERi VE TEKNOLOJiSi YÜKSEK OKULU'NA GiRişTE YAPILAN

T.C. Hitit Üniversitesi. Sosyal Bilimler Enstitüsü. İşletme Anabilim Dalı

HEDEF BELiRLENEN ENGELLi OLAN VE OLMAYAN ÖGRENCILERDE ANTRENMANIN PERFORMANS VE DUYGUSAL DURUMLAR ÜZERiNE ETKisi

Argumentative Essay Nasıl Yazılır?

SPSS (Statistical Package for Social Sciences)

.. ÜNİVERSİTESİ UNIVERSITY ÖĞRENCİ NİHAİ RAPORU STUDENT FINAL REPORT

İŞLETMELERDE KURUMSAL İMAJ VE OLUŞUMUNDAKİ ANA ETKENLER

"Farklı?-Evrensel Dünyada Kendi Kimliğimizi Oluşturma" İsimli Comenius Projesi Kapsamında Yapılan Anket Çalışma Sonuçları.

DETERMINING THE CURRENT AND FUTURE OPINIONS OF THE STUDENTS IN SECONDARY EDUCATION ON NANOBIOTECHNOLOGY *

The Study of Relationship Between the Variables Influencing The Success of the Students of Music Educational Department

EGE UNIVERSITY ELECTRICAL AND ELECTRONICS ENGINEERING COMMUNICATION SYSTEM LABORATORY

TR2009/ /409 Benim için İnsan Hakları «Human Rights for Me» Body of Knowledge for AC/HR Education

Yaz okulunda (2014 3) açılacak olan (Calculus of Fun. of Sev. Var.) dersine kayıtlar aşağıdaki kurallara göre yapılacaktır:

ANKARA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ DÖNEM PROJESİ TAŞINMAZ DEĞERLEMEDE HEDONİK REGRESYON ÇÖZÜMLEMESİ. Duygu ÖZÇALIK

ÖZET Amaç: Yöntem: Bulgular: Sonuçlar: Anahtar Kelimeler: ABSTRACT Rational Drug Usage Behavior of University Students Objective: Method: Results:

UBE Machine Learning. Kaya Oguz

YABANCI DİL I Zorunlu 1 1 4

KULLANILAN MADDE TÜRÜNE GÖRE BAĞIMLILIK PROFİLİ DEĞİŞİKLİK GÖSTERİYOR MU? Kültegin Ögel, Figen Karadağ, Cüneyt Evren, Defne Tamar Gürol

WEEK 11 CME323 NUMERIC ANALYSIS. Lect. Yasin ORTAKCI.

Educational On-line Programmes for Teachers and Students

CmpE 320 Spring 2008 Project #2 Evaluation Criteria

Profiling the Urban Social Classes in Turkey: Economic Occupations, Political Orientations, Social Life-Styles, Moral Values

Immigration Studying. Studying - University. Stating that you want to enroll. Stating that you want to apply for a course.

Erzincan University Journal of Education Faculty Skin-Number: 14-2 Years:2012

A RESEARCH ON THE RELATIONSHIP BETWEEN THE STRESSFULL PERSONALITY AND WORK ACCIDENTS

DOKUZ EYLUL UNIVERSITY FACULTY OF ENGINEERING OFFICE OF THE DEAN COURSE / MODULE / BLOCK DETAILS ACADEMIC YEAR / SEMESTER. Course Code: CME 4002

ANKET 2- Personel(Staff)

BASKETBOL OYUNCULARININ DURUMLUK VE SÜREKLİ KAYGI DÜZEYLERİNİN BELİRLENMESİ

Tanı Testlerinin Değerlendirilmesi. ROC Analizi. Prof.Dr. Rian DİŞÇİ

Hukuk ve Hukukçular için İngilizce/ English for Law and Lawyers

EĞİTİM Doktora Orta Doğu Teknik Üniversitesi, Ankara Eğitim Fakültesi, Bilgisayar Öğretimi ve Teknolojileri Bölümü

ABSTRACT $WWLWXGHV 7RZDUGV )DPLO\ 3ODQQLQJ RI :RPHQ $QG $IIHFWLQJ )DFWRUV

Mart Ayı Değerler Eğitimi. Samimiyet

2015/2016 ERASMUS+ APPLICATION RESULTS 2015/2016 ERASMUS+ BAŞVURU SONUÇLARI

$5$ù7,50$ (%(/ø. gö5(1&ø/(5ø1ø1 *g5(9 7$1,0/$5, 9( <(7(5/ø/ø. $/$1/$5,1$ *g5(.(1'ø/(5ø1ø '(ö(5/(1'ø50(/(5ø g]hq (VUD.$5$0$1 + O\D 2.

Instance Based Learning k-nn. YZM 3226 Makine Öğrenmesi

Postmenopozal Kadınlarda Vücut Kitle İndeksinin Kemik Mineral Yoğunluğuna Etkisi

GENÇLİK VE SPOR BAKANLIĞINDA ÖRGÜT İKLİMİNİN İŞGÖREN PERFORMANSI ÜZERİNE ETKİSİ: ALAN ARAŞTIRMASI

DERS BİLGİ FORMU DERS BİLGİLERİ. Türü Zorunlu/ Seçmeli DERS PLANI

ACT (American College Testing ) Sınavı Hakkında

MESLEK YÜKSEKOKULLARINDAKİ ÖĞRENCİLERİN ÖĞRENİM GÖRDÜKLERİ BÖLÜMÜ SEÇİMİNDEKİ ETKİLİ FAKTÖRLER

Bilim ve Teknoloji Science and Technology

TEŞEKKÜR. Her zaman içtenliğiyle çalışmama ışık tutan ve desteğini esirgemeyen sevgili arkadaşım Sedat Yüce ye çok teşekkür ederim.

Yüz Tanımaya Dayalı Uygulamalar. (Özet)

Proceedings/Bildiriler Kitabı I. G G. kurumlardan ve devletten hizmet beklentileri de September /Eylül 2013 Ankara / TURKEY

KALEIDOSCOPES N.1. Solo Piano. Mehmet Okonşar

BEDEN EGITIMI ÖGRETMENI ADAYLARıNIN SINIF ORGANIZASYONU VE DERS ZAMANI KULLANIMI DAVRANıŞLARlNIN ANALIzI

ELIT VE ELIT OLMAYAN ERKEK BASKETBOLCULARDA HEDEF YÖNELIMI, GÜDÜSEL (MOTIVASYONEL) IKLIM VE

ISSN: Yıl /Year: 2017 Cilt(Sayı)/Vol.(Issue): 1(Özel) Sayfa/Page: Araştırma Makalesi Research Article

Selçuk Üniversitesi Sosyal Bilimler Enstitüsü Dergisi 21 / Ahmet Murat ELLEZ * Nevzat GÜMÜŞ ** Rahman SEFEROV ***

Clear omegle ban on puffin

Table 1. Demographic and clinical characteristics of the patients

A UNIFIED APPROACH IN GPS ACCURACY DETERMINATION STUDIES

WEEK 4 BLM323 NUMERIC ANALYSIS. Okt. Yasin ORTAKCI.

A Y I K BOYA SOBA SOBA =? RORO MAYO MAS A A YÖS / TÖBT

4. HAFTA BLM323 SAYISAL ANALİZ. Okt. Yasin ORTAKCI.

NEAR EAST UNIVERSITY GRADUATE SCHOOL OF SOCIAL SCIENCES APPLIED (CLINICAL) PSYCHOLOGY MASTER PROGRAM MASTER THESIS

A New Approach for Named Entity Recognition

ENG ACADEMIC YEAR SPRING SEMESTER FRESHMAN PROGRAM EXEMPTION EXAM

Dairesel grafik (veya dilimli pie chart circle graph diyagram, sektor grafiği) (İngilizce:"pie chart"), istatistik

Çalıştığı kurumun prestij kaynağı olup olmaması KIZ 2,85 ERKEK 4,18

Website review dersbook.com

EĞİTİM FAKÜLTESİ ÖĞRENCİLERİNİN ÖĞRETMENLİK MESLEK BİLGİSİ DERSLERİNE YÖNELİK TUTUMLARI Filiz ÇETİN 1

Üniversite Öğrencilerinin Akademik Başarılarını Etkileyen Faktörler Bahman Alp RENÇBER 1

Korelasyon ve Regresyon

HTML 4. Bölüm. Doç. Dr. İsmail Rakıp Karaş Dersin Course Page:

ÖZGEÇMĐŞ. Derece Bölüm/Program Üniversite Yıl Lisans

Korelasyon ve Regresyon

Delta Pulse 3 Montaj ve Çalıstırma Kılavuzu.

KANSER HASTALARINDA PALYATİF BAKIM VE DESTEK SERVİSİNDE NARKOTİK ANALJEZİK KULLANIMI

DOKUZ EYLUL UNIVERSITY FACULTY OF ENGINEERING OFFICE OF THE DEAN COURSE / MODULE / BLOCK DETAILS ACADEMIC YEAR / SEMESTER. Course Code: MMM 4027

Arýza Giderme. Troubleshooting

6. Seçilmiş 24 erkek tipte ağacın büyüme biçimi, ağacın büyüme gücü (cm), çiçeklenmenin çakışma süresi, bir salkımdaki çiçek tozu üretim miktarı,

B a n. Quarterly Statistics by Banks, Employees and Branches in Banking System. Report Code: DE13 July 2018

Transkript:

1 CS 553 INTELLIGENT DATA ANALYSIS PROJECT WORKSHOP ORHUN ALP ORAL

2 PROJECT OUTLINE 1. Domain Information 2. Dataset: Extraction, Features and possible values 3. Preprocessing: Statistics, missing values, outliers 4. Analysing Data To make pattern analysis: Segmentation, clustering, PCA To find explanations: Classification, regression, deviation analysis. 5. Result Interpretation / Evaluation 6. Future Work

3 1. DOMAIN INFORMATION Aim of the project is to analyze and understand which factors are more effective for scientific thinking skills for university students. To understand these factors 1 survey and 4 different psycholohical tests are done to 409 students.

4 1. DOMAIN INFORMATION Survey results give demographical information about the students, whereas other tests give scientific results about thinking skills of the students. The information gathered from analysis are evaluated by Assoc. Prof. Dr. Günseli Orhon from Akdeniz University Institute of Social Sciences Department. She is the expert of this domain and owns the dataset.

5 2. DATASET : DATA EXTRACTION Attitude test towards school: Okulda alınan eğitim hayattaki başarıyı garantiler. Okulda alınan eğitimle gerçek yaşamdaki başarı ilişkili değildir. Çevremde mesleklerinde başarılı olan kişilerin iyi okul deneyimleri var. Bence okul zaman kaybıdır. (Negative sentence) Okulun en önemli yatırım olduğunu düşünüyorum. Okulda alınan eğitim bir insanın kaderini belirler. Okula gitmekten genelde keyif alırım. Academic support: Okulda hocalarım bana destek veriyor Okulda gerek duyduğum desteği görüyorum Okulda sorun yaşadığım zaman hocalarım bunu fark ediyor Okulda akademik danışmanımdan memnunum. Okuldaki akademik yaşam benim için hayal kırıklığı (Negative meaning) Gerek duyduğum her zaman, hocalarıma ulaşabilirim.... Okula gitmekten hoşlanmıyorum. Ailem her zaman iyi eğitimin önemli olduğunu düşünür. Şu anda okulu bıraksam hayatımda önemli bir değişiklik olmaz. Bence okul her insan için gereklidir. Okul kazandırması gereken özellikleri kazandıramıyor.... Academic satisfaction: Okulda istediğim bilimsel ortamı bulamıyorum Okulum tam da hayal ettiğim gibi bir bilimsel altyapı sunuyor Okulda iyi öğrendiğimi hissediyorum Okulum benim öğrenme ihtiyaçlarımı umursamıyor Okulda mutsuzum Scientific thinking test: Olaylara bakarken her zaman bilimsel düşünmeye çalışırım Bence bilim evrenin sırlarını açıklar Bence bilimle çözülemeyecek sorun yok Bence bir sorunu çözmenin anahtarı analiz etmektir....... Negative meaning scores are inreversed for evaluation: Inversion done : 1 5, 2 4 5 1, 4 2

6 2. DATASET : ATTRIBUTES AND POSSIBLE VALUES There are 408 rows and all 71 features are integers: Nominal Features (Demographic data from survey results): SED : Socio-Economical Level of the subject. (1..3) GENDER : Gender. (MALE / FEMALE) M_EDU : Educational status of subject s mother. (1..5) F_EDU : Educational status of subject s father. (1..5)

7 2. DATASET : ATTRIBUTES AND POSSIBLE VALUES There are 408 rows and all 71 features are integers: AT1..12 : Attitude test towards school. (1..5) AK1..30 : Academic support test. (1..5) AS1..5 : Academic satisfaction scale. (1..5) SC1..20 : Scientific thinking skills test. (1..5)

8 2. DATASET : DATA CONTENT Occurances table: Allmost uniformly distributed None of the father education status is 1 Test results occurancies looks normal..

9 2. DATASET : DATA CONTENT BOX PLOT Attitude test towards school AT1..AT12 7 out of 12 questions looks similar distribution.

10 2. DATASET : DATA CONTENT BOX PLOT 2 Academic support test AK1..AK30 For most of the questions 5 points are outliers. Distributions of the test results looks similar.

11 3. PREPROCESSING: STATISTICS, MISSING VALUES Analyse maximum, minimum and missing values. with missing values without missing values %3 of the data is eliminated for further analysis, eliminated data contains missing feature values. KNIME toolkit used for this analysis.

12 3. PREPROCESSING: NEW FEATURE GENERATION For each test, I generate new aggregate feature that shows the sum of that test result. Because each test feature is actually part of a test group. SC_SUM feature data contains sum of the SC features values, and it can be the most determinant feature for scientific thinking. New features are: - AT_SUM - SC_SUM - AK_SUM - AS_SUM KNIME toolkit used for this analysis.

13 3. PREPROCESSING: OUTLIER VERIFICATION Aggregated test results analyzed in the box plot. Only academic support test has some outliers. These outliers are examined and verified their truth existence by the expert. KNIME toolkit used for this analysis.

14 4. ANALYSING DATA: CORRELATION FOR GENERATED FEATURES There are some significant correlations between features generated features and demographic information: Socio-eco. status is negatively correlated with academic support test. Mother s education status is positively correlated with scientific thinking test.

4. ANALYSING DATA: TO MAKE PATTERN ANALYSIS To detect groups in the different scientific thinking test, k-means algorithm used with k=7 with normalized SC_SUM KNIME toolkit used for this analysis. 15

4. ANALYSING DATA: TO MAKE PATTERN ANALYSIS To analyse the relation of the clusters with respect to demographical information about the student, use decision tree Socio-economic status, gender, father education, mother education. Decision tree shows that socio-economic status is the significant factor between separation of cluster_6 from cluster_4. KNIME toolkit used for this analysis. 16

17 4. ANALYSING DATA: TREE VIEW C4.5 Random sampling done for splitting traning and test data for the decision tree.

18 4. ANALYSING DATA: TO FIND EXPLANATIONS (REGRESSION) Regression with generated columns Target: SC_SUM Most significant characteristics is for AK_SUM

19 4. ANALYSING DATA: TO FIND EXPLANATIONS (REGRESSION) Regression with generated columns Target: SC_SUM Parameters: AT_SUM, AK_SUM, AS_SUM Min error rate : 0.13 ~%0 Max error rate : 45.22 %57 Mean prediction error: 15.74 Scale for SC_SUM: 20-100 Mean error rate: %19

20 4. ANALYSING DATA: TO FIND EXPLANATIONS (REGRESSION) Regression with existing columns Target: SC_SUM Parameters: AT1..12 AK1..30 AS1..5

21 4. ANALYSING DATA: TO FIND EXPLANATIONS (REGRESSION) Regression with generated columns Target:SC_SUM Parameters: all test parameters: AK1..30, AT1.12, AS1..5 Upper bound increased by 12 compare to previous case Lower bound decreased by 4 compare to previous case Min error rate : ~0 Max error rate : 50.44 %63.05 Mean prediction error: 12.43 Scale for SC_SUM: 20-100 Mean error rate: %15 %4 decreased

22 4. ANALYSING DATA: TO FIND PATTERN (PCA) PCA analysis with: AT_SUM, AK_SUM, AS_SUM For SC_SUM: To search that whether is it possible to find pattern of scientific thinking test result from variability between other test results.

23 4. ANALYSING DATA: TO FIND PATTERN (PCA-REGRESSION) Regression with pricipal components Target: SC_SUM Most significant characteristics is for PCA_dimension 0

24 4. ANALYSING DATA: TO FIND PATTERN (PCA-REGRESSION) Regression with principle components Target: SC_SUM Parameters: PCA_dim0, PCA_dim1, PCA_dim2 Min error rate : ~0 Max error rate : 45.50 %56.05 Mean prediction error: 15.72 Scale for SC_SUM: 20-100 Mean error rate: %19 Same results with test totals regression

25 5. RESULT INTERPRETATION / EVALUATION Analysis shows that scientific thinking skills change with the following: If the social-economic status of the student is middle level; it increases, whereas low social-economic status has negative effects. Parent s educational status is positively correlated. High attitude test results show positive effects on scientific thinking skills. o High academic satisfaction skills show positive effects on scientific thinking skills.

26 6. FUTURE WORK Polynomial combinations can be used for regression analysis with assigning different weights to each feature. Other test results reasons should be investigated to find out the effects of the features more detailed.

27 QUESTIONS? Thank you.