İnsan Bilgisayar Etkileşiminde İstatistiksel Analizler

Benzer belgeler
Dersin Yürütülmesi Hakkında

PARAMETRİK ve PARAMETRİK OLMAYAN (NON PARAMETRİK) ANALİZ YÖNTEMLERİ.

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

Hipotezlerin test edilip onaylanması için çeşitli istatistiksel testler kullanılmaktadır. Fakat...

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1

Statistical Package for the Social Sciences

1. FARKLILIKLARIN TESPİTİNE YÖNELİK HİPOTEZ TESTLERİ

PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz.

ÇND BİYOİSTATİSTİK EĞİTİMİ

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

Sık kullanılan istatistiksel yöntemler ve yorumlama. Doç. Dr. Seval KUL Gaziantep Üniversitesi Tıp Fakültesi

BÖLÜM 3 KURAMSAL ÇATI VE HİPOTEZ GELİŞ

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları II (19 Nisan 2012)

İçindekiler. Pazarlama Araştırmalarının Önemi

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Parametrik Olmayan Testler. İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

Varyans Analizi (ANOVA) Kruskal-Wallis H Testi. Doç. Dr. Ertuğrul ÇOLAK. Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Sosyal Bilimlerde Araştırma Yöntemleri. Bölüm 8. VERİ İŞLEMEYE HAZIRLIK, TEMEL İSTATİSTİKİ ÖLÇÜLER VE ANALİZ TÜRLERİ Sait Gürbüz - Faruk Şahin

ÖRNEK BULGULAR. Tablo 1: Tanımlayıcı özelliklerin dağılımı

BİYOİSTATİSTİK PARAMETRİK TESTLER

KRUSKAL WALLIS VARYANS ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

SPSS UYGULAMALARI-II Dr. Seher Yalçın 1

Non-Parametrik İstatistiksel Yöntemler

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

BÖLÜM I ARAŞTIRMANIN DOĞASI

BİR ÖRNEKLEM İÇİN T TESTİ İLİŞKİSİZ ÖRNEKLEMLER İÇİN T-TESTİ

Tekrarlı Ölçümler ANOVA

DERS BİLGİLERİ Ders Kodu Yarıyıl T+U Saat Kredi AKTS Deneysel Tasarım EKO60 Bahar Ön Koşul Dersin Dili. Zorunlu

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

İstatistik ve Olasılığa Giriş. İstatistik ve Olasılığa Giriş. Ders 3 Verileri Sayısal Ölçütlerle İfade Etme. Verileri Sayısal Ölçütlerle İfade Etme

TAŞINMAZ DEĞERLEMEDE İSTATİSTİKSEL ANALİZ

K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır.

İÇİNDEKİLER ÖN SÖZ...

FARKLILIKLARI İNCELEMEYE YÖNELİK ANALİZ TEKNİKLERİ

Tek Yönlü Varyans Analizi (ANOVA) Kruskal Wallis H Testi

Araştırma Yöntemleri. Araştırma Tasarımı ve İstatistik Test Seçimi

İstatistik ve Olasılık

Merkezi Eğilim ve Dağılım Ölçüleri

MATE 211 BİYOİSTATİSTİK İKİ FARKIN ÖNEMLİLİK TESTİ VE İKİ EŞ ARASINDAKİ FARKIN ÖNEMLİLİK TEST SORULARI

Mühendislikte İstatistiksel Yöntemler

İçindekiler. Ön Söz... xiii

OLASILIK ve İSTATİSTİK Hipotez Testleri

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

İSTATİSTİK MHN3120 Malzeme Mühendisliği

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER

İLERİ ARAŞTIRMA SORU HAVUZU

Ortalamaların karşılaştırılması

Kestirim (Tahmin) Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir.

Bağımsız Örneklemler İçin Tek Faktörlü ANOVA

17.ULUSAL TURİZM KONGRESİ

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

REPEATED MEASURES ANOVA (Tekrarlı Ölçümler ANOVA )

Kazanımlar. Z puanları yerine T istatistiğini ne. zaman kullanacağını bilmek. t istatistiği ile hipotez test etmek

1 PAZARLAMA ARAŞTIRMASI

BÖLÜM 13 HİPOTEZ TESTİ

PROBLEM:1. 11 yeni doğan rata günlük 1000 unts/kg epo uygulanmış, kontrol grubuna ise salin uygulanmıştır.

Çalıştığı kurumun prestij kaynağı olup olmaması KIZ 2,85 ERKEK 4,18

NORMAL DAĞILIM VE ÖNEMLİLİK TESTLERİ İLE İLGİLİ PROBLEMLER

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

Parametrik Olmayan İstatistiksel Yöntemler

UYGUN HİPOTEZ TESTİNİN SEÇİMİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

İstatistik ve Olasılık

Araştırma Yöntemleri. Çıkarımsal İstatistikler: Parametrik Testler I. Giriş

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

Örnek...4 : İlk iki sınavında 75 ve 82 alan bir öğrencinin bu dersin ortalamasını 5 yapabilmek için son sınavdan kaç alması gerekmektedir?

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

İkiden Çok Grup Karşılaştırmaları

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir

BÖLÜM 10 ÖRNEKLEME YÖNTEMLERİ

Ders 8: Verilerin Düzenlenmesi ve Analizi

TANIMLAYICI İSTATİSTİKLER

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS DERS NOTLARI I 5 Nisan 2012

ABSTRACT $WWLWXGHV 7RZDUGV )DPLO\ 3ODQQLQJ RI :RPHQ $QG $IIHFWLQJ )DFWRUV

VARYANS ANALİZİ (ANOVA)

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları III (3 Mayıs 2012)

Ders Bilgileri Ders Kodu Yarıyıl T+U Saat Kredi AKTS FEN BİLİMLERİNDE İSTATİSTİKSEL TEKNİK VE UYGULAMALAR

IİSTATIİSTIİK. Mustafa Sezer PEHLI VAN

Deneysel Araştırmalarda Uygun Örneklem Büyüklüğü Ve İstatistiksel Güç Analizi. Doç Dr. Nurhan DOĞAN AKÜ Tıp Fak. Biyoistatistik ve Tıbbi Bilişim AD

BİYOİSTATİSTİK. Uygulama 4. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

İÇİNDEKİLER. Ön Söz Saymanın Temel Kuralları Permütasyon (Sıralama) Kombinasyon (Gruplama) Binom Açılımı...

UYGULAMA 1 SPSS E GİRİŞ. SPSS; File, Edit, View, Data, Transform, Analyze, Graphs, Utilities, Window, Help adlı 10 adet program menüsü içermektedir.

T TESTİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ. Yrd. Doç. Dr. C. Deha DOĞAN

BÖLÜM 8 BİLGİSAYAR UYGULAMALARI - 2

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

5.HAFTA. Yrd. Doç. Dr. Sedat ŞEN Harran Üniversitesi

BİYOİSTATİSTİK Tek Örneklem ve İki Örneklem Hipotez Testleri Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

Merkezi Yığılma ve Dağılım Ölçüleri

ÖLÇME VE DEĞERLENDİRME. Antrenörlük Eğitimi 4. Sınıf. Ölçme ve Değerlendirme - Yrd. Doç. Dr. Yetkin Utku KAMUK

LİKERT TİPİ ÖLÇEKLERE FARKLI BİR YAKLAŞIM Kelime Tabanlı Ölçekler ile Gülenyüz Ölçeklerin Karşılaştırılması

Transkript:

İnsan Bilgisayar Etkileşiminde İstatistiksel Analizler Research Methods in Human-Computer Interaction, 2nd Edition Harry Hochheiser, Jinjuan Heidi Feng, Jonathan Lazar

İstatistiksel Analizler -I HCI da İstatistiksel Analiz Tanımı: Değişkenler arasındaki ilişkilerin tanımlanması ile kullanılan verilerdeki farklılıkları ve bunların sonuçlarını bulmaya yardımcı olan güçlü bir araçtır. Anlamlılık Testi: Toplanan verilerin niteliği ve çalışmanın tasarımı, kullanılması gereken uygun anlamlılık testini belirler. Parametrik Testler: Eğer veriler normal olarak dağıtılmış ise ve uygun aralıklarda ölçeklenmiş ise, parametrik testler uygundur. Aksi taktirde, parametrik olmayan (nonparametrik) testler seçilir. Farklı istatistiksel yöntemler çoklu gruplardan çıkarılan anlamları karşılaştırır.

İstatistiksel Analizler -II t Testi ve ANOVA testleri Sık kullanılan parametrik testlerin anlamlarını karşılaştırmak üzere farklı tipteki t testleri ve ANOVA testleri ile incelenebilir. Parametrik Olmayan Testler Parametrik olmayan testler ki-kare testleri (Chi-square test), Mann-Whitney U test ve Wilcoxon signed-rank testleri verilebilir. Korelasyon Analizi Korelasyon analizi (Correlation analysis) iki değişken arasındaki anlamlı ilişkilerin tanımlanmasıdır. Regresyon Analizi İki ya da daha fazla değişkenin olması ve niceliksel (quantitative modele gereksinim vardır. Böylece bağlı değişken ile bağımsız değişkenler arasındaki ilişkiyi bulmak üzere regresyon analizi (regression analysis) gerçekleştirilebilir.

Deneysel Araştırmalardaki (Experimental Reasaerch) Testlerden Farklılıklar Deneysel araştırmalar yapılırken gerçekleştirilen istatistiksel testler farklı yöntemlerle toplanmış verilerle ile ilgili çalışmalar idi. Kullanıcı çalışmaları (user studies) için uygun istatistiksel yöntemlerin seçimi ve test sonuçlarının doğru yorumlanması temeldir. Çalışmaya göre haftalar, aylar ya da yıl boyutundaki hazırlıklar ve verilerin toplanmasından sonra, ortaya oldukça yüklü bir veri kümesi çıkar. Bu veri kümesi artık rahatlıkla kullanılabilir. Çalışmaların türüne göre, veri analizi aşaması, veri toplama aşamasına eşit veya daha fazla emek yoğun bir çalışma aşamasıdır. Kullanılacak istatistiksel yöntem türüne göre, örneğin güven eşiği (confidence threshold) ve önemlilik testi (significance test) yapılabilir. Bu testlerin sonuçlarının yorumlanması ile verileri analiz edilirken birçok kritik karar alınabilir. İstatistiksel yöntemin yanlış seçimi veya sonuçların yanlış yorumlanması ile emekle elde edilen verilerin israf edilmesine neden olan hatalı sonuçlara yol açabilir.

İstatistiksel Testler (Bu bölümde incelenecek olan) Çalışmaya bağlı olarak uygun yöntem seçilerek istatistiksel yazılımında uygulanır ve elde edilen sonuçlar yorumlanır. Genel veri analizi işlemleri ve çok kullanılan istatistiksel yöntemler : Bağımsız örneklerin t testi (independent-samples t test), Eşleştirilmiş örneklerin t-testi (paired-samples t test), Tek yönlü varyans analizi (one-way analysis of variance (ANOVA)), Factorial ANOVA, Tekrarlanan ölçümler (repeated measures) ANOVA, Korelasyon (correlation), Regresyon (regression), Ki-kare testi (chi-squared test)

Tek Yönlü ve İki Yönlü VaryansAnalizi IndependentVariable(IV) Tek yönlü veya iki yönlü, Varyans Analizi testin bağımsız değişkenlerinin sayısını ifade eder. Tek yönlü bir bağımsız değişken (2 seviyeli) ve iki yönlü iki bağımsız değişken (birden fazla seviyeye sahip olabilir) vardır. Örneğin, tek yönlü Varyans Analizi bir bağımsız değişken (tahıl gevreği) ve iki yönlü Varyans Analizi ise iki bağımsız değişken (tahıl gevreği, kalori) olabilir.

ANOVA Testi ANOVA testi, anket veya deney sonuçlarının anlamlı olup olmadığını öğrenmenin bir yoludur. Bu da, boş hipotezin reddedilmesi veya alternatif hipotezin kabul edilmesinin gerekip gerekmediğinin çözümüdür. Temel olarak, boş ve alternatif hipotez arasında fark olup olmadığını görmek için farklı test grupları olmalıdır. Örneğin; bir arayüz geliştiricisinin ürününe son halini vermek için karar vermesi gereken iki farklı süreç olsun. Bir sürecin diğerinden daha iyi olup olmadığı bilinmek istenir ve sorunun bir olası cevabı bu test ile elde edilebilir.

ANOVA testinin Excel üzerinden çalışması

SPSS deki ANOVA Tekrarlanan Ölçümler

Verilerin İstatistiksel Analize Hazırlanması Orijinal verilerin toplanması laboratuvar ortamındaki deneylerle, kullanılabilirlik testleri ile (usability tests), alan çalışmaları ile (field studies) veya daha farklı şekillerde sağlanır. Daha sonra bu verilerin istatistiksel analizi yapılır. Bunun için bir önişleme (preprocessing) gerekir. Orijinal veriler toplandığında, elle girilen verilerde hatalar olabilir ya da uygun formatta olmayabilir. Bu hatalar veya tutarsızlıklar filtrelenmez veya düzeltilmezse, tüm veri setinde problem oluşabilir. Veriler içerisinde silinmesi gerekenler varsa,örneğin yaşın 223 olarak girilmiş olması gibi, temizlenir. Otomatik olarak toplanmış verilerin hatalarının ayıklanması için de araştırma gerekir

Verilerin İstatistiksel Analize Hazırlanması Çoklu veri giriş tekniklerini araştıran bir çalışma üzerinde çalışılıyor olsun. Bu çalışmada performansı değerlendiren veriler (örneğin, tıklamaların sayısı ve zaman gibi ) verileri işleyen yazılım (data logging software) tarafından otomatik olarak kaydedilecektir. Katılımcıların kişisel tercihleri ve memnuniyet verileri, çeşitli anketler aracılığıyla elle toplanabilir. Böylece aynı katılımcıyla ilgili tüm verilerin doğru bir şekilde gruplandırıldığından emin olunmalıdır. Bir katılımcının performans verileri başka bir katılımcının kişisel verileriyle gruplandırılmışsa sonuç geçersiz olacaktır.

Verilerin Kodlanması Demografik bir Verinin Orijinal Formu Örneği (Sample Demographic Data in Its Original Form) Kodlanmış Formdaki Örnek Demografik Veri ( Sample Demographic Data in Coded Form)

t-testleri İki yöntemi karşılaştırmak için kabul edilen istatistiksel prosedür testidir. Gerçekleştirilecek çalışmanın özel tasarımına göre farklı türlerde t testi uygulanmalıdır. Karşılaştırılan iki grubun birbiri ile ilişkisi yoksa, bağımsız örnek (independent sample) t testi kullanılabilir. İki ortalamaya (mean) aynı grup tarafından katkıda bulunma söz konusu ise, eşleştirilmiş örneklem t testi (paired samples t) düşünülebilir. t

t-testi Örneği Bazı kelimelerin (bir kelime grubunun) anlamlarının tahmini için geliştirilmiş bir yazılımının kullanımının yazma hızını etkileyip etkilemediği araştırılsın. Testin ho hipotezi şöyle ifade edilecektir: Kelime tahmini yazılımını kullananlar ile yazılımı kullanmayanlar arasında görev tamamlanma süresinde önemli bir fark yoktur.

Bağımsız Örneklem t-testi İki katılımcı grubunun alındığı hipotez test edilsin. Gruplardan biri sadece standart bir kelime işlem yazılımı kullanırken, diğer grup, kelime öngörme fonksiyonlarını kullanan kelime işlem yazılımını kullansın. Eğer rastgele örnekleme metodu kullanılıyorsa, iki grup birbirinden bağımsızdır. Bu durumda, bağımsız örneklem t- testi veri analizi için uygundur.

Tanımlayıcı İstatistikler (Descriptive Statistics) Örneğin, veri noktalarının ait olduğu aralık inmek istenebilir ya da veri noktalarının nasıl dağıldığını bilinmmek istenebilir En yaygın kullanılan tanımlayıcı ölçümler: ortalama, medyan, mod, varyans, standart sapma aralık.. içerir.

MerkeziEğilim Ölçümleri Measures of Central Tendency Ortalama (mean) veri setinin aritmetik ortalamasıdır. Bir çalışmadaki çoklu gruplar ortalamalarını karşılaştırıyor olsun. Bir grubun ortalaması diğer grubun ortalamasından büyük ise, t testi gibi önem testleri yapılabilir. Böylece farkın istatistiksel olarak anlamlı olup olmadığı araştırılır. Medyan (median) is bir veri setindeki orta değerdir (middle score) Aşağıdaki veri setleri verilmiş olsun. ortalaması 30.4, medyan 29.

MerkeziEğilim Ölçümleri Measures of Central Tendency Mod, bir veri setinde en yüksek frekansla oluşan değerdir. Yedi katılımcıdan her hafta İnternette geçirdikleri saat sayısı hakkında aşağıdaki veriler toplanmış olsun. Veri setinin modu 22

Yayılma Ölçüleri Measuresof Spread Diğer bir önemli tanımlayıcı ölçümler grubu, veri noktalarının veri kümesinin merkezinden ne kadar sapma gösterdiğidir. Kısaca, veri setinin ne kadar yayıldığını bilinmek istenir. Bu gruptaki ölçümler aralık, varyans ve standart sapmaları içerir.

Normal Dağılım Bir veri setinin dağılımını tanımlamak için normal dağılım yaygın olarak kullanılan bir yöntemdir. Normal dağılım ortalama ve standart sapma ile tanımlanabilen özel bir çan şeklindeki dağılımdır Bir popülasyonun (örneklemin) yoğunluğu, öğrenci notları ve çeşitli performans ölçütleri gib farklı çalışma alanlarındaki birçok özellik normal olarak dağıtılabildiği için, normal dağılım şekli veri analizi için çok önemlidir ve faydalıdır.

Dağılım Ölçütleri Measuresof Spread Aralık (range), veri kümesindeki en yüksek ve en düşük puanlar arasındaki mesafeyi ölçer. Yazma hızı veri setinde, aralık (range) 50-15 = 35'tir. Aralık ne kadar büyükse, veri seti o kadar fazla dağıtılır. Bir veri setinin varyansı, örneklem için veri setinin, mümkün bütün değerlerin ortalamadan (beklenen değer) uzaklıklarının karelerinin ortalaması şeklinde bulunan bir ölçüdür. Varyansın kareköküne standart sapma denir. Aralık için değerlendirildiği gibi, daha yüksek varyanslar veya standart sapmalar veri setinin daha iyi dağıldığını gösterir.

Ortalamaların Karşılaştırılması Birden fazla koşulu olan veya fazla sayıda grup içeren kullanıcı çalışmalarında, araştırmacının amacı, koşullar veya gruplar arasında bir fark olup olmadığını bulmaktır. İki arama motorunun etkinliğinin değerlendirildiği ve bu etkinlikte gruplar arası (between group design) bir tasarım gerçekleştirildiğinde, iki katılımcı grubu üzerinde çalışıldığı kabul edilsin. Her grubun bir dizi arama gerçekleştirmek üzere, iki arama motorundan birini kullanması istenir. Grup içi bir tasarım (with-in group design) seçilirse, bir katılımcı grubu için her katılımcının her iki arama motorunu kullanarak bir dizi arama işlevi gerçekleştirilir. Her iki durumda da, iki arama motoru arasında bir fark olup olmadığını bulmak için iki grubun performans koşulları karşılaştırılır.

Between-group design Katılımcıların üç gurubu da deneylerde yer alır ve her grup Within-group design Her katılımcı çoklu deneysel koşula maruz kalır. Katılımcıların sadece bir grubu tüm deneyler mevcuttur.

Ortalamaları ve bunların farklı uygulamalarını karşılaştırmak için çok kullanılan Önem testleri (Significance Tests