SPSS (Statistical Package for the Social Sciences) Genel Yapı ve Tanıtım : Tahmine Dayalı Analitik Yazılımı SPSS Yazılımları ilk olarak 1967 yılında 2 doktora öğrencisinin tez çalışmaları için geliştirilmeye başlanmış, zaman içerisinde diğer öğrencilerden gelen talepler doğrultusunda geliştirilmiye devam edilmiş ve 1968 yılında profesyonel bir şirket yapısı altında ürünleştirilmeye başlanmıştır. İlerleyen yıllarda SPSS anket ve saha araştırmaları konusunda çözümler sunmaya başlamış, 1998 yılından itibaren ise dünyadaki ilk veri madenciliği çözümü olan Clementine (şimdiki adı Modeler) ile yapay zeka ve istatistik kökenli yöntemleri bir arada sunduğu Veri Madenciliği alanında yer almıştır. SPSS, Temmuz 2009 da başlayan ve Ekim 2009 da sonuçlanan bir süreç sonunda IBM in analitik pazarda güçlü olma stratejisi ile IBM bünyesine katılmıştır. SPSS Yazılımları IBM in Smarter Planet stratejisinin en önemli bileşenini oluşturmaktadır. IBM Analytical Decision Management IBM Social Media Analytics IBM SPSS Data Collection IBM SPSS Modeler Tahmine Dayalı Bakım IBM SPSS Statistics Büyük Veriler İçin Tahmine Dayalı Analitik
SPSS Yazılımları dört (4) ana grup altında toplanmaktadır: SPSS İstatistiksel Analiz Çözümleri SPSS Veri Madenciliği Çözümleri SPSS Veri Toplama Çözümleri SPSS Kurumsal Entegrasyon Çözümleri Dersin konusu olarak ele alınacak ürün İstatistiksel Analiz Çözümleri arasında bulunan SPSS Statistics : Tahmin Edin: Verileri anlamak, eğilimleri tanımlamak ve doğru tahminler üretmek için gelişmiş istatistiki analizin gücünü.. Sebep sonuç ilişkileri kurarak karar verme konusunda yorum yapan bir bilgisayar yazılımıdır Bilgisayara kurulu SPSS programı çalıştırıldığında aşağıdaki ekran ile karşılaşılır : Hazır bir paket program olması nedeniyle işlevi ve rolü hakkında yeterli bilgi edinildiğinde kullanımı gayet kolay ve anlaşılır bir yazılım haline gelmektedir. Temel olarak bir veri grubu üzerine; bu veriler rassal seçilmiş örneklem gruplarına anket yapılarak deney sonuçları cihazlarla elde edilmiş ölçüm sonuçları benzer işi yapan farklı makinalarla hesaplanmış değerler vb elde edilmiş olabilir hedeflenen sentez, tahmin ve değerlendirmelere ulaşmak için kapsamında bulunan analiz yöntemlerin uygulanmasıdır.
Veriler sisteme işlendikten sonra esas olarak Analiz menusu altındaki fonksiyonlar kullanılarak bu veriler üzerinden tahmin ve değerlendirmeleri yapılır. Hangi Analiz seçeneğinin hedefinize uygun olduğu ilerleyen dönemlerde edineceğiniz analiz yöntemleriyle ilgili istatistiki bilgilerle şekillenecektir.
Giriş ve Tanım Ekranları Yeni bir analiz penceresi dataların analiz için uygulamaya girileceği data editor ekranı ile görülür. Temel olarak 2 tab dan oluşur : Data View : dataların görünümü Variable View : değişken tanımlarının görünümü var = variable =değişken Yukarıdaki ekranda Data View (Veri ekranı) sekmesi açıktır. Variable View (Değişken ekranı)" sekmesine tıkladığımızda aşağıdaki ekran açılır: Bunlar değişken özellikleridir. Değişkenin adı, türü, vb. Data View = Veri Ekranı Variable View = Değişken Ekranı
SPSS üzerinde analize temel verileri belirlemek üzere aşağıdaki örnek anketin kullanılacağını varsayalım : 28 sorudan oluşan Kütüphane kullanım memnuniyeti anketidir. Soruların her biri bir değişken olarak kabul edilecektir. KÜTÜPHANE KULLANICI MEMNUNİYET ANKETİ Bu anketten elde edilecek veriler doğrultusunda sizlerin istek ve beklentilerine uygun bir hizmet ortamı sağlamak, gerekiyorsa kütüphanelerimizde yeniden yapılanma etkinliklerine başlanması amaçlanmaktadır. Her bir ifade ile ilgili düşüncenizi, seçtiğiniz cevabın yanındaki parantezi işaretleyerek belirtebilirsiniz. 1. Yaşınız? (Lütfen belirtiniz) 2. En çok hangi kütüphanemizden yararlanıyorsunuz? ( ) Merkez Kütüphanesi ( ) MYO Kütüphanesi ( ) Kolej Kütüphanesi 3. Bölümünüz? (Lütfen belirtiniz) 4. Ünvanınız? (Lütfen belirtiniz) 5. Kütüphanenin hangi hizmetinden en çok yararlanıyorsunuz? ( ) Elektronik kaynaklar ( ) Süreli yayınlar ( ) Danışma hizmetleri ( ) Ödünç verme ( ) Diğer 6. Kütüphaneyi ne kadar sıklıkla kullanıyorsunuz? ( ) Hergün ( ) Haftada ikiden çok ( ) Haftada iki kez ( ) Haftada bir kez ( ) Diğer 7. Kütüphaneyi hangi saatler arası kullanıyorsunuz? ( )08:00-12:00 ( )12:00-13:00 ( )13:00-17:00 ( )17:00-21:00 ( )21:00-24:00 ( )24:00-08:00 8. Kütüphanenin açık olduğu saatler yeterli ve uygundur. 9. Hizmet aldığınız yerlerde (ödünç verme vs.) işlemler hızlı gerçekleştirilmektedir. 10. Telefonla bilgi almaya çalıştığımda gördüğüm ilgiden ve verilen bilgiden memnunum. 11. Kütüphanede bana bir kullanıcı olarak önem verildiğini hissediyorum. 12. Ödünç verilen kitap sayısı yeterlidir.
13. Kitapların ödünç verilme süresi yeterlidir. 14. Kitap rafları düzenlidir. 15. Dergi rafları düzenlidir. 16. Kütüphaneye gelen yeni yayınlar hızlı bir şekilde duyurulmaktadır. 17. Kütüphaneyi daha etkin kullanabilmemiz konusunda bizlere düzenli olarak eğitim verilmektedir. 18. Kütüphanenin web sayfası kütüphane kaynaklarını, verilen hizmetleri ve genel olarak kütüphaneyle ilgili bilgileri yansıtma konusunda oldukça yeterlidir. 19. Evimdeki ve üniversitedeki bilgisayarımla kütüphane kataloğunu kolayca tarayabiliyorum. 20. Evimdeki ve üniversitedeki bilgisayarımla elektronik yayınları kolayca tarayabiliyorum. 21. Kütüphanenin üst yönetimine kolayca erişerek problemimi rahatlıkla anlatabiliyorum. 22. Kütüphanenin tüm hizmet noktalarında (fotokopi, ödünç verme bankosu vb.) kullanıcılara eşit davranılmaktadır. 23. Kütüphanede hizmetler hakkında anlaşılabilir, tam ve güncel bilgi veren broşürler ve yönlendirmeler yeterlidir. 24. Yerinde bulamadığım kitap, dergi, ansiklopedi vb. bilgi kaynaklarına erişebilmem konusunda yeterince yardımcı olunmaktadır. 25. Kütüphane hizmetleri hakkında şikayet ve önerilerim dikkate alınır. 26. Kütüphane kataloğunu tarayabileceğim bilgisayarlar sayıca yeterlidir. 27. Kütüphanenin alanımla ilgili bilimsel kitap koleksiyonu güncel/yeterlidir. 28. Kütüphanenin alanımla ilgili elektronik kaynakları (CD-ROM, DVD-ROM, çevrimiçi veri tabanları, sesli kitaplar, elektronik dergiler vb.) yeterlidir. 1. değişken: Yaş 2. değişken: Kütüphane 3. değişken: Bölüm.
Verilerin SPSS e girilmesinde ilk adım değişkenlerin tanımlanmasıdır. Bu forma ilişkin değişken girişi aşağıdaki gibi olacaktır: 1. soru için: Yaş Sorusu 2. Soru için : Kütüphane tercihi
böylece devam ettirilerek 28 soruya ilişkin değişkenlerin girildiği ekran aşağıdadır : Değişken sayfasındaki her bir alana ilişkin tanımlar aşağıda verilmiştir: Name: Değişken adı (Değişken adı en fazla 8 karakter olarak ve Türkçe karakter içermeyecek biçimde girilmelidir). Type: Değişken türü (Genelde numeric (sayısal) seçeneği seçilir. Bunun anlamı girdiğimiz değişkenler için sayı ile ifade edilebilen verilerin olduğudur. Örneğin, ilk değişkenimiz olan Yaş değişkeni için 21, 23, 30 gibi sayı ile ifade edilebilen yanıtlar alınacağından bu değişken numeric (sayısal) olarak işaretlenmiştir. Width, Decimal: Girilecek değişken değerlerinin tamsayı ve ondalık kısımları en fazla kaç basamaklı olacaksa tamsayı için width kısmına, ondalık kısım için ise decimal kısmına o değerler girilmelidir. Örneğin, ilk değişkenimiz olan Yaş değişkeni için girilecek değerler genelde 2 basamaklıdır, bu değişken için olasılığı çok düşük olmakla birlikte 3 basamaklı bir değer de girilebilir (100 ün üzerinde yaşlar). Yaş tamsayı olduğundan ondalık kısım da olmayacaktır. Bu durumda width (tamsayı) kısmı 3, decimal (ondalık) kısmı 0 olmalıdır.
Label: Değişken etiketi anlamına gelmektedir. Değişkeni nasıl tanımlamak istiyorsak bu kısma onu yazarız. Örneğin 3. soru için (s3 değişkeni) için değişken etiketi (label) Bölüm şekinde tanımlanmıştır. Veri girişinden sonra yapılacak veri analizleri sonucunda oluşturulacak tablo ve grafiklerde değişken etiketleri görüneceği için bu etiketlerin çalışmanın en başında verilmesi önem taşımaktadır. Values: Bu kısımda değişkenin alabileceği mümkün değerler için kodlama yapılmaktadır. Örneğin, Üniversite bünyesinde 3 kütüphane yer almaktadır. Bu durumda 2. değişkenin alabileceği 3 değer vardır: 1 (Merkez Kütüphanesi), 2 (MYO Kütüphanesi) ve 3 (Kolej Kütüphanesi). Bu durumda, Merkez Kütüphanesi: 1, MYO Kütüphanesi: 2 ve Kolej Kütüphanesi: 3 olarak kodlanır. Measure: Değişken türüdür. Nominal (Sınıf Değişkeni), Ordinal (Sıralı değişken), Scale (Aralıklı-Oranlı değişken). Örneğin yaş değişkeni (s1) aralıklı-oranlı, Yararlanılan kütüphane (s2) sınıf değişkeni, Kütüphaneden yararlanma saatleri (s7) sıralı değişkendir. Değişkenlerin tamamını değişken sayfasında yukarıdaki gibi tanımladıktan sonra veri giriş ekranına geçilerek ankete verilen yanıtlar buraya girilir: (Veri giriş ekranında girdiğimiz değişken isimlerinin başlıklarda (daha önce var yazan kısımlarda) göründüğüne dikkat edin) Değişken isimleri
Laboratuvar Çalışması : CATs de kaynaklar içinde verilmiş olan KutuphaneAnket.pdf dosyasından soru ve seçeneklerini kullanarak Variable View görünümünü oluşturunuz. Kütüphane kullanıcılarının daha çok hangi yaşlarda oldukları, okudukları ya da çalıştıkları bölümler, en çok kullandıkları kütüphane hizmetleri, kütüphane hizmetlerinden memnun olup olmadıkları vb. bilgilerin elde edilebilmesi için anket verilerinin SPSS veri sayfasına girilip analiz edilmesi gerekir. Veri girişinde her bir anket formu bir satırı yani 1 kullanıcıya ilişkin bilgileri ifade edecektir. Örneğin yukarıdaki doldurulmuş anket formunun veri girişi aşağıdaki gibi olacaktır: Data ekranında Value Labels seçildiğinde de rakamsal değerlere karşılık metin yanıtları karşımıza gelecektir. Bu şekilde örneklemlendirdiğimiz yapıyla SPSS üzerinde anketimiz analize hazır hale getirilmiş olacaktır. Sonraki adım ilgili analiz metoduyla verilere yönelik tahmin, yorum ve değerlendirmelerin gerçekleştirilmesidir.
Temel Analizler SPSS üzerinde hazır ve elinizdeki verilerin uygulanarak yorumlanmasını sağlayacak onlarca analiz yöntemi mevcuttur. Herhangi bir anket ile ilgili temel değerlendirme noktaları, sonuçlarının özetlenmesine yönelik en bilinen fonksiyonlar : Frekans Dağılımları Frekans dağılımları anket sorularına verilen yanıtlar arasındaki değişikliği göstermenin en basit yöntemlerinden biridir. Bu dağılımlar, anket sorularına verilen cevapların basitçe sayılması ve gruplandırılması ile elde edilebilir. Frekans dağılımları kolay yorumlanabilmeleri için genelde tablolar ya da grafik barlar halinde sunulurlar. Ankete katılanların sayısı çok fazla olabilir. Anket bilgilerini düzenlemenin bir yolu da ankete katılanları sınıflar halinde düşünmektir.
Sınıflandırma, katılımcıları, benzer özelliklerine dayanarak, organizasyonla olan ilişkileri (içeriden, tüketi ci, tedarikçi), faaliyet alanları ya da kullandıkları hizmet ya da ürünlerin çeşidine göre gruplandırmaktır. Sınıflandırma farklı grupları belirleme ve tecrübelerini ayırt etmede kullanılan genel bir yöntemdir Ankete katılanları belirleyip, verilerinin gerektiği gibi sınıflandırılıp analiz edilebilmesi için, ankette demo grafik maddeler kullanılır. Yüzdeler : Anket verilerini özetlemenin en basit yollarından birisi de yüzdelerdir. Yüzde, belirli bir cevap tercihinin toplam sayısının, toplam cevap sayısına bölümünden elde edil en sonucun 100 le çarpılması ile elde edilir. Örneğin 1000 kişiye uygulanan bir ankettin 1nci sorusunda A seçeneğini işaretleyenlerin sayısı 1 25 olsun. Buradan A seçeneğini işaretleyenlerin yüzdesi; 125/1000=0.125, =.125x 100 = 12.5, %12.5 olarak bulunur. Yüzdeler tablolar, grafik barlar ya da pasta diyagram yardımı ile gösterilir Karmaşık analizlere örnekler Korelasyon ve Regresyon metodlarının kullanımlarıyla oluturulan istatistiksel değerlendirmeler verilebilir. Oluşturulan analiz ve değerlendirmelerin Grafiklerle desteklenmesi, çalışmanın okunması ve anlaşılırlılığını kolaylaştırmaktadır. SPSS de Graph menusü altından değişkenlere göre çok sayısa grfaik hazırlatılabilir.
İleri Analizler ve Uygulama Örneği Lise öğrencileri adlı veri dosyası 200 lise öğrencisinin demografik bilgilerini ve çeşitli derslerden aldıkları puanları içermektedir. (data dosyası CATs de paylaşılmıştır) Her öğrenciyle ilgili olarak toplanan veriler toplam 11 değişkende tutulmuştur. Öncelikle SPSS veri ve değişken sayfalarının hazırlanması gereklidir. lise öğrencileri.sav için uygulamaya gelen bilgiler :
Tanımlayıcı İstatistikler 200 lise öğrencisinin matematik dersinden aldıkları notlar için uygun tanımlayıcı istatistikleri (ortalama, ortanca, en küçük ve en büyük değer, standart sapma vb.) bir tablo halinde gösterip, kısaca yorumlayınız: Frekans değişkeni : Matematik Dersinden aldığı not İstatistik değerleri : Mean, Median, Mode merkezinde Standart Sapma, Minimum, Maksimumu ve Range için analiz sonuçları
Matematik notu değişkenine ilişkin tanımlayıcı istatistikler : Tanımlayıcı İstatistik Değer Ortalama 53 Ortanca 52 Tepe değeri 57 Standart sapma 9,4 Dağılım genişliği 42 En küçük değer 33 En büyük değer 75 şeklinde elde edilir. Sonuçların yorumlanması : 200 lise öğrencisinin matematik dersinden aldıkları notların ortalaması 53 tür. 200 öğrencinin matematik notuna ilişkin ortanca değer 52 dir. Ortanca değerinin 52 olması öğrencilerin matematik notları en düşükten en yükseğe doğru sıralandığında tam ortada yer alan notun 52 olduğu anlamına gelmektedir. Tepe değeri 57 dir. Bunun anlamı 57 ye yakın not alan öğrenci sayısının fazla olmasıdır. En yüksek not 75, en düşük not ise 33 tür. 200 öğrencinin matematik notlarına ilişkin dağılımın genişliği 42 dir (75-33). Standart sapma değeri 9,4 bulunmuştur. Standart sapma 200 öğrencinin matematik dersinden aldıkları notlar arasındaki farklılığın bir ölçüsüdür. Standart sapma değeri çok büyük bulunmadığı için notlar arasındaki farklılığın çok fazla olmadığını söyleyebilecektir.
Grafik Oluşturma Öğrenciler örneklemimizde bulunan veri grubu için cinsiyet ve sosyo ekonomik durum arasındaki ilişkiyi gösteren grafik hazırlanması : Graphs menüsü altından Char Builder seçilir. Temel grafikler hazır grafik galerisinde görünmektedir İlgilenilen ve hazırlanacak grafik formatı; sürükle /bırak yöntemi ile grafik Önİzleme / preview ekranına taşınır. Grafikte kullanılacak değişken ve analiz değerleri tanımlanır o X ekseni için : Sosyo Ekonomik durumu o Color Group = Ayrıştırılacak veri : Cinsiyet o Bar grafik Y kolonu : count / sayısı Olacak şekilde aşağıdaki gibi düzenlenir :
Hazırlanan yapı üzerinden çıktı ekranında karşılaşılan sonuç aşağıdaki gibi olacaktır. Temel yorum : Sosyo ekonomik olarak düşük seviyede kız öğrencimizin erkeklere oranla daha fazla olduğudur. Bununla birlikte örneklemimizde yoğunluk (cinsiyetten bağımsız) orta seviyeli sosyo ekonomik gruptadır. Ders Bilgisi : bu 200 lük örneklem üzerinden yapılandırılabilecek parametrik, parametrik olmayan ve uyumluluk istatistiksel analiz örnekleri için referans SPSS LiseOrneklemAnalizler.pdf dosyasıdır.