Mühendislik Bilimleri için İstatistik Hazırlayan Muammer Nalbant 1
Mühendislik Bilimleri İçin İstatistik Kurs Müfredatının Gözden Geçirilmesi 2 İmtihan ve Grup Projesi Sunuşu 4-5 Grup Oluşturma JMP ye Giriş İletişim Hattı (kurs web sitesi, iletişim araçları) Öğretici Bölümler 2
Bölüm Amaçları İstatistiği tanımlamak Anahtar terimlerle tanışmak: popülasyon, değişken, istatistik. Örnek verinin nasıl elde edileceğini öğrenmek. 3
1.1: İstatistik nedir? İstatistik: Veri toplama, tanımlama ve yorumlama bilimi. İstatistiğin iki alanı vardır: Tanımlayıcı İstatistik: örnek verisinin toplanması, sunumu ve tanımlanması. Kestirimsel (Çıkarımsal/Inferential) İstatistik: populasyonlar hakkında karar verme ve sonuç çıkarma. 4
Örnek: Ülke çapında matematik ve sözlü sınav sonuçları incelendi. Aşağıdaki beyanlardan hangisi tanımlayıcı, hangisi çıkarımsaldır. Ortalama matematik notu 4.92 dir. (tanımlayıcı) Ortalama sözlü notu 4.75 dir. (tanımlayıcı) Diğer lisedeki öğrenciler matematikten daha yüksek fakat sözlüden daha düşük not aldılar. (tanımlayıcı) İmtihana giren tüm öğrencilerin % 80 i okullara yerleştirildi. (Inferential-kestirimsel) Öğrencilerin % 32 si sözlü sınavda 61 üstünde not aldılar. (Tanımlayıcı) Matematik notları, 10 yıl öncesinden daha yüksektir. (Inferential -kestirimsel) 5
1.2 Temel Terimlere Giriş Popülasyon: Kişiler veya nesneler veya olaylar hakkında analiz edilen özellikler topluluğu veya takımı. Popülasyonların iki çeşidi: sonlu veya sonsuz. Örnek: Popülasyonun alt takımı. Parametreler, popülasyonlardan hesaplanır. İstatistik, örneklerden hesaplanır. 6
Değişken: Popülasyon veya örneğin her bir münferit elemanı hakkındaki özellik. Veri (tekil): Popülasyon veya örneğin bir elemanıyla birleşmiş değişkenin değeri. Bu değer; rakam, kelime veya sembol olabilir Veri (çoğul): Örneğe ait elemanın her birinden değişken için toplanan değerler takımı. Deney (Experiment): Verilerin elde edildiği planlanmış aktivite. Parametre: Tüm popülasyonun (sabit) tüm verisini özetleyen sayısal değer İstatistik: Örnek verisini özetleyen sayısal değer. (örnekle değişir) 7
Örnek: Bir fakülte dekanı, fakültedeki öğrencilerin ortalama yaşını öğrenmek istiyor. Bu durumda aşağıdaki temel terimleri teşhis ediniz. Populasyon fakültedeki tüm fakülte öğrencilerinin yaşlarıdır. Örnek (sample) o popülasyonun her hangi bir alt kümesidir. Mesela, 10 fakülte öğrencisini seçebilir ve onların yaşlarını tespit edebiliriz. Değişken (variable) her bir fakülte öğrencisinin yaş ıdır. Bir veri (data) belirli bir fakülte öğrencisinin yaşı olacaktır. Veri (data) örnekteki değerler kümesi olacaktır. Deney (experiment) örneği biçimlendiren ve örnekteki her fakülte öğrencisinin gerçek yaşını belirlemeyi seçmek için kullanılacak yöntem olacaktır. İlgilenilen Parametre (parameter) fakültedeki tüm öğrencilerin ortalama (average) yaşıdır. İstatistik örnekteki tüm fakülte öğrencileri için ortalama yaştır. 8
Değişkenlerin iki çeşidi: Kategorik (Kalitatif veya Nitelik) Değişken: Popülasyonun bir elemanını kategorize eden veya tanımlayan değişken. Not:Kategorik değişkenden elde edilen veri için anlamlı olmayan toplama veya ortalama alma gibi aritmetik operasyonlar. Sayısal (Kantitatif veya Nicelik) Değişken: Popülasyonun bir elemanını ölçen değişken. Not: Sayısal değişkenden elde edilen veri için anlamlı olan toplama veya ortalama alma gibi aritmetik operasyonlar. 9
Örnek: Kategorik (kalitatif) veya sayısal (kantitatif) değişkenler gibi aşağıdaki örneklerin her birini teşhis ediniz. 1. Bir istatistik sınıfındaki her öğrencinin memleketi. (Kategorik) 2. Bir benzin istasyonunda birbiri peşi sıra gelen 10 müşteri tarafından pompalanan benzin miktarı. (Sayısal) 4. Her 20 öğrenci tarafından kazanılmış beyzbol kupasının rengi. (Kategorik) 5. Verilen istatistik ev ödevini tamamlamak için geçen zamanın uzunluğu. (Sayısal) 6. Garaja park edilen kayıtlı her arabanın durumu. (Kategorik) 10
Kategorik (kalitatif) veya sayısal (kantitatif) değişkenler, aşağıdaki şekilde alt biçimlere ayrılabilir: Değişken Kategorik Sayısal Nominal (anma) Ordinal (Sıralı) Discrete (ayrık) Continuous (sürekli) 11
Nominal Variable: Popülasyonun bir elemanını sınıflandıran (veya tanımlar, veya isimler) kantitatif değişken. (Medeni hal, Cinsiyet, Ödeme yöntemi) Ordinal Variable: Sıralı konum veya diziyi içine alan kantitatif değişken. (Eğitim) Discrete Variable: Ayrık değişken, saymayla birleştirilmiştir. (Sayı, alınan kurs sayısı, her 5 dakikada çalan telefon sayısı) Sürekli Değişkenler (Continuous Variable): Genellikle ölçüyle birleşmiş sürekli değişkenler. (Mesafe, Parça maliyeti) 12
Örnek: Aşağıdaki örneklerin her birini kalitatif veya sayısal değişken olarak teşhis ediniz: 1. Ankara da verilen herhangi bir günde saat 12.00 deki sıcaklık. 2. Her fakülte üyesi tarafından sürülen otomobil 3. 6 voltluk el feneri bataryasının uygun şekilde çalışıp çalışmadığı. 4. Kurşun kalemin ağırlığı. 5. Telefonla konuşma süresine göre ücretlendirme yapan sayaç. 6. Çocukların yediği çikolatanın markası. 7. Yetişkinler tarafından kütüphaneden alınan kitap çeşidi. 13
Örnek: Aşağıdaki örneklerin her birini kalitatif veya sayısal değişken olarak teşhis ediniz: 1. Ankara da verilen herhangi bir günde saat 12.00 deki sıcaklık. (Sayısal) 2. Her fakülte üyesi tarafından sürülen otomobil (Kategorik) 3. 6 voltluk el feneri bataryasının uygun şekilde çalışıp çalışmadığı. (Kategorik) 4. Kurşun kalemin ağırlığı. (Sayısal) 5. Telefonla konuşma süresine göre ücretlendirme yapan sayaç. (Sayısal) 6. Çocukların yediği çikolatanın markası. (Kategorik) 7. Yetişkinler tarafından kütüphaneden alınan kitap çeşidi. (Kategorik) 14
Örnek: Aşağıdaki örneklerin her birini (1) nominal, (2) ordinal, (3) discrete, veya (4) continuous değişken olarak teşhis ediniz 1. Ağrının tekrar gelinceye kadar geçen zamanın uzunluğu. 2. Paketteki bisküvi sayısı. 3. İstatistik kitabında kullanılan renklerin sayısı. 4. Evdeki buzdolabının markası. 5. Yeni arabanın genel memnuniyet oranı. 6. Bilgisayarın sabit diskindeki dosya sayısı. 7. Yüzme havuzundaki suyun PH seviyesi. 8. Tel zımba içindeki zımba tellerinin sayısı. 15
Örnek: Aşağıdaki örneklerin her birini (1) nominal, (2) ordinal, (3) discrete, veya (4) continuous değişken olarak teşhis ediniz 1. Ağrının tekrar gelinceye kadar geçen zamanın uzunluğu. (continues) 2. Paketteki bisküvi sayısı. (discrete) 3. İstatistik kitabında kullanılan renklerin sayısı. (discrete) 4. Evdeki buzdolabının markası. (nominal) 5. Yeni arabanın genel memnuniyet oranı. (ordinal) 6. Bilgisayarın sabit diskindeki dosya sayısı. (continues) 7. Yüzme havuzundaki suyun PH seviyesi. (continues) 8. Tel zımba içindeki zımba tellerinin sayısı. (discrete) 16
1.3: Ölçme ve Değişkenlik Hangi response değişken olursa olsun: verilerde daima değişkenlik olacaktır. İstatistiğin temel amaçlarından biri: değişkenliği ölçme ve karekterize etme. Bir imalat prosesindeki değişkenliğin kontrol edilmesi (veya azaltılması) : istatistiksel proses kontrol. 17
Örnek: Bir tedarikçi, soda kutularına 10 kg soda doldurmaktadır. Her bir kutu gerçekte ne kadar soda ihtiva etmektedir? Herhangi bir kutunun tam olarak 10 kg lik soda ihtiva etmesi hiç olmayacak bir durumdur. Değişkenlik, her hangi bir prosesde vardır. Bazı kutular, 10 kg dan daha fazla, bazıları biraz daha az ihiva edebilir. Ortalama olarak, her kutuda 10 kg lık soda vardır. Tedarikçi, kutuların çoğunda 10 kg lık soda ya yakın soda bulunduğunu dolayısıyla prosesde az bir değişkenlik olmasını beklemektedir. 18
1.4: Veri Toplama İstatikçinin karşılaştığı ilk problem: verinin nasıl elde edileceğidir. Verinin tam veya temsili elde edilmesi önemlidir. Çıkarımlar, veriden elde edilen istatistiği temel alır. Çıkarımlar sadece veri kadar iyi olabilir. 19
Önyargılı Örnekleme Yöntemi: Örnek alınan popülasyondan sistematik şekilde farklılaşan veriyi üreten örnek alma yöntemi. Önyargısız örnekleme yöntemi, önyargılı olmayandır. Örnek alma yöntemleri, sık sık önyargılı örneklerle sonuçlanır: 1.Uygun örnek: kolaylıkla erişilen, popülasyonun elemanlarından seçilen örnek. 2.Gönüllü örnek: gerekli bilgiye katkıda bulunmayı kendi isteğiyle seçen popülasyon elemanlarından toplanan örnek. 20
Veri toplama prosesi: 1. Anket (survey) veya deneyin amaçlarını tanımlayınız. 2. Değişkeni ve ilgili popülasyonu tanımlayınız. 3. Veri toplama ve veri ölçme şemalarını tanımlayınız. Bu, örnek alma prosedürlerini, örnek büyüklüğünü ve veri ölçme cihazlarını kapsar (anket, ölçek, cetvel, vb.). 4. Uygun tanımlayıcı veya çıkarımsal veri analizi tekniklerini tanımlayınız. 21
Veri toplamada kullanılan yöntemler: Deney: Araştırıcı, çevreyi kontrol eder veya değiştirir ve incelenen değişkene etkisini gözler. Anket (Survey-tetkik): İlgilenilen popülasyonun bir kısmının örneklenmesiyle elde edilen veri. Araştırıcı, çevreyi değiştirmez. Sayım: % 100 anket. Popülasyonun her elemanı, sayılır. Nadiren kullanılır: derlenmesi zor ve zaman alıcıdır ve pahalıdır. 22
Örnekleme Çerçevesi: Örneğin alınacağı popülasyona ait elemanların listesi. Örnek: tüm öğrencilerin listesi öğretmende var Örnek Tertibi: örnek çerçevesinden örnek elemanlarının seçimi işlemi. Örnek: 22,000 lik popülasyondan örneği nasıl seçeriz 23
Karar Örnekleri (Judgment Samples): Örnekler tipik olma temeline göre seçilirler Karar örneklerinden elde edilen sonuçların geçerliliği, toplayıcı kararının sağlamlığını yansıtır. Olasılık Örnekleri (Probability Samples): Seçilen elemanlarının olasılık esasına göre çekildiği örnekler. Popülasyondaki her eleman, örneğin parçası olarak belirli bir seçilme olasılığına sahiptir. 24
Rasgele örnekler (Random Samples): Populasyondaki her elemanın seçilme şansının eşit olasılığa sahip olduğu durumda seçilen örnek. n büyüklüğündeki tüm örnekler, eşit seçilme şansına sahiptir. Rasgele örnekler, ya sonlu popülasyondan yerdeğiştirme örneklemesiyle ya da sonsuz popülasyondan yer değiştirme yapmaksızın örneklemeyle elde edilir. Rasgele örnekler, resgele sayılar (random numbers) tablosundan elde edilebilir. 25
Örnek: Bir işveren her sabah her işçinin işi değiş tokuş etmenin ne kadar zaman aldığıyla ilgilenmektedir. Rasgele 35 işçilik bir örnek seçilecek ve bunların değiş tokuş zamanı kaydedilecektir. 2712 işçi vardır. (sonlu populasyon) Her işçi numaralanır: 0001, 0002, 0003, vb.. 2712 ye kadar. Dört haneli rasgele sayılar kullanarak örnek teşhis edilir: Keyfi şekilde başlama yeri alınız Herhangi bir yönde hareket ediniz >2712 sayıları dikkate almayınız Tekrarlanan sayıları dikkate almayınız 26
Sistematik Örnek: birinci elemandan başlayarak birinci k elemanının rasgele seçildiği, örnek çerçevesinin her knıncı parçasının seçildiği örnek. 100 kişinin % 10 unu seçmek için (100/10=10 th konum) Birinci elemanı rasgele şekilde seçiniz = 5 Bir sonrakini seçiniz: 5+10=15, 15+10=25. Tabakalı Rasgele Örnek: örnek alma çerçevesini tabakalaştırdıktan sonra basit rasgele örnek alma tekniği ortalamalarıyla tabakaların her birinden sabit sayıda parça seçerek elde edilen örnek. Bu yıl teklif edilen her kurstan 1 öğrenci seçiniz. 27
Oransal Örnek (veya Kota Örnek): Örnekleme çerçevesinin tabakalaştırılması ve sonra basit rasgele örnekleme tekniğinin ortalamasıyla her tabakadan tabakanın büyüklüğüyle (veya kota/pay ile) orantılı olarak parça sayısı seçilmesiyle elde edilen örnek. Her sınıfta her 20 öğrenci için 1 öğrenci seçimi Salkım Örnek (Cluster Sample): örnekleme çerçevesinin tabakalaştırılması ve sonra tabakanın tümünden değil bir kısmından parçaların tümünün veya bir kısmının seçilmesiyle elde edilen örnek. Her Salı akşamı sınıftan 1 öğrenci seçimi 28
Uygun (Convenience) Örnek ve Gönüllü Örnek, sıklıkla ön yargılı örneklerle sonuçlanabilir. Veri, deneyler veya gözlem çalışmalarıyla toplanabilir. Anketler, gözlemsel çalışmalardır. Rasgele (tesadüfi) örnek (her veri değerinin aynı şansa sahip olduğu), en yaygın olasılık örneğidir. 29
Rasgele (Random) Örnekler Rasgele (Random) Sayılar Cetveli Sistematik (herknıncı eleman) Tabakalı- Her tabakadan (gruptan) elemanların sabit sayısı Oransal her katmandan büyüklüğüne göre belirlenen elemanların sayısı Salkım (Cluster) belirli katmandaki tüm elemanların sabit sayısı 30
1.5: Olasılık ve İstatistiğin mukayesesi Olasılık (Probability): tüm ihtimalleri (popülasyona sahip olduğunuzda tüm ihtimalleri bilirsiniz) bildiğinizde bir şeyin meydana gelme şansı İstatistik: örneğe dayalı popülasyon hakkında yorum veya genelleştirme yapmaya imkan sağlar. 31
Örnek: Bir kavanozda 100 şeker vardır. Şekerlerin 15 tanesi kırmızıdır. Avuçla 10 tane şeker seçilir. Olasılık sorusu: Seçilen 10 şekerden 3 tanesinin kırmızı olma olasılığı nedir? Örnek: İçinde 1000 şeker bulunan bir kavanozdan avuçla 10 tane seçiliyor. Avuçla alınan şekerlerden üçü kırmızıdır. İstatistik sorusu: Tüm kavanozdaki kırmızıların oranı nedir? 32
1.6: İstatistik ve Teknoloji Elektronik teknolojisi, istatistik alanında çok büyük bir etkiye sahip olmuştur. İstatistik tekniklerinin çoğu, tekrarlayıcı niteliktedir: bilgisayarlar ve hesap makinaları, bu hususta iyidir. İstatistik yazılım paketlerinin birkaçı: JMP, MINITAB, SYSTAT, STATISTICA, SAS, Statgraphics, SPSS ve hesap makinaları. 33