BÖLÜM..AMAÇ GİRİŞ: İSTATİSTİĞİ MÜHEDİSLİKTEKİ ÖEMİ Doğa bilimlerinde karşılaştığımız problemlerin birçoğunda olaydaki değişkenlerin değerleri bilindiğinde probleme kesin ve tek bir çözüm bulunabilir. Örneğin bir cismin kütlesi ve cismi etkileyen kuvvet bilindiğinde cismin ivmesini hesaplayabiliriz, bir borunun kesit alanı ile borudaki akışkanın ortalama hızı biliniyorsa boru kesitinden birim zamanda geçen akışkanın hacmini bulabiliriz. Bu gibi olaylarda yasalara deterministik (gerekirci) anlamda bilinmektedir. Buna karşılık öyle olaylar vardır ki bunlarda sonucu önceden kesin olarak bilmek mümkün değildir, işte bu tür olaylara istatistiki (stokastik) rasgele olaylar denir. Basit bir örnek olarak bir zar atışında zarın hangi yüzünün görüneceğini önceden kestiremeyiz. Belirsizliklerin etkilediği problemlere inşaat mühendisliğinde bir örnek olarak bir barajın projelendirilmesinde kullanılacak taşkın debisinin belirlenmesini ele alalım.proje taşkını olarak yıllık taşkın diye adlandırılan taşkının seçildiğini kabul edelim. Bu noktada çeşitli sorular akla gelir:. yıllık taşkın nasıl tanımlanabilir? Bu her yılda bir kere görülen bir taşkın mıdır? 2. Barajın ömrünün 5 yıl olduğu kabul edilirse bu süre içinde böyle bir taşkının görülmesi olasılığı nedir? 3. Elimizde 2 yıl süreli taşkın kayıtları varsa akarsuyun yıllık taşkın debisini nasıl hesaplayabiliriz. Bu ve buna benzer soruların cevaplarını verebilmek için olasılık teorisi ve istatistiki bilimlerine başvurmak gerekir. İstatistik için gözlem yapmak gerekir. İstatistiki bilgileri kullanmak için bir takım verilere ihtiyaç vardır. Bu verileri örneklerle tamlayalım..2. Bazı Örnekler: Aynı beton karışımından aynı koşullar altında hazırlanmış 3 betonarme kirişin yükleme deneyinde ilk çatlağın meydana geldiği yükler (kg) aşağıdaki değerler olarak ölçülmüştür:
635 8 45 89 52 8 7 76 86 99 66 73 79 57 8 74 94 86 84 595 93 84 79 74 8 685 78 6 85 8 Aynı koşullar altında ölçülen değerlerin birbirinden farklı olması incelenen olayda bir belirsizlik bulunduğunu göstermektedir. Belirsizlik içeren verileri ne şekilde düzenleyip ifade etmeliyiz ki değerlendirmeleri ve yorumlanmaları kolay olsun? İlk adım olarak gözlem sonuçlarını basamaklı bir diyagram halinde gösterelim(şekil,). 2 35 8 6 4 2 5 6 7 8 9 Gözlem sayısı 3 25 2 5 5 HİSTOGR Çatlma yükü(kg) Şekil.
Bu diyagram (histogram) bize çeşitli aralıklarda kalan gözlem sayılarını verir. Örneğin 3 deneyden 3 ünde gözlenen çatlama yükü 9- kg aralığında kalmıştır. Histogram bize gözlem sonuçlarının dağılımı hakkında (tablolanmış değerlere göre) daha derli toplu ve kolay işlenir bir bilgi verir. Düşey eksende gözlem sayısı yerine toplam gözlem sayısına bölünmüş değerleri (toplamın yüzdesi olarak frekansları) işaretlersek frekans histogramını elde ederiz (şekil.2) 2 8 6 4 2 3/3 4/3 8/3 /3 3/3 2/3 5 6 7 8 9 Gözlem sayısı 35 3 25 2 5 5 Çatlma yükü(kg) Şekil.2 Frekans histogramı bize örneğin gözlemlerin % unda çatlama yükünün 9- kg aralığında kaldığını gösterir. Başka bir deyişle bu deneylerde çatlama yükünün 9- kg aralığında bir değer alması olayının frekansı. dur. Başka bir gösterim şeklinde belli bir değerin altında kalan çatlama yüklerinin frekanslarını işaretleyebiliriz. Bunun için frekans histogramındaki değerleri ardışık olarak birbirine eklemek gerekir. Böylelikle eklenik ferkans dağılımını elde etmiş oluruz (Şekil.3). Eklenik frekans dağılımından örneğin çatlama yükünün 9 kg ın altında kalması olayının frekansını.83olarak okuyabiliriz. Yani deneylerin %83 ünde
ölçülen çatlama yükü 9 kg dan küçük olmuştur.(geriye kalan %7 sinde 9kg dan büyük yükler ölçülmüştür). Deneylerin yarısında (%5) çatlama yükünün 8 kg küçük kaldığı, diğer yarısında ise 8 kg aştığı görülmektedir. Bu sonuca bakarak bu deneylerde ölçülen çatlama yükü için ortalama bir değer olarak 8 kg almayı düşünebiliriz. Eklenik Frekans F..8.6.4 Eklenik Frekans Dağılımı.2 5 6 7 8 9 Çatlama Yükü (kg) Bu diyagramları çizerken kg lık aralıklarla çalıştık. Daha geniş ya da daha dar aralıklarla çalışırsak ne olurdu. Aralıklar daraldıkça frekans histogramının daha düzensiz bir görünüm aldığı, bazı aralıklara düşen gözlem sayısının çok azaldığı (veya hiç gözlem düşmediği), buna karşılık aralıklar genişledikçe eldeki bilginin büyük bir kısmının kullanılmadığı görülmektedir (Şekil.4). Gözlem sonuçlarını iyi bir şekilde özetleyerek ifade edebilmek için sınıf aralığı sayısı uygun şekilde seçilmelidir.
Frekans f.8.6.4.2 5 7 9 Çatlama Yükü (kg).6.4.2.8.6.4.2
Frekans f.266.995.33.665 35 3 25 2 5 5 5 7 9 Çatlama Yükü (kg) Şekil.4 Gözlem sonuçlarını tek bir değerle ifade etmek istersek bu değeri ne şekilde hesaplayabiliriz? Akla gelen bir yol, gözlemlerin %5 sinin küçük (büyük) olduğu değeri kullanmaktır (medyan).tablodaki 3 değer büyüklük sırasına dizilirse ortada kalan iki değer 79 ve 8, bunların ortalaması 795 kg olur. (Ya da eklenik frekans dağılımından.5 ye karşılık 8 kg okunur). Başka bir düşünüş de aritmetik ortalamayı hesaplamaktır: x = x i (.) Bu örnekte x=789 kg bulunur ki yukarıdaki değerlere yakındır. Öyleyse bu deneylerde ölçülen çatlama yükleri için ortalama bir değer olarak 789 (ya da 8) kg alabiliriz. Ölçülen değerlerin bu ortalama çevresindeki dağılımı malzemenin hazırlanmasında ve deneylerde gözden kaçan rastgele farklılıklara ve hatalara bağlanabilir.
Ortalamayı bu şekilde hesapladıktan sonra deney sonuçlarını ortlama çevresinde dağılımın büyüklüğünü tek bir sayıyla ne şekilde gösterebiliriz? Bazı ölçüm sonuçları ortalamadan büyük, bazıları küçük olacağına göre bunların ortalamadan farkları da bazen pozitif, bazen negatif değerler alacak ve dolayısıyla toplamları sıfıra yakın olacaktır. Bu bakımdan bu farkların karelerini toplamak ve bunların ortalamasını almak daha anlamlı olur. Böylece dağılımın büyüklüğünün bir ölçüsü olarak varyansı tanımlamış oluruz: 2 Var[ X ] = ( x i x) (.2) Örnekte Var[X]=39 2 bulunur. Varyans ölçülen büyüklüğün karesi boyutunda olduğundan,(kg 2 ) fiziksel anlamı olan bir büyüklük olarak bunun karekökünü kullanmak uygun olacaktır: s x = Var[ X ] = ( xi x (.3) ) 2 Örnekte s x =39 kg s x e standart sapma diyoruz. Standart sapma büyüdükçe ölçüm sonuçlarının ortalama çevresindeki dağılımı da büyür. Dikkat edilirse, bütün gözlem sonuçlarının aynı miktarda artmasının (veya azalmasının) ortalamayı da aynı miktarda değiştireceği, fakat standart sapmayı etkilemeyeceği görülür. Başka bir deney serisinde ortalamanın y =75, standart sapmanın s y =35 bulunduğunu kabul edelim. Hangi seride ölçümlerin dağılımı daha fazladır? Ortalamalar farklı olduğu için doğrudan doğruya standart sapmaları karşılaştırmak anlamlı olmaz. Karşılaştırmada boyutsuz bir büyüklük kullanmak uygun olur. Değişim (varyasyon) katsayısı, standart sapmanın ortalamaya oranı olarak tanımlanır: C = vx sx / x (.4)
ilk örnekte C vx =39/789=.75, ikinci örnekte C vy =35/75=.8 bulunur. Buna göre ikinci seride çatlama yüklerinin biraz daha fazla değişken olduğu görülüyor. Gözlenmiş değerlerin ortalaması ve varyansından sonra önemli diğer bir büyüklük de gözlemlerin ortalama etrafında dağılımlarının çarpıklığını ölçen bir büyüklüktür. Dağılımın tam simetrik olması halinde ortalamadan belli bir miktarda büyük olan her gözleme aynı miktarda küçük olan diğer bir gözlem karşı geleceği için x i x 3 = olacağından çarpıklığı ölçmek için bu toplam kullanılabilir. Toplamı boyutsuz hale getirmek için standart sapmanın kübü ile bölmek uygun olur. Böylece çarpıklık katsayısı tanımlanır: Csx = x i x 3 s x 3 / (.5) Çarpıklık katsayısının olması dağılımın simetrik, pozitif olması sağa, negatif olması sola doğru çarpık, yani bu yönlere doğru uzanan bir kuyruğu olduğunu gösterir. İncelediğimiz örnek için C sx =.57 bulunur. Bu değerin a çok yakın olması dağılımın oldukça simetrik olduğunu ifade eder (histogram da bunu göstermektedir). Sonuç olarak, deneylerde ölçülen 3 değerin taşıdığı bilgiler x =789, s x =39 ve C sx =.57 olmak üzere üç sayıyla büyük ölçüde ifade edilebilmiş olmaktadır. Aynı yöntem, ölçüm sayısının çok daha fazla (örneğin 3 yerine 3) olması halinde de uygulanabilirdi. Bu durumda gözlem değerlerinin taşıdığı bilginin ekonomik bir şekilde ifade edilişi daha da belirgin olarak ortaya çıkmaktadır.