DOĞRUSAL OLMAYAN MODELLERİN UYUMUNDA FARKLI İSTATİSTİK PAKET PROGRAMLARININ KARŞILAŞTIRILMASI



Benzer belgeler
SPSS (Statistical Package for Social Sciences)

Bağımsız Örneklemler İçin Tek Faktörlü ANOVA

BÖLÜM 8 BİLGİSAYAR UYGULAMALARI - 2

Pazarlama Araştırması Grup Projeleri

YILLARI ARASINDA GÜNEY CAROLINA DA OKUL İÇİ ŞİDDET İSTATİSKLERİ ANALİZİ (Bir Önceki Projeden Devam Edilecektir)

ADMIT: Öğrencinin yüksek lisans programına kabul edilip edilmediğini göstermektedir. Eğer kabul edildi ise 1, edilmedi ise 0 değerini almaktadır.

UYGULAMA 4 TANIMLAYICI İSTATİSTİK DEĞERLERİNİN HESAPLANMASI

QUANTILE REGRESYON * Quantile Regression

Data View ve Variable View

Önsöz. İçindekiler Algoritma Algoritma Nasıl Hazırlanır? Yazılımda Algoritma Mantığı Nedir? 1.2. Algoritma Örnekleri ve Sorular

SPPS. Verileri Düzenleme ve Değiştirme 3 - Data Menüsü. Y. Doç. Dr. İbrahim Turan Nisan 2011

Regresyon. Regresyon korelasyon ile yakından ilişkilidir

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

Bootstrap Metodu ve Uygulanışı Üzerine Bir Çalışma 2. Güven Aralıkları, Hipotez Testi ve Regresyon Analizinde Bootstrap Metodu

İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications*

Bilgisayar Programlama

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

ALIŞTIRMA 2 GSYİH. Toplamsal Ayrıştırma Yöntemi

19. BÖLÜM BİRBİRİYLE İLİŞKİLİ OLAN İKİ DEĞİŞKENDEN BİRİSİNDEKİ DEĞİŞİME GÖRE DİĞERİNİN ALACAĞI DEĞERİ YORDAMA (KESTİRME) UYGULAMA-I

4. BÖLÜM: REGRESYON ANALİZİNİ KULLANMAYI ÖĞRENME

İÇİNDEKİLER 1. GİRİŞ...

İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

KİNETİK MODEL PARAMETRELERİNİN BELİRLENMESİNDE KULLANILAN OPTİMİZASYON TEKNİKLERİNİN KIYASLANMASI

UYGULAMA 1 SPSS E GİRİŞ. SPSS; File, Edit, View, Data, Transform, Analyze, Graphs, Utilities, Window, Help adlı 10 adet program menüsü içermektedir.

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

SPSS (Statistical Package for Social Sciences)

TABLO I: Bağımlı değişken; Tüketim,- bağımsız değişkenler; gelir ve fiyat olmak üzere değişkenlere ait veriler verilmiştir.

Dependent Variable: Y Method: Least Squares Date: 03/23/11 Time: 16:51 Sample: Included observations: 20

Çalıştığı kurumun prestij kaynağı olup olmaması KIZ 2,85 ERKEK 4,18

Kısıtsız Optimizasyon OPTİMİZASYON Kısıtsız Optimizasyon

K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır.

BİLGİSAYAR PROGRAMLAMA DERSİ

A. Regresyon Katsayılarında Yapısal Kırılma Testleri

BÖLÜM 13 HİPOTEZ TESTİ

OLASILIK ve KURAMSAL DAĞILIMLAR

Statistical Package for the Social Sciences

İÇİNDEKİLER ÖN SÖZ...

BİLGİSAYAR PROGRAMLAMA DERSİ

Verilerin Standardizasyonuna Yönelik Bir Bilgisayar Yazılımı: Standart

11. BÖLÜM: EŞANLI DENKLEM SİSTEMLERİ

2. BÖLÜM: REGRESYON ANALİZİ

3. BÖLÜM: EN KÜÇÜK KARELER

Çan eğrisi biçimindeki simetrik dağılımdır.

ENM 316 Arena Uygulama Dersi Mayıs 2015

1. YAPISAL KIRILMA TESTLERİ

Sürekli Rastsal Değişkenler

SANAYİ İŞÇİLERİNİN DİNİ YÖNELİMLERİ VE ÇALIŞMA TUTUMLARI ARASINDAKİ İLİŞKİ - ÇORUM ÖRNEĞİ

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Deneysel Verilerin Değerlendirilmesi. Dersi Veren Öğretim Üyeleri: Yrd. Doç. Dr. Özge ANDİÇ ÇAKIR. Prof. Dr. Murat ELİBOL FİNAL SINAVI

10. HAFTA BLM323 SAYISAL ANALİZ. Okt. Yasin ORTAKCI.

Adım Adım SPSS. 1- Data Girişi ve Düzenlemesi 2- Hızlı Menü. Y. Doç. Dr. İbrahim Turan Nisan 2011

UYGULAMA 2 TABLO YAPIMI

SAYISAL ÇÖZÜMLEME. Yrd.Doç.Dr.Esra Tunç Görmüş. 1.Hafta

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

13. Olasılık Dağılımlar

BİRDEN ÇOK BAĞIMLI DEĞİŞKENİ OLAN MODELLER

ÖNGÖRÜ TEKNĐKLERĐ ÖDEV 5 (KEY)

Kangal Köpeği Yavrularında Vücut Ağırlığı Değişimlerinin Tanımlanmasında Doğrusal Olmayan Büyüme Modellerinin Kullanılması*

MONTE CARLO BENZETİMİ

BİL-142 Bilgisayar Programlama II

SPSS de Tanımlayıcı İstatistikler

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER. Abdullah Can

KUKLA DEĞİŞKENLİ MODELLER

Zeki Optimizasyon Teknikleri

Hipotezlerin test edilip onaylanması için çeşitli istatistiksel testler kullanılmaktadır. Fakat...

k ise bir gerçek sayı olsun. Buna göre aşağıdaki işlemler Matlab da yapılabilir.

EKONOMETRİ. GRETL Uygulamaları. Prof. Dr. Bülent Miran

Tanı Testlerinin Değerlendirilmesi. ROC Analizi. Prof.Dr. Rian DİŞÇİ

4. HAFTA BLM323 SAYISAL ANALİZ. Okt. Yasin ORTAKCI.

BAĞIMLI KUKLA DEĞİŞKENLİ MODELLER A- KADININ İŞGÜCÜNE KATILIM MODELİ NİN DOM İLE E-VIEWS DA ÇÖZÜMÜ

SPSS-Tarihsel Gelişimi

8. BÖLÜM: DEĞİŞEN VARYANS

Dersin Sorumlusu: Yrd. Doç. Dr. Birol SOYSAL. Sunumları Hazırlayan: Doç. Dr. Bülent ÇAKMAK

Normal Dağılımlılık. EKK tahmincilerinin ihtimal dağılımları u i nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

Bu örnekte kullanılan veri 200 gözleme sahiptir ve örnek için özel olarak oluşturulmuştur.

EKONOMİK KATILIM VE FIRSATLARDA CİNSİYET EŞİTSİZLİĞİNİN SOSYOEKONOMİK VE KÜLTÜREL DEĞİŞKENLERLE İLİŞKİSİ. Aslı AŞIK YAVUZ

SIMMAG Kullanım Kılavuzu. Adem Ayhan Karmış. Ana Ekran

The International New Issues In SOcial Sciences

GÜVEN ARALIKLARI ve İSTATİSTİKSEL ANLAMLILIK. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

4. HAFTA BLM323 SAYISAL ANALİZ. Okt. Yasin ORTAKCI.

EKONOMETRİK MODEL TANIMLAMADA KULLANILAN SINAMA YÖNTEMLERİ VE

ESNEK YAPILANDIRMA UYGULAMASINDA YENİLİKLER

PARMAKLI VE TAMBURLU ÇAYIR BİÇME MAKİNALARINDA ARIZALANMA VE TAMİRE BAĞLI RİSK KATSAYISININ SİMÜLASYONLA BELİRLENMESİ

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

CHAPTER 6 SIMPLE LINEAR REGRESSION

Matris Cebiriyle Çoklu Regresyon Modeli

Kukla Değişken Nedir?

Ankara Üniversitesi Fen Fakültesi. Astronomi ve Uzay Bilimleri. AST206 İstatistik Astronomi Dersi OCTAVE GİRİŞ. Öğr. Gör.

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları III (3 Mayıs 2012)

1. GİRİŞ Kılavuzun amacı. Bu bölümde;

Varyans Analizi (ANOVA), Kovaryans Analizi (ANCOVA), Faktöriyel ANOVA, Çoklu Varyans Analizi (MANOVA)

Normal Dağılımlılık. EKK tahmincilerinin ihtimal dağılımları u i nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.

Eğer Veri Çözümleme paketi Araçlar menüsünde görünmüyor ise yüklenmesi gerekir.

İNTERNET TARAYICISI ÜZERİNDE ÇALIŞABİLEN ELEKTRİK TALEP TAHMİNİ ANALİZ PROGRAMI

6. Ders. Genelleştirilmiş Lineer Modeller (Generalized Linear Models, GLM)

BİLGİSAYAR PROGRAMLAMA MATLAB

Tekrarlı Ölçümler ANOVA

Transkript:

DOĞRUSAL OLMAYAN MODELLERİN UYUMUNDA FARKLI İSTATİSTİK PAKET PROGRAMLARININ KARŞILAŞTIRILMASI Arş. Gör. Çiğdem YAKUPOĞLU 1 Doç. Dr. Yavuz AKBAŞ 2 1 Ege Üniversitesi, Ziraat Fakültesi, Zootekni Bölümü, 35100 Bornova İZMİR, e-mail: yakupoglu@ziraat.ege.edu.tr 2 Ege Üniversitesi, Ziraat Fakültesi, Zootekni Bölümü, 35100 Bornova İZMİR, e-mail: yavuz@ziraat.ege.edu.tr Özet Hayvancılıkta büyüme ve laktasyon eğrisi gibi doğrusal olmayan bir yapı sergileyen sistemlerin tanımlanmasında doğrusal olmayan modeller kullanılmaktadır. Amaç, söz konusu sistemlere ait verilere en iyi uyumu sağlayacak modelin geliştirilmesidir. Ayrıca bu modellerin parametreleri kullanarak yorumlanması zor olan çok sayıdaki bilginin, biyolojik olarak yorumlanabilir şekilde özetlenmesidir. Bu amaçla model geliştirme çalışmaları yanında, geliştirilmiş bazı modellerin farklı alan ve özelliklere uyumunun incelendiği çalışmalar da mevcuttur. Doğrusal olmayan modellerin veri setlerine uyumunda SPSS, SAS, STATISTICA, BMDP, SAAM ve MINOS gibi istatistik paket programlarından yararlanılmaktadır. Bu çalışmada doğrusal olmayan modellerin parametre tahminlerinin yapılmasında kullanılan bazı paket programlar ulaşılabilirlik, tanımlama kolaylığı, kullandığı yöntemler gibi özellikler açısından tanıtılacak, uygulamalı karşılaştırmalar yapılacaktır. Anahtar Kelimeler: Doğrusal olmayan modeller, bilgisayar yazılımları, büyüme ve laktasyon eğrileri Abstract COMPARISON OF DIFFERENT STATISTICAL SOFTWARE FOR FITTING NONLINEAR MODELS Nonlinear models have a common use in animal breeding as lactation and growth curves. General purpose is to develop a model giving the best fitting on data set by summarizing the information into a few biologically interpretable parameters of the model. In addition to model developing, there are a lot of studies concentrated on fitting accuracy of various models on different area and traits. There are several statistical software such as SPSS, SAS, STATISTICA, BMDP, SAAM and MINOS for fitting the nonlinear models. The objectives of this study are to introduce and compare the statistical software on the basis of availability, easy to use and methods concentrated on giving practical applications. Key Words: Nonlinear models, software, growth and lactation curves 1. Giriş Bağımlı değişkenin, bağımsız değişken veya değişkenlerin doğrusal bir fonksiyonu olmadığı modeller doğrusal olmayan (nonlinear) modeller olarak adlandırılmaktadır [1]. Doğrusal olmayan modeller fizyoloji, kimya, ekonomi ve hayvan yetiştirme gibi bir çok bilim dalında yaygın olarak kullanılmaktadır. Doğrusal olmayan modellerin tahminlenmesi doğrusal (linear) modellerden çok daha zordur. Bu modellerde doğrusal modellerde oluğu gibi bağımsız değişkenlerin basitçe listelenmesi yerine, regresyon eşitliğinin yazılması, parametre işlemlerinin tanımlanması, bunlar için başlangıç değerlerinin seçilmesi ve parametrelere bağlı olarak modele ait türevlerin belirtilmesi gerekmektedir. Bazı modellerin uyumu zor olduğu gibi, iterasyon yönteminin, modelin uyumunu başarı ile gerçekleştireceğine garanti verilmemektedir [2]. İterasyon işlemine bir veya daha fazla parametre için mantıklı başlangıç değerlerinin seçilmesi ile başlanmaktadır. Hesaplamada bu değerleri içeren geçici eşitlik çözülürken, parametre değerleri giderek sabitleşmektedir. Parametre sayısının artması ile iterasyon sayısı da artış göstermektedir. Tahminlerin yüksek hızlı bilgisayarlarda yapılması bu konuda oldukça büyük kolalıklar sağlamaktadır [3]. Nitekim gelişen bilgisayar teknolojisi, kullanımın yaygınlaşması ve uygun yazılımların geliştirilmesi hesaplamalardaki zorlukları büyük oranda ortadan kaldırmıştır [4]. Bu çalışmada, doğrusal olmayan modellerin uyumunda yararlanılan SPSS, SYSTAT, STATISTICA ve SAS paket programlarının tanımlama biçimi, kullanılan iterasyon yöntemi ve erişilebilirlik açısından karşılaştırılması amaçlanmıştır. 2. Kullanılan Programlar ve Genel Özellikleri Çalışmada, doğrusal olmayan modellerin uyumununa örnek olması açısından, Gompertz büyüme eğrisi modeli kullanılmıştır. Bu amaçla bir bıldırcının çıkıştan itibaren, dört gün aralıklarla eşeysel olgunluk yaşına kadar elde edilmiş canlı ağırlık verisi üzerine Gompertz modelinin [5] uyumu yapılmıştır. Uyumu yapılan Gompertz modelinin fonksiyonu aşağıdaki gibidir. Y = A.exp K.t ( B.exp ) 1

Gompertz fonksiyonunun A, B ve K parametrelerine ait biyolojik yorumlar aşağıdaki gibidir. t : Zaman A : Zaman sonsuza ulaştığındaki (asimtotik) canlı ağırlık B : Başlangıç ağırlığı K : Büyüme hızı Model uyumu yapılırken, parametre başlangıç değerleri daha önceki çalışmalardan ön bilgi alınarak belirlenebilmektedir. Bu çalışmada A, B ve K parametreleri başlangıç değerleri sırasıyla 200, 3.5 ve 0.07 olarak alınmıştır. 2.1. SPSS SPSS programının, Windows altında çalışan 6.0 sürümü kullanılarak doğrusal olmayan modellerin uyumunun yapılması işlemi Statistics menüsünden Regression alt menüsü ve daha sonra da nonlinear seçeneği işaretlenerek başlatılmaktadır (Şekil 1). Şekil 1. SPSS programında nonlinear regresyonun tanımlanması Ekrana gelen pencerede bağımlı değişken dependent, model tanımlamaları ise model expression bölümünde yapılmakta, daha sonra parametrelere ait başlangıç değerleri parameters bölümünde belirlenerek modelin uyumuna geçilmektedir (Şekil 2). Şekil 2. SPSS programında nonlinear modelin tanımlanması SPSS programı ile doğrusal olmayan modellerin uyumunun yapılmasında kullanılacak kayıp fonksiyonların tanımlandığı, parametrelere ait çeşitli sınırlamaların getirildiği, kaydedilmesi istenen ayrıntı bilgiler ve kullanılacak tahminleme yönteminin belirlendiği düğmeler de mevcuttur. Bu düğmeler ve kullanımları aşağıda açıklanmıştır. 2

Genel olarak gözlenen değerlerden beklenen değerlerin sapması tahminlemelerin güvenilirliğindeki azalmaları (loss) belirtmektedir. Bu nedenle kayıp fonksiyon, parametrelerin tahminlenmesinde minimizasyonu yapılan fonksiyondur. Yaygın olarak bilinen biçimleri, gözlenen ve beklenen değerler arasındaki farkın mutlak değerini ve maksimum olabilirlik tahmininin negatifini içermektedir. SPSS programında kayıp fonksiyon düğmesi kullanıcıya iki uygulama sunmaktadır. Bunlardan ilki olan user defined loss function uygulaması, tanımlanan herhangi bir fonksiyonun toplamının minimize edilmesi işlemini gerçekleştirmektedir. Program, kayıp fonksiyon belirtilmediği durumda ise en küçük kareler toplamı temeline dayalı olarak hata kareler toplamında küçültme işlemi yapan sum of squared residuals uygulamasını kullanmaktadır. Bu düğme ile parametre değerlerine belirli alt ve üst sınırlar tanımlanabilmektedir. Parametre değerleri için herhangi bir sınırlama yapılmadığında unconstrained seçeneği geçerlidir. Adından da anlaşıldığı gibi saklama düğmesi, isteğe bağlı olarak tahminlenen değerleri (predicted values), hataları (residuals), parametrelerin her bir iterasyonuna ilişkin türevlerini (derivatives) ve kayıp fonksiyon değerlerini (loss function values) korumaktadır. Bu seçenek düğmesi ise doğrusal olmayan modelin uyumu için parametrelere ait tahmin değerlerinin elde edilmesinde sequential quadratic programming veya levenberg marquardt tahminleme yönteminin seçimine imkan tanımaktadır. Herhangi bir tanımlama yapılmadığında levenberg marquardt iterasyon yöntemi kullanılmaktadır. SPSS programı doğrusal olmayan modeller için yapılan analiz sonucu her bir parametre için hata kareler toplamını, regresyon belirleme katsayısını, düzeltilmiş ve düzeltilmemiş kareler ortalamasını, asimtotik parametre tahminleri, standart hataları ve her birinin % 95 güven aralıklarını ve ayrıca parametre tahminlerinin asimtotik korelasyon matrislerini çıktı halinde verebilmektedir. 2.2. SYSTAT SYSTAT programının Windows altında çalışan 5.0 sürümünde, herhangi bir doğrusal olmayan modelin uyumu Stats menüsünden nonlin alt menüsü yardımı ile başlatılmaktadır (Şekil 3). Şekil 3. SYSTAT programında nonlinear regresyonun tanımlanması Bu alt menü kayıp fonksiyonun, uyumu sağlanacak modelin ve uyumun yeniden çalıştırılabildiği işlem seçeneklerine sahiptir. Modelin uyumunda kullanıcıya çeşitli alternatifler sunan seçenekler ve kullanımları aşağıdaki gibidir. SYSTAT programında, bu seçenek ile kullanılacak olan kayıp fonksiyon tanımlanabilmektedir. Ancak bu işlemin model tanımlamasından önce yapılması öngörülmektedir. Program, kayıp fonksiyon tanımlaması yapılmadığında en küçük kareler üzerinden minimizasyonu gerçekleştirmektedir. 3

Uyumu yapılacak modelin tanımlaması Model... seçeneği yardımı ile yapılmaktadır. Ekrana gelen Nonlinear Model penceresinde kullanılacak model Expression, parametrelere ait başlangıç değerleri Start, yapılacak iterasyon sayısı Iterations ve iterasyon işlemini durduracak maksimum tolerans değeri Tolerance bölmümü ile belirlenebilmektedir (Şekil 4). Şekil 4. SYSTAT programında nonlinear model uyumu basmaklarının tanımlanması SYSTAT programında, uyumu yapılacak modelde yer alacak bağımlı ve bağımsız değişkenler Ekle (Add) düğmesi ile model tanımlamasına alınmaktadır. Bağımlı ve bağımsız değişken dışındaki herhangi bir tanımlama ise parametre olarak kabul edilmektedir. Parametrelere ilişkin tahmin değerlerinin hesaplanmasında Quasi-Newton ya da Simplex iterasyon yöntemlerinden biri seçilebilmektedir. Herhangi bir yöntem seçilmediğinde Quasi-Newton yöntemi üzerinden işlem yapılmaktadır. İterasyon ve tolerans değerinin belirtilmediği durumda ise, program sırasıyla 20 ve 0.00005 değerlerini kabul etmektedir. Tüm işlemler sonunda, hataları, tahminlenen değerleri ve değişkenleri SYSTAT dosyası olarak saklamak için Save file bölümü seçilmektedir. Modelin uyumunda istenilen sayıda iterasyonla yakınsama gerçekleşmediğinde Resume... seçeneği kullanılmaktadır. Bu seçeneğe geçildiğinde karşımıza gelen Resume Estimating penceresinde iterasyon işlem basamakları için yeniden tanımlamalar yapılabilmektedir. Böylece kullanıcı bir sonraki model uyum işlemi için önceki özetlerden yararlanabilmektedir. 2.3. STATISTICA Statistica programının Windows altında çalışan 4.3 sürümü ile doğrusal olmayan modellerin uyumu işlemi, programın Analysis menüsünden User specified regression alt menüsü kullanılarak başlatılmaktadır (Şekil 5). Şekil 5. STATISTICA programında nonlinear regresyonun tanımlanması 4

Bu menü ile ekrana gelen pencerede, uyumu yapılması istenen model ve kayıp fonksiyon Function to be estimated & loss function düğmesi ile tanımlanabilmekte, Select cases düğmesi ile veri setlerine ait bazı mantıksal tanımlamalar yapılabilmektedir. Ayrıca tartı değişkeni ve eksik gözlemler tanımlatılabilmektedir. (Şekil 6). Bu menülere ait ayrıntı bilgi aşağıda verilmiştir. Şekil 6.STATISTICA programı doğrusal olmayan model uyumu model tanımlanma penceresi Bu menü parametreler için bazı mantıksal işlemlerin yapılmasına imkan sağlamaktadır. Örneğin Exclude if seçeneği seçilip (A<=10) OR (B=C); tanımlaması yapılırsa, A parametresinin 10 dan küçük ve eşit ya da B parametresinin C parametresine eşit olduğu durumlarda işlem yapılacağı anlaşılmaktadır. Bu menü herhangi bir değişkene ait değerler üzerinde işlem yapılacak tartı değişkeninin belirlenmesinde kullanılmaktadır. Bu menüde, analiz için kullanılan değişkenlerden herhangi birinin eksik gözlem içermediği ve herhangi bir tanımlamanın yapılmadığı durumda Casewise deletion of missing data seçeneği kullanılmaktadır. Eksik gözlem bulunduğunda ise Substituted by means seçeneği, diğer gözlemlere ait ortalama ile bu eksik kısımlara bir değer atayarak işlem yapılmasını sağlamaktadır. Uyumu yapılması istenen model ve kayıp fonksiyonun tanımlaması bu menü yardımıyla yapılmaktadır. Kayıp fonksiyon için herhangi bir tanımlama yapılmadığında program en küçük kareleri kullanmaktadır (Şekil 7). Şekil 7. STATISTICA programında model ve kayıp fonksiyon penceresi Tahminlenecek fonksiyon ve kayıp fonksiyon Estimated function and loss function penceresinde tanımlandıktan sonra, tahminleme yöntemleri Estimation method, maksimum iterasyon sayısı maximum number of iterations, yakınsama değeri Convergence criterion, parametrelere ait başlangıç değerleri Start 5

values, denenecek parametre değerlerine ait değişim aralığı Initial step size, parametrelere ait ortalama ve standart sapma değerleri Means & standart deviations, değişkenler için matris plotu Matrix plot for all variables ve Box & Whisker plotunun tanımlandığı pencereye geçilmektedir (Şekil 8). Bu penceredeki menü ve düğmelere ait açıklamalar aşağıda sunulmuştur. Şekil 8. STATISTICA programında nonlinear model uyumu basmaklarının tanımlanması STATISTICA programı parametre tahminleme yöntemi olarak Quasi Newton, Simplex Procedure, Hooke- Jeeves Pattern Moves, Rosenbrock Pattern Search ve uygun tanımlamalarla bunların çeşitli kombinasyonlarını kullanmaktadır. Herhangi bir tahminleme yöntemi seçilmediğinde Quasi Newton iterasyon yöntemi ile tahminlemeler yapılmaktadır. Parametre tahminleme işleminde uygulanacak iterasyon işleminin sayısı, bu bölümde belirtilmektedir. Programda maksimum iterasyon sayısı bakımından herhangi bir tanımlama yapılmadığında maksimum iterasyon sayısı 50 kabul edilmektedir. Yakınsama kriterinin tanımlanabildiği bu bölümde, herhangi bir tanımlama yapılmadığı durumda yakınsama için 0.0001 değeri kabul edilmektedir. İterasyon içeren çözümler, başlangıç değerinin seçimine karşı çok hassastırlar. Başlangıç değerinin yanlış seçilmesi ile bir çözüme ulaşılmayabilir veya bu durumda elde edilen parametre tahminleri matematiksel olarak doğru ama biyolojik olarak yetersiz olabilir [3]. Başlangıç değerleri botunu ile iterasyonda kullanılacak parametre başlangıç değerleri belirlenebilmekte ve gereğinde değiştirilebilmektedir. Herhangi bir tanımlama yapılmadığında program herbir parametre için 0.1 değerini başlangıç kabul etmektedir. İterasyon işleminin parametreler arasında hangi büyüklükteki adımlarla gerçekleştirileceği bu düğmesi yardımıyla belirlenmektedir. Program herhangi bir tanımlama yapılmadığında Quasi-Newton metodu için 0.5, Simplex and Rosenbrock metodu için 1.0 ve Hooke-Jeeves metodu için 2.0 değerini kabul etmektedir. Seçilen herhangi bir değişkenin veya değişkenlerin ortalama ve standart sapmasına ilişkin sonuçlar bu buton aracılığı ile alınmaktadır. Kullanılan değişkenler arasındaki ilişkinin görsel olarak belirlenmesinde bu seçenek kullanılmaktadır. Değişkenlerin ortalama, medyan ve standart hatalarına göre bir gösterim istendiğinde ise bu seçenek kullanılmaktadır. Ayrıca bu pencerede Asymtotic standart errors seçeneği ile parametrelere ait asimtotik standart hatalar da alınabilmektedir. 6

Parametre tahminleri için yapılan iterasyonda yakınsama sağlanıp sağlanmadığı Parametre Tahminleme (Parameter Estimation) penceresindeki açıklama ile anlaşılmaktadır (Şekil 9). Şekil 9. STATISTICA programında parametre tahminleme penceresi İterasyon sonucu yakınsama sağlanmamışsa değişik parametre başlangıç değerleri ve iterasyon yöntemleriyle işlem yeniden yapılmalıdır. Eğer yakınsama sağlanmışsa ayrıntıların verildiği Sonuçlar (Results) penceresine ulaşılmaktadır (Şekil 10). Şekil 10. STATISTICA programında sonuçlar penceresi. Şekilden de görüldüğü gibi sonuçlar penceresi zengin bir listeye sahiptir. Parametre tahminleri (Parameter estimates), parametrelere ait kovaryans ve korelasyon değerleri (Cov. /Corr. Of parameters), hata değerleri (Residual values),tahmin değerleri (Predicted values), gözlenen değerler (Observed values), ortalama ve standart sapmalar (Means & standard deviations), farklar (Difference), tahmin ve hata değerlerini saklama (Save predicted and residual values), uyumu sağlanan fonksiyonun gözlem değererine göre iki boyutlu grafiği (Fitted 2D function & observed values), uyumu sağlanan fonksiyonun gözlem değererine göre üç boyutlu grafiği (Fitted 2D function & observed values), hataların dağılışı (Distribution of residuals), hataların normal olasılık dağılışı (Normal probability of residuals), yarı normal olasılık dağılışı (Half normal probability plot), tahminlenen değerlere karşı gözlenen değerler (Predicted versus observed values), tahminlenen değerlere karşı hata değerleri (Predicted versus residual values), tüm değişkenler için matris plot (Matrix plot for all variables) ve tüm değişkenler için Box & Whisker plotu (Box & whisker plot for all variables) gibi düğmelerle istatistik analizler elde edilebilmektedir. 2.4. SAS Makalenin bu bölümüne kadar Windows altında çalışan paket programlarda uyum işlemi tanıtılmıştır. Aşağıda açıklanacak olan SAS paket programının 6.02 sürümü ise, DOS altında çalışmaktadır. Bir başka deyişle, doğrusal olmayan modellerin uyumunda değişik komutlar kullanılmakta ve daha sonra bu komutların çalıştırılması ile işlem yapılmaktadır (Şekil 11.) 7

Şekil 11. SAS programında işlem penceresi SAS programında, doğrusal olmayan model uyumu için yararlanılan komutlar dizisi PROC NLIN bölümünde tanımlanmaktadır. Bir kısmının zorunlu, bir kısmının da isteğe bağlı olarak kullanıldığı bu komutlar aşağıdaki gibidir. PROC NLIN BOUNDS PARAMETERS Kullanılması zorunlu BY Kullanılması isteğe bağlı tanımlamalar MODEL DER ID OUTPUT OUT SAS programında, herhangi bir doğrusal modelin uyumu işlemi için bir takım adımlar takip edilmektedir. Analiz edilecek veri setinin adı DATA tanımlaması ile açıklandıktan sonra, kullanılacak iterasyon yönteminin METHOD tanımlaması ile seçimi ilk adımı oluşturmaktadır. Daha sonra tahminlenecek parametre isimleri ve bunlara ait başlangıç değerleri PARAMETERS tanımlaması ve uyumu yapılacak model ise MODEL tanımlaması ile belirtilmektedir. Genel olarak bu program Gauss (Modified gauss-newton Method), Marquardt (Marquardt Method), Newton (Newton Method), Gradient (Gradient ya da Steepest-Descent Method) ya da DUD (Multivariate Secant ya da False Position (DUD)) iterasyon yöntemlerinden birini kullanmaktadır. DER tanımlaması DUD metodu dışında kullanılan iterasyon yöntemlerinde, parametrelere ait kısmi türevlerin kullanılmasını sağlamaktadır. Program, DER tanımlaması yapıldığında DUD metodunu, yapılmadığında ise Gauss metodunu hazır olarak kullanmaktadır. Ayrıca programda parametre tahminlerine BOUNDS tanımlaması yardımıyla bir sınırlama verilerek, tahminleme işleminin daha kısa zamanda yapılması sağlanabilmektedir. Çeşitli değişkenlere göre oluşturulmuş gruplar üzerinde ayrı ayrı analiz istendiğinde ise BY tanımlaması kullanılmaktadır. Fakat bu tanımlama, söz konusu değişkenler için bir sıralamanın yapılması şartını taşımaktadır. Diğer yandan, iterasyon işlemi için yakınsama kriteri CONVERGE, maksimum iterasyon sayısı MAXITER ve kayıp fonksiyon _LOSS_ tanımlaması ile önceden belirtilebilmektedir. Herhangi bir tanımlama yapılmadığında program, yakınsama kriteri için 10-8, maksimum iterasyon sayısı için 50 ve kayıp fonksiyon için en küçük kareleri kabul etmektedir. İterasyon işlemi sonucunda değişik amaçlar için çıktı dosyası tanımlanabilmektedir. Eğer çıktı dosyası parametre tahminleri için isteniyorsa OUTEST, değişkenler için isteniyorsa ID ve hesaplanan istatistikler için ise OUTPUT OUT tanımlamasının kullanımı uygun olacaktır. Öte yandan, EFORMAT tanımlaması ile çıktı dosyasındaki sayısal değerler e notasyonunda gösterilebilmektedir. Dolayısı ile farklı skalalarda olan sayısal değerler bu komutun kullanılması ile bir örnek hale getirilebilmektedir. 3. Sonuç ve Tartışma Doğrusal olmayan modellerin uyumu bakımından karşılaştırılan bilgisayar paket programları, kullandığı işletim sistemi, hard diskte kapladığı yer, verileri tanımlama şekli, öğrenme ve çalıştırma kolaylığı, kullandığı algoritmalar, analiz sonucu sunduğu bilgiler, çalışma hızı ve kolay elde edilebilirlik bakımından karşılaştırılmıştır. DOS altında çalışan SAS programına karşın SPSS, SYSTAT ve STATISTICA programları Windows işletim sistemi altında çalışması bakımından farklılık göstermektedir. 8

Programlar hard diskte çeşitli büyüklüklerde yer kaplamaktadır. SPSS programının 26,5 MB hard disk kapasitesi ile en fazla, SYSTAT programının 5,37 MB kapasitesi ile en az yer kaplayan program olduğu saptanmıştır. SAS ve STATISTICA programlarının sırası ile 14 ve 12,5 MB alana gereksinim duyduğu belirlenmiştir. SPSS, SYSTAT ve STATISTICA programları Windows uyumlu programlardan veri transferini kolaylıkla gerçekleştirmektedir. Ayrıca bu programlar kendine ait editör ortamından veri girişine izin vermekte ve belirli formatlardan da dönüşüme imkan sağlamaktadır. DOS altında çalışan SAS programı ise kendi editörü ile veri girişi yanında, ASCII yapıdaki dosyaları dışarıdan okuyabilmektedir. İncelenen programlar arasında SPSS, gerekli tüm tanımlamaları tek pencerede ele alırken, SYSTAT ve STATISTICA programları ayrı ayrı pencerelerde tanımlama yapmaktadır. Fakat bu programlar Windows altında çalışma, tanımlamaları çeşitli düğmelerle yapma ve her pencerede yardım menüsünü bulundurma yönleriyle kullanıcılar için büyük kolaylık sağlamaktadır. Buna karşın, işlemlerde kendi yapısına uygun bir programlama gerektiren SAS programı için aynı kolaylık söz konusu değildir. Kullanılan iterasyon yöntemine göre de programlar çeşitlilik göstermektedir. STATISTICA ve SAS paket programı diğerlerinden farklı olarak, dört ayrı iterasyon yöntemini kullanıma sunmaktadır. Ayrıca, STATISTICA programı bu yöntemlerin birbirleri arasındaki kombinasyonlarına da imkan tanımakta ve iterasyon adımlarını program akışı sırasında vermektedir. Genel olarak tüm programlar, analiz sonuçları olarak iterasyon çözümlerini, doğrusal olmayan regresyon özet istatistiklerini, parametre tahminleri ve standart hatalarını, asimtotik % 95 güven aralıklarını ve parametre tahminlerinin asimtotik korelasyon matrisini vermektedir. Ulaşılan bilgi miktarı bakımından, STATISTICA programının daha ayrıntılı olduğu belirlenmiştir. Programların çalışma performansları bakımından karşılaştırılması yapıldığında, ele aldığımız veri setinin küçüklüğü nedeniyle belirgin bir farklılık bulunmamıştır. Ancak daha büyük veri setlerinde çalışma hızı bakımından farklılıklar beklenebilmektedir. Günümüz teknolojisinde bu programların elde edilmesinde herhangi bir engel görülmemektedir. İnternet üzerinden http://www.spss.com (SPSS) http://science.software-directory.com (SYSTAT) http://www.statsoft.com(statistica) http://www.sas.com (SAS) adresleri aracılığı ile programlar hakkında daha detaylı bilgiler istenebilmekte ve satın alma işlemleri yapılabilmektedir. Seçilen herhangi bir paket program, ulaşılan bilgi miktarı, kolaylık, çalışma hızı ve veri tanımlama özellikleri bakımından kullanılabilir olmalıdır. Bu çalışmada veri tanımlaması, kullanım kolaylığı açısından SPSS, sunduğu bilgi miktarı için STATISTICA ve farklı iterasyon yöntemlerini kullanıma sunması bakımından SAS paket programının diğerlerine göre üstün olduğu belirlenmiştir. 4. Kaynaklar 1. Yakupoğlu, Ç., Etlik Piliçlerde Büyüme Eğrilerinin Karşılaştırılması. Ege Üniversitesi Fen Bilimleri Enstitüsü, Zootekni Anabilim Dalı Yüksek Lisans Tezi.İzmir. 1999. 2. SAS, Institute Inc., Cary, NC, USA. 1987. 3. Efe E., Büyüme Eğrileri. Fen Bilimleri Enstitüsü, Zootekni Anabilim Dalı Doktora Tezi.Adana. 1990. 4. Akbaş,Y., Büyüme Eğrisi Modellerinin Karşılaştırılması. Hayvansal Üretim Dergisi Sayı:36. 1995. 5. Laird,A. K., Dynamics of Relative Growth. Growth 29, 249-263. 1965. 5. Ek 5.1. SPSS All the derivatives will be calculated numerically. SPSS for WINDOWS Release 6.0 Iteration Residual SS A B K 1 103175,9915 200,000000 3,50000000,070000000 1.1 50617834444-2641,5593-9,0397156,711524169 1.2 13288,11749 209,277813 1,75402573,178240848 2 13288,11749 209,277813 1,75402573,178240848 2.1 1095,870034 230,969629 3,03699315,188373442 3 1095,870034 230,969629 3,03699315,188373442 3.1 271,2985483 197,184864 3,96421589,250120951 4 271,2985483 197,184864 3,96421589,250120951 4.1 58,22543615 204,096593 4,46291936,258852182 5 58,22543615 204,096593 4,46291936,258852182 5.1 55,87667297 203,064227 4,55195728,262135450 6 55,87667297 203,064227 4,55195728,262135450 6.1 55,86826323 203,033951 4,55796613,262324736 7 55,86826323 203,033951 4,55796613,262324736 9

7.1 55,86824617 203,030730 4,55828912,262337973 8 55,86824617 203,030730 4,55828912,262337973 8.1 55,86824614 203,030649 4,55830221,262338430 Nonlinear Regression Summary Statistics Dependent Variable WEIGHT Source DF Sum of Squares Mean Square Regression 3 190029,20845 63343,06948 Residual 11 55,86825 5,07893 Uncorrected Total 14 190085,07670 (Corrected Total) 13 50139,07149 R squared = 1 - Residual SS / Corrected SS =,99889 Asymptotic 95 % Asymptotic Confidence Interval Parameter Estimate Std. Error Lower Upper A 203,03064901 3,692927275 194,90257088 211,15872714 B 4,558302207,186671824 4,147440293 4,969164121 K,262338430,009686747,241018043,283658817 Asymptotic Correlation Matrix of the Parameter Estimates A B K A 1,0000 -,6810 -,9030 B -,6810 1,0000,9056 K -,9030,9056 1,0000 5.2. SYSTATW5 ITERATION LOSS PARAMETER VALUES 0.2308843D+04.2000D+03.3500D+01.5000D-01 1.1202937D+04.2000D+03.3499D+01.8319D-01 2.1200225D+04.2000D+03.3548D+01.8432D-01 3.2285240D+03.1946D+03.3511D+01.7774D-01 4.3223892D+01.1929D+03.3489D+01.7252D-01 5.6089564D-01.1929D+03.3483D+01.7170D-01 6.3980603D-01.1929D+03.3480D+01.7159D-01 7.3359205D-01.1929D+03.3477D+01.7152D-01 8.3246321D-01.1929D+03.3476D+01.7149D-01 9.3226655D-01.1930D+03.3476D+01.7148D-01 10.2843300D-01.1936D+03.3479D+01.7137D-01 11.5823736D-02.1975D+03.3494D+01.7056D-01 12.1305445D-02.1994D+03.3499D+01.7015D-01 13.2863280D-03.1994D+03.3498D+01.7011D-01 14.8142603D-04.1999D+03.3499D+01.7001D-01 15.1460386D-04.1999D+03.3500D+01.7002D-01 16.1010484D-05.2000D+03.3500D+01.7001D-01 17.6882195D-06.2000D+03.3500D+01.7001D-01 DEPENDENT VARIABLE IS WEIGHT SOURCE SUM-OF-SQUARES DF MEAN-SQUARE REGRESSION 20982.653 3 6994.218 RESIDUAL 0.000 13 0.000 TOTAL 20982.636 16 CORRECTED 4993.476 15 RAW R-SQUARED (1-RESIDUAL/TOTAL) = 1.000 CORRECTED R-SQUARED (1-RESIDUAL/CORRECTED) = 1.000 PARAMETER ESTIMATE A 199.975 B 3.500 K 0.070 5.3. STATISTICA 5.4. SAS Dependent Variable CANLIAG Method: Gauss-Newton Iter A B K Sum of Squares 0 200.000000 3.500000 0.070000 103176 1 177.800316 3.402033 0.075012 102400 2 145.955403 3.249047 0.084687 101626 3 111.123165 3.063099 0.102918 100508 4 87.929771 2.960871 0.135388 94477 5 91.467330 4.602511 0.520591 32228.416213 6 111.733162 3.080229 0.299562 23834.325673 7 157.114111 3.596100 0.222567 12924.724630 8 202.616985 4.583580 0.269815 129.648794 9 203.091276 4.548021 0.261805 55.938189 10 203.029542 4.558008 0.262333 55.868278 11 203.030909 4.558283 0.262338 55.868246 12 203.030645 4.558302 0.262338 55.868246 NOTE: Convergence criterion met. Non-Linear Least Squares Summary Statistics Dependent Variable CANLIAG Source DF Sum of Squares Mean Square Regression 3 190029.20845 63343.06948 Residual 11 55.86825 5.07893 Uncorrected Total 14 190085.07670 (Corrected Total) 13 50139.07149 Parameter Estimate Asymptotic Asymptotic 95 % Std. Error Confidence Interval Lower Upper A 203.0306447 3.6929181012 194.90255574 211.15873370 B 4.5583022 0.1866728547 4.14743645 4.96916795 K 0.2623384 0.0096867578 0.24101795 0.28365893 Asymptotic Correlation Matrix Corr A B K A 1-0.681042317-0.902972326 B -0.681042317 1 0.9055961889 K -0.902972326 0.9055961889 1 10