Önsöz. Değerli katılımcılar,

Benzer belgeler

BÖLÜM 7 BİLGİSAYAR UYGULAMALARI - 1

ÖĞRENME FAALĠYETĠ GELĠġMĠġ ÖZELLĠKLER

DOKÜMAN YÖNETİM SİSTEMİ KULLANIMI GELEN EVRAK

K12NET Eğitim Yönetim Sistemi

Digifresh Kullanım Kılavuzu

DEĞERLENDİRME NOTU: Mehmet Buğra AHLATCI Mevlana Kalkınma Ajansı, Araştırma Etüt ve Planlama Birimi Uzmanı, Sosyolog

Bilgisayar Uygulamaları PSİ105

Araştırma Notu 15/177

Evrak Ekle. Kurum İçi Giden Evrak Ekleme. Kırmızı renker; doldurulması zorunlu alanları ifade etmektedir. İleri Geri tarihli işlem yapılamamaktadır.

Şekil 1. Sistem Açılış Sayfası

Karadeniz Teknik Üniversitesi Orman Fakültesi. Orman Endüstri Mühendisliği Bölümü PROJE HAZIRLAMA ESASLARI

Tasarım Raporu. Grup İsmi. Yasemin ÇALIK, Fatih KAÇAK. Kısa Özet

Analiz aşaması sıralayıcı olurusa proje yapımında daha kolay ilerlemek mümkün olacaktır.

Veri Toplama Yöntemleri. Prof.Dr.Besti Üstün

DÜNYA EKONOMİK FORUMU KÜRESEL CİNSİYET AYRIMI RAPORU, Hazırlayanlar. Ricardo Hausmann, Harvard Üniversitesi

BÖLÜM 3 FREKANS DAĞILIMLARI VE FREKANS TABLOLARININ HAZIRLANMASI

SİRKÜLER. 1.5-Adi ortaklığın malları, ortaklığın iştirak halinde mülkiyet konusu varlıklarıdır.

B02.8 Bölüm Değerlendirmeleri ve Özet

Sayın Bakanım, Sayın Rektörlerimiz ve Değerli Katılımcılar,

KAVRAMLAR. Büyüme ve Gelişme. Büyüme. Büyüme ile Gelişme birbirlerinden farklı kavramlardır.

VEZNE PROGRAMINDA POSTA ÜCRETİ İLE İLGİLİ YAPILAN DÜZENLEMELER (Vezne Sürüm: )

KAMU İHALE KURULU KARARI. Toplantıya Katılan Üye Sayısı : 7 : Elektrik ihtiyacının temini.

SÜREÇ YÖNETİMİ VE SÜREÇ İYİLEŞTİRME H.Ömer Gülseren > ogulseren@gmail.com

29 Ocak 2015 Senato Sayı : 123 YÖNERGE

DİKKAT! SORU KİTAPÇIĞINIZIN TÜRÜNÜ "A" OLARAK CEVAP KÂĞIDINA İŞARETLEMEYİ UNUTMAYINIZ. SAYISAL BÖLÜM SAYISAL-2 TESTİ

ALPHA ALTIN RAPORU ÖZET 26 Ocak 2016

KAHRAMANMARAŞ SÜTÇÜ İMAM ÜNİVERSİTESİ BİLİMSEL DERGİLER YÖNERGESİ BİRİNCİ BÖLÜM Amaç, Kapsam, Dayanak ve Tanımlar

ALPHA ALTIN RAPORU ÖZET 10 Kasım 2015

MAT223 AYRIK MATEMATİK

KOCAELİ İL MİLLİ EĞİTİM MÜDÜRLÜĞÜ EVRAK TAKİP SİSTEMİ

İTÜ GELİŞTİRME VAKFI ÖZEL Dr. NATUK BİRKAN İLKOKULU VE ORTAOKULU. OkulNET Kullanım Kılavuzu

YÜKSEKÖĞRETİM KURUMLARI ENGELLİLER DANIŞMA VE KOORDİNASYON YÖNETMELİĞİ (1) BİRİNCİ BÖLÜM. Amaç, Kapsam, Dayanak ve Tanımlar

ELLE SÜT SAĞIM FAALİYETİNİN KADINLARIN HAYATINDAKİ YERİ ARAŞTIRMA SONUÇLARI ANALİZ RAPORU

1. YAPISAL KIRILMA TESTLERİ

Ç.Ü. GÜZEL SANATLAR FAKÜLTESİ İÇ MİMARLIK BÖLÜMÜ GÜZ YARIYILI İÇM PROJE 5 & DİPLOMA PROJESİ

Fizik ve Ölçme. Fizik deneysel gözlemler ve nicel ölçümlere dayanır

BİLİŞİM TEKNOLOJİLERİ ÜÇ BOYUTLU GRAFİK ANİMASYON (3DS MAX) MODÜLER PROGRAMI (YETERLİĞE DAYALI)

Genel bilgiler Windows gezgini Kes Kopyala Yapıştır komutları. 4 Bilinen Dosya Uzantıları

PATOLOJİ DERNEKLERİ FEDERASYONU ETİK YÖNERGE TASLAĞI. GEREKÇE: TTB UDEK kararı gereğince, Federasyon Yönetim

ÖĞRENME FAALĠYETĠ 6 ÖĞRENME FAALĠYETĠ NESNE ĠġLEMLERĠ

Deneysel Verilerin Değerlendirilmesi

1 OCAK 31 ARALIK 2009 ARASI ODAMIZ FUAR TEŞVİKLERİNİN ANALİZİ

YATIRIM FONU ALIM SATIM İŞLEMLERİ KULLANICI KILAVUZU

MAKÜ YAZ OKULU YARDIM DOKÜMANI 1. Yaz Okulu Ön Hazırlık İşlemleri (Yaz Dönemi Oidb tarafından aktifleştirildikten sonra) Son aktif ders kodlarının

Q-BIZ VIEWER KULLANIM KILAVUZU

Deprem Yönetmeliklerindeki Burulma Düzensizliği Koşulları

TESİSAT TEKNOLOJİSİ VE İKLİMLENDİRME ÇELİK BORU TESİSATÇISI MODÜLER PROGRAMI (YETERLİĞE DAYALI)

Uzem Eğitmen Girişi. Şekil 1. Sisteme girdikten sonra Şekil 2 deki ekran karşımıza çıkacak. Bu ekrandaki adımları kısaca tanıyalım.

EPKAS (ELEKTRONİK PROJE KONTROL ARŞİVLEME SİSTEMİ) WEB KULLANIM KILAVUZU

EĞİTİM BİLİMİNE GİRİŞ 1. Ders- Eğitimin Temel Kavramları. Yrd. Doç. Dr. Melike YİĞİT KOYUNKAYA

KAPSAMLI İÇERİK SADELEŞTİRİLMİŞ ARAMA MOTORU YENİLİKÇİ BİLGİ İŞLEME TEKNOLOJİSİ PRATİK GÖRÜNTÜLEME ARAÇLARI MOBİL ERİŞİM

Başbakanlık (Hazine Müsteşarlığı) tan:

KİTAP İNCELEMESİ. Matematiksel Kavram Yanılgıları ve Çözüm Önerileri. Tamer KUTLUCA 1. Editörler. Mehmet Fatih ÖZMANTAR Erhan BİNGÖLBALİ Hatice AKKOÇ

M i m e d ö ğ r e n c i p r o j e l e r i y a r ı ş m a s ı soru ve cevapları

T.C. NUH NACİ YAZGAN ÜNİVERSİTESİ YAZILIM KULÜBÜ TÜZÜĞÜ. BİRİNCİ BÖLÜM Kuruluş Gerekçesi, Amaç, Kapsam, Dayanak ve Tanımlar

Üniversitelerde Yabancı Dil Öğretimi

DENEY 2: PROTOBOARD TANITIMI VE DEVRE KURMA

Anonim Verilerin Lenovo ile Paylaşılması. İçindekiler. Harmony

Topoloji değişik ağ teknolojilerinin yapısını ve çalışma şekillerini anlamada başlangıç noktasıdır.

1. RESİM DÜZENLEME. Bir resmin piksel yoğunluğu yani PPI (Pixel Per Inches) 1 inç karede (1 inç = 2.54 cm) bulunan piksel sayısıdır.

BÜRO YÖNETİMİ VE SEKRETERLİK ALANI HIZLI KLAVYE KULLANIMI (F KLAVYE) MODÜLER PROGRAMI (YETERLİĞE DAYALI)

ÖLÇÜ TRANSFORMATÖRLERİNİN KALİBRASYONU VE DİKKAT EDİLMESİ GEREKEN HUSUSLAR

YÖNETMELİK KAFKAS ÜNİVERSİTESİ ARICILIĞI GELİŞTİRME UYGULAMA VE ARAŞTIRMA MERKEZİ YÖNETMELİĞİ

BİLGİSAYAR PROGRAMLARI YARDIMIYLA ŞEV DURAYLILIK ANALİZLERİ * Software Aided Slope Stability Analysis*

BÖLÜM 1 YAZILIM TASARIMINA GİRİŞ YZM211 YAZILIM TASARIMI. Yrd. Doç. Dr. Volkan TUNALI Mühendislik ve Doğa Bilimleri Fakültesi / Maltepe Üniversitesi

ARAŞTIRMA PROJESİ NEDİR, NASIL HAZIRLANIR, NASIL UYGULANIR? Prof. Dr. Mehmet AY

T.C. MİLLÎ EĞİTİM BAKANLIĞI METAL TEKNOLOJİSİ SAC METAL

Akreditasyon Çal malar nda Temel Problemler ve Organizasyonel Bazda Çözüm Önerileri

Resim 1: Kongre katılımı (erken kayıt + 4 günlük kongre oteli konaklaması) için gereken miktarın yıllar içerisindeki seyri.

ÇEVRE KORUMA TEMEL ALAN KODU: 85

ACENTE PORTAL QUICKRES/TROYA ACENTE BAŞVURU KILAVUZU

BİT ini Kullanarak Bilgiye Ulaşma ve Biçimlendirme (web tarayıcıları, eklentiler, arama motorları, ansiklopediler, çevrimiçi kütüphaneler ve sanal

PROJE TEKLİF FORMU. Haydi birlikte harika bir iş çıkartalım.

Anaokulu /aile yuvası anketi 2015

Görüntü Analizi Görüntü Analizin Temelleri

DÖNER SERMAYE MALİ YÖNETİM SİSTEMİ

Ek 1. Fen Maddelerini Anlama Testi (FEMAT) Sevgili öğrenciler,

DERS SOSYOLOJİ KONU SOSYOLOJİNİN ARAŞTIRMA YÖNTEM VE TEKNİKLERİ

GİYİM ÜRETİM TEKNOLOJİSİ ÇOCUK DIŞ GİYSİLERİ DİKİMİ (CEKET- MONT- MANTO) MODÜLER PROGRAMI (YETERLİĞE DAYALI)

3- Kayan Filament Teorisi

SİİRT ÜNİVERSİTESİ UZAKTAN EĞİTİM UYGULAMA VE ARAŞTIRMA MERKEZİ YÖNETMELİĞİ BİRİNCİ BÖLÜM. Amaç, Kapsam, Dayanak ve Tanımlar. Amaç

in Kullanımı tamamlamış gerçekleştirmiş

İZMİR KÂTİP ÇELEBİ ÜNİVERSİTESİ ENGELSİZ ÜNİVERSİTE KOORDİNATÖRLÜĞÜ VE ENGELLİ ÖĞRENCİ BİRİMİ ÇALIŞMA USUL VE ESASLARI BİRİNCİ BÖLÜM

ELITE A.G. KS100/HEFM SICAK-SOĞUK ETĐKET BOY KESME VE ĐŞARETLEME MAKĐNASI KULLANIM KILAVUZU

FOTOGRAMETRİK DEĞERLENDİRME - ÇİFT FOT. DEĞ. Analog ve Analitik Stereodeğerlendirme. Yrd. Doç. Dr. Aycan M. MARANGOZ

1.3. NİTEL ARAŞTIRMA YÖNTEMLERİ GİRİŞ NİTEL ARAŞTIRMALARDA GEÇERLİK VE GÜVENİRLİK SORUNLARI... 2

BİREYSEL SES EĞİTİMİ ALAN ÖĞRENCİLERİN GELENEKSEL MÜZİKLERİMİZİN DERSTEKİ KULLANIMINA İLİŞKİN GÖRÜŞ VE BEKLENTİLERİ

SANAT VE TASARIM GUAJ BOYA RESĠM MODÜLER PROGRAMI (YETERLĠĞE DAYALI)

GİYİM ÜRETİM TEKNOLOJİSİ. GALOŞ ve BONE DİKİMİ MODÜLER PROGRAMI (YETERLİĞE DAYALI)

ÜNİTE 5 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

Türkiye Ekonomi Politikaları Araştırma Vakfı Değerlendirme Notu Sayfa1

WEB SAP (ORION) STAJ BAŞVURU KULLANICI DÖKÜMANTASYONU. Süheyla GÜVEN

HALK EĞİTİMİ MERKEZLERİ ETKİNLİKLERİNİN YÖNETİMİ *

KORELASYON VE REGRESYON ANALİZİ

İSTANBUL TİCARET ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ BİLGİSAYAR SİSTEMLERİ LABORATUARI YÜZEY DOLDURMA TEKNİKLERİ

II. Bölüm HİDROLİK SİSTEMLERİN TANITIMI

GAZİANTEP İL MİLLİ EĞİTİM MÜDÜRLÜĞÜ TÜBİTAK 4006 BİLİM FUARLARI PROJE YÜRÜTÜCÜLERİ TOPLANTISI

Transkript:

Önsöz Değerli katılımcılar, Mart 2007 den beri büyük bir ekip olarak, heyecan ile yürüttüğümüz TÜRKHAYGEN-I projesinin yeni bir aşamasına varmış bulunuyoruz. Artık verilerimiz, özellikle mikrosatelit belirteçlere dayalı olanlar, birikmeye başladı. Verilerimizin analizlerini yapıp ham verilerde yatan bilgileri elde etmek, bütünleştirmek, yorumlamak için hazırlanıyoruz. Sizlerin de gözlemiş olduğunuz gibi bu amaçla kullanılacak araçlar (analiz yöntemleri) sayıca pek çok, üstelik hızla artıp gelişmekteler. Bu çalıştayda, TÜRKHAYGEN-I projesinin genetik grubunun ilgilendiği sorulara benzeyen sorulara cevap arayan, uluslararası saygın dergilerde yayınlanmış 2007 makalelerinin kullandığı analiz yöntemlerinden başlıcalarını beraberce çalışacağız. Analizlerin kullanımını çalıştayda pekiştirmek istediğimiz için, analiz sayısını sınırlı tutuyoruz. Analiz sonuçlarını yorumlamak da ayrı bir beceri gerektirmektedir. Gene bu yönde ilk adımları atmak için, çalıştay sonunda tek veri setini, 4 ayrı grup olarak öğreneceğimiz yöntemlerle irdeleyip, sonuçların yorumlanmasını beraber yapacağız. Hepimize verimli ve zevkli bir çalıştay diliyorum, Saygılarımla, Çalıştayı düzenliyen ekip adına Prof.Dr. İnci Togan i

Çalıştay Programı 08.07.2008 Salı 09.00 09.30 Kayıt ve Açılış 09.30 12.30 Çalıştaya Genel Bakış, Bilgisayarlara Programların Yüklenmesi 12.30 14.00 Öğle Yemeği 14.00 15.30 FSTAT Programı nın çalışılması 15.30 15.45 Kahve Molası 15.45 17.15 PHYLIP Programı nın çalışılması 09.07.2008 Çarşamba 09.30 11.00 Arlequin Programı nın çalışılması 11.00 11.15 Kahve Molası 11.15 12.30 Arlequin Programı nın çalışılması 12.30 14.00 Öğle Yemeği 14.00 15.30 Structure Programı nın çalışılması 15.30 15.45 Kahve Molası 15.45 17.15 PCAGEN Programı nın çalışılması 17.45 19.00 Genetik Grubu Toplantısı 19.00 22.00 Akşam Yemeği 10.07.2008 Perşembe 09.30 12.00 Uygulama: Örnek verinin 4 grup tarafından analiz edilmesi 12.00 13.30 Öğle Yemeği 13.30 14.10 Uygulama: FSTAT analiz sonuçları 14.15 14.35 Uygulama: Phylip analiz sonuçları 14.40 15.05 Uygulama: Arlequin analiz sonuçları 15.05 15.25 Kahve molası 15.25 15.45 Uygulama: Structure analiz sonuçları 15.50 16.00 Uygulama: PCAgen sonuçları 16.05 16.30 Değerlendirma anketi 16.35 16.45 Kapanış ii

Dizin Önsöz... i Çalıştay Programı... ii Dizin...... iii Çalıştaya Genel Bakış... 1 FSTAT Programı... 40 PHYLIP Programı... 90 Arlequin Programı... 110 Structure Programı... 166 PCAGEN Programı... 225 Okunması tavsiye edilen makaleler ve kitaplar... 254 Katılımcılar ve Destekleyen Şirketler... 261 Yararlı Bilgiler... 262 ODTÜ Haritası... 263 iii

Populasyon Genomiği I Çalıştayı Genel Bakış Prof. Dr. İnci itogan 8-10 Temmuz 2008, ODTÜ- Ankara 1

Genetik veri toplamak için gerekli teknik problemleri çözdük ve elimizde veriler birikmeye başladı. İlk çalıştayda mikrosatelit belirteç verilerine dayalı yapılabilecek istatistiksel analizlerden bazı sık kullanılanları çalışacağız Analizlerin kullanımlarını öğrenip uygulayacağız Önce bazı kavramları hatırlıyalım 2

Amaç Programlardaki ortak terim ve kavramlardan basitce bahsetmek Bir populasyon genomiği çalışmasında hangi sıra ile ne yapmak istenebilir? Sorusuna cevap vermek Sorunun cevabı da seçtiğimiz programların yapabilecekleri ile uyumlu olacağından soruyu cevaplarken programlarla yapılacaklara genel bir bakış sunmak + Çaliştayımızın ş isminin nasıl oluştuğunu ş ğ da belirtmek 3

Depolanmış veriden bir kesit görüyorsunuz: IRK KOD LOKUS KARAYAKA FCB226 OarHH47 OarVH72 KRY1 Ovis-Kry-01-03-2007-60-01-27 116-142 125-133 125-133 KRY2 Ovis-Kry-01-03-2007-60-02-02 116-156 133-141 123-127 KRY3 Ovis-Kry-01-03-2007-60-03-28 116-142 133-141 123-127 KRY4 Ovis-Kry-01-03-2007-60-04-29 116-154 129-133 123-127 KRY5 Ovis-Kry-01-03-2007-60-05-30 150-154 127-133 127-133 KRY6 Ovis-Kry-01-03-2007-60-06-42 116-154 129-133 123-127 KRY7 Ovis-Kry-01-03-2007-60-07-43 03 07 116-128 119-131 125-127 KRY8 Ovis-Kry-01-03-2007-60-08-44 116-142 135-141 123-131 KRY9 Ovis-Kry-01-03-2007-60-09-31 116-152 133-141 123-133 KRY10 Ovis-Kry-01-03-2007-60-10-32 116-142 135-141 123-131 4

Bu veriler nükleer DNA nın otozomal kromozomlarından primerlerimizle tanımlanmış bölgelerindeki, lokuslarındaki tekrar sayılarına bağlı uzunlukları göstermekte Otozomal omal kromozomlardan omlardan okuduğumuzdan ğ dan her birey için bir çok çift: 116-142 125-133... gibi değerler okumaktayız. 5

Bir lokusa odaklanırsak, bir türün bir çok ırkından o ırkları temsil edecek şekilde ellişer bireyi bu lokus açısından incelersek Pek çok alel (örn: CAG tekrar sayısı 5-17 arasında yani 13 alel) gözlemiş olabiliriz ( polimorfik lokus ) Monomorfik lokus da olabilir. Bizimkiler önceden kullanımı tavsiye edilenlerdi ve hepsi polimorfik lokuslardı 6

Bu polimorfik lokus açısından tür içinde genetik çeşitlilik (varyasyon) y var demeliyiz. Bu çeşitlilik nasıl ortaya çıktı? Mutasyon dediğimiz evrimsel güçlerden biriyle Tür içi genetik çeşitliliği: ırlarda, ırk içi grupta, bireyde, gibi kompartmanlarda/ birimlerde çalışabiliriz. NOT:Çalışmamız sonunda ırklarımız çok genetik çeşitlilik sergiliyor derken iyi düşünelim. Grup 1 Grup 1 Irk 1 Grup 2 Grup 3 Grup 2 Tür Grup 3 Irk2 7

Önce, Bu birimlerin (birey, ırk içi grup, ırklar ve tüm türde) her birinde genetik çeşitlilik ne kadar? Nasıl dağılmış? Sonra da Nasıl böyle şekillendi? soruları projemizin de çalıştayımızın da temel sorularıdır (Örn: Ham verileri irdeliyeceğiz Bu ırk ötekinden çok daha az genetik çeşitlilik içeriyor Neden? i Başına ne geldi?) Bu sorular populasyon genetiğinin de temel sorularıdır. Çalıştayımızın ş başlığındaki ş ğ Populasyon p y terimi bu sorulara cevap arıyacağımız için vardır. 8

Ya bu genomiği terimi neden seçildi? Farklı populasyonların p bir çok bireyinden elde edilen, farklı belirteçlere dayalı verilerle yapılan calışmaya Populasyon genomiği çalışması diyoruz (Allendorf ve Luikart, 2007 ). Projemizde genetik kısmında tam da bunu yapıyoruz: mtdna+ mikrosatelit (20 mikrosat); bir çok ırktan ve birçok bireyle; farklı belirteç sonuçlarını da bütünleştireceğiz VE ayrıca analizler için de bilgisayar kullanımının vazgeçilmez oluşu genomik Çalıştayımızın adı böylece oluştu 9

Birimlerde genetik çeşitlilik ne kadardır ve genetik çeşitlilik nasıl dağılmış bulunmaktadır? Örn. Bu grubun bireyleri çok çeşitlilik sergiliyor bireyler de birbirbirlerine benziyor / benzemiyor Çok, çok çok, az benziyor bunlara bir skala versem evrensel objektif ölçütüm olsa onunla ölçebilsem 10

Genetik çeşitliliği nasıl ölçsek? Bir çok ölçüt var. Bir grupta ve gene tek lokus üzerinde çalışırsak Alel sayısını (number of alleles) verebilirim örn. 2 (Alel sayısı ölçütlerden biri) Fakat 1) n=2 kişide 2 alel n=1000 2 alel gorüyorum ki 2 sayısı bu iki durum için farklı yorumlanmalı Alelik zenginlik (allelic richness): ) (gözlem sayısı dikkate alınmalı) ) diğer ğ bir ölçüt 2) a) n= 50 kişi 121 125 b) n= 10 kişi i 121 125 n= 40 kişi 125 125 alel frekanslarını (başka bir ölçüt) vereyim: 121 aleli için pa=0.5, pb=0.1 11

Ya durum aşağıdaki gibiyse 3) Grup1 25: 121 121; 50: 121 127; 25:127 127 alel121 frekansı=0.5, Grup2 100: 121 127 alel121 l121 frekansı=0.5, Alel sayısı aynı, gözlem sayısı aynı, frekanslar aynı Ama alellerin ll bireylerde bulunma/ paketlenme biçimleri i i farklı genotip dağılımları farklı (bu da genetik çeşitlilik kapsamında belirtilmeli) Bunu Ho: gözlenen heterozigotluk (observed heterozygosity) la yansıtabilirim Ho1= 50%, Ho2= 100% 12

Şu ana kadar tek bir lokusa bağlı genetik çeşitlilik ile ilgili konuştuk ama çoğunlukla genetik çeşitlilik birden fazla lokusla tanımlanır. O zaman çalışılan lokuslardaki durumu genel olarak yansıtacak bir ölçüt: grupta lokus başına düşen ortalama alel sayısı (MNA-mean number of alleles ölçütünü de ) kullanabilirim Örn: Grup 1 Or.all.say=1, Grup 2 Or.all.say=3 ise Şu sorular sorulabilir: Aynı lokuslar mı çalışıldı? Aynı sayıda birey mi gözlendi? Cevaplar evet ise Grup 1 de genetik çeşitlilik daha az diyebiliriz. 13

Ölçütlere devam edeceğiz Birazdan bir grup içinde kullanacağımız son ölçüt olan He: Beklenen heterozigotluk (expected heterozygosity) tan bahsedeceğiz Onu tarif etmeden populasyonların genetik çeşitliliğini şekillendiren bazı güçleri ve sonra Populasyon genetiğinde pek bilinen bir modeli ve bir denge prensibini hatırlıyalım 14

Bir populasyonda alel l frekansları ile ölçülen genetik çeşitlilik nasıl değişir? Rastlantıyla =rastlantısal genetik salınma (populasyonun sayısı büyük etken, ayrıca bireylerin gelecek generasyona katkı farkları...) ) ile; Göçün katkısıyla; Seçilimle (doğal veya yapay) Ki bunlar da evrimsel güçler (Bir de mutasyon vardı) dir. Biz çalışmalarımızda bunlarla da ilgilenmekteyiz Örn. Bir çok ırk göçden etkilenmiş ama özellikle biri etkilenmediyse, o yüzyılların doğal seçilimini temsil ediyor olabilir onu özel olarak korumak isteyebiliriz 15

Populasyon genetiğinde, ğ istatistiksel analizlerde çalışılan ş durumu basite indirgemek için (/ ya da bu gün gözlenenlerden geriye giderken arada hangi basamaklardan geçildiği ile ilgili vb durumlarda) modellemeler yapılır Bir düşünsel model Gen Havuzu modelidir: Tüm bireylerin genomlarını bir havuza döksek, Dişi ve erkeklerde alel frekansları aynı olsa (Örn. 2 alel ve p,q) Havuza katkıda bulunan birey sayısı çok olsa Hiç bir evrimsel güç bu havuzda çalışmıyor olsa Bir sonraki generasyonun bireylerini oluşturmak ş için havuzdan ilgilendiğimiz lokusun örneklerini rastgele seçip eşleştirsek, ve bir sonraki generasyonun bireylerini böylece oluşturduğumuzu varsaysak Bu bireylerin de sayıları çok olsa 16

Böylece oluşturduğumuz bireylerden elde edeceğimiz yeni gen havuzuna baksak p ve q değişmiyecektir Gen havuzunun ait olduğu populasyon Hardy-Weinberg dengesindedir (HWD) 2 2 ve genotip frekansları p : 2 pq : q olacaktır (HWD beklenen genotip frekansları) Bu frekansları (istatistiksel analizlerin tolerans ettiği kadar farklı da olsa) görüyorsak gen havuzunun ait olduğu populasyon HWD deriz Bu durum bize evrimsel güçlerin bu gen havuzunda etkili olmadıklarını (= yok/ biri var ama etksiz/ikisi var ama etkisiz...) gösterir. 17

Mikrosatelitler ve HWD Bir kere mikrosatelit lokusları çoğunlukla ğ DNA üzerinde, RNA ürünleri olmayan ve gen kontrol bölgelerinin dışındaki bölgelerdedir Çoğunlukla bireyin mikrosatelit lokusuna bağlı genotipinin hangi alelerden oluşmuş olduğu onun yaşama şansına ve üreme etkinliğine hiç etki etmez ( Aleller nötr) Eğer bir populasyon bir çok lokus açısından HWD den sapmışsa populasyonun tüm genomunu etkiliyen bir olgu örn. yeni göç, rastlantısal olmayan çiftleşme sözkonusu olabilir 18

HW prensibi bize güçlü evrimsel mekanizmaların işleyip işlemediğine ilişkin sinyaller verdiği gibi bir lokusun doğru çalışıp çalışmadığını da gösterebilir Bir lokus bazen bir populasyonda, başka bir lokus başka bir populasyonda dengeden sapma gösteriyorsa, bu lokuslarda boş (null) aleller gelişmiş olabilir (Handley ve ark. 2007) Böyle bir durumda çalışmanın ş o lokus bazında elde edilen sonuçları daha farklı değerlendirilmelidir. 19

HWD nin kullanımının bir başka örneği Genetik farklılaşma aynı ırkın alt grupları arasında da var olabilir Bir ırkın doğudan örneklenen bireyleri kendi aralarında, batıdan örneklenen bireyleri de kendi aralarında benzeşebilir. Biz bu duruma ırk içinde alt yapılanma/ alt gruplaşma var deriz. Alt gruplaşma (substructuring) nın varlığı da kendini tüm ırk için HWD var mı diye sorulduğunda ğ genellikle birden fazla lokusda heterozigot eksikliği gözlenmesi şeklinde sinyal vererek belli eder Alt gruplaşmanın ş heterozigot eksikliği ğ yaratmasına Wahlund etkisi denmektedir. Bizlerin yapacağı çalışmalara benzeyen bir çok başka çalışmada Wahlund etkisi gözlenmiştir. 20

HW dengesi varlığını ğ test etme yöntemleri birden fazladır Bildiğimiz ğ 2 X testi olduğu ğ gibi bir de Tam (Exact) test diye bir yöntem mikrosatler (çok alelleri olduğundan) için kullanılmaktadır. Hesaplamalar çok uzundur, bilgisayar yardımı gerekmektedir.bu test ile dengeden sapmalara tolarans artmaktadır. Başka yöntemler de var (Örn. Fis ve lokusların kombinasyonları ile). Gene istatistikle uğraşmış olanlarınızın bildiği bir başka kural vardır. Aynı anda 20 mikrosatelit lokusu için HWD var mı? diye sorulmaktaysa, α -tipi hatayı 0.05 in altında tutmak için α=0.05/20=0.0025 değeri testlerde kritik değer olarak kullanılır. Bu yeni değerin kullanılması Bonferroni düzeltmesi olarak bilinir. 21

Biz hala grup içi genetik çeşitlilik ölçütleri hakkında konuşuyoruz Son olarak He beklenen (=genetik çeşitlilik, genetic diversity) heterozigotluk tl da bir ölçüttür He GÖZLENEN alel frekanslarının HW dengesindeki populasyonda yaratması beklenen heterozigotların frekanslarını belirtir Ho ve He yi yyan yana görürseniz aralarındaki fark da size dengeden sapmanın yönünü ve büyüklüğünü belirtir Hem He hem Ho grupda lokusların her biri için verilebileceği gibi bir çok lokusun ortalamaları l olarak da verilebilir. Örn. ortalama olarak beklenen heterozigotluk gibi 22

Irk içi çgenetik çş çeşitlilik ölçütlerinin en sık kullanılanlarını konuştukş Irklar ya da ırk grupları arasındaki genetik farklılaşmayı ölçmek için kullanılan ölçütlerden de bahsedelim Bunlar da pek çok Önce F- istatistiklerinden bahsedelim Wright (1951) ın fiksasyon indisleri: Fıs, Fst, Fıt Fıs bir ırk kiçin i ise ırk kiçi ihwd dengesinden d sapmayı verir -1, +1 arasındadır ( - heterozigot fazlalığını, + heterozigot azlığını belirtir) Fıt toplam tür içindeki HW dengesinden sapmanın ölçütüdür Fst de ırklar arasındaki genetik farklılaşmanın ölçütüdür Fst 0-1 arasında bir değer alır. Populasyonlar genetik salınımayla birbirlerinden farklılaşmışsa ve aralarında gen akımı yoksa Fst değeri ğ i1 e yakın olur. 23

Fst ile ilgili üç şey söyleyeceğim Fst yi frekanslar üzerinden hesaplıyabileceğimiz ğ gibi mikrosatelitlerin moleküler belirteç ( aleller arasındaki farkın da ölçülebildiği belirteçler) olmalarından yararlanalarak frekanslarını hesapladığımız alellerin birbirlerine benzemelerini de ek olarak hesaplara katabiliriz. Örn: 121 125 den oluşmuş bir populasyon ile 123 127 157 161 alelleri içeren iki populasyonu karşılaştırıyorsak son ikisinde alel frekansları aynıysa bile alel farklılıkları nedeniyle 3üncü populasyon 1inciye daha uzak olacaktır Size Fst nin çeşitli biçimlerde hesaplanmasını sağlıyan paket programlar öğretilecektir 24

Fst ile ilgili ikinci husus Fst yi yani populasyonlar arasındaki farkın büyüklüğünün istatistiksel olarak anlamlı olup olmadığını sınıyabiliriz. Sınama yöntemi olarak bilgisayarların hızlanmasından yararlanılarak permutasyon testi uygulanmaktadır. Testin çok güzel bir görsel anlatımını bir sonraki saydamda Jobling ve ark. nın (2004) kitabından alınmış olarak görüyoruz. 25

Permutasyon testine bir örnek (Jobling ve ark., 2004) 26

Son olarak Fst ile ilgili olarak Fst leri gruplar (örn. Irklar) arası farkların= genetik uzaklıkların ölçütü olarak düşünüp Tüm ırkaların çalıştığımız lokuslar bazında birbirlerine uzaklığını topluca sergiliyebiliriz. Bu amaçla ağaç çizebiliriz. En yaygın kullanılan ağaç çizme yöntemi komşu birleştirme (neighbour joining) yöntemidir. Peter ve ark.2007 27

Irkların aralarındaki farkların görsel olarak sergilenmesi Ağaçlar: Bir örneğini önceki saydamda gördük. Dallar var, dallanma noktaları var. Dallanma noktaları üzerinde sayılar var. Sayılar çöz-bağla (bootsrap) değerlerini vermektedir. Bu sayılar ağacın üzerinde dallanma noktasının güvenilirliğini belirtmektedir. Bunları elde ederken gene bilgisayarların hızlı işlem yapma kapasitelerinden yararlanılmaktadır (mikrosatelit lokuslarına 1-20 ye kadar değerler verilir, geri koyma örnekleme yöntemi ile rastgele 20 sayı çekilir örn: 5,7,20, 5, 5... Lokuslarının değerlerine dayalı bir ağaç çizilir daha sonra yeniden bağımsız bir 20 örnekleme yapılıp tekrar ağaç çizilir her bir dallanma noktası hangi sıklıkla gözlendiyse o sıklık değeri ağacın üstüne o dallanma noktasına çöz- bağla değeri olarak yazılır). Bir çok ağaç ğ çizilmesinden il i sonra onlara dayalı tek bir ağaçta ğ sonuçların özetlenmiş haline ortak (consensus) ağaç denir 28

Irkaların aralarındaki farkların görsel olarak sergilenmesi (devam) Ağaç çizerken bir çok farklı genetik uzaklık ölçütü kullanabiliriz, bir tanesi de Nei nin standart genetik uzaklığıdır. Irkların birbirlerine göre konumunu 20 mikrosatelitin katkıları ile oluşturulmuş birbirine dik eksenler üzerinde de GÖRSEL olarak sergiliyebiliriz. Sığır ğ ırklarının temel bileşenler ş analizi yardımı ile gösterilişi Loftus ve ark., Molecular Ecology,1999 29

Irklar arası farkları saptama ve sergileme (devam) Şimdiye kadar hep birimler sanki mutlak birimlermiş gibi düşündük! Halbuki ırklar (mesela 10 ırk) başta iki üç ırktan çeşitli oranlarda karışmış olarak ortaya çıkmış olabilir. Yeni bir metod ile structure t ile kaç tane temel gen havuzu ırkları yarattı? ırklar bu temeller açısından hangi oranda karışmış? ve bu karışım bakımından da birbirlerine ne kadar benziyorlar söylemek mümkün? Burada her numara ırkı gösteriyor her renk de bir temel gen havuzunu belirtmekte (Koban çalışması) 30

Irklar veya ırk grupları arası farkları saptama (devam) Bu amaçla çok kullanılan bir yazılım Arlequin dir. Irklar arasında bulunan genetik varyasyon y tüm genetik varyasyonun y ne kadarıdır (toplam genetik varyasyonun tanımlanan birimlere ayrıştırmak)? Doğudaki ırklar arasındaki benzerlik batıdakilerden az mıdır? sorularına cevap vermek mumkündür Örn. Yağlı kuyruklu koyunlar birbirlerine ince kuyruklulara benzediğinden daha fazla benzemektedirler hipotezini böylece sınayabiliriz. Arlequin programı aracılığıyla bir de Acaba mikrosatelitlerel dayalı genetik farklılaşma coğrafik uzaklıklara paralel mi? Ya da sekanslara dayalı genetik farklara paralel mi? Sorularına da Mantel Testi yaklaşımı ile cevap arıyabiliriz. Arlequin çok geniş kapsamlı bir yazılımdır onu kullanmaya gelecek çalıştayda sekansları incelerken de devam edeceğiz. 31

Çalıştayımız boyunca tanışacağımız programlarda Permutasyon testi, Tam (exact) test (ki bunlardan bahsettik) Bayesian yaklaşımı ve MCMC terimlerini duyacaksınız. Bayesian yaklaşımı bir hipotezin gözlenen veriler ( frekans ya da oran hesaplamadan, hatta önden bilinen bilgileri de katarak) çerçevesinde ne kadar olası olduğunu saptar (Bizim alışık olduğumuz hipotez testinde test ettiğimiz hipotezi red edip edemiyeceğimizi söyleriz) MCMC (Markov Chain Monte Carlo): Olasılık dağılımlarından örnekleme aracı (algoritma) dır. Olasılık dağılımını tamolarak elde edemediğimizdurumda ondan MCMC ile bir çok örnek mesela 50.000 örnek elde edilir. Başta elde edilen örnekler (burn in period) örn ilk 5.000 atılır, geri kalanlar bizim erişmek istediğimiz dağılımın örnekleri olarak kullanılır. 32

Özet Verileri ırklar bazında çeşitli ölçütlerle özetlemeyi: Fstat, Arlequin Irklar arası farkları görsel olarak sergilemeyi: Pcagen, Phylip, Structure Genetik çeşitliliğin ırklar veya ırk grupları arası dağılımını saptamayı: Arlequin Irklar arasındaki farkların iki ayrı veri dizisi bazında benzerliğini ölçmeyi Arlequin Genetik farklılıkların büyüklüğünun önemi testi; HWD nin var olup olmadığı testi; Tüm bireylerimiz bir arada düşünüldüğünde kaç temel ana populasyonun karışımları oldukları testleri gibi testleri Tüm proramlarla ÇALIŞACAĞIZ. 33

Bu çalıştayın amacı mikrosatelit analizleri yapma becerimizi i i geliştirmenin i yanısıra analiz sonuçlarını anlama derinliği kazanmaktır 34

Bazan bir kişinin fotografini görürüz. Onu tanımıyorsak, fotoğraftan sadece cinsiyetini, belki yaklaşık yaşını, saçını, güzel olup olmadığını görürüz Ama tanıyorsak, beraber zaman geçirmişsek, fotoğrafını algılamamız değişir,örneğin takdir ettiğimiz becerilerini, fiziksel olarak geçirdiği evrimleri, kızgınlıklarımızı, da içerir olur fotoğraf 35

Örn. Aşağıdaki resim bir çoğumuz için: bu genç hanımın enerjik, iyimser, tuttuğunu koparan biri olduğunu da içeriyor çünkü onu tanıyoruz 36

Biraz da hayaliniz i genişse aşağıdaki ğ kişiyi i i de ona benzetiyor olabilirsiniz 37

İşte biz de bu çalıştayda çıktı olarak elimize aldıklarımızı çizim veya sayıların ötesinde daha derin daha bütünsel algılamamız gerektiğini hissettirmek için de çaba vereceğiz. 38

Kaynakça: Allendorf F ve Luikart G. 2007.Conservation and the genetics of populations. Blackwell Publishing. Handley L. ve ark. 2007. Heredity, 1-12 Jobling M.A. ve ark.2004. Human Evolutionary Genetics, Origin, Peoples and ddisesase. Garlan Science, Taylor and dfrancis Group Lowe A. ve ark. 2004. Ecological Genetics, Blackwell Publishing Loftus R.T. ve ark. 2004. Mol. Ecol., 2015-22 Peter C. ve ark. 2007. Animal Genetics, 37-44 39

FSTAT Software for Population Genetics Analysis Dr. Evren KOBAN TÜRKHAYGEN-I Projesi Populasyon Genomiği - I Çalıştayı 8-10 Temmuz 2008, ODTÜ, Ankara 40

FSTAT: Eş-baskın ş (co-dominant) )genetik işaretler ş kullanarak elde edilmiş verilerden analizlerini gerçekleştiren ve test eden bir bilgisayar yazılımıdır. Web sitesi: http://www2.unil.ch/popgen/softwares/fstat.htm htm 41

FSTAT ile ne hesaplayabiliriz? i - Lokus ve alel bakımından analiz edilmiş birey sayısı - Örnek (populasyon) başına ve toplamda gözlenen alel frekansları - Örnek ve lokus başına gözlenen ve beklenen genotip sayısı - Örnek ve lokus başına unbiased gen çeşitliliği -Örnek başına, lokus başına ve toplamda gözlenen alel sayısı - Örnek başına, lokus başına ve toplamda gözlenen alel l zenginliği -Fis (örnek ve lokus başına) hesaplaması ve istatistiksel olarak testi - Nei nin (1987) gen çeşitliliği ve farklılaşma değerleri hesaplaması. - Weir & Cockerham ın (1984) alel ve lokus başına ş ve toplamda Capf (Fit), theta (Fst) and smallf (Fis) değerleri hesaplaması -Hamilton ın (1971) akrabalık (relatedness: relat=2fst/(1+fit)), hesaplaması (Queller and Goodnight ın (1989) hesaplamasına paralel). 42

FSTAT yeniden örnekleme yoluyla hesaplamalar için güven aralığı ğ elde eder: - Lokus başına populasyonlar üzerinden Jackknifing yapar. Yeniden örneklenen birim populasyonlardır. Dörtten fazla populasyon olmalıdır. -Lokus üzerinden Jackknifing yapar. Yeniden örneklenen birim lokuslardır. Dörtten fazla lokus olmalıdır. -Lokus üzerinden bootstrapping gerçekleştirir. Dörtten fazla lokus olmalıdır. l - R- statistics (Slatkin, 1995) hesaplaması yapar, stepwise mutation modelini izleyen mikrosatlit lokuslar için uygundur. -Populasyon çiftleri arası Fst (theta) hesaplar. 43

devam.. - Toplamda her örnek her lokus için HW dengesinde mi test eder. - Bütün veri seti HW dengesinde d mi test t eder. - Her örnek her lokus için HW dengesinde mi test eder. - Örnekler içinde HW dengesi olduğunu varsayarak ve varsaymayarak örneklerin farklılaşmasını ş test eder. -Örnek çiftlerinin farklılaşmalarını test eder. Test örnekler içinde rastgele çiftleşme varsayımında bulunmaz. - Her bir örnek içindeki ve toplamdaki genotipik dengede mi test eder. - Örnek gruplarının istatistik veriler için farklılaşıp farklılaşmadığını test eder. - Kategorilere ayrılmış bireylerin yayılma oranlarında (dispersal rate) farklılık olup olmadığını test eder. 44

Ayrıca.. - FSTAT ve GENEPOP veri dosyalarını birbirlerinin i i formatına çevirir i - Multiple regression (çoklu regrasyon) ve kısmi mantel testi gerçekleştirir. 45

FSTAT ın son versiyonu olan fstat293dist.exe programı bilgisayara yüklenip çalıştırıldığında aşağıdaki döküman ve dosyalar oluşur: - Fstat293.exe t293 - Fstat293.hlp - Fstat293.cnt - Readme.txt - Readme.doc - \data - \data\bias dispersal - \data\multiple regression 46

FSTAT veri dosyası hazırlama: - Program yalnızca bir txt editör ile yazılmış.dat dosyalarını tanır. - Aleller ll rakamlarla l kodlanmalıdır. l d Kodlama için i tek, çift ya da üç basamaklı sayılar kullanılabilir. - Veri dosyası 3 kısımdan oluşur: İlk satırda 4 rakam vardır (örnek sayısı, lokus sayısı, en büyük alel, alel kodları kaç basamaklı) Bunu takip eden satırlarda lokus isimleri yer alır Lokus isimlerinin ardından genotipik veriler girilir. 47

Örnek veri dosyası: örnek sayısı, lokus sayısı, en büyük ük alel, alel kodu basamak sayısı Lokus isimleri Aralardaki boşluk 1 space olarak verilmiştir. Genotipik veriler Populasyon numarasından sonra 3 boşluk verilmiştir. Örnekler/populasyonlar 48

Örnek veri dosyası: örnek sayısı, lokus sayısı, en büyük alel, alel kodu basamak sayısı Lokus isimleri Aralardaki boşluk 1 space olarak verilmiştir. Genotipik veriler Populasyon numarasından sonra 3 boşluk verilmiştir. Örnekler/populasyonlar 49

Elimizdeki TÜRKHAYGEN-I verilerini kaydetmek için: - Excel dosyası açılır ve veriler aşağıdaki şekilde yazılır: Gözlenmeyen alel 000-000 Birey kodu/ numarası/ adı Alel uzunlukları 1. alel l 2.alel l Lokus isimleri 1. Populasyon 2. Populasyon FCB20 FCB48 FCB304 INRA063 ILSTS005 MAF33 AKK1 1 106-118 149-155 176-188 *000-000 *000-000 124-136 AKK1 2 *094-106 149-149 164-164 167-173 194-200 124-124 AKK1 3 *094-094 145-155 164-178 *000-000 194-196 124-136 AKK1 4 *098-106 *000-000 148-164 165-175 196-202 122-132 AKK1 5 *092-110 163-165 164-182 167-175 194-202 122-124 AKK1 7 *094-110 149-169 164-182 167-169 194-198 122-124 AKK1 8 *096-104 149-163163 170-182182 165-173173 194-196196 122-124124 AKK1 11 *094-094 149-157 164-176 161-173 196-198 136-136 AKK1 12 *094-094 149-155 164-188 165-171 198-200 136-136 AKK1 13 *094-094 163-163 146-182 161-175 198-200 124-124 AKK2 2 1061-08 149-149 168-168 163-177 196-196 122-132 AKK2 3 106-108 149-155 164-178 165-175 198-202 122-136 50

Elimizdeki TÜRKHAYGEN-I verilerini kaydetmek için: 51

Elimizdeki TÜRKHAYGEN-I verilerini kaydetmek için: * 52

Elimizdeki TÜRKHAYGEN-I verilerini kaydetmek için: Veri dosyası.txt dökümanı olarak kullanılmaya hazır. 53

Analiz için FSTAT programının veri dosyasına çevirmek: - 54

Analiz için FSTAT programının veri dosyasına çevirmek: Lokus isimleri 55

Analiz için FSTAT programının veri dosyasına çevirmek: örnek sayısı, lokus sayısı, en büyük alel, alel kodu basamak sayısı Örnekler /populasyonlar Oluşturulan FSTAT veri dosyası.dat olarak kaydedilir. 56

Populasyon isimleri dosyası: - Program veri dosyasında örnekler numara ile gruplandırılır. - Analiz sonuçlarının örneklerin isimleri ile gösterilmesi isteniyorsa bir.txt dosyasına alt alta sadece isimler i yazılır. Program ilk 6 karakteri kt tanır. - Programa veri dosyası yüklendikten sonra isim dosyası da yüklenir. 57

Programın limitleri: - Maksimum örnek sayısı: 200 - Maksimum lokus sayısı: 200 - Maksimum alel sayısı : 999 - Maksimum birey sayısı : 200.000 58

FSTAT klasörü ve programı başlatmak: 59

FSTAT Windows Arayüzü: 60

Menü seçenekleri: File -Open -Save default options -Exit Options -Label file for pops -Loci to use : pencere açılır ve lokus isimlerinden analizi istenen seçilir -Samples to use : pencere açılır ve örnek isimlerinden analizi istenen seçilir Utilities -Reset seeds Random Number Generator -File conversion (FSTAT - GENEPOP) 61

Menü seçenekleri: Biased dispersal Mantelise it! -Matrices to columns -Multiple regression and partial mantel test Help -Contents -About 62

Sekmeler: Computations among groups of samples F-statistics, Testing and Disequilibrium 63

Sekme 1: F-statistics, Testing and Disequilibrium Bu sekme içindeki hesaplamalar farklı analiz başlıkları ş altında toplanmıştır. ş 64

Sekme 1: F-statistics, Testing and Disequilibrium A. Gene diversities and F-statistics 65

Sekme 1: F-statistics, Testing and Disequilibrium B. Testing 66

Sekme 1: F-statistics, Testing and Disequilibrium C. Genotypic Disequilibrium 67

Sekme 1: F-statistics, Testing and Disequilibrium Analizleri gerçekleştirmek 68

Sekme 2: Computations among groups of samples Analiz edilecek grup sayısı girilir İstenilen test tipi Grupları belirlemeye yardım eden pencere Analizi gerçekleştirme İstenilen permutasyon sayısı Gerçekleştirilebilecek analizler 69

Sekme 2: Computations among groups of samples Grupları belirleyen pencere: 70

Sekme 2: Computations among groups of samples Analiz limitleri: Grup sayısı : 2-10 Permütasyon sayısı: 200 15.000 71

Analizlerin kaydedildiği dosyalar: -.out dosyası analiz sonuçlarını kaydeder -.fst ve.mat dosyaları Fst hesaplaması istendiyse oluşur,.fst de ikili örnek grupları için i Fst hesaplaması, mat da ise varyans bileşenleri l i vardır. - -.x2 dosyası genetipik frekans hesaplaması istendiyse oluşur; gözlenen ve beklenen genotipler yer alır. - -PP.PVL dosyası ikili örnek gruplarının farklılaşma derecesini örnekler içinde HW dengesi olduğunu varsaymadan hesaplanırsa oluşur. İki tablo vardır: uncorrected p değerleri ve bonferroni correction uygulanmış p değerleri - _test.out dosyası örnek grupları arasında istatistiksel karşılaştırma yapıldığında (Sekme 2) oluşur. - -tables.ld dosyası genotypic disequilibrium hesaplamalarında tabloyu kaydet opsiyonu seçildiyse oluşur. BÜTÜN SONUÇLARDA TAB AYIRACI KULLANILMIŞTIR, EXCEL DOSYASINA AKTARILABİLİR. 72

Örnek veri dosyası ile analiz çalışması - Veri dosyası 73

Örnek veri dosyası ile analiz çalışması 74

Örnek veri dosyası ile analiz çalışması 75

Örnek veri dosyası ile analiz çalışması 76

Örnek veri dosyası ile analiz çalışması 77

Örnek veri dosyası ile analiz çalışması Sonuç dosyaları 1. Fstat_calistay veriler.out Her bir lokusun her bir gözlenen alelinin frekans dağılımı 78

Örnek veri dosyası ile analiz çalışması Sonuç dosyaları 1. Fstat_calistay veriler.out Gen çeşitliliği Gözlenen alel sayıları Alel zenginliği Fis değerleri 79

Örnek veri dosyası ile analiz çalışması Sonuç dosyaları 1. Fstat_calistay veriler.out Fis değerleri için hesaplanan olasılıklar 80

Örnek veri dosyası ile analiz çalışması Sonuç dosyaları 1. Fstat_calistay veriler.out Heterozigotluk hesaplamaları 81

Örnek veri dosyası ile analiz çalışması Sonuç dosyaları 1. Fstat_calistay veriler.out Capf (Fit) Theta (Fst) Smallf (Fis) Relat Relatc Sig_a Sig_b Sig_c 82

Örnek veri dosyası ile analiz çalışması Sonuç dosyaları 1. Fstat_calistay veriler.out F-statistics 83

Örnek veri dosyası ile analiz çalışması Sonuç dosyaları 2. Fstat_calistay veriler.x2 84

Örnek veri dosyası ile analiz çalışması Sonuç dosyaları 3. Fstat_calistay veriler.fst : pairwise Fst hesaplamaları 4. Fstat_calistay veriler-pp.pvl pvl : Pairwise Fst değerlerinin olasılık hesaplamaları 85

Sonuç dosyalarının Excel e aktarılması: 86

Sonuç dosyalarının Excel e aktarılması: 87

Sonuç dosyalarının Excel e aktarılması: 88

Sonuç dosyalarının Excel e aktarılması: 89

PHYLIP PHYLogeny Inference Package Havva DİNÇ TÜRKHAYGEN-I Projesi Popülasyon Genomiği-I Çalıştayı 8-10 Temmuz 2008 ODTÜ - Ankara 90

PHYLIP Ana Sayfası: http://evolution.genetics.washington.edu/phylip.html 91

PHYLIP Dr. Joe Felsenstein (Washington Üniversitesi Genom Bilimleri ve Biyoloji Bölümü) tarafından oluşturulmuş, filogenileri anlamak için kullanılan bir bilgisayar yazılımıdır ve içinde 35 tane program içermektedir. Bu paket program şu metotları içermektedir: - Parsimoni (DNA ve protein için) - Uzaklık Matrisi (Distance Matrix) - Olabilirlik (Likelihood) Metotları - Çözbağla (Bootstrap) - Consensus Ağaçları 92

PHYLIP ile analiz edilebilen veri tipleri şunlardır: - DNA dizileri - Protein dizileri - Restriksiyon parça uzunlukları - Uzaklık matrisi - Gen frekansları - Kantitatif tif karakterler... kt 93

PHYLIP in son versiyonu olan phylip3.67 programı bilgisayara i yüklendiğinde, d klasörde doc, exe ve src olmak üzere 3 klasör oluşmaktadır. Komşu birleştirme (neighbor-joining, NJ) ağacı çizmek için gerekli olan programlar exe klasöründe bulunmaktadır & veri dosyası bu klasöre kayıt edilmelidir. 94

Alel Frekanslarını İçeren PHYLIP Veri Dosyası Formatı Populasyon Lokus Her Lokus için Toplam Sayısı Sayısı Gözlenen Alel Sayısı JMP29 Lokusunun 20 Alelinin Frekansları... Populasyon İsimleri (toplamda 10 kolon) Alel Frekansları 95

Phylip ile Komşu-Birleştirme ş ş (NJ) Ağacı ğ Çizme Özeti data.txt (alel frekanslarını içeren veri dosyası) seqboot.exe seq.txt ( outfile dosyası) gendist.exe gendist.txt ( outfile dosyası) neighbor.exe nj.txt ( outtree dosyası) consense.exe exe cons.txt ( outtree dosyası) and bootstraps.txt ( outfile dosyası) drawtree.exe (köksüz (unrooted) ağaç için) 96

PHYLIP Paket Programında Kullanılacak Olan Programların Görevleri Seqboot: girilen orijinal veriyi kullanarak çoklu veri setleri oluşturarak çözbağla (bootstrap) değeri hesaplayan program Gendist: gen frekansarını kullanarak istenilen genetik uzaklığı (Nei nin i D A veya Reynolds) hesaplayan program Neighbor: komşu birleştirme (NJ) metodunu uygulayarak genetik uzaklık kdeğerleri ğ ile ağaç ğ oluşturan program Consense: çokluk kuralına (majority rule) göre ortak (consensus) ağaçları ğ belirleyen l ve bu ağaçların ğ en ortak tek bir halini sergileyen program Drawtree: köksüz (unrooted) ağaç çizen program [Drawgram: köklü (rooted) ağaç çizen program] 97

seqboot.exe ENTER ENTER Analiz için gerekli parametreler, belirtilen harfler ve her harften sonra ENTER a basılması ile ayarlanır. 98

seqboot.exe ENTER exe klasöründe oluşan outfile.txt dosyasını seq.txt olarak farklı kayıt ediliyor. Bu dosya verinin 1000 farklı organize edilmiş halini içermektedir. 99

gendist.exe ENTER ENTER Analiz için gerekli parametreler, belirtilen harfler ve her harften sonra ENTER a basılması ile ayarlanır. 100

gendist.exe ENTER exe klasöründe oluşan outfile.txt dosyası gendist.txt olarak farklı kayıt edilir. Bu dosya, Nei nin D A genetik uzaklığına ğ göre popülasyonların p birbirlerine olan genetik uzaklık değerlerini içermektedir. 101

neighbor.exe ENTER ENTER Analiz için gerekli parametreler, belirtilen harfler ve her harften sonra ENTER a basılması ile ayarlanır. 102

neighbor.exe ENTER exe klasöründe oluşan outtree.txt txt dosyası nj.txt txt olarak farklı kayıt edilir. Bu dosya ağacın ğ çizilebilmesi için popülasyonlar p arasındaki ilişkiyi formülize eder. 103

consense.exe ENTER ENTER Analiz için gerekli parametreler, belirtilen harfler ve her harften sonra ENTER a basılması ile ayarlanır. 104

consense.exe ENTER exe klasöründe oluşan outtree.txt dosyası cons.txt ve outfile.txt dosyası ise bootstraps.txt olarak farklı kayıt edilir. cons.txt programın okuyabileceği ve en ortak (consensus) ağacın çizilebileceği ağaç formatını içerir. 105

drawtree.exe ENTER ENTER ENTER 106

PHYLIP ile 4 Popülasyon için Çizilmiş Komşu Birleştirme Ağacı 107

Çözbağla (Bootstrap) Değerleri bootstraps.txt dosyasından: CONSENSUS TREE: The numbers on the branches indicate the number of times the partition of the species into the two sets which are separated by that branch occurred among the trees, out of 1000.00 trees +-------------Pop4 +------ +------Pop2 +-1000- +------Pop1 +--------------------Pop3 remember: this is an unrooted tree! Ağacın dalları üzerindeki sayılar, iki popülasyonun çizilen 1000 ağacın kaçında bu şekilde ayrıldığını göstermektedir. Bootstrap değeri ağaç üzerinde genelde yüzdelik olarak belirtilir. 108

Çözbağla (Bootstrap) Değerleri ile Komşu Birleştirme Ağacı & Yorumlar Elde edilen ağaca göre, en küçük genetik uzaklık popülasyon 1 ve popülasyon 2 arasındadır. Bu ağaçlar %100 çözbağla değeri ile güvenilirliği en yüksek şekilde dallanmışlardır. Çizilen ağaçtaki popülasyonlarda 2 temel grup gözlenmektedir. 109

ARLEQUIN Programı & AMOVA, Mantel Test Dr. Ceren Caner Berkman TÜRKHAYGEN-I Projesi Populasyon Genomiği Çalıştayı-I 8-10 Temmuz 2008, ODTÜ, Ankara 110

Arlequin: Amacı ortalama populasyon genetiği bilgisine sahip bir kullanıcının, birçok farklı temel metod ve istatistiksel testi elinde bulunan verilere uygulayarak verileri hakkında genetik ve demografik bilgiye ulaşmasını sağlamak olan bir bilgisayar yazılımıdır. Web sitesi: http://cmpg.unibe.ch/software/arlequin3 111

ARLEQUIN İsmi Nereden Geliyor? Fstat PHYLIP: PHYLogeny Inference Package 16. yüzyıl İtalyan halk tuluat tiyatrosu Ariecchino: üstünde baklava desenli bir giysi, başında tavşan ya da tilki tüyü takılı, geniş kenarlı bir başlık, yüzünde siyah deriden yarım bir maske ve elinde tahta bir pastav bulunmaktadır. Ariecchino = Arlequin 112

ARLEQUIN İLE NE ANALİZ EDEBİLİRİZ? Arlequin programı ile birçok farklı genetik veri analiz edilebilmektedir... DNA sekansları RFLP Mikrosatelit Alel frekansı... 113

DEVAM... Genetik veriler haplotipik ik yada genotipik ik olabilir... Haplotipik veri: Ex 1: Haplotipik RFLP verisi: 100110100101001010 Ex 2: Haplotipik DNA sekansı verisi: CATTTAAGCATGACATACGGA Genotipik veri: Ex1: Genotipik DNA sekans verisi: GGCATTTAAGCATGACATA GGGATTTTAGCATGACATT Ex 2: Genotipik Mikrosatelit verisi: 63 24 32 62 24 30 63 24 30 62 24 32 Gametik safhası biliniyor Gametik safhası bilinmiyor (Çekinik (recessive) alel yok) Gametik safhası bilinmiyor (Çekinik (recessive) alel var) 114

ARLEQUIN İLE NE HESAPLAYABİLİRİZ? Arlequin programına dahil edilen analiz yöntemlerinin istatistiksel gücünün yüksek olmasına dikkat edilmiştir. Bu sebeple birkaç istisna dışında d tüm analizlerin güvenilirliği permütasyon ya da exact test ile test edilmektedir. 115

Arlequin in son versiyonu olan Arlequin 3.11 programı bilgisayara yüklenip çalıştırıldığında aşağıdaki döküman ve dosyalar oluşur: 116

ARLEQUIN ARAYÜZÜ Grafik arayüzü sayesinde kullanıcı kolay ve çabuk bir şekilde farklı analizleri gerçekleştirebilmektedir. 117

Dosya Menüsü Yeni proje Proje aç Proje kapa Yakın zamanda kullanılan projeler ------------------- Ayarları yükle Ayarları kaydet (.ars) Ayarları farklı kaydet --------------- Çıkış 118

Görüntü Menüsü ü Proje j bilgisi ----------------- Ayarlar genel ayarlar 119

Seçenekler Menüsü ü Sonuçları ç ekle İlgili ayarları kullan AMOVA dağılımlarını (null distribution) sakla 120

Yardım Menüsü ü Arlequin q Kullanım Klavuzu Arlequin web sayfası Genetik yazılım forumu ------------------- Arlequin hakkında 121

Arlequin Araç Çubuğu Arlequin araç çubuğu sıkça kullanılan menü öğelerini içermektedir. Simgeye tıklandığında ilgili menü öğesi çalışmaktadır. 122

Girdi dosyasının hazırlanması Girdi dosyasına Arlequin programında Arlequin project ismi verilmektedir. Arlequin project dosyasını hazırlamak icin: 1. Notepad gibi bir text editör yardımı ile belirli anahtar kelimeleri kullanarak Arlequin formatında kendiniz hazırlayabilirsiniz. 2. Arlequin Project Wizard seçeneğini kullanılarak önce arlequin formatında bir taslak hazırlayıp daha sonra verileri bu taslağın içine yerleştirerek girdi dosyasını oluşturabilirsiniz. 3. Genetix programı ile başka bir formattaki veriyi Arlequin formatına çevirebilirsiniz 123

124

Arlequin girdi dosyasının uzantısı arp olmalıdır. 125

126

127

128

Populasyon sayısı Veri tipi Haplotipik veri icin 0, genotipik veri için 1 Gametik safha bilinmiyorsa 0, biliniyorsa 1 Ko-dominant veri 0, resesif veri 1 Eksik veriler? ile belirtilmiştir Veriler Örnekler Populasyon adı Populasyona ait birey sayısı Populasyona ait veriler 129

DEVAM... Grup sayısı 130

Örnek girdi dosyası 1 Populasyonun adı Populasyonun büyüklüğü 1 2 3 4 131

Örnek girdi dosyası 2 Girdi dosyasında veriler birey birey de girilebilir. 132

Yapı Oluşturulan l grup sayısı Gruba ait populasyonlar Gruba ait populasyonlar AMOVA analizi için incelenen populasyonlar guruplandırılarak test edilmek istenen genetik yapı belirlenmelidir. Gruba ait populasyonlar 133

AMOVA için girdi dosyasının Arlequin programında açılması ve analizler... 134

135

136

Üzerine tıklayarak 1 i 2 ye çevirelim 137

138

Analysis of Molecular Variance (AMOVA) AMOVA, moleküler verileri kullanarak populasyonlar arasındaki farklılaşmayı tahmin etmektedir. Bir başka deyişle populasyonların farklılaşması ile ilgili hipotezler bu yöntem ile test edilebilmektedir. Genetik çeşitliliği farklı hiyerarşik düzeyde (gruplar arası, populasyonlar arası, populasyon içi) incelemektedir. Genotiplerin frekanslarına ek olarak alel yapısındaki enformasyonu da kullanarak k genetik yapı indislerini i i (genetic structure indices) hesaplamaktadır. Birçok farklı moleküler veri (mikrosatellitler, RFLP, AFLP, sekans vb...) bu yöntem ile analiz edilebilmektedir (Excoffier ve ark 1992). Güvenilirliği permütasyon yöntemi ile test edilmektedir. 139

Gruplar arası Grup içindeki populasyonlar arası Populasyon içi 140

Use project distance matrix: Girdi dosyasında d uzaklık k matriksi verilmişse bu matriks kullanılarak analiz yapılabilir. Compute distance matrix : Girdi dosyasındaki verilerden uzaklık matriksi hesaplanabilir. Veriler ile Fst- like (infinite allele mutational (IAM) model) veya Rstlike (step-wise mutation (SMM) model) uzaklık k matriksi i hesaplanır ve bu matriks kullanılarak analiz yapılır. Use conventional F-statistics: ti ti Veriler için sadece alel frekansları kullanılarak matriks oluşturulur ve bu matriks kullanılarak analiz yapılır. 141

142

Çıktı Dosyası... 143

DEVAM... Populasyon içi Grup içindeki populasyonlar arası Gruplar arası 144

DEVAM... 145

Locus by locus AMOVA: AMOVA analizi her bir lokus icin ayrı ayrı da yapılabilmektedir. Özellikle eksik verilerin olduğu durumlarda standart AMOVA ile birlikte locus by locus AMOVA da uygulanmalıdır. 146

Çıktı Dosyası... 147

DEVAM... 148

Include individual level: Bireyler bazında lokuslar l arası farklılıklar da analize eklenmektedir. Compute population specific F IS s: AMOVA analizi haricinde populasyonlar için kendileşme katsayısı (inbreeding coefficients, F IS ) hesaplanmaktadır. 149

Çıktı Dosyası... Birey içi 150

Mantel test Bu test metodu iki farklı uzaklık matriksi arasındaki korelasyonu test etmektir (Mantel, 1967; Rousset ve Raymond, 1997). Bir başka deyişle metod, eşit boyutlu iki matriksin benzerliğinin karşılaştırmaktadır. Örnek: Irklar arası genetik uzaklık matrisi ile coğrafi uzaklık matrisi arasındaki uyumun karşılaştırılması Irkların F ST değerleri ğ matrisi ile coğrafi ğ uzaklık matrisleri arasındaki uyumun karşılaştırılması 151

Mantel test örnek girdi dosyası 152

DEVAM... Matriks büyüklüğü Karşışaktırılacak matriks sayısı 1. Matriks 1. Matriksdeki populasyonların giriliş sırası 2. Matriks 2. Matriksdeki populasyonların giriliş sırası 153

Mantel Test için girdi dosyasının Arlequin programında açılması ve analizler... 154

155

Mantel test analizinde sonuçların güvenilirliği permütasyon testi ile test edilmektedir. 156

Çıktı Dosyası... 157

DEVAM... 1. Matriks tik 2. Matriks 158

DEVAM... 159

Genetix programı ile Al Arlequin girdi idi dosyasının oluşturulması l 1. arlequin_veri dosyası.xls dosyasını açın. 2. Verileri notepad dosyasına aktarın. 3. uygulama.txt ismini vererek kaydedin. 160

161

162

163

164

Girdi dosyası... 165

STRUCTURE PROGRAMI (GENETİK İ YAPI TESTİ İ ) (Structure Software Version 2.22 April 3, 2007) Dr. Emel ÖZKAN TÜRKHAYGEN-I Projesi Populasyon Genomiği I Çalıştayı 8-10 Temmuz 2008, ODTÜ- Ankara 166

Structure Programı (Nisan 2007) : Populasyonlara ait bireylerin elde edilen moleküler genetik verileri (Mikrosatelit, AFLP, RFLP ve SNP) doğrultusunda; önceden bilinmeyen, deneme yanılma yoluyla varsayılan gruplara bireyleri tayin etmek ve en optimal grup sayısını bulmak için kullanılan bir analiz metodudur. (Pritchard ve ark.; 2000). Web sitesi: http://pritch.bsd.uchicago.edu Structure2.2 167

Structure programı ile ne analiz edilmektedir? Populasyonların mevcut genetik yapısı incelenmekte, Populasyonların genetik farklılıkları belirlenebilmekte, Çalışılan ş bireylerin populasyonlara p atanması yapılabilmekte, Genetik yapı bakımından karışmış olan melez bireyler (admixed individuals) ve göçmen bireyler (migrants individuals) ayrılabilmektedir ( Eğer kısa bir süre (F1, F2 generasyonlarında) önce melezleme veya bir karışım söz konusu olduysa). 168

devam.. Çalışılan populasyonlara ait bireylerden elde edilen AFLP (Çoğaltılmış Parça Uzunluk Polimorfizmi), RFLP (Restriksiyon Enzimleri Uzunluk Polimorfizmi), Mikrosatelit yada SNP (Tek Nükleotid Polimorfizmi) verileri doğrultusunda hesaplamalar yapılarak bireylerin hangi populasyonlara tayin edilebileceğini test edilebilmektedir. 169

STRUCTURE Programı, 3 Nisan 2007 tarihinden itibaren güncelleştirilmiş (Structure Version 2.2) olup yenilenmiştir. AFLP tekniği gibi dominant belirteçlerin (markerların) kullanıldığı çalışmalardan elde edilen verilerin analizinin bu programda yapılabileceği belirtilmektedir. 170

Structure test metodunda: Ksayısı kadar populasyon olduğu varsayılarak (kibuksayısı bilinmiyor olabilir); her bir populasyonun her bir lokusundaki ki alel l frekansı setleri dikkate alınarak populasyonlar birbirlerinden ayrılıp karakterize edilirler. (K değerlerinin belirlenmesinde frekanslar kadar, çalışılan lokusların alelleri arasındaki farklılıkta dikkate alınmaktadır.) 171

devam.. alel frekansları dikkate alınarak yapılan bu ayırımda, Örnek bireyler tek bir populasyona yüksek bir ihtimal ile tayin edilebildiği gibi, Eğer bireylerde çalışılan lokuslar açısından bir genetik karışım (admixture) söz konusu ise; iki ya da daha fazla populasyona da tayin edilebilmektedir. 172

Structure Test Metodundaki varsayımlar; Populasyonlar içerisinde, çalışılan lokuslar açısından Hardy - Weinberg Dengesinin ve Bağıntı eşitsizliği (Linkage disequlibrium) nin mevcut olduğu varsayılmaktadır. Populasyonlarda mutasyonların mevcut olmadığı farz edilerek Mikrosatellit, SNP ve RFLP gibi genetik markerlarının analizinde kullanılmaktadır. 173

Structure programındaki modelde, Alt populasyonlar içerisinde, çalışılan genetik belirteçler (marker) açısından Bağıntı eşitsizliği (Linkage Disequlibrium) nin mevcut olmadığı varsayılmaktadır. Bu nedenle birbirlerine oldukça yakın markerların analizinde kullanılamayacağı belirtilmiştir (Pritchard ve ark., 2004) Fakat Structure Version 2.0 nin kullanılmaya başlanması ile birlikte, birbirlerine bağlı belirteç (marker) verilerinin incelenmesinde kullanılabilmektedir. 174

Structure test metodunda, Bayesian yaklaşımı ve Markov Chain Monte Carlo - MCMC metodunu kullanmaktadır. 175

Bir kez daha tekrar ediyorum ; Structure Programı; alel frekansları arasındaki ilişkilerden yararlanarak çalışılan bireyleri ırklara tayin etmekte ve ırkların mevcut genetik yapısını belirlemektedir (Wiener ve ark., 2004, Falush ve ark., 2003). Bu test metodunda populasyonlara ait bireyleri ilgili populasyonlara ayırmak ve doğru parametreleri belirleyebilmek için doğru/uygun olan Markov Zinciri sayısının ve uzunluğunun saptanmasına ihtiyaç vardır. 176

Bu nedenle doğru uzunluğu ve sayıyı bulabilmek için, farklı çalışmalarda ş çeşitli ş uzunluk değerleri ğ (length of burning period) ve MCMC sayıları denenerek, en uygun sayının 10.000 ila 100.000 arasında olmasının yeterli olduğu belirtilmiştir (Pritchard ve ark., 2007 ) 177

Structure veri dosyası hazırlama: Program yalnızca (.txt) editör ile yazılmış dosyalarını tanır. Populasyonlar rakamlarla kodlanmalıdır (1, 2, 3, 4, 5,.. ). Veri dosyası 2 kısımdan oluşur: İlk satırda çalışılan lokus isimleri yer alır. Bunu takip eden satırlarda genotipik veriler yer alır. 178

Structure programında veriler.txt formatında hazırlanmaktadır. Populasyon numarası Lokus ismi Birey no 179

Boş bir not defteri açılır. İlk satıra Lokus isimleri yazılır. Tab tuşu ile 2 ara verilir. İkinci satıra, birey no, populasyon no ve alel uzunlukları yazılır. Tab tuşu ile birer ara verilir. veya dosya Excel (.xls)formatında yazılıp not defteri (. txt ) formatına çevrilebilir. 180

Farklı kaydet seçeneğinden dosyaya isim verilerek (.txt ) formatında kaydedilir. 181

Populasyon No 1. alel uzunluğu İki alel arası 1 tab tuşu boşluk bırakılacak Birey No Lokus İsmii 2. alel uzunluğu 182

Veriler (.txt) formatında hazırlandıktan sonra, masaüstünde yer alan Structure kısa yolu üzerine tıklanarak program açılır. File kısmına tıklanarak Open data file seçeneğine tıklanır 183

.txt formatında kaydedilen dosya seçilir. 184

(...txt) formatında kaydedilen dosya programda açılmaktadır. 185

Data Aosyasının açılmasının ardından; - Yeni tasarım-new Project kısmı açılır. 186

Daha sonra Tasarım dosyasına isim verilir. Tasarım dosyanın bilgisayarda kaydedileceği kısım seçilir ve data dosyası seçilir. NEXT KISMINA TIKLANIR. 187

Çalışılan birey sayısı, lokus sayısı, ve eksik olan verilerin ifade edilme şekli yazılır. 188

Sıra kısmında çalışılan lokusların isimlerinin yer aldığı kısım işaretlenir, her bir sütunda bireylere ait verilerin olduğu kısım işaretlenir. NEXT kısmına tıklanır. 189

Her bir bireyin ve bu bireylerin hangi populasyona ait olduğunun tanımlamasının dosyada yapılmış olduğu belirtilir. 190

Verilerin tanımlanması bittiği için Finish Finish kısmına basılır. 191

Proceed kısmına tıklanır. 192

Proceed kısmına tıkladıktan sonra, parametreleri kaydedeceğimiz d i kısma gelinmiş i ve Parameters Sets dosyamız oluşturulacaktır. 193

Parameters Set kısmına gelinir ve New Seçeneği ğ seçilir. 194

Markov Chain Monte Carlo - MCMC Monte Carlo Markov Zinciri sayısının ve uzunluğunun yazılması gerekir. Bu zincir sayısı ve uzunluğunun 10.000 ila 100.000 arasında olmasının populasyonları birbirinden ayırmak için yeterli olduğu belirtilmiştir. 195

Uygun olan Monte Carlo Markov Chain - MCMC Monte Carlo Markov Zinciri i i sayısının ve uzunluğunun ğ yazılmasının ardından d OK kısmına tıklanır. 196

OK kısmına tıkladıktan sonra dosyanın kaydedileceği alt dosya ismi yazılır ve tekrar OK kısmına tıklanır. 197

Bizim örneğimizde, çalışılan bireylerin karışık bir geçmişi olduğu düşünüldüğü için Admixture Model kullanılmaktadır. 198

7 farklı mikrosatelit lokusu çalışılmış ve alel frekanslarımız birbirleri ile ilişkili olduğu bilinmektedir 199

Programda tüm parametreler tanımlandıktan sonra çalışmaya hazır hale gelmiştir. Programın çalıştırılmasını sağlayabilmek amacı ile Project kısmına gelinip Start a Job seçeneğine tıklanır. 200

Daha sonra çalışılan populasyon sayısı dikkate alınarak uygun K değerinin belirlenmesi aşamasına geçilmektedir. Çalışılan örnek bireylerimizin 4 farklı populasyondan alındığını düşünüyoruz. Fakat gerçekte bu populasyon sayımızın (K sayımızın) farklı olduğu düşünülmektedir. 201

Populasyon sayımızın (K sayımızın), 1 ila 7 populasyondan alınmış olduğunu ğ varsayalım. 20 tekerrür ile her bir K değerini ğ i analiz edelim. 202

Structure Programı nda analizin başlaması için dosya isminin üzerine tıklamak k gerekmektedir. kt Dosya seçildikten sonra START kısmına tıklanmaktadır. 203

Program başlatıldıktan sonra zincir sayısı ve uzunluğuna bağlı olarak çalışma süresi değişmektedir. 204

SONUÇLARIN DEĞERLENDİRİLMESİ: Yapılan bir çalışmada 4 farklı populasyonda 7 farklı mikrosatelit lokusu çalışılmış ve bunların sonuçları STRUCTURE PROGRAMI nda analiz edilmiştir. Bu örnek bir analizde 7 farklı mikrosatelit bölgesine göre çalışılan bireylerde 4 farklı populasyonun mevcut olduğu ve en uygun K değerinin i 4olduğu gözlemlenmiştir(şekil l i( sizce nasıl yorumlanabilir?) 205