Benzer belgeler
SNP TEK NÜKLEOTİD POLİMORFİZMLERİ (SINGLE NUCLEOTIDE POLYMORPHISMS)

HAFTA III Bağlantı, Asosiyasyon, Haritalama

T.H. Morgan ve A.H. Sturtevant 1911

Gen Arama Yordamı ve Nörolojik Hastalıklarla İlgili Gen Keşfi Çalışmalarına Türkiye den Örnekler

Anksiyete Bozukluklarında Genom Boyu Asosiyasyon Çalışmaları

Mutasyon: DNA dizisinde meydana gelen kalıcı değişiklik. Polimorfizm: iki veya daha fazla farklı fenotipin aynı tür popülasyonunda bulunmasıdır.

Hardy Weinberg Kanunu

Populasyon Genetiği. Populasyonlardaki alel ve gen frekanslarının değişmesine neden olan süreçleri araştıran evrimsel bilim dalı.

2 Çeşit Populasyon mevcuttur. Gerçek/Doğal Populasyonlar: Örneğin yaşadığınız şehirde ikamet eden insanlar.

TEMEL VETERĠNER GENETĠK

HAFTA II Mendel Genetiği

Parkinson Hastalığı ile α-sinüklein Geni Polimorfizmlerinin İlişkisinin Araştırılması

FEN ve TEKNOLOJİ / KALITIM KALITIM İLE İLGİLİ KAVRAMLAR

Rekombinasyon ve Bağlantı Analizi (Recombination and Linkage Analysis)

GENETİK ALGORİTMALAR. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ

ADIM ADIM YGS LYS Adım EVRİM

hendisliği BYM613 Genetik MühendisliM Tanımlar: Gen, genom DNA ve yapısı, Nükleik asitler Genetik şifre DNA replikasyonu

1. ÜNİTE : HÜCRE BÖLÜNMESİ VE KALITIM

GENETİK POLİMORFİZMLER. Prof. Dr. Filiz ÖZBAŞ GERÇEKER

Nicel Genetik ve Çok Etmenli Karakterler

GENETĐK Popülasyon Genetiği. Doç. Dr. Hilâl Özdağ. Pierce B., Genetics: A conceptual Approach,

Mendel Dışı kalıtım. Giriş

Tıbbın Geleceğine dair.. Genetik Testler ve Kişiselleşmiş Tıp Anlayışı. B. Aysin Sermen

X kromozomu (Devam) X STR Polimorfizmi Yaklaşık 6 µm uzunluğunda olup 165 milyon baz çifti içermektedir. Şimdiye kadar X kromozoma bağlı

GENETİK I BİY 301 DERS 5

Bağlantı ve Kromozom Haritaları

TC. İSTANBUL ÜNİVERSİTESİ ADLİ TIP ENSTİTÜSÜ İNSERSİYON/DELESYON (INDEL) MARKIRLARI VE TÜRKİYE POPULASYONU ARZU DÜVENCİ

GENETİK TANI YÖNTEMLERİ. Prof.Dr.Mehmet Alikaşifoğlu

Mendel Genetiği, Kalıtım, Gen Mühendisliği ve Biyoteknoloji

Temel ve Uygulamalı Araştırmalar için Araştırma Süreci

İ. Ü İstanbul Tıp Fakültesi Tıbbi Biyoloji Anabilim Dalı Prof. Dr. Filiz Aydın

DNA Dizileme (Sekanslama)

8. Sınıf Fen ve Teknoloji

İstanbul Tıp Fakültesi Tıbbi Biyoloji AD Prof. Dr. Filiz Aydın

Serdar BİROĞUL YÜKSEK LİSANS TEZİ (ELEKTRİK EĞİTİMİ) GAZİ ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ANKARA

BİYOİNFORMATİK CİHAN SUVARİ

Yeni Nesil Genomik Sistemler. ve Uygulamaları

doğrudur? Veya test, sağlıklı dediği zaman hangi olasılıkla doğrudur? Bu soruların yanıtları

Yaş Doğrulama Metotları

Klinik Araştırmalarda Farmakogenetik Bilginin Kullanılmasına Giriş ve Örnekler

10.Sınıf Biyoloji. Genetik. cevap anahtarı

Genom Sayısal ve Yapısal Mutasyonlar. Prof. Dr. Fatma Savran Oğuz

Fonksiyon Optimizasyonunda Genetik Algoritmalar

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Gezgin Satıcı Probleminin İkili Kodlanmış Genetik Algoritmalarla Çözümünde Yeni Bir Yaklaşım. Mehmet Ali Aytekin Tahir Emre Kalaycı

3) Aşağıda verilen ifadelerden hangisi mayoz bölünmenin sebep olduğu faydalardan değildir?

GENETİK HASTALIKLAR. Dr.Taner DURAK. Tıbbi Genetik Uzmanı. Bursa Orman Bölge Müdürlüğü Fikir Bahçesi Konferansı

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş

(ZORUNLU) MOLEKÜLER İMMÜNOLOJİ I (TBG 607 TEORİK 3, 3 KREDİ)

GENETİK ALGORİTMA ÖZNUR CENGİZ HİLAL KOCA

Haplotip ve Bağlantı Analizi. Linkage= Bağlantı Association= İlişkilendirme

Süreklilik gösteren özellikler çoğunlukla iki ya da daha fazla gen tarafından kontrol edilirler.

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ

Konu 4 Ökaryotlarda Kromozom Haritalaması

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR

BÖLÜM 13 HİPOTEZ TESTİ

ORMAN AĞACI ISLAHI. Yrd. Doç. Dr. DENİZ GÜNEY ( GÜZ DÖNEMİ)

Genetik Algoritmalar. Bölüm 1. Optimizasyon. Yrd. Doç. Dr. Adem Tuncer E-posta:

Araştırmada Evren ve Örnekleme

İLAÇ ARAŞTIRMALARINDA SURROGATE MARKERLAR

KALITIMIN GENEL İLKELERI. Mendel Genetiği Eksik baskınlık Eş baskınlık Çok alellilik Kontrol Çaprazlaması

Mutasyon ve Genetik Sürüklenme

Gen haritasının ne kadarı tamamlandı DNA'nın şimdiye kadar yüzde 99'u deşifre edildi.

Temel ve Uygulamalı Araştırmalar için Araştırma Süreci

İstanbul Tıp Fakültesi Tıbbi Biyoloji AD Prof. Dr. Filiz Aydın

ETKİN İLAÇ KULLANIMINDA GENETİK FAKTÖRLER. İlaç Kullanımında Bireyler Arasındaki Genetik Farklılığın Mekanizması

ADIM ADIM YGS LYS Adım EKOLOJİ 15 POPÜLASYON GENETİĞİ

POLİMERAZ ZİNCİR REAKSİYONU (PZR-PCR) VE RESTRİKSİYON PARÇA UZUNLUĞU POLİMORFİZMİ (RFLP)

Genetik Kavramlar Sekizinci baskıdan çeviri Klug, Cummings, Spencer

DERS BİLGİLERİ BTEC

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

Sınıf ; Çalışma yaprağı 4

AF Konusunda Klinik Pratikte Kullanılan Genetik Çalışmalar Türkiye de Durum Ne?

TEOG1 DENEME SINAVI 2 ( DNA, Mitoz,Mayoz Kapsamlı)

This information (23) on X-linked genetic disorders is in Turkish X bağlantılı Genetik Hastalıklar (İngilizce'si X-linked Genetic Disorders)

BİYOİSTATİSTİK Sağlık Alanına Özel İstatistiksel Yöntemler Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

ANKARA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ DÖNEM PROJESİ İMAR ÖZELLİKLERİNİN TAŞINMAZ DEĞERLERİNE ETKİLERİ. Yeliz GÜNAYDIN

Biyoteknoloji ve Genetik I Hafta 13. Ökaryotlarda Gen İfadesinin Düzenlenmesi

14 HhBbeeAa X HhBbEeAa genotipli bireylerin çaprazlanmasından oluşacak bireyler kaç farklı genotipte olabilir? A) 16 B) 54 C) 27 D) 11 E) 4

Mikobakteriyolojide yeni nesil dizileme ile analiz

Diafragmatik Herni. Prof. Dr. E. Ferda Perçin Gazi Üniversitesi Tıp Fakültesi Tıbbi Genetik AD Ankara-2018

Sıralama Öğrenme ile Sağkalım Tahminleme

Sınıf ; Çalışma yaprağı 3

Epigenetik ve Kanser. Tayfun ÖZÇELİK Bilkent Üniversitesi Moleküler Biyoloji ve Genetik Bölümü

TEMEL EĞİTİMDEN ORTAÖĞRETİME GEÇİŞ ORTAK SINAV BAŞARISININ ÇEŞİTLİ DEĞİŞKENLER AÇISINDAN İNCELENMESİ

BÖLÜM 2 VERİ SETİNİN HAZIRLANMASI VE DÜZENLENMESİ

Herediter Meme Over Kanseri Sendromunda. Prof.Dr.Mehmet Ali Ergün Gazi Üniversitesi Tı p Fakültesi T ı bbi Genetik Anabilim Dalı

KALITSAL MADDE PROF. DR. SERKAN YILMAZ

BİYOİSTATİSTİK Örnekleme ve Örnekleme Yöntemleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Hafta VIII Rekombinant DNA Teknolojileri

Sosyal Bilimler Enstitüsü. Beden Eğitimi ve Spor (Ph.D) 1. Yarı Yıl

DNA TİPLEME YÖNTEMLERİ (SOMATİK STRLOKUSLARI)

En Etkili Kemoterapi İlacı Seçimine Yardımcı Olan Moleküler Genetik Test

SAYISAL YÖNTEMLERDE PROBLEM ÇÖZÜMLERİ VE BİLGİSAYAR DESTEKLİ UYGULAMALAR

ÜNİTE:1. İstatistiğin Tanımı, Temel Kavramlar ve İstatistik Eğitimi ÜNİTE:2. Veri Derleme, Düzenleme ve Grafiksel Çözümleme ÜNİTE:3

Fenotip: Bir canlının gözle görülebilen tüm özelliklerine fenotip adı verilir. Canlının dış görünüşüdür. Genotip ve çevre etkisiyle meydana gelir.

KONU 5 Evrim Mekanizmaları I: Seçilim ve Mutasyon. Aslı Sade Memişoğlu

Moleküler Biyoloji ve Genetik Bölümü Boğaziçi Üniversitesi

Prof.Dr. Meltem Yalınay Çırak Gazi Üniversitesi Tıp Fakültesi Mikrobiyoloji ve Klinik Mikrobiyoloji A.D. SALGINLARIN İZLENMESİ VE MOLEKÜLER

Transkript:

ANKARA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ DOKTORA TEZİ AİLE TEMELLİ İLİŞKİLENDİRME ÇALIŞMALARINDA SINIRLI ÖRNEKLEM BOYUTU İÇİN İSTATİKSEL SİNYAL İŞLEME ALGORİTMALARININ KULLANILMASI Farid RAJABLI ELEKTRONİK MÜHENDİSLİĞİ ANABİLİM DALI ANKARA 2011 Her hakkı saklıdır

ÖZET Doktora Tezi AİLE TEMELLİ İLİŞKİLENDİRME ÇALIŞMALARINDA SINIRLI ÖRNEKLEM BOYUTU İÇİN İSTATİSTİKSEL SİNYAL İŞLEME ALGORİTMALARININ KULLANILMASI Farid RAJABLI Ankara Üniversitesi Fen Bilimleri Enstitüsü Elektronik Mühendisliği Anabilim Dalı Danışman: Doç. Dr. H. Gökhan İLK Bu tez kapsamında aile temelli ilişkilendirme çalışmalarında yaşanan örneklem boyutu sorununun çözümü için ardışık olasılık oran testi (AOOT) ve permütasyon temelli birleşik kalıtımda dengesiz aktarım testi (B-KDAT) önerilmiştir. İlk aşamada,anne-baba-çocuk üçlüsü genotip verisi için, AOOT ile kalıtımda dengesiz aktarım testi (KDAT),birsimülasyon verisi üzerinde uygulanarak karşılaştırılmıştır. KDAT, tekli nükleotid polimorfizmleri (SNP)iki gruba sınıflandırırken (hastalıkla ilişkili olan ve ilişkili olmayansnp ler), AOOT elde edilen bulguları sadece ilişkili veya ilişkisiz diye sınıflandırmamış, üçüncü bir bölge olarak bir gri bölge oluşturmuş, karar veremediği bulguları oraya atarak daha fazla örnek sayısına ihtiyaç duyduğunu belirtmiştir.duyarlılık, belirlilik ve doğruluk değerleri, her iki yöntem için de hesaplanmış ve AOOT nin tüm bu ölçütlerde her anne-baba-çocuk üçlü sayısı için KDAT den üstün olduğu gösterilmiştir. İkinci aşama olarak, anne-baba-çocuk üçlüsü ve anne-çocuk/baba-çocuk ikilisigenotip verilerini içine alabilen permütasyon temelli B-KDAT testi, yeni birsimülasyon verisi üzerine uygulanmış ve testin istatistiksel güç analizi yapılmıştır. Bu test istatistiğinin, küçük örneklem boyutunda (50 üçlü ve 30 ikili) % 80 üzerinde bir istatistiksel güce sahip olduğu görülmüştür. Mayıs 2011, 74 sayfa Anahtar Kelimeler: İlişkilendirme, Tekli Nükleotid Polimorfizmi, Kalıtımda Dengesiz Aktarım Testi, Ardışık Olasılık Oran Testi, Simülasyonçalışması i

ABSTRACT Ph.D. Thesis APPLICATION OF STATISTICAL SIGNAL PROCESSING ALGORITHMS IN SMALL SAMPLE SIZE FAMILY BASED ASSOCIATION STUDIES Farid RAJABLI Ankara University Graduate School of Natural and Applied Sciences Department of Electronic Engineering Supervisor: Assoc. Prof. Dr. H. Gokhan ILK In this thesis, a sequential probability ratio test (SPRT) and permutation based combined transmission disequilibrium test (C-TDT) are proposed to overcome the problem of limited number of samples in family based association studies. Firstly, for case-parent trios, the results of SPRT are compared with the ones obtained from the traditional transmission disequilibrium test (TDT) through simulated data. While TDT classifies single nucleotide polymorphisms (SNPs) into only two groups (SNPs associated with the disease and those not associated with the disease), SPRT has the flexibility of assigning SNPs to a third group that is SNPs for which we do not have enough evidence and for that reason we need to keep on sampling. It is shown that SPRT results in better specificity, accuracy and sensitivity values for classifying SNPs when compared to TDT. Secondly, a simulation study is carried out to determine the power of the permutation-based C-TDT statistic, which incorporates the genotype information from both case-parent trios and case-parent pairs.especially, it is observed that 50 trios and 30 pairs are enough in size to reach a 80% amount of statistical power. May 2011, 74 pages Key Words :Association, SingleNucleotidePolymorphism, TransmissionDisequilibrium Test, SequentialProbabilityRatio Test, Simulationstudy ii

TEŞEKKÜR Doktora eğitimimin boyunca bilgi, öneri ve yardımlarını esirgemeyerek, önerileri ile bana yol gösteren danışman hocam sayın Doç. Dr. H. Gökhan İLK e (Ankara Üniversitesi Elektronik Mühendisliği Anabilim Dalı) derin saygılarımı sunar ve teşekkür ederim. Tez çalışmam boyunca,maddi manevi desteklerini esirgemeyen değerli bölüm başkanımız sayın Doç. Dr. Ziya TELATAR a (Ankara Üniversitesi Elektronik Mühendisliği Anabilim Dalı), tezimin şekillenmesinde aktif rol oynayan ve bilimsel yaklaşımı kendilerinden öğrenmeye çalıştığım değerli hocalarım sayın Doç. Dr. Hilal ÖZDAĞ a (Ankara Üniversitesi Biyoteknoloji Enstitüsü) ve sayın Yrd. Doç. Dr. Özlem İLK e (Orta Doğu Teknik Üniversitesi İstatistik Bölümü) teşekkürlerimi sunarım.çalışmalarıma katkıda bulunandilayçiglidağ DÜNGÜL e (Ankara ÜniversitesiBiyoteknoloji Enstitüsü) ve aynı zamanda çalışmamsırasında büyük yardımları dokunan ve önemli katkılarda bulunan Gül İNAN a (Orta Doğu Teknik Üniversitesi İstatistik Bölümü) ve Enver KAYAASLAN a (Bilkent Üniversitesi Bilgisayar Mühendisliği Anabilim Dalı) teşekkürü borç bilirim. Sadece eğitim hayatım müddetince değil, iyi ve kötü günde her daim yanımda olan, maddi ve manevi desteklerini esirgemeyen, fedakârlık ve hoşgörülerinden dolayı anneme, babama, kızıma ve tabii ki eşime minnettar olduğumu belirtir ve teşekkür ederim. Farid RAJABLI ANKARA, Mayıs 2011 iii

İÇİNDEKİLER ÖZET... i ABSTRACT... ii TEŞEKKÜR... iii SİMGELER DİZİNİ... v ŞEKİLLER DİZİNİ... vi ÇİZELGELER DİZİNİ... vii 1. GİRİŞ... 1 2. İLİŞKİLENDİRME ÇALIŞMALARINDA KURAMSAL TEMELLER... 5 2.1 Gen Haritalama ve Genlerin Lokalizasyon Tespiti... 5 2.2 Bağlantı ve İlişkilendirme Analizleri... 6 2.3 Moleküler Belirteçler... 7 2.4 Tek Nükleotid Polimorfizmi... 8 2.5 Kompleks Hastalıklar... 11 2.6 İlişkilendirme Çalışmaları... 11 2.6.1 Aday gen ilişkilendirme çalışmaları... 12 2.6.2 Genom boyu ilişkilendirme çalışmaları... 13 2.7 Popülasyon Temelli Genom Boyu İlişkilendirme Çalışmaları... 15 2.8 Aile Temelli Genom Boyu İlişkilendirme Çalışmaları... 16 3. KALITIMDA DENGESİZ AKTARIM TESTİ (KDAT)... 19 3.1 İlişkilendirme Çalışmalarında Kullanılan Geleneksel Yöntem KDAT Üzerine Temel Bilgiler... 19 3.2 Kalıtımda Dengesiz Aktarım Testin Bir Örnek Üzerinde Uygulaması... 21 3.3 KDAT İstatistiksel Güç Analizi ve Bulgular... 25 4. ARDIŞIK TEST... 33 4.1 İlişkilendirme Çalışmaları için Önerilen Özgün Bir Yöntem Ardışık Olasılık Oran Testi (AOOT) Üzerine Temel Bilgiler... 34 4.3 AOOT için Örneklem Boyutu Karşılaştırması... 35 4.4 Gereç Olarak KullanılanSimülasyon Verisi için Geliştirilen Algoritma... 37 4.5 AOOT ve KDAT TestlerinSimülasyon Verisi Üzerine Uygulanması ve Bulgular... 41 iv

5. BİRLEŞİK KALITIMDA DENGESİZ AKTARIM TESTİ VE PERMÜTASYON TESTLERİ... 52 5.1 Birleşik Kalıtımda Dengesiz Aktarım Test İstatistiği ve Permütasyon Testleri Temel Bilgiler... 52 5.2 Permütasyon Temelli B-KDAT için Simülasyon Çalışması ve İstatistiksel Güç Analizi... 58 6. SONUÇ... 67 KAYNAKLAR... 70 ÖZGEÇMİŞ... 74 v

KISALTMALAR DİZİNİ A AHT AOOT B-KDAT CNV DN DNA DP G GRO GWAS HN HP KDAT LD MATLAB RFLP ROC S SNP STR T VNTR Adenin Ardışık Hipotez Testi Ardışık Olasılık Oran Testi Birleşik Kalıtımda Dengesiz Aktarım Test Varyasyon Kopya Sayısı (CopyNumberVariation) Doğru Negatif Deoksiribonükleik Asit (DeoxyribonucleicAcid) Doğru Pozitif Guanin Genotipik Risk Oranı Genom Boyu İlişkilendirme Çalışmaları (Genom WideAssociationStudy) Hatalı Negatif Hatalı Pozitif Kalıtımda Dengesiz Aktarım Testi Bağlantı Dengesizliği (LinkageDisequilibirum) Matris Laboratuarı (MatrixLaboratory) RestriksiyonParça Uzunluk Polimorfizmi (RestrictionFragmentLengthPolymorphism) Receiver Operating Characteristic Sitozin Tek Nükleotid Polimorfizmi (Single NucleotidePolymorphism) Kısa Tekrarlayan DNA Dizileri (Short Tandem Repeat) Timin Değişken Sayıda Ardı Ardına Tekrarlayan DNA Dizileri (VariableNumber of Tandem Repeat) vi

ŞEKİLLER DİZİNİ Şekil 2.1 Mayoz bölünme sırasında homolog kromozomların birbirileriyle karşılıklıparça değişimi... 6 Şekil 2.2 DNA dizisi üzerinde bireysel varyasyon olan SNP... 9 Şekil 2.3 Kromozom üzerinde genlerin ve SNP lerin yerleşimi... 10 Şekil 2.4 Aile temelli ilişkilendirme çalışmalarında kullanılan anne-babaçocuküçlüsü... 16 Şekil 3.1 Ebeveynlerden hasta çocuğa aktarılan ve aktarılmayan alellerin toplamsayılarını gösteren KDATtablosu... 22 Şekil 3.2 Az veya orta düzeyde ilişki gösteren SNP ler için hesaplanan doğru pozitifyüzdeleri... 30 Şekil 3.3 Az veya orta düzeyde ilişki gösteren SNP ler için hesaplanan hatalı negatifyüzdeleri... 30 Şekil 3.4 Yüksek düzeyde ilişki gösteren SNP ler için hesaplanan doğru pozitifyüzdeleri... 31 Şekil 3.5 Yüksek düzeyde ilişki gösteren SNP ler için hesaplanan hatalı negatif yüzdeleri... 31 Şekil 4.1 AOOT farklı τ 1 değerleri için %0.1 1.Tip hata ile %80 istatistiksel güç eldeedebilmesi için gereken maksimum, ortalama, ortanca ve minimum sayıda beklenen örneklem boyutu sayısı(örneklem boyutu τ 1 = 0.5için sonsuz değerini almaktadır)... 36 Şekil 4.2 AOOT ve KDAT testleri için yapılan simülasyon çalışmasının akış diyagramı... 40 Şekil 4.3 Ardışık olasılık oran testi ile kalıtımda dengesiz aktarım testinin artan üçlüsayısına göre doğruluk yüzdeleri... 42 Şekil 4.4 Ardışık olasılık oran testi ile kalıtımda dengesiz aktarım testinin, yüksekdüzeyde ilişkilendirme gösteren veriler için artan üçlü sayısına göre duyarlılık yüzdeleri... 43 Şekil 4.5 Ardışık olasılık oran testi ile kalıtımda dengesiz aktarım testinin, az veya ortadüzeyde ilişkilendirme gösteren veriler için artan üçlü sayısına göre duyarlılık yüzdeleri... 44 Şekil 4.6 Ardışık olasılık oran testi için anlamlı olmayan ilişkilendirme gösteren veriler için artan üçlü sayısına göre belirlilik yüzdeleri... 45 Şekil 4.7 Kalıtımda dengesiz testi için anlamlı olmayan ilişkilendirme gösteren veriler için artan üçlü sayısına göre belirlilik yüzdeleri... 46 Şekil 4.8 Ardışık olasılık oran testi ve kalıtımda dengesiz aktarım testi için ROCeğrileri.... 51 Şekil 5.1 Sadece bir taşıyıcı çocuğu olan üç farklı aile grubu... 53 Şekil 5.2 Permütasyon temelli B-KDAT uygulamasının akış diyagramı... 58 vii

ÇİZELGELER DİZİNİ Çizelge 3.1KDATdört gözlü tablosu... 20 Çizelge 3.2 KDATanalizinde kullanılacak genotip verileri... 21 Çizelge3.3 Anne ve babanın genotiplerine göre olası çocuk genotipleri... 26 Çizelge 3.4 İlişki göstermeyen, az ve orta düzeyde ilişki gösteren ve yüksek düzeydeilişki gösterensnp lerin trio sayısına göre sıra ile doğru negatif vehatalı pozitif; doğru pozitif ve hatalı negatif; doğru pozitif ve hatalı negatif yüzde oranları... 29 Çizelge 4.1b ve c nin, 1 değerini alabilmeleri için 0.1 ile 0.9 aralığında değişenolasılıklar için üretilen 45 durum... 38 Çizelge 4.2 α=%0.1 ve β=%20için iki analiz testin üçlü sayısına göre genel doğruluk tablosu... 46 Çizelge 4.3 Yüksek düzeyde ilişkilendirme gösteren SNP lerin üçlü sayısına göre doğru pozitif, hatalı negatif ve duyarlılık yüzde oranları... 47 Çizelge 4.4 Az veya orta düzeyde ilişkilendirme gösteren SNP lerin üçlü sayısına göredoğru pozitif, hatalı negatif ve duyarlılık yüzde oranları... 48 Çizelge 4.5 İlişkilendirme göstermeyen SNP lerin üçlü sayısına göre doğru negatif, hatalı pozitif ve belirlilik yüzde oranları... 49 Çizelge 5.1 Herhangi bir SNP te anne ve babanın genotipinin gözlemlenmesiüzerine, aynı SNP te çocuğun genotipinin alabileceği değerler... 60 Çizelge 5.2Herhangi bir SNP teanne-baba-çocuk üçlüsü genotiplerinin, B-KDAT testistatistiğinde, T ve NT terimlerine olan katkıları... 61 Çizelge 5.3Herhangi bir SNP te anne veya babanın genotipinin gözlemlenmesiüzerine, aynı SNP te çocuğun genotipinin alabileceği değerler ve bu genotiplerinb-kdat test istatistiğinde, N, N ve terimlerine olankatkılar... 62 N Çizelge 5.4 Örneklem büyüklüklerine göre güç ve hesaplanmış anlamlılık düzeyleri... 65 viii

1. GİRİŞ Bu yüzyılın başlarında, İnsan Genomu Projesinin büyük ölçüde tamamlanması ile ortaya koyduğu açılım, bilim dünyasında büyük bir heyecanla karşılandı. Başlığı ile sınırlı kalmayıp sadece insan genomunu değil, diğer canlıları da içermesi genetik çalışmalarda bir devrim niteliği taşımaktadır. Bu gelişme o kadar büyük bir yankı uyandırmıştı ki, dönemin Amerika Birleşik Devletleri başkanı Bill Clinton ve İngiltere başbakanı Tony Blair,İnsan Genom Projesini Yaşamın Sırları Çözüldü sloganı ile 2000 yılının Haziran ayında dünyaya duyurmuşlardır. Henüz başlangıcın sonuna gelindiği bilinen bu proje ile DNA üzerinde yer alan baz dizinlerinin büyük kısmı öğrenilmiştir. 3.2 milyar baz çiftinden oluşan insan çekirdek DNA dizisinin çıkarılması ile bugün ilk aşaması tamamlanmakta olan bir sürecin başında bulunuyoruz. Genomun işlevselliği, yani hangi dizilerin hangi proteini kodladıkları, bunların yerleri ve çalışma yolları, birliktelikleri, kullanılabilirlikleri, protein protein etkileşimleri öğrenilmedikten sonra bu bilgi ham haliyle çok fazla bir şey ifade etmemektedir. Görüldüğü üzere elde edilen büyük ölçekteki verilerin boyutu her geçen gün artmakla beraber onların değerlendirilmesi ve analizlerinin yapılabilmesi için yeni yöntem ve araçların geliştirilmesi de aynı derecede önem arz eden bir mesele olarak karşımıza çıkmaktadır. Bu yönde geliştirilen DNA mikroçip teknolojisi ile aynı anda binlerce gene ilişkin gen ifade verileri ve milyonu aşkın moleküler belirteçler incelenebilmektedir. Böylece elde edilen büyük ölçekteki verilerin veri tabanında depolanması, veri ön işleme yöntemleri kullanılarak verilerin düzenlenmesi, uygun yöntemlerle analiz edilmesi ve gereksinim duyulursa yeni istatistiksel analiz yöntemlerinin geliştirilmesi, genom çalışmalarında sonuca gidilmesinde çok büyük önem arz etmektedir. Bu tez çalışmasına, mikroçip teknolojisi ile geliştirilen ve binlerce moleküler belirtece sahip olan mikro dizin yongaların düzgün veri verebilmeleri için kullanılan ön işleme algoritmaların tetkiki ile başlanmıştır. İlk olarak, aile temelli ilişkilendirme çalışmaları kapsamında elde edilen verilerin istatistiksel analizi için kullanılan kalıtımda dengesiz 1

aktarım testi incelenmiş ve simülasyon çalışmaları ile elde edilen veriye uygulanması geliştirilen bir yazılım ile sağlanmıştır. Bir sonraki aşamada, kalıtımda dengesiz aktarım testi uygulamasında karşılaşılan güvenli sonuç için örneklem boyutu kısıtlamasını aşabilmek için, istatistiksel sinyal işlemede kullanılan, ardışık olasılık oran testi önerilmiştir. Daha sonra, hem kalıtımda dengesiz aktarım testi hem de özgün bir yaklaşım olan ardışık olasılık oran testi üretilen simülasyon verisi aracılığıyla sınanmış ve sonuçlar karşılaştırılarak, tartışılmıştır. Son olarak, aile temelli ilişkilendirme çalışmalarında örnek veri olarak kullanılan, anne-baba-çocuk üçlüve anne-çocuk/babaçocuk ikili, genotip verisini beraber istatistiksel analiz edebilmek içinpermutasyon temelli birleşik kalıtımda dengesiz aktarım testi kullanılmıştır. Bu tez kapsamında permutasyon temelli birleşik kalıtımda dengesiz aktarım testin I. Tip hata ve istatistiksel gücü simülasyon çalışması ile elde edilen veri üzerinde bu testin uygulanması ile farklı örneklem boyutları için tespit edilmiştir. Bu tezi oluşturan bölümlerin bir özeti verilirse, Bölüm 2 de, tezin önemi ve amacının anlaşılabilmesi için ilişkilendirme çalışmaları kapsamında gerekli olan kuramsal altyapı sunulmaktadır. İlk önce genlerin lokalizasyon tespiti üzerinde durulmaktadır. Daha sonra lokalizasyon tespiti için kullanılan bağlantı analizleri ve ilişkilendirme çalışmaları anlatılmaktadır. Ardından, genomda lokalizasyonu bilinen varyasyonlardan olan moleküler belirteçler tanıtılmakta ve çok yaygın olarak görünen moleküler belirteçlerden tekli nükleotid polimorfizmi değerlendirilmektedir. Bu aşamadan sonra, kompleks hastalıklar ve ilişkilendirme çalışmaları beraber incelenmekteve ilişkilendirme başlığı altında aday gen ve genom boyu çalışmaları ayrı ayrı anlatılmaktadır. En sonunda, genom boyu ilişkilendirme çalışmaları kapsamında yapılan popülasyon temelli ve aile temelli çalışmalara ayrı başlıklar altında yer verilerek izahı yapılmaktadır. Bölüm 3 de, öncelikle kalıtımda dengesiz aktarım testinin uygulanabilmesi ile ilgili genel bilgiler verilmektedir. Daha sonra bir makaleden alınmış gerçek bir örnek üzerinde uygulanması anlatılmaktadır. Ardından, yapılan simülasyon çalışması ve algoritması kısaca anlatılmaktadır. Son olarak, simülasyon çalışması ile üretilen, 30 ile 2

200 arasında değişen, anne-baba-çocuk üçlü genotip verisi üzerinde kalıtımda dengesiz aktarım testi uygulanmakta ve elde edilen sonuçlar yorumlanmaktadır. Bir sonraki bölümde, ilk önce bu tez çalışması ile aile temelli ilişkilendirme çalışmalarına uygulanan ardışık olasılık oran testi tanıtılmaktadır. Daha sonra ardışık olasılık oran testi için örneklem boyutu karşılaştırması yapılmakta ve önerilen testin istatistiksel gücü simülasyon çalışması ile ölçülmektedir. Bölümün bitiminde, kalıtımda dengesiz aktarım testi ile ardışık olasılık oran testinperformansı,simülasyon çalışması ile üretilen veri üzerinde uygulayıpduyarlılık, belirlilik ve doğruluk değerlerinhesaplanması ile değerlendirilmekte ve karşılaştırılmaktadır. Bölüm 5 de, öncelikle anne-baba-çocuk üçlüsü ve anne-çocuk/baba-çocuk ikilisi genotip verisini beraber analiz edebilen permütasyon temelli birleşik kalıtımda dengesiz aktarım testi hakkında temel bilgiler verilmektedir. Ardından, yeni bir simülasyon çalışması ile elde edilen veriler üzerinde bu metodun uygulanmakta vefarklı örneklem boyutları için I. Tip hata ile istatistiksel güç tespiti yapılmaktadır. Sonuç bölümünde, bu tez kapsamında çalışılan analiz metotları kısaca bir daha anlatılmaktadır.elde edilen sonuçların karşılaştırılması yapılarak bu teze özgün olarak önerilmiş ardışık olasılık oran testin, küçük örneklem boyutlu veriler için güvenli bir şekilde kullanılabileceği belirtilmektedir. Permütasyon temelli birleşik kalıtımda dengesiz aktarım testi için yapılan istatistiksel güç analizine vurgu yapılarak, hem annebaba-çocuk üçlü hem de anne-çocuk/baba-çocuk ikili verilerine sahip olunduğunda bu metodun kullanımı önerilmektedir. Özgünlük iddiaları (claims of originality) Aile temelli ilişkilendirme çalışmaları esnasında elde edilen verilerin analizi için kullanılan geleneksel metotlarda karşılaşılan en büyük sorunlardan biri olan, yeterli sayıda veriye ulaşılamadığı için güçlü bir analiz yapamama, bu tez çalışması kapsamında önerilen ardışık olasılık oran testiile aşılmıştır. Bu 3

çalışma bir yayın haline getirilerek European Journal of Human Genetics dergisinde (DOI:10.1038/ejhg.2011.51, 2011) elektronik olarak yayınlanmıştır. Aile temelli ilişkilendirme çalışmalarında, anne-baba-çocuk üçlüsünden oluşan ailelerin yanında, anne veya babadan sadece bir tanesinin olduğu, anne-çocuk ikilisi ve baba-çocuk ikilisinden oluşan ailelerin de gözlenmesi mümkündür. Bu çalışmaya özgün olarak, anne-baba-çocuk üçlüsündenve anne-çocuk/babaçocuk ikililerinden gelen bilgiyi ortak olarak değerlendirmek için önerilen permütasyon temelli birleşik kalıtımda dengesiz aktarım testi içinsimülasyon çalışması ile I. Tip hata ile istatistiksel güç tespiti yapılmıştır. Bu çalışma sayesinde, aile temelli ilişkilendirme çalışmaları yürüten araştırmacılar, birleşik kalıtımda dengesiz aktarım testi kullandıklarında hem elde ettikleri sonuçların istatistiksel gücü hem de istedikleri istatistiksel güce ulaşmak için gerekli örneklem boyutu hakkında fikir sahibi olmuş olacaklar. 4

2. İLİŞKİLENDİRME ÇALIŞMALARINDA KURAMSAL TEMELLER 2.1 Gen Haritalama ve Genlerin Lokalizasyon Tespiti Genetik haritalama, genlerin kromozomlar üzerinde bulunduğu yerlerin (lokus) gösterilmesidir. Böylece insan genomunun anatomisi ortaya çıkarılır. Genetik haritalama, kısaca genomun matematiksel analizi olarak bilinir ve genlerin kromozomlar üzerindeki lokalizasyonlarının bulunmasında moleküler biyolojik yöntemler ve bir dizi karmaşık istatistiksel analizler kullanır. Özellikle genetik nedenli hastalıkların lokalizasyonlarının saptanması alanında son derece verimli bir metot olarak karşımıza çıkmaktadır. Metot en genel anlamı ile lokalizasyonu aranan gen ile lokalizasyonu bilinen bir genetik belirleyicinin ( marker ) kuşaklar arasında birlikte kalıtılmasının test edilmesi esasına dayanır(akarsu ve Lüleci 2009). Genetik haritalama özellikle kalıtımsal hastalıklara yol açan genlerin kromozomlar üzerindeki lokalizasyonlarının saptanmasında yaygın olarak kullanılmaktadır. Genetik haritalamada nirengi noktası olarak kullanılan genetik belirteçler, her bireyin genomunda bulunan DNA dizisi üzerinde tanımlanabilen genetik varyasyonlardır. Bu belirteçler genomda belli aralık ve sıklıklarla bulunması bunların genomun topoğrafyasının belirlenmesinde etkin bir şekilde kullanılmalarını sağlamıştır. Genetik belirteçler bu özellikleri ile hastalık genlerinin tespitinde kullanılabilen genomik varyasyonlardır. Mayoz bölünme sırasında, kromozomlar biri anneden diğeri babadan gelen homolog kromozomların birbirileriyle karşılıklı parça değişimine uğrarlar. Bu esnada, birbirine yakın genler çoğunlukla bir arada giderken, birbirinden uzak olan genler ise bağımsız düzenlenme kuralına göre, bir arada gidebilecekleri gibi çoğunlukla ayrılırlar. Bu mekanizma ile gerçekleşen parça değiş-tokuşu, rekombinant denilen yeni alel (kromozom çifti üzerine iki genin karşılıklı yerleşmesidir) kombinasyonlarının oluşmasına neden olarak, genetik çeşitliliğe katkıda bulunur (Klug 2000). Şekil 2.1 de bu mekanizma gösterilmektedir. 5

Şekil 2.1 Mayoz bölünme sırasında homolog kromozomların birbirileriyle karşılıklı parça değişimi Yukarıdaki bilgiler ışığında, aranılan (hastalıkla ilişkili olabileceğini düşünülen) gen lokalizasyonunu bilinen moleküler belirtece çok yakınsabirlikte kalıtlanacaklarından, aranılan genin yeri de bulunmuş olacaktır hipotezi ile araştırmacılar hastalıklarla ilgili hedef genleri bulabilmektedirler. 2.2 Bağlantı ve İlişkilendirme Analizleri Hastalıklarda yatkınlık gen lokalizasyonunun tespiti için farklı fakat ilgili iki ana analiz yöntemi kullanılmaktadır. Bunlar bağlantı (linkage) ve ilişkilendirme (association) analizleridir. Bağlantı analizi, genomda belirli bir bölgenin kalıtımı ile hastalığa yatkın ailelerde hastalığın kalıtımı arasında istatistiksel ilişki tanımlar. Bağlantı analizleri, mendel kalıtımı gösteren hastalıklara neden olan genleri rahatlıkla saptayabilirken, etkisi zayıf olan ve birçok genin etkisi ile gelişen kompleks hastalıklarda gen(ler) saptamasında 6

yetersiz kalmaktadır. Astım, kanser, diyabet ve kalp hastalıkları gibi kompleks hastalıklarda, ancak kısıtlı bir başarı ile bağlantı analizi gen tanımlama yapabilmektedir. Dolayısıyla, kalıtım modeli bilinmeyen genetik etkenlerin işe karıştığı kompleks hastalıkların incelenmesi ve araştırılmasında, ilişkilendirme çalışmaları devreye girmektedir. İlişkilendirme çalışmaları; kalıtım modeli bilinmeyen, genetik etkenlerin işe karıştığı kompleks hastalıkların incelenmesinde ve bu hastalıklarla ilişkili olabilecek yeni aday genlerin lokalize edilmesinde kullanılmaktadır. Bu çerçevede ilişkilendirme çalışmalarında, genetik varyasyonun hastalıklı bireydeki frekansı ile kontrol bireydeki frekansı karşılaştırılmaktadır (Pharoah vd. 2004). 2.3 Moleküler Belirteçler Moleküler belirteçler genomda lokalizasyonu bilinen, mutasyon veya polimorfizm kapsamında meydana gelen varyasyonlardır. Sıklıkla kullanılan moleküler belirteçler arasında mikrosatellitler, restriksiyon parça uzunluk polimorfizmleri (Restriction Fragment Length Polymorphism, RFLP), değişken sayıda ardı ardına tekrarlayan DNA dizileri (Variable Number of Tandem Repeat, VNTR), kısa tekrarlayan DNA dizileri (Short Tandem Repeat, STR), tek nükleotid polimorfizmi (Single-Nucleotide Polymorphism, SNP) ve kopya sayısı varyasyonları (Copy Number Variation, CNV) sayılabilir. Moleküler belirteçler, organizmaların genetik haritalarının oluşturulmasında ve hastalığın genetik nedenleri arasındaki ilişkiyi açıklamada kullanılmaktadır. Ayrıca, moleküler belirteçler bir ailenin nesiller boyunca kalıtılan özelliklerini izleme olanağı vermektedir. Kromozom üzerinde birbirine yakın olan DNA dizileri beraber kalıtılırlar. Bundan dolayı, moleküler belirteçler ilişkilendirme çalışmalarında, hastalıkla daha önce 7

ilişkilendirilmemiş bir geni lokalizeetme potansiyeline sahiptir. Araştırmacılar kompleks hastalıklarda hedef genleri bulmak için, genellikle ilgili genlere yakın olan ve birlikte kalıtılan genetik belirteçleri takip etmektedirler. Keza, tek genin sorumlu olduğu kalıtsal hastalıklarda, bağlantı analizi ile tespiti çalışılan sorumlu genin lokalizasyonunda yine moleküler belirteçlerden faydalanılmaktadır (Brown vd. 2006). Genom haritasının çıkarılması, genlerin hastalıklarla ilişkilendirilmesi ve lokalizasyonlarının belirlenmesi gibi amaçlarla, yukarıda bahsi geçen (mikrosatellitler, RFLP, VNTR, STR) DNA temelli moleküler belirteçler, uzun yıllardır kullanılmaktadır. Ancak bu belirteçlerin gerek çözünürlüklerinin sınırlı olması ve gerekse yüksek işlem hacimli analizlere uygun olmamaları yeni nesil moleküler belirteçlerin keşfini zaruri kılmakta idi. Bu bağlamda genomda çok yaygın olarak(her birkaç yüz baz çiftinde bir) bulunan, dolayısı ile çözünürlükleri oldukça yüksek olan SNP lerin kullanımı gündeme geldi. Bu belirteçler, moleküler belirteçler içerisinde çok yaygın kullanım alanı bularak değerli bir hal aldı. 2.4 Tek Nükleotid Polimorfizmi DNA dizisi üzerinde bireysel varyasyonlar görülmektedir. DNA dizisini oluşturan adenin (A), guanin (G), sitozin (S) ve timin (T) baz çiftinden birinin diğer baz çifti ile değişmesi tek nükleotid polimorfizmi (SNP) olarak adlandırılır. Şekil 2.2 de, 1. durumdaki baz çiftinden birinin (C-G), 2. durumda başka bir baz çifti (A-T) ile nasıl değiştiği gösteriliyor. 8

Şekil 2.2 DNA dizisi üzerinde bireysel varyasyon olan SNP DNA, insanlarda %99.9 oranında aynıdır. Sadece, 3 milyon civarında baz çifti farklılık göstermektedir ve farklılık gösteren bu baz çiftlerinden yaklaşık %90 ı tek nükleotid polimorfizmi diye adlandırılan moleküler belirteçlerdir. DNA da gözlemlenen bu dizi varyasyonu, biz, insanlar arasında fiziksel, hastalıklara yatkınlık vs. gibi farklılıkları ortaya çıkarmaktadır. SNP ler insan genomunda en sık bulunan genetik varyasyonlardır. Bir genetik varyasyonun polimorfizm (çok biçimlilik) olarak tanımlanabilmesi için bir popülasyondaki sıklığının en az %1 olması gerekmektedir. İnsan genomunda genler tüm DNA dizisinin çok az bir kısmını kapsamaktadır ve genler arasındaki DNA dizisinin %90 dan fazlası belirli bir ürün kodlamamaktadır. İnsan genomunda SNP ler yaklaşık her 300~1000 baz çiftinde bir bulunurlar. Birçok SNP protein yapı ve fonksiyonunda değişikliğe neden olmaz (Miller ve Kwok 2001). Eğer SNP ler aminoasitlerde değişikliğe neden oluyorlarsa yanlış anlamlı (missense) SNP olarak adlandırılırlar. Şekil 2.3 te bir kromozom üzerinde genlerin ve SNP lerin nasıl yer alabileceği gösterilmektedir. 9

Şekil 2.3 Kromozom üzerinde genlerin ve SNP lerin yerleşimi İlerleteci(promoter)bölgedeki SNP ler, protein yapısına etkileri olmamakla birlikte transkripsiyon faktörlerinin bağlanmasını etkileyerek protein ifadelemesini (expression) değiştirebilmektedirler. Fakat çoğu SNP hem kodlamayan dizide bulunmaları hem de aynı aminoasidi kodlayan varyantlar oluşturdukları için fenotip (genetik karakterlerden ve kısmen de dış ortama bağlı olarak canlılarda ortaya çıkan özelliklerin tümü) üzerinde herhangi bir etkileri yoktur. Aday gen analizinde SNP ler seçilirken bu farklılıkların anlaşılması önemlidir. Genel olarak, ilerleteci bölgedeki SNP ler ve yanlış anlamlı SNP ler kodlamayan bölgedekilere göre muhtemelen daha önemlidir (Yende vd. 2006). SNP ler, genomda sık ve kararlı bir şekilde dağılım gösterebilmeleri nedeni ile tercih edilen moleküler belirteç olmuşlardır. Yüksek işlem hacimli genotipleme yöntemlerinin gelişmesi ile aynı anda bir bireye ait milyonun üzerinde SNP genotipi sağlanabiliyor. Bu manada, ilgili bireyin genom haritasının oluşturulması ortaya koyulabilir bir hale gelmiştir. Böylece, SNP mikrodizinleri gibi yongalar geliştirilerek, hem bağlantı hem de ilişkilendirme analizlerinde, kendilerine yaygın kullanım alanı bulabilmektedirler. (Gupta vd. 2008). 10

2.5 Kompleks Hastalıklar Birçok kalıtsal ve çevresel faktörlerin etkisi ile oluşan hastalıklara kompleks hastalıklar adı verilmektedir (Schork 1997). Yaklaşık son 30 yıl içinde, mendel kuralına göre kalıtılan hastalıklardaki moleküler genetiğinin anlaşılması istikametinde büyük mesafeler kat edilmiştir. Mendel kurallarına göre, tek bir gen incelenmekte ve ilgili gende izlenen mutasyonlar hastalık üzerinde geniş etkiye sahip olmaktadır. Günümüzde ise, birçok genin beraber hareketle oluşturdukları etki ile poligenik kalıtım gösteren kompleks insan hastalıklarında moleküler genetiğinin çözümlenmesi için yoğun çalışmalar sürdürülmektedir. Bu çalışmaya genomik teknolojideki gelişmeler katkıda bulunmaktadır (Pharoah vd. 2004). Düşük etkinli (penetranslı) aleller, kompleks hastalıklara olan yatkınlığı artırmaktadırlar. Bu gibi aleller ailelerde seyrek olarak çoklu vaka oluşturacağından, bu alellerin genetik bağlantı analizleri ile tanımlanması zor hatta imkansızdır. Bu nedenle, hasta ve kontrol gruplarında spesifik alel frekanslarının kıyaslanması ile yapılan ilişkilendirme çalışmaları, düşük penetranslı (etkinli) alellerin aranması ve belirlenmesi için çözüm olmaktadır (Webb ve Houlston 2007, McCarthy vd. 2008). 2.6 İlişkilendirme Çalışmaları İnsan genom sekans taslağının 2001 yılında çıkarılması ve 2003 yılında tam olarak netleştirilmesinden sonra, hastalıkların genetik öğelerini inceleyen araştırmalarda patlama olmuştur. Sosyo-demografik ve klinik risk faktörleri, belirli bir bireyin neden hastalık geliştirdiği, ya da öldüğünü tam olarak açıklayamamaktadır. Bu nedenle, bilim adamları genetik varyasyonların hastalıklara yatkınlığa neden olup olmadığını ve hastalıkların sonucunu etkileyip etkilemediğini anlamaya çalışmaktadırlar (Yende vd. 2006, Manolio vd. 2008). 11

İlişkilendirme çalışmaları, kalıtım modeli bilinmeyen, genetik etkenlerin işe karıştığı astım, kanser, diabet, kalp hastalıkları gibi kompleks ve yaygın hastalıkların araştırılması ve bu gibi hastalıklarda rol oynayan genlerin tanımlanması için kullanılmaktadır. İlişkilendirme çalışmaları ile vakalar (belirli bir hastalığı olan kişiler veya belli bir özelliğe sahip bireyler) ve kontroller arasındaki alel frekans farkına bakılmaktadır. Aleller incelenerek, belirteç, lokustaki (bir genin kromozom üzerindeki yeri) belirli bir alelin, hastalığa yüksek risk oluşturan yatkınlık aleli ile nasıl birlikte kalıtlandığı hakkında bilgi vermektedir (Kruglyak 2008). Kompleks hastalıkları etkileyen genleri ortaya çıkarmak ve tanımlamak için iki temel ilişkilendirme çalışma yaklaşımı vardır. Bunlar, aday gen ilişkilendirme çalışmaları ve genom boyu ilişkilendirme çalışmalarıdır (Schork 1997). Bu çalışmalar sırası ile aşağıda anlatılmaktadır. 2.6.3 Aday gen ilişkilendirme çalışmaları Aday gen analizi, belirli bir moleküler belirteç ile bir hastalık arasındaki ilişkilendirmeyi test etmeyi amaçlayan bir yaklaşımdır (Schork 1997). Bu çalışmada, hastalığın biyolojisi ile ilgili varsayımlar ile araştırılacak hastalığa ait eldeki tüm veriler göz önünde bulundurarak, ilgili aday genlerle çalışılmaktadır. Dolayısıyla, bu yaklaşım ile yeni genlerin izolasyonu gerekmemektedir, ancak aday genlerin fonksiyonları ile ilişkili bilgilerin elde edilebilmesi için bu genlerin genomdaki lokalizasyonuna gerek duyulmaktadır. Genomda, belirlenen aday genlerin bulunduğu bölgelere sıkı bağlantı gösteren genetik belirteçler öncelikli olarak test edilmektedir. Test edilen bu genetik varyasyonlar, hastalıklı kişilerde hastalıklı olmayanlara göre daha sık görülüyorsa, o varyasyon ve hastalık arasında bir ilişki olabileceği çıkarımı yapılabilmektedir (Schork 1997). Aday gen ilişkilendirme çalışmalarında, biyolojik yolak ile ilgili en olası bir veya daha fazla gendeki genetik varyasyonun rolü araştırılmaktadır. Dolayısıyla, daha önceden yatkınlık lokusu ile ilgili bir bilgiye sahip olmadan bu çalışmanın yürütülmesi mümkün olmamaktadır. 12

2.6.4 Genom boyu ilişkilendirme çalışmaları Genom boyu ilişkilendirme çalışmaları (genom wide association study, GWAS), güncel bir strateji olarak, hastalığa yatkınlığın genetik temelini ortaya çıkarmak için kullanılmaktadır (Moore vd. 2010). Genom boyu ilişkilendirme çalışmalarında araştırıcı yatkınlık lokusu ile ilgili önceden bir bilgiye sahip değildir, ilgilenilen hastalıkla ilişki gösteren kromozomal bölgeyi tanımlamak için çalışmaktadır (Yende vd. 2006). Bu çalışmada, genomda en yaygın olarak bulunan, genomik varyantlar olan SNP ler kullanılmaktadır. SNP ler binlerce kuşak önce oluşan ve doğal seleksiyon veya şansla yayılan mutasyonlardır. Daha önce mevcut olan SNP e çok yakın ikinci bir SNP oluştuğunda (aralarında onbinlerce baz çiftinden de fazla mesafe olabilmektedir) bu iki varyant alel, çoğunlukla bir sonraki kuşaktaki aynı oğula aktarılmaktadır. İki alelin tesadüfi olmayan bu birlikteliği, bağlantı dengesizliği (linkage disequilibirum, LD) olarak tanımlanmaktadır (Cichon vd. 2009). Eğer bir SNP yaygın olan bir hastalığın riskini artırıyorsa, hastalık ile bu SNP (direk ilişkili) ve birkaç yakın SNP (LD den kaynaklanan dolaylı ilişkili) arasında istatistiksel olarak anlamlı bir ilişki, ilişkilendirme var olduğu düşünülmektedir (Cichon vd. 2009). Farklı lokuslardaki polimorfizmler arasındaki tesadüfi olmayan ilişkilendirme, LD derecesine göre ölçülmektedir. LD derecesi, sayısal olarak, gözlenen ve beklenen alel frekansı arasındaki farktır. LD nin derecesi genetik bağlantı, seleksiyon, rekombinasyon ve mutasyon oranı, genetik kayma, tesadüfi olmayan çiftleşme ve popülasyon yapısı gibi birçok faktörden etkilenmektedir. Hastalık fenotipi (kalıtsal karakterlerden ve kısmen de dış ortama bağlı olarak ortaya çıkan özelliklerin tümü) ile hastalığa yatkınlık lokusu arasındaki ilişkinin test edilmesini amaçlayan genom boyu ilişkilendirme çalışmalarında, hastalık fenotipi ile ilişkilendirme gösteren moleküler belirteç amaca ulaşmada ipucu olarak kullanılmaktadır. Bu sayede, hastalık fenotipi ile ilişkilendirme gösteren moleküler belirteç ile yüksek LD gösteren lokus, hastalığa yatkınlık lokusu olarak tanımlanabilmektedir. Genom boyu ilişkilendirme çalışmalarında, genler değil lokuslar tanımlanmakta ve insan hastalıklarının yaygın varyasyon-yaygın hastalık hipotezine uyan lokuslarınınbulunması 13

üzere tasarı yapılmaktadır (Hardy 2009). Yaygın varyasyon-yaygın hastalık hipotezi, birçok yaygın hastalığın yaygın alellerden kaynaklandığını belirtmektedir (Hardy 2009, Moore vd. 2010). Genom varyasyonları ile ilgili bilgiler ışığında ve yeni biyomühendislik yöntemlerinin birlikte kullanımı ile bir milyondan fazla SNP i analiz edebilen yongalar tasarlanmıştır. Bu yongaların kullanımı arttıkça maliyeti düşmüş ve böylece çalışmaların sayısı da gittikçe yükselmiştir. 2008 yılında yayınlanan iki yayına göre, genom boyu ilişkilendirme çalışmaları ile 70 hastalık için yüzlerce yatkınlık lokusu rapor edilmiştir (Moore vd. 2010). Tipik bir genom boyu ilişkilendirme çalışması, 4 aşamadan oluşmaktadır. Bunlar sırası ile vaka/kontrol grubunun seçilmesi, DNA izolasyonu ve genotiplendirme, hastalık ile eşik değerini geçen SNP ler arasındaki ilişkinin istatistiksel olarak değerlendirilmesi ve son olarak, verileri güçlendirmek ve doğrulamak için tanımlanan ilişkinin bağımsız popülasyon örneklerinde tekrarlanması veya işlevsel anlamın deneysel olarak incelenmesidir. Günümüzde çok yaygın olarak kullanılan genom boyu ilişkilendirme çalışmalarının avantajları ve dezavantajları da bulunmaktadır. Avantajları arasında bir başlangıç hipotezine ihtiyaç duymaması, işlenebilen dijital bilgi kullanması, hem sekans hem de kopya sayısı varyasyonları hakkında bilgi sağlaması sayılabilmektedir. Ayrıca genom boyu ilişkilendirme çalışmaları, çoklu etkileşim gösteren hastalık genlerini ve bu genlerin ayrı ayrı yolaklarını tanımlayabilerek, hastalığın etiyolojisinin (hastalık nedenlerini araştırma bilimi) kapsamlı olarak anlaşılmasını sağlamaktadır. Genom boyu ilişkilendirme çalışmalarında, çok sayıda örneğe gereksinim duyulması bir dezavantaj olarak çalışmalara önemli bir kısıtlama getirmektedir; bir diğer kısıtlayıcı özelliği ise popülasyonda sadece yaygın olan, yani %5 ten daha fazla görülen alelleri 14

belirleyebilmesidir. Bu nedenle genom boyu ilişkilendirme çalışmalarının, hastalık ile ilişkili bütün genetik değişkenlikler hakkında bilgi sağladığı düşünülmesi önemli bir hata olacaktır (Hardy 2009). Bu çalışma ile elde edilecek verilerin doğrulanması için, yine çok sayıda örnek ile tekrarlanması gerekliliği de genom boyu ilişkilendirme çalışmalarında önemli bir dezavantaj olarak karşımıza çıkmaktadır (Hardy 2009). Birçok araştırmada vazgeçilmez bir araç olarak kullanılan genom boyu ilişkilendirme çalışmaları, popülasyon temelli ve aile temelli olarak iki farklı şekilde ele alınmaktadır. 2.7 Popülasyon Temelli Genom Boyu İlişkilendirme Çalışmaları Popülasyon temelli genom boyu ilişkilendirme çalışmalarının tasarımında vaka ve kontrol grupları ile çalışılmaktadır. Vaka ve kontrol gruplarını oluşturan bireyler bağımsız seçilen bireyler olduklarındanpopülasyon katmanlaşması (stratification) ortaya çıkmaktadır (Cardon ve Palmer 2003). Popülasyondaki katmanlaşma gerçekte olmayan ilişkilerin varmış gibi görünmesine neden olabilmektedir. Popülasyon katmanlaşması, popülasyondaki alt popülasyonlar arasında alel frekansında sistematik bir farkın olması durumudur. Bu fark alt popülasyonların farklı soydan gelmeleri gibi nedenlerden kaynaklanabilmektedir. Popülasyon katmanlaşması, karışma, test istatistiğinde aşırı dağılmaya yol açan ilintisizlik (relatedness) ve seçmede önyargı (bias) gibi üç önemli probleme yol açmaktadır (Duncan 2005). Yukarıda bahsedildiği gibi, popülasyon katmanlaşması popülasyon temelli ilişkilendirme çalışmalarında önemli bir sorun olarak ortaya çıkmaktadır. Bu nedenle, son yıllarda yapılan araştırma ve incelemeler sonucundapopülasyon temelli ilişkilendirme çalışmalarındaistatistiksel olarak güvenilir sonuç elde edebilmenin tek yolu, binlerce vaka-kontrol üzerinde çalışmak olduğuna karar birliği ile varılmıştır (Duncan 2005, Bowcock 2007). Fakat binlerce hatta onbirlercevaka-kontrol örneğine gereksinim duyulması, popülasyon temelli ilişkilendirme çalışmasını, oldukça zor ve maliyetli bir çalışma olduğunu açıkça ortaya koymaktadır. 15

Araştırmacılar, lojistik şart ve imkanlarına göre çalıştıkları hastalıkların ve/veya kendi çalışma gruplarının özelliğine göre popülasyon temelli ve/veya aile temelli ilişkilendirme çalışması yaklaşımını tercih etmektedirler. Bir sonraki alt başlıkta anlatılacağı üzere, aile temelli yaklaşımda popülasyon temelli yaklaşımdan farklı olarak katmanlaşma sorunu büyük ölçüde aşıldığı için önemli bir avantaj olarak daha az sayıda örnek ile çalışmalarsürdürülebilmektedir. 2.8 Aile Temelli Genom Boyu İlişkilendirme Çalışmaları Aile temelli genom boyu ilişkilendirme çalışmalarında, etkilenmiş birey yani hasta (çocuk) ile onun sağlıklı anne ve babası ile çalışılmaktadır. Şekil 2.4 de bu yapı veriliyor. Burada etkilenen çocuk, sağlıklı olan anne ve babadır. Şekil 2.4 Aile temelli ilişkilendirme çalışmalarında kullanılan anne-baba-çocuk üçlüsü Popülasyon temelli ilişkilendirme çalışmalarının önündeki en büyük engel olan popülasyon katmanlaşması, aile bazlı tasarımla büyük ölçüde aşılmaktadır. Buyaklaşım ile genetik çalışmalarda kısıtlayıcı bir sorun olarak araştırmacıların karşısına çıkan örnek sayı problemi bir nebze çözüme kavuşmaktadır. Genetik analizler için binler rakamları ile değerlendirilen ihtiyaç, bir manada bu yaklaşım ile yüzlere indirgenebilmiştir (Yang vd. 2003). Bu nedenle son yıllarda aile temelli ilişkilendirme çalışmalarına olan ilgi artmıştır. 16

Yalnız kanser gibi birçok kompleks hastalıklar, insanlarda ileri yaşlarda ortaya çıktığı için, üçlü tasarımda kullanılan hasta çocuk ve sağlıklı anne-baba üçgeninde anne ve baba verisine ulaşmada çok ciddi sıkıntılar yaşanabilmektedir. Çünkü ileri yaşta hasta çocuğun anne veya babası veya her ikisi çoktan vefat etmiş oluyor. Veri toplama aynı zamanda hem vakit hem de nakit bakımından çalışma gruplarını zorlayan birer unsur olarak ortaya çıkmaktadır. Aile temelli ilişkilendirme çalışmalarında, geleneksel metotlar ile istatistiksel güçlü analiz yapabilmek için, en az 200 üçlüye yani anne-baba-çocuk olarak toplam 600 ve üzeri örneğe ihtiyaç duyulmaktadır (Yang vd. 2003). Bu örnek sayısına ulaşmak bazen araştırmacının yıllarını almakta, bazen de hiç mümkün olamamaktadır. Yukarıda verilen genel bilgilendirme sonrası, özetle şunlar söylenebilir: Son yıllarda yapılan araştırma ve incelemeler sonucunda vaka-kontrol tasarımında güvenilir sonuç alabilmenin tek yolunun binlerce vaka üzerinde çalışmak olduğu hususunda karar birliğine varılmıştır. Fakat bu durum çoğu zaman araştırmacıları zor bir durumda bırakmaktadır. Zira günümüz şartlarında genom boyu analizlerin örnek başına 800-1000 Amerikan Dolarını bulan maliyetleri olduğu düşünüldüğünde bu çaptaki araştırmaların niçin yalnızca Amerika ve İngiltere menşeli olduğunu anlamak güç olmayacaktır. Vaka-kontrol tasarımının önündeki bir diğer önemli kısıtlama bu denli geniş bir örnek grubunu toplayabilmekte ortaya çıkan ciddi lojistik zorluklardır. Bu kadar çok sayıda hasta ve kontrol örneğini toplayabilmek çok merkezli koordine bir çalışmayı gerektirmektedir. Vaka-kontrol tasarımlarının bu iki temel kısıtlaması nedeni ile başvurulan bir diğer yaklaşım aile temelli ilişkilendirme analizleridir. Aile temelli tasarımlarda vakalar sağlıklı anne ve babaları ile karşılıklı olarak incelenir. Bu tasarımda karşılaştırma sağlıklı anne babalarla bir diğer ifade ile benzer gen havuzu ile yapılacağı için popülasyon katmanlaşması problemi aşılabilmekte ve 200 hasta 200 sağlıklı anne ve baba ile (toplam 600 birey, 200 tane anne, baba, çocuktan oluşan üçlü/trio) karşılaştırıldığında hastalıkla güvenle ilişkilendirme yapılacak genler tespit edilebilmektedir. Aile temelli ilişkilendirme analizleri vaka-kontrol tasarımlarının önündeki en önemli iki kısıtlamayı kaldırabilmekle beraber özellikle erişkin dönemde 17

ortaya çıkan hastalıklarda halen hayatta olan anne ve babalara ulaşmada ve sonuçta güvenilir sonuç verebilecek 200 üçlüyü tamamlamada sıkıntı yaşanan analizlerdir. Bu tez çalışmasında, çok faktör ve çok gen etkisi altında (obezite, kanser, astım vb.) kompleks hastalıkların oluşumunda rol alan genlerin tespiti için uygulanan aile temelli ilişkilendirme analiz metotlarının önündeki en büyük engel olan örneklem büyüklüğü sınırlaması, önerilen istatistiksel sinyal işleme algoritmaları ile aşılmıştır. 18

3. KALITIMDA DENGESİZ AKTARIM TESTİ (KDAT) 3.1 İlişkilendirme Çalışmalarında Kullanılan Geleneksel Yöntem KDAT Üzerine Temel Bilgiler Kalıtımda dengesiz aktarım testispielman, McGinnis ve Ewens (1993) tarafından aile temelli ilişkilendirme çalışmalarında marker ve hastalık lokusları arasında bir genetik bağlantı olduğunda uygulanmak üzere önerilmiştir. Bu öneri McNemar testin özel bir uygulamasıdır. Bu test, toplumdaki genetik yapılanmadan etkilenmemektedir ve ilgilenilen alel açısından, heterozigot ebeveynleri ve hasta çocukları incelemektedir. Özet olarak şöyle denebilir, ilişkiyi değerlendirmek ve eş zamanlı olarak hastalık ve gösterge alelinin kuşaklar arası birlikteliğini değerlendiren bağlantı hakkında da bilgi edinebilmek için, kalıtımda dengesiz aktarım testi (KDAT) kullanıma girmiştir (Ewens ve Spielman1995). KDAT analizinin yapılabilmesi için hasta çocuğa aktarılan ve aktarılmayan alellerin karşılaştırıldığı bir çizelge oluşturulmasına ihtiyaç duyulmaktadır (Dracopoli 1994). Her iki ebeveynden de kalıtılan ve kalıtılmayan alleller, aynı tablo içinde belirtmemiz gerektiği için, dört gözlü kalıtımda dengesiz aktarım testi çizelgesi oluşturulmaktadır (Çizelge 3.1). Bu dört gözlü kalıtımda dengesiz aktarım testi çizelgesi, anne ve babada belirli bir genotip görüldüğü durumlarda çocukların genotiplerine aktarılan ve aktarılmayan aleller değerlendirilerek doldurulmaktadır. İki alelli (A ve B) bir marker lokusum ele alınmakta ve etkilenmiş çocuk ile anne ve babasının genotipleri elde edilmektedir. Genel manada, veri analizi alel aktarılma sayısıdır; yani, ebeveynlerin her bir genotipi için (AA, AB ve BB), A alelinin veya B alelinin etkilenmiş çocuğa aktarılma sayısını vermektedir (Spielman vd. 1993). 19

Çizelge 3.1 KDAT dört gözlü tablosu Çocuğa Aktarılmayan Aleller Alel A Alel B Çocuğa Aktarılan Aleller Alel A a b Alel B c d Çizelge 3.1 de : a = homozigot anne ve babalardan taşıyıcı çocuğa A alelini aktarıp, fakat yine A alelini aktaramayan toplam anne ve baba sayısını göstermektedir. b = heterozigot anne ve babalardan taşıyıcı çocuğa A alelini aktarıp, fakat B alelini aktaramayan toplam anne ve baba sayısını göstermektedir. c = heterozigot anne ve babalardan taşıyıcı çocuğa A alelini aktaramayıp, fakat B alelini aktaran toplam anne ve baba sayısını göstermektedir. d = homozigot anne ve babalardan taşıyıcı çocuğa B alelini aktaramayıp, fakat yine B alelini aktaran toplam anne ve baba sayısını göstermektedir. Kalıtımda dengesiz aktarım testi aşağıdaki test istatistiğini kullanmaktadır. 2 ( b c) 2 KDAT = ~ χ (1) b+ c (3.1) 20

Kalıtımda dengesiz aktarım testi, istatistiğinde iki alel içeren sistem kullanıldığı içinχ dağılımı özelliği göstermektedir. İki alellik sistemde oluşturulan çizelge iki gözlü bir çizelge olduğundan serbestlik derecesi de 1 olarak seçilmektedir. 3.2 Kalıtımda Dengesiz Aktarım Testin Bir Örnek Üzerinde Uygulaması Burada Current Protochols Human Genetics kitabında KDAT analizlerini açıklamak için var olan bir örnek kullanılmıştır. Bu örneği, Akarsu ve Çakır (2004) makalelerinde 9 durum alt başlıklarında açıklamaktadırlar. Durumların açıklamalarına geçmeden önce iki aşamalı bir ön çalışma yapılmaktadır. İlk olarak, ebeveyn-çocuk karşılaştırılması yapılarak, anne-babada belirli bir genotip görüldüğü zaman çocuk genotipini gösterecekbir çizelge hazırlanmaktadır. Var olan örnek göz önünde bulundurulduğu zaman, çizelge 3.2 ortaya çıkmaktadır. İkinci aşamada, hasta çocuğa aktarılan ve aktarılmayan alellerin karşılaştırıldığı bir tablo oluşturulmaktadır. Bu tablo, Bölüm 3.1 de dört gözlü KDAT tablosu olarak tanıtılmakta ve çizelge 3.1 de verilmektedir. Oluşturulan dört gözlü tablo, aşağıda açıklanacak 9 durum bir bir değerlendirilerek doldurulmaktadır. Çizelge 3.2 KDATanalizinde kullanılacak genotip verileri Anne Baba Hasta çocuklarda gözlenen Ebeveynlerde gözlenen genotip sayıları toplam genotip sayısı A-A A-B B-B 1 AA AA 12 12 0 0 2 AB AA 25 20 5 0 3 AA AB 25 20 5 0 4 AB AB 50 20 20 10 5 AB BB 25 0 15 10 6 BB AB 25 0 15 10 7 BB BB 13 0 0 13 8 AA BB 12 0 12 0 9 BB AA 13 0 13 0 21

Şekil 3.1 de, doldurulmuş dört gözlü KDAT tablosu gösterilmektedir. Bu tablo çizelge3.2 de sunulan genotip verileri kullanılarak doldurulmuştur. Çocuğa aktarılan ve aktarılmayan aleller ışığında doldurulan bu tablo, verilen örnekteki 9 durum göz önünde bulundurularak hazırlanmıştır. Şekil 3.1 Ebeveynlerden hasta çocuğa aktarılan ve aktarılmayan alellerin toplam sayılarını gösteren KDATtablosu Şekil 3.1 de KDAT tablosundaki kutucuklara eklenen toplam sayıların nasıl elde edildiği gelecek dokuz durum ile izah edilecektir. 1 numaralı durum: Anne AA, Baba AA olduğu durumda çocuklarda tek durum ortaya çıkar (AA). Bu durumda annenin kalıtılan aleli A olduğu durumda kalıtılmayan aleli yine A olacağından a kutucuğuna 12 bireyi yazılması gerekir. Baba tarafından bakıldığı zaman durum annenin aynısı olacaktır. Baba tarafından da kalıtılan ve kalıtılmayan alel A olduğu için a kutucuğuna bir kez daha 12 birey işlenir. 2 numaralı durum: Anne AB, Baba AA olduğu durumda çocuklarda teorik olarak dört farklı durum ortaya çıkar AA, AA, BA ve BA durumları. Görüldüğü gibi bu pratikte aslında iki durum halinde görülecektir AA ve BA durumları. Annenin çocuğa aktardığı aleli A iken, aktarmadığı alel B olacaktır. Bu durumu karşılayan toplam 20 birey vardır 22

ve b kutucuğuna 20 birey yazılır. Annenin aktardığı alel B olduğu durumda ise aktarmadığı alel A olacağından bu duruma uygun olan 5 birey c kutucuğuna yazılır. Baba tarafından bakıldığında kalıtılan ve kalıtılmayan aleller arasında fark yoktur ve her ikisi de A aleli olacaktır. Bu nedenle a kutucuğuna toplam 25 birey eklenir. 3 numaralı durum: Anne AA, Baba AB ise çocuklarda yine teorik olarak dört durum oluşur AA, AB, AA ve AB durumları. Pratikte bu yine sadece iki farklı durum olarak karşımıza çıkar. AA durumda 20 birey, AB durumda ise 5 birey gözlenmiştir. Annenin çocuğa aktardığı aleli A iken, çocuğa aktarılmayan alel yine A olacaktır. Bu durumda çocuğun AA ya da AB olması annenin kalıttığı alel açısından herhangi bir fark göstermez. a içine 20+5=25 yazılır. Baba tarafından bakıldığı zaman kalıtılan alelin A ve B olmasına göre iki farklı durum ortaya çıkmaktadır. Çocuk AA durumunda olduğunda babanın çocuğa kalıttığı alel A, kalıtmadığı alel ise B olacaktır. Bu durumda olan toplam 20 birey vardır ve b kutucuğuna 20 yazılır. Çocuğun AB olduğu durumda ise babanın çocuğa verdiği alel B olacak kalıtmadığı, alel ise A olacaktır ve c kutusuna 5 yazılır. 4 numaralı durum: Anne AB, Baba AB durumunda ise çocuklarda toplam dört durum olur. İlk durum AA durumudur. Bu şekilde 20 birey gözlenmiş. İkinci durum AB ve üçüncü durum BA şeklindedir. Jel görünümü açısından bu iki durumu birbirinden ayırmak mümkün değil. O nedenle çocukta AB durumunda gözlenen 20 birey aslında her iki durumu da ifade etmektedir. Dördüncü durum BB durumudur ki bu şekli gösteren toplam 10 birey gözlenmiştir. Annenin kalıtılan aleli A, kalıtılmayan aleli B olduğu durumda toplam 40 birey var iken, baba tarafından bakıldığında yine kalıtılan alel A, kalıtılmayan alel B olan toplam 20 birey olacaktır. Böylece, b kutucuğuna 40+20 birey yazılır. Annenin kalıtılan aleli B kalıtılmayan aleli B olduğu durumda olan 10 birey var iken, baba tarafından da aynı durumda olan yine 30 birey vardır. Böylece c kutucuğuna 10+30 birey yazılır. 5 numaralı durum: Anne AB, Baba BB ise çocuklarda iki durum oluşur. İlk durum AB durumudur ve bu şekilde toplam 15 birey vardır. İkinci durum BB şeklindedir (10 23

birey). Anne nin kalıtılan aleli A ise, kalıtılmayan aleli B olacağından b kutucuğunun içine 15 yazılır. Yine annenin kalıtılan aleli B olduğu zaman kalıtılmayan aleli A olacağından c kutucuğunun içine 10 birey yazılır. Baba tarafından bakılacağı zaman kalıtılan ve kalıtılmayan aleller her zaman B olacağı için d kutucuğunun içine 25 (15+10) yazılması gerekir. 6 numaralı durum: Anne BB, Baba AB ise çocuklarda iki durum oluşacaktır. İlk durum BA durumudur ve bu şekilde toplam 15 birey vardır. İkinci durum BB şeklindedir (10 birey). Annenin kalıtılan aleli daima B, kalıtılmayan aleli de yine B olacağından d kutucuğunun içine 25 yazılır (15+10). Baba tarafından bakıldığı zaman kalıtılan alel A olduğu zaman kalıtılmayan alel B olan 15 birey var ve b kutucuğunun içine 15 yazılır. Babanın kalıtılan alleli B olduğu durumda kalıtılmayan aleli A olacaktır ve c kutucuğunun içine 10 yazılır. 7 numaralı durum: Anne BB, Baba BB ise çocuklarda sadece BB durumu olur. Bu durumda 13 birey var. Annenin kalıtılan aleli B, kalıtılmayan aleli yine B olacağından d kutucuğunun içine 13 yazılır. Babada da aynı durum söz konusu olduğu için yine d kutucuğunun içine 13 yazılır. 8 numaralı durum: Anne AA, Baba BB ise çocuklarda sadece AB durumu olur. Bu durumda 12 adet birey var. Annenin kalıtılan aleli A, kalıtılmayan aleli yine A olacaktır ve a kutucuğunun içine 12 yazılır. Baba tarafından baktığımız zaman kalıtılan alel B, kalıtılmayan alel yine B olacağı için bu kez d kutucuğunun içine 12 yazılması gerekir. 9 numaralı durum: Anne BB, Baba AA ise çocuklarda sadece BA durumu olur. Bu durumda 13 birey var. Annenin kalıtılan aleli B, kalıtılmayan aleli yine B olacağı için d kutucuğunun içine 13 yazılır. Baba tarafından bakıldığı zaman kalıtılan alel A olduğunda kalıtılmayan alel yine A olacaktır ve a kutucuğunun içine 13 yazılır. 24