HapMap The International HapMap Consortium ELİF KARLIK 2602120047 Moleküler Biyoloji ve Genetik Anabilim Dalı
HapMap projesinin hedefi: Sağlık ve hastalıkta insan genomundaki genetik varyasyonları belirleyerek gelecekteki çalışmaları kolaylaştırmak için kaynak sağlamak
HapMap -insanda meydana gelen genetik varyasyonlar kataloğu Hangi varyasyon DNA da nerede? Populasyon içindeki dağılımı nedir? Dünya genelindeki farklı populasyonlardaki dağılımı nedir?
İki farklı birey arasındaki genetik farklılık %0.1 İki farklı bireyin kromozomları karşılaştırıldığında ~1000 bazda bir farklılık Bir kişi A nükleotine Bir diğeri G nükleotidine Bir başkası aynı bölgede fazladan bir nükleotide sahip olabilir veya Başka bir bireyde o bölgede bir DNA parçası kayıp olabilir
Genin alternatif formları veya SNP veya varyantın bir diğer tipi allel Kromozomlardaki allel koleksiyonları da genotip Baz düzeyindeki değişimler genetik varyasyonun en yaygın tipi Single nucleotide polymorphism Tek nükleotit polimorfizmi SNP ( snip )
Tek nükleotit polimorfizmi (SNP) Bu basit değişimler transisyon veya transversiyon tipinde olabilirler. 4 farklı tipten: 1transisyon tipi C T (G A) ya da 3 transerviyon tipi C A (G T) C G (G C) T A (A T)
markır İnsan genomunda tanımlanan ~10 milyon SNP (300 bazda bir) SNP lerin ve diğer varyantların kromozomlarda nasıl organize olduklarının anlaşılması Birbirine yakın genetik varyantlar beraber kalıtılma eğilimindedir. Kromozomun belli bir yerinde genel olarak G yerine A var ise kromozomda A nın etrafındaki diğer bölgelerde de aynı genetik varyantlar olabilir. Tek bir kromozomda bağlantılı bölgelerdeki allel serileri olarak tanımlanır ve beraber kalıtılırlar. haplotip
Haplotiplerin ortaya çıkışı A a Parent 1 Parent 2 B b X A a B b A B A B a b a b OR A b a B A B A B a b A B A B a b a B A B A b A b etc High LD -> No Recombination (r 2 = 1) SNP1 tags SNP2 Low LD -> Recombination Many possibilities
Haplotiplerin ortaya çıkışı
Haplotipler: Mutasyonla; tek nükleotit değişimleri ile İnsersiyon/delesyon ile Yapısal değişiklikler ile ortaya çıkabilirler.
Modern insan Afrika dan çıkarak dünyadaki diğer insan türlerinin yerini aldı.
The International HapMap Project Genetik varyantların keşfi hastalıkların patogenezinde, tanısında ve tedavisinde oldukça önemli Direkt yaklaşım Direkt olmayan yaklaşım HapMap projesinde kullanılan yaklaşım
International HapMap projesi 4 farklı populasyona ait genel haplotipleri tanımlamayı amaçlamaktadır. Bu haplotipleride tanımlayabilmek için genomda benzersiz tag (etiket) SNP leri tanımlamak oldukça önemli
HapMap projesine başlanırken? 1. İnsan genom dizisine ulaşılabilirlik 2. Genel SNP verilerinin eldesinde hangi genotiplendirme deneylerinin kullanılacağı 3. İnsan bağlantı dengesizliğinin kavranması 4. Yüksek doğrulukta ve ucuz yüksek işlem hacimli SNP genotiplendirme teknolojilerinin geliştirilmesi (proje ilk başladığında her bir örnekteki her bir SNP nin maliyeti 0.40 dolar iken 2005 te faz I bittiğinde 0.10 dolar) 5. Web-tabanlı düzenlenmesi stoklama ve veri paylaşılmasının 6. Etik ve kültürel konularda çerçevenin oluşturulması öncelikli konulardı.
HapMap projesinin dizaynında? 1. Projenin organizasyonu 2. Çalışılacak DNA örneklerinin seçimi 3. SNP sayısının 2.6 milyondan 9.2 milyona olacak şekilde arttırılarak halka açılması 4. 10 ENCODE bölgesinin dizilenmesi 5. Genome-wide yapılması haritalama genotiplendirilmesinin 6. Verilerin yüksek kalitede yayımlanması 7. Veri kordinasyonunun sağlanması ve verilerin proje veri kordinasyon merkezi tarafından dağıtılması* ( http://www.hapmap.org ) * Bu projedeki bilgiler hızlı ve kullanıma ilişkin bir kısıtlama olmaksızın paylaşılmaktadır.
DNA örnekleri ve populasyonlar Phase 1 Phase 2 Phase 3 Samples & POP panels 269 samples (4 panels) 270 samples (4 panels) 1,115 samples (11 panels) Genotyping centers HapMap International Consortium Perlegen Broad & Sanger Unique QC+ SNPs 1.1 M 3.8 M (phase I+II) 1.6 M (Affy 6.0 & Illumina 1M) Reference Nature (2005) 437:p1299 Nature (2007) 449:p851 Draft Rel. 1 (May 2008) Örnekler 4 farklı populasyından: -Ibadan, Nijerya Yoruba insanları iki ebeveyn ve bir çocuktan oluşan 3 lü setler (trios) -Japonya, Tokyo bölgesinden akraba olmayan bireylerden -Çin, Beiijing bölgesindeki Han Çinlileri akraba olmayan bireylerden -Centre d Erude du polyprohisme humain (CEPH) merkezi tarafından 1980 yılında örneklendirilmiş Kuzey ve Batı Avrupa kökenli vatandaşlar
Faz III örnekleri label population sample # samples QC+ Draft 1 ASW* African ancestry in Southwest USA 90 71 CEU* Utah residents with Northern and Western Europe an ance stry from the CEPH colle ction 180 162 CHB Han Chinese in Beijing, China 90 82 CHD Chinese in Metropolitan Denver, Colorado 100 70 GIH Gujarati Indians in Houston, Te x as 100 83 JPT Japanese in Tokyo, Japan 91 82 LWK Luhya in Webuye, Kenya 100 83 MEX* Mexican ancestry in Los Angeles, California 90 71 MKK* Ma asai in Kinyawa, Kenya 180 171 TSI Toscans in Italy 100 77 YRI* Yoruba in Ibadan, Nige ria 180 163 1,301 1,115 * Populasyonlar 3 lü aile gruplarından oluşturulmuş HapMap3 siteleri: http://ftp.hapmap.org/genotypes/2008-07_phaseiii/hapmap_format Broad - http://www.broad.mit.edu/~debakker/p3.html Sanger - http://www.sanger.ac.uk/humgen/hapmap3/ Baylor - http://www.hgsc.bcm.tmc.edu/projects/human/
Faz I tamamlandı, Nature yayınında açıklandı * 1,000,000 SNPs 269 HapMap örneğinde başarılı bir şekilde tiplendirildi * ENCODE varyasyon referans kaynağı mümkün Faz II tamamlandı, veriler yayımlandı * >3,500,000 SNPs tiplendirildi
Faz III HapMap 11 panel ve 1,115 örnek 558/557 erkek/kadın 924/191 kurucu/kurucu değil Platformlar: Illumina Human 1M (Sanger) Affymetrix SNP 6.0 (Broad) Alleller NCBI b36 tabanında
March, 2010 105,098,087 The 1000 Genomes Project submitted 17.3M SNPs The 2008 SNP Submissions for the James Watson Genome totaled 3,542,364 The 2008 SNP Submissions for the J. Craig Venter Genome totaled 4,018,050 The 2008 SNP Submissions for the Individual Chinese Genome totaled 5,077,954 The 2008 SNP Submissions for the Individual Korean Genome totaled 1,750,224
ENCODE-HAPMAP işbirliği On tipik 500 kb bölge 48 örnek dizilendi 270 HapMap örneğinde bütün tanımlanan SNP ler (ve dbsnp deki diğerleride) tiplendirildi En son verilere göre her bir 279 bp da bir SNP
Her bir merkez SNP seçimi, kalite kontrol ve verilerin açıklanmasında aynı standardı kullanmıştır. 269 örneğin bütün setleri dizilenmiştir. Bu nedenle veriler %99.7 oranında doğruluk payına sahip ve %99.3 ü tamamlanmıştır. Faz I HapMap te 11.500 non-sinonim SNP tanımlanmıştır. 10 ENCODE bölgesinde genome-wide haritalama ile karşılşatırıldığında SNP yoğunluğunun 10 kat daha fazla olduğu gösterilmiştir. 5 Mb genelinde 17.944 SNP 279 bç de bir
Faz I HapMap te 1.3 milyon SNP genotiplendirilmiş. Sadece %3.3 ünün SNP arası mesafeleri 10 kb dan daha uzundur ve %11.9 u tüm genoma dağılmıştır. X kromozomunda SNP girişimi; nadir veya monomorfik ve genel SNP yoğunluğu düşüktür. mtdna da 168 başarılı, polimorfik SNP tanımlanmış, 15 haplogrup Y kromozomu içinde 84 SNP karakterize edilmiş 8 tane Y haplogrup tanımlanmış
Daha önceki verileriyle uyumlu olarak: ENCODE bölgelerindeki SNP lerin çoğu yaygın değildir. %46 sı nadir ve %9 u sadece tek bir bireyde görülmüştür. YRI örneklerine göre CEU, CHB ve JPT örneklerindeki allel frekansları daha düşüktür.
Maya, fare ve diğer kromozomlarda olduğu gibi insan genomunda da rekombinasyon için sıcak bölgeler bulunmaktadır. ENCODE verileri kullanılarak genomda rekombinasyon oranları ve sıcak noktalar belirlenmiştir. Sıcak noktalar ~2 kb yayılmış kısa bölgelerdir. ENCODE bölgelerinde 88 sıcak nokta tanımlanmış ve bu 5 Mb boyunca bütün rekombinasyonun %80 nini ve dizininde %15 ini oluşturmaktadır. Haplotipler sıklıkla rekombinasyon sıcak noktaları tarafından bozulurlar. Rekombinasyonun sınırlandığı sentromer bölgelerinde 100 SNP den daha fazlası belirlenmiştir.
Faz II HapMap ile birlikte 2.1 milyon SNP başarılı bir şekilde genotiplendirilmiştir. ~11.000 non-sinonim SNP belirlenmiş ve bunlarında 4.500 ünün major histocompatibility complex (MHC) olduğu belirlenmiştir.
Faz II HapMap ile %68 i 5kb bölgede lokalize olan 32.996 sıcak nokta belirlenmiştir. Bu bölgeler incelendiğinde savunma ve bağışıklıkla ilişkili genlerde rekombinasyon oranı yüksek iken şaperonlarda düşüktür. Bağışıklık, hücre adezyonu, ektrasellüler matriks, iyon kanalları ve sinyal iletimi gibi hücre yüzeyi ve eksternal fonksiyonlar ile ilişkili olan genler yüksek rekombinasyon oranı gösterme eğilimindedir. Şaperon, ligaz, izomeraz, sentaz gibi hücre için önemli genlerin rekombinasyon oranları düşük olma eğilimindedir.
Bu projenin amacı, mevcut GWAS analizinde kullanılan genetik varyantların fonksiyonel özelliklerini incelemek ve fonksiyonel anlamlarıyla birlikte varyantların altkümelerini belirlemektir.
Bu çalışmada; Beyaz ırk için referans olarak kullanılan panel -HapMap II (release 22, Genome Build 36, CEU populasyonu) 2.543.887 otozomal SNP analiz edildi... RefGene ve hastalıkla ilişkili OMIM genlerinde tarama yapıldı. 22.107 otozomal gen ve 2209 hastalıkla ilişkili OMIM genleri
22.107 otozomal genin 22.215 i (%96 sı) en az bir SNP içermekte geri kalan 892 gende ise herhangi bir SNP tanımlanamamış. HapMap SNP lerin %56.45 i gen arası bölgelerde ve %39.21 i intronlarda bulunmakta Bunlarında %0.52 missense ve %0.01 nonsense SNP 13.291 missense SNP nin 3122 si (%23) nün hastalıklarla ilişkili olduğu bulunmuştur.
HAPMAP SNP SUDOKU Fill in the blank spaces in the grid so that every vertical column, every horizontal row and every 3x3 box contains the letters H, A1, P1, M, A2, P2, S, N, and P3, without repeating any. Note the tag letters shown in the grid contain all of the information in the full grid. H A1 P1 M A2 P3 S N P2 M S P1 P3 H H M P1 N H P3 H A1 N A1 N A2 S P3 A2 S H
Kaynaklar http://www.hapmap.org The International HapMap Consortium, 2003. The International HapMap Project. Nature 426, 789-796. International HapMap, C., 2005. A haplotype map of the human genome. Nature 437, 1299 1320. International HapMap, C., et al., 2007. A second generation human haplotype map of over 3.1 million SNPs. Nature 449, 851 861. Liu, C., Lin, H. ve Lin, H., 2012. Functional analysis of HapMap SNPs. Elsevier Gene 511, 358-363.