Metagenom Analiz Stratejileri Prof.Dr. Engin Yılmaz Acıbadem Üniversitesi Tıbbi Biyoloji AD 1. Ulusal İnsan Mikrobiyotası ve Sağlığımıza Etkileri Kongresi 8-10 Aralık 2016, Ankara
İnsan Genom Projesi İnsan genomunu ve onun insan sağlığı üzerinde oynadığı rolü anlamaya çalışmak. 2005 1990 2000 2003/2007 2003 2008 2006
İnsan Mikrobiyom Projesi İnsan vücudunun farklı bölgelerinde bulunan mikroorganizma gruplarını karakterize etmek, mikrobiyom ve insan sağlığındaki değişiklikler arasındaki ilişkiyi anlamak. Our second genome 2008
İnsan Mikrobiyom Projesi Potansiyel Etkisi İnsan vücudu içinde ve üzerinde ~ 100 trilyon bakteri bulunmakta ve vücut ağırlığının ~ % 3'ünü oluşturmaktadır. Rolleri konusunda sınırlı bir bilgiye sahip olsak da, bu çeşitliliği sağlık ve hastalıkta sorgulayabilen teknolojilere sahibiz. Sağlıklı bireylerin normal florası, yeni modülatörler ve doğal ürünlerin tanımlanması için bir kaynak oluşturmaktadır. Popülasyondaki değişiklikler ve kaymalar, sağlık durumunun göstergeleri olarak kullanılabilir. Mikrobiyom, hastalığın seyrinin izlenmesi için kullanılabilir.
İnsan Mikrobiyom Projesi Potansiyel Etkisi Mikrobiyom bağışıklık gelişiminde önemli rol oynamaktadır. Mikrobiyota / antibiyotik ve immün aracılı hastalıkların gelişimi arasındaki ilişkiler belirlendi. Gelişmiş sanitizasyon, antibiyotik kullanımı ve bağışıklama, mikrobiyotayı değiştirebilen faktörlerdir. Mikrobiyal populasyonlar coğrafi bölgeye göre değişebilir. Mikrobiyom akıl sağlığı ve insan davranışını etkileyebilir. Ağırlık / BMI e bağlı olarak mikrobiyomda farklılıklar gözlenebilir. Diyete bağlı olarak mikrobiyomda farklılıklar gözlenebilir. Sağlık durumuna bağlı olarak mikrobiyomda farklılıklar gözlenebilir.
Metagenom: mikrobiyomun genetik taslağı metabolizma Mikrobiyomun insandaki rolünü anlamak için hangi biyolojik özelliklere ihtiyacımız var? transkriptler? proteinler? metabolitler?
Metagenom Analiz Stratejisi 16s rrna amplikon dizilimi ile kimlerin olduğu belirlenir? 2,3 milyonun üzerinde bilinen bakteri 16s rrna'sı Tür ve miktarının belirlenmesi Metagenomik dizilim - ne yapabilirler? Pan-genom içeriğinin belirlenmesi Metagenomik transkriptomikler - aktif genler? RNA nın cdna ya cevrilmesi ve dizilenmesi Aktif olarak transkribe olan bakteriyel genlerin belirlenmesi için insan dizilerinin ve bakteriyel rrna nın filtrelenmesi Diğer omics teknolojileri: Proteomics, transcriptomics, metabolomics Biyolojik yorumlamayı yapabilmek için terabayt düzeyindeki datanın analizi
Metagenom Analiz Stratejisi Kültüre bağlı analiz: Organizmanın laboratuvarda üretilmesi ve saf kolonilerin sağlanması. Genom dizisinin tamamlanması. Kültüre bağlı olmayan analiz: 16S ribosomal RNA (rrna) dizilemesi. Son yıllardaki teknolojik gelişmeler sayesinde, tüm genomun fragmanlar halinde dizilenmesi, biraraya getirilmesi ve referans genomlar ile karşılaştırılması mümkün olmaktadır. Biyoinformatik analiz metodları ve modellerinin geliştirilmesi ile büyük data setlerinin analizedilmesi. Elde edilen veriler diğer omics teknolojileri ile birlikte değerlendirilerek daha fazla bilgiye sahip olabilmek.
16S rrna Gen Analizi Korunmuş bölgeler Tüm bakterilerde aynı Tek PCR primer çifti, çeşitli bakterilerden gelen 16S rrna genlerini çoğaltabilir Değişken bölgeler Türler arasında korunmuş Türler arasında farklılık Bakteri "türlerinin" çeşitlerini ve bolluklarını tanımlamak için diziden "bilgi" çıkarma. Bakteri türleri Belirlenen türlerin zenginliğinin belirlenmesi Türler arası ilişkilerin belirlenmesi Popülasyon çeşitliliğinin analizi. Popülasyonlar arasındaki çeşitliliğin karşılaştırılması.
Tür Zenginliği ve Doğruluğunun Tahmini 16S rrna geni kütüphane analizi Genom kapsama alanı kütüphanedeki bolluk ile orantılıdır yoğun türler > orta yoğunluktaki türler > nadir türler
16S rrna Veri Analizi QIIME (Quantitative Insights Into Microbial Ecology) http://qiime.sourceforge.net mothur http://www.mothur.org MG-RAST (Metagenomics - Rapid Annotation using Subsystems Technology) http://metagenomics.nmpdr.org Genboree http://genboree.org/java-bin/workbench.jsp EzTaxon http://eztaxon-e.ezbiocloud.net Pheonix2 http://sourceforge.net/projects/phoenix2. METAGENassist http://www.metagenassist.ca. MEGAN http://www-ab.informatik.uni-tuebingen.de/software/megan VAMPS http://vamps.mbl.edu CloVR-16S http://clovr.org/developers RDPipeline (Ribosomal Database Project Pipeline) http://rdp.cme.msu.edu Plummer et al., J Proteomics Bioinform 2015, 8:12
Neden Metagenom Gerekli? Hücre yapısının ve işlevinin araştırılması Konakcı ile ilişkinin anlaşılması Metabolizmanın anlaşılması Gen ifadesinin anlaşılması (RNA-Protein) Genomun yeniden düzenlenmesi DNA varyasyonlarının tanımlanması Genotipleme ve Adlitıp İlaç ve aşı geliştirilmesi Protein protein ilişkilerinin anlaşılması Minimal gen setinin tanımlanması
Dizileme Yöntemleri Sentez ile dizileme Sanger sequencing (Applied Biosystems) Pyrosequencing (Roche/454) Reversible terminator (Illumina) Ion torrent (Life Technologies) Single Molecule Real Time Sequencing (Pacific Biosciences) Oligo ligasyon ile dizileme SOLiD (Applied Biosystems) DNA dizisinin direk okunması Nanopore sequencing (Oxford Nanopore Thec.)
Yeni Nesil Oyuncaklar Sequel System: SMRT Sequencing PacBio RS II: long-read sequencer
DNA dizi analiz metodlarının karşılaştırılması Metod Okuma Uzunluğu Doğruluk % (tek okuma) Okuma/Koşum Zaman/Koşum Fiyat/milyon baz Avantaj Dezavantaj Gerçek zamanlı dizileme (PacBio) avg 14,000 bp max >40,000 bp 87 50,000/ SMRT cell, 500 1000 mbaz 30 dk 4 saat $0.13 $0.60 En uzun okuma uzunluğu Hızlı tanımlama Orta ölcekli Ekipman çok pahalı olabilir Düşük doğruluk Yarı iletken iyon (Ion Torrent) >400 bp 98 >80 milyon 2 saat $1 Daha ucuz ekipman Hız Homopolimer hatası Pyrosequencing (454) Sentez ile dizileme (Illumina) 700 bp 99.9 1 milyon 24 saat $10 50-300 bp 99.9 >6 milyar (TruSeq ) 1-11 gün Cihaza ve okuma uzunluğuna bağlı $0.05 - $0.15 Uzun okuma boyu Hız Sıralama modülüne ve istenen uygulamaya bağlı olarak yüksek dizi verimi potansiyeli Koşumlar pahalı Homopolimer hatası Ekipman çok pahalı olabilir Yüksek DNA konsantrasyonu gerekli Ligasyon ile dizileme (ABI SOLiD) 50+35 / 50+50 bp 99.9 1.2-1.4 milyar 1-2 hafta $0.13 Baz başına düşük maliyet Diğer metodlardan daha yavaş Palindromik dizilerin sekansı konusu? Zincir terminasyonu (Sanger) 400-900 bp 99.9 N/A 20 dk - 3 saat $2400 Uzun bireysel okuma Birçok uygulama için kullanışlı Büyük dizileme projeleri için pahalı ve pratik değil Klonlama veya PCR zaman alıcı basamak
Yüksek Ölçekli Veri Analizi Sorgulama, karşılaştırma, veri kümelerini analiz etme Referans genom ve karşılaştırmalı genom değerlendirmesi için okumanın planlanması Metadata bağlamında sekans verilerini analiz etmek için çok değişkenli istatistikler Örnek Karşılaştırma - Taksonomik profiller - Fonksiyonel ve metabolik profiller Data Analizi Noncoding özelliklerin belirlenmesi (16S, 18S, trna) Protein işlevi Taksonomik Sınıflandırma Bir araya getirme - Metagenomik - Metatranskriptomik - Kısa Peptidler
Metagenomik Verilerin Analiz Şeması Bioinformatics and Biology Insights 2015:9 75 88
Çalışmanın tasarımı, grupların oluşturulması ve örneklemin sayısı Metaveri standartları ve gizlilik Örneklerin toplanması kodlanması ve dağıtımı Dizileme Merkezleri Dizileme tipi primerler ve metodun seçimi Verilerin depolanması transferi Biyoinformatik Kalite kontrol 16S rrna Dizileme WGS OTU Filotipler Ref Genom Haritalama Metabolik yapılandırma Birleştirme Değerlendirme Gruplama Filtreleme Sınıflandırma Sınıflandırma Genomun okunması Gen ve Yolaklar Metagenom ve genler Verilerin olgunlaştırılması, fenotipler ile ilişkilendirme ve yorumlama