Doku ve Hastalıklara Özgü Büyük Ölçekli Biyolojik Ağları Oluşturul ası ve Analizi

Benzer belgeler
TOPSIS yönteminin adımları 5 Adım 1. Normalize karar matrisinin oluşturulması 6 Karar matrisinin normalizasyonu aşağıdaki formül kullanılarak yapılır:

Sıralama Öğrenme ile Sağkalım Tahminleme

Bilgiye Erişim Sistemleri Information Retrieval (IR) Systems. M.Fatih AMASYALI BLM 5212 Doğal Dil İşlemeye Giriş Ders Notları

3. UYGULAMA - ORTAK ATIF ANALİZİ İLE BENZERLİK TAHMİNİ. Fırat Üniversitesi-Elazığ

SE4SEE A Grid-Enabled Search Engine for

YZM ALGORİTMA ANALİZİ VE TASARIM DERS#6: AZALT VE FETHET YÖNTEMİ

İki Boyutlu Yapılar için Doğrudan Rijitlik Metodu (Direct Stiffness Method) (İleri Yapı Statiği II. Kısım)

KADASTRO HARİTALARININ SAYISALLAŞTIRILMASINDA KALİTE KONTROL ANALİZİ

Algoritma Geliştirme ve Veri Yapıları 10 Graf Veri Modeli. Mustafa Kemal Üniversitesi



Graf Veri Modeli. Düğümler kümesi. Kenarlar kümesi

İleri Diferansiyel Denklemler

Bu dersi aşarı ile ta a laya öğre iler:

GİRNE ÜNİVERSİTESİ DENİZCİLİK YÜKSEKOKULU GEMİ MAKİNELERİ İŞLETME MÜHENDİSLİĞİ DERS TANITIM KATALOĞU

Türkiye Bilimler Akademisi

İleri Diferansiyel Denklemler

Dr. Y. İlker TOPCU. Dr. Özgür KABAK web.itu.edu.tr/kabak/

Yapay Sinir Ağları. (Artificial Neural Networks) DOÇ. DR. ERSAN KABALCI

Araş.Grv. Na i Berkut Yrd. Doç. Dr. REŞAT VOLKAN GÜNEL

Elektrik Devre Temelleri 3

İleri Diferansiyel Denklemler






İNÖNÜ ÜNİVERSİTESİ MALATYA MESLEK YÜKSEKOKULU DERS TANITIM FORMU. Kredisi AKTS Eğitim Dili Tipi: Zorunlu/ Saat

23. Sistem denge denklemlerinin direkt kurulması

YAZILIM MÜHENDİSLİĞİ BÖLÜMÜ İNTİBAK ÇİZELGESİ SINIF / GÜZ DÖNEMİ

YZM 2116 Veri Yapıları

İLERİ ALGORİTMA ANALİZİ TABU ARAMA ALGORİTMASI (TABU SEARCH)

VERİ YAPILARI. GRAPH LAR Düzce Üniversitesi Teknoloji Fakültesi ÖĞR.GÖR.GÜNAY TEMÜR 1

Uzay Çetin. Netlogo ve R ile Sosyal Ağ Analizi uygulaması Nejat Kutup, Uzay Çetin

MOL KAVRAMI I. ÖRNEK 2

TOBB EKONOMİ VE TEKNOLOJİ ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ I. SINIF EĞİTİM - ÖĞRETİM PROGRAMI

Transformasyonlar (İleri Yapı Statiği)

Yrd. Doç. Dr. Tuğba ÖZACAR ÖZTÜRK

BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Yrd. Doç. Dr. Övünç ÖZTÜRK

Spektroskopi ve Spektrofotometri. Yrd. Doç. Dr. Bekir Engin Eser Zirve University EBN Medical School Department of Biochemistry

ENDÜSTRİ MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

Nokta uzayda bir konumu belirtir. Noktanın 0 boyutlu olduğu kabul edilir. Herhangi bir büyüklüğü yoktur.

Bilgisayar Mühendisliği Yüksek Lisans Programı

Detecting Blackhole Attack on AODVbased Mobile Ad Hoc Networks by Dynamic Learning Method(2007)

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir

İŞARET ve SİSTEMLER (SIGNALS and SYSTEMS) Dr. Akif AKGÜL oda no: 303 (T4 / EEM)

CBS ve Coğrafi Hesaplama

Çizgeler (Graphs) Doç. Dr. Aybars UĞUR

Power BI. Neler Öğreneceksiniz?

BİLGİSAYAR MÜHENDİSLİĞİ DOKTORA PROGRAM BİLGİLERİ

tarih ve 217 sayılı Eğitim Komisyonu Kararı Eki-3

Büyük Veri Analitiği (Big Data Analytics)

BMT 206 Ayrık Matematik. Yük. Müh. Köksal GÜNDOĞDU 1

Ders Kodu Dersin Adı Dersin Ġntibak Durumu

Bilgisayar Mühendisliği Yüksek Lisans Programı

Örnek Arasınav Soruları Güz 2017

Elektrik Devre Temelleri

HACETTEPE ÜNİVERSİTESİ BAHAR DÖNEMİ

Web Madenciliği (Web Mining)

Adana Toplu Taşıma Eğilimleri

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Orjinal Adı: Pattern Recognition

WEBİNAR AVRUPA BİRLİĞİ HORIZON PROJELERİNE NASIL KATILABİLİRİZ? Yaşar Üniversitesi AB Araştırma ve Uygulama Merkezi

İleri Diferansiyel Denklemler

Bölüm 7: Kilitlenme (Deadlocks)

Bu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır.

ö ğ ö ö ö ş ö

MAT223 AYRIK MATEMATİK

Ğ ç «Ğ ç Ö Ö Ö ş ö ö ç Ö Ö ö ş ö ş Ş Ö Ö ç ş ş ç Ş ş

Internet Nedir? Devlet Kurumları. Internet Servis Sağlayıcılar. Lokal Ağ. Eğitim Kurumları. Kişisel Bilgisayar. Dizüstü Bilgisayar.

Kaynak: A. İŞLİER, TESİS PLANLAMASI, 1997

Temel Elektronik Basic Electronic Düğüm Gerilimleri Yöntemi (Node-Voltage Method)

Yrd. Doç. Dr. A. Burak İNNER

ÖRNEKLER-VEKTÖR UZAYLARI 1. Çözüm: w=k 1 u+k 2 v olmalıdır.

Bilgisayarla Görüye Giriş

MAT223 AYRIK MATEMATİK

2. BASİT DOĞRUSAL REGRESYON 12

Veri Ağlarında Gecikme Modeli

Sayısal Yöntemler (COMPE 350) Ders Detayları

Akademik Dünyada Özgür Yazılım. Akademik Dünyada. Onur Tolga Şehitoğlu

İlk Yapay Sinir Ağları. Dr. Hidayet Takçı

DENEYİN AMACI Akım uygulanan dairesel iletken bir telin manyetik alanı ölçülerek Biot-Savart kanunu

Zeki Optimizasyon Teknikleri

BİYOİNFORMATİK ARAŞTIRMALARI VE ARAÇLARI

İletişim Ağları Communication Networks

Dijital Dönüşüm Adımları

SAB 101 OLASILIK DERS NOTLARI. Prof.Dr. Fatih TANK. SAB 101 Olasılık. F.Tank. 1 Rastgelelik. 2. Modelleme. 3. Kümeler Cebiri. 4. Sınıf. 5.

GEO182 Lineer Cebir. Matrisler. Matrisler. Dersi Veren: Dr. İlke Deniz Derse Devam: %70. Vize Sayısı: 1

Lineer Denklem Sistemleri Kısa Bilgiler ve Alıştırmalar

GridAE: Yapay Evrim Uygulamaları için Grid Tabanlı bir Altyapı

AVRASYA ÜNİVERSİTESİ

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 1 ( yılı ve sonrasında birinci

ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ ELEKTRİK-ELEKTRONİK MÜHENDİSLİĞİ BÖLÜMÜ ÖĞRETİM YILI EĞİTİM PLANI 1. YARIYIL

7. Kafes sistem sayısal örnekleri

Dağıtık Ortak Hafızalı Çoklu Mikroişlemcilere Sahip Optik Tabanlı Mimari Üzerinde Dizin Protokollerinin Başarım Çözümlemesi

DERS SEÇİM KILAVUZU. Sınıf Dönemi Kodu Adı Sınıf Dönemi Kodu Adı. Nesne Yönelimli Programlama. Yazılım Tasarımı ve Mimarisi

İLAÇ ARAŞTIRMALARINDA SURROGATE MARKERLAR

Analitik Geometri II (MATH 122) Ders Detayları

KARINCA KOLONİ ALGORİTMASI BMÜ-579 Meta Sezgisel Yöntemler. Yrd. Doç. Dr. İlhan AYDIN Fırat Üniversitesi, Bilgisayar Mühendisliği Bölümü

Transkript:

Boğaz da Yapay Öğre e İs ail Arı Yaz Okulu 2-5 Temmuz 2018 Doku ve Hastalıklara Özgü Büyük Ölçekli Biyolojik Ağları Oluşturul ası ve Analizi Tolga Can Bilgisayar Mühe disliği Bölümü ODTÜ

İçerik Genom ölçeği de biyolojik etkileşi verileri Pathway Commons portalı Doku ya da hastalıklara özgü biyolojik etkileşi ağları ı oluşturul ası Çizgecikler (İ g. Graphlets) Büyük bir çizge içinde çizgeciklerin sayıl ası Büyük çizgelerde yakı lık sorguları Çizgede yeniden aşla alı rastgele yürüme (İ g. Random Walks with Restarts)

Pathway Commons Biyolojik etkileşi verilerini ve u ları analizi için faydalı araçları içeren bir web portalı. pathwaycommons.org Cerami, E. G., Gross, B. E., Demir, E., Rodchenkov, I., Babur, Ö., A ar, N., Sa der, C.. Pathway Commons, a web resource for biological pathway data. Nucleic Acids Research, 39(Database issue), D685 D690.

Pathway Commons Araçları da Bir Örnek

Pathway Commons Versiyon 10 (7 Mayıs 2018) http://www.pathwaycommons.org/ archives/pc2/v10/pathwaycommon s10.all.hgnc.sif.gz 32,875 protein/küçük molekül arası da 2,374,707 etkileşi

Pathway Co o s taki Etkileşi ler http://www.pathwaycommons.org/pc2/formats

Pathway Commons Versiyon 10 (7 Mayıs 2018) 18,931 protein arası da 1,225,798 etkileşi Etkileşi Türü Sayısı interacts-with 434,790 in-complex-with 189,421 controls-state-change-of 250,730 catalysis-precedes 190,578 controls-expression-of 139,194 controls-transport-of 7,776 controls-phosphorylation-of 13,309 yönlü etkileşi ler

Ağı ta a ı ı görüp de anlamak çok zor ProNet (Asthana et al. 2004) S. Cerevisiae 3,112 düğü 12,594 kenar

Farklı tür etkileşi ler içeren bir ağ string.embl.de

Doku/Hastalıklara Özgü Ağları elde edilmesi En doğru yolu: etkileşi belirleme deneylerinin yapıldığı doku/hastalık bilgilerini kullanmak Pathway Co o s daki veri kay akları ı çoğu da böyle bir bilgi yok ne yazık ki Yüksek ölçekli etkileşi belirleme yöntemleri doku ya da hastalığa özel örneklerde çalıştırıl a ış olabiliyor

Doku/Hastalıklara Özgü Ağları elde edilmesi Daha az doğru ama bir dokuda olmayan etkileşi leri çıkar a ı bir yolu: Transkriptom profilleri NCBI GEO GSE7307: Expression profiling by array Herkese açık veri, April 09, 2007 Normal ve hasta insan dokuları Affymetrix U133 plus 2.0 ile profille iş Toplam 677 örnek, 9 da fazla doku tipi 141 farklı hastalık/doku ağı elde etmekte kulla ıla ilir

Doku/Hastalıklara Özgü Ağlar İfade edil iş genlerin belirlenmesi Basit bir eşik değer kulla ı ı: ifade değeri. da büyük olan bütün genlerin ifade edildiği i varsaymak Daha doğru çözümler: Her genin da ra ışı ı bütün dokuları göz önüne alıp ayrı ayrı modellemek Referans genler kullanarak normalizasyon yapmak

Çizgeciklerin sayıl ası 2-3 düğü lü çizgeciklerin sayıl ası için bir yöntem: Her bir 2-3 düğü lü kenar kodla ası Hashtable eriyapısı ile sayıla ilir Ama izomorfik olan çizgeciklerin yal ız a bir kez sayıl ası için dikkatli olmak gerekir

Ke arları kodla ası A da B ye olan kenar: 1 1 1 0 1 0 1 0 B de A ya olan kenar: 1 1 0 1 0 1 0 1 Bu iki kodla a ı izomorfik olduğu gerçeği ile sayı yap alıyız

İstatistiksel A la lılığı Ölçülmesi Gerçek biyolojik ağlardaki çizgeciklerin sayıları ı rastgele oluşturul uş (örn. kenar karıştır ası yöntemi ile) ağlardaki çizgecik sayıları ile karşılaştıra iliriz. Eğer rastgele ağlarda bu sayılar normal bir dağılı gösteriyorsa:

Biyolojik Ağlarda Yakı lık Sorguları Yakı lık (İ g. Proximity) sorguları genlerin fo ksiyo ları ı belirlenmesi, hastalık-gen ilişkileri, ay ı yolakta görev alan genlerin belirlenmesi gibi bir çok amaçla kulla ıl aktadır.

Çizgelerde Rastgele Yürüme Google PageRank ölçütü de bu yöntemi kullanarak geliştirilmiştir.

Google PageRank Varsayım: A sayfasından B sayfasına olan bir bağlantı A sayfasının B sayfasını önerdiğini göstermektedir Yani bir sayfa ne kadar fazla sayfa tarafından öneriliyorsa o kadar önemlidir (PageRank i fazladır) diyebiliriz Gelen bağlantı sayısının direkt kullanılmasının problemi ne olabilir?

Google PageRank Özyineli bir çözüm: Bir sayfanın önemi hem kendisine yapılan bağlantıların sayısıyla, hem de bu bağlantıları yapan sayfaların önemiyle orantılıdır. S. Brin and L. Page. "The Anatomy of a Large- Scale Hypertextual Web Search Engine." Computer Networks 30:1-7 (1998), 107-117.

PageRank tanımı Sonsuza kadar devam edecek şekilde, aşağıdaki gibi rastgele hareket eden bir web gezgini düşünelim: Başlangıçta gezgin rastgele bir sayfadadır Her adımda gezgin c olasılığı ile tamamen rastgele bir sayfaya ya da 1- c olasılığı ile bulunduğu sayfadaki rastgele bir bağlantıya gider PageRank ölçütü limitte gezginin bir p sayfasını ne oranda ziyaret ettiğini gösterir.

Yeniden başlamalı rastgele yürüme s düğümünde başlayan bir rastgele yürüme düşünelim. Her adımda bulunduğu düğümün komşularından birine rastgele gidebiliriz ya da s düğümüne c olasılığı ile geri dönebiliriz. s

Bir yakınlık ölçütü ( t) p s ( v) olasılığını rastgele gezginin v düğümünde t. adımda bulunma olasılığı olarak tanımlarsak. Limitte değişmez olan p s (v) değeri v düğümümün s düğümüne olan yakınlığı (İng. affinity) ile orantılıdır ve yinelemeli matris işlemleri ile kolayca hesaplanabilir.

Yakınlık vektörü p nin durgun halini hesaplama s başlangış düğümlerini belirten bir sütun vektörü olsun (yani, s i =1/n, eğer i düğümü n tane başlangıç düğümünden biri ise, değilse s i =0). Aşağıdaki yinelemeli denklemi p sütun vektörü değişmeyene kadar uygula: p t+1 = (1-c)A T p t + cs burada A normalize edilmiş komşuluk matrisini ve c de başa dönme olasılığını göstermektedir.

Küçük bir örnek Başlangıç (geri dönüş düğümleri): n 5 ve n 6 olsun.

Yakı lık matrisi ve aşla gıç vektörleri A: n1 n2 n3 n4 n5 n6 n1 0 0 0 1 0 1 n2 0 0 0 1 0 0 n3 0 0 0 1 0 1 n4 1 1 1 0 1 1 n5 0 0 0 1 0 1 n6 1 0 1 1 1 0 s = p 0 n1 0 n2 0 n3 0 n4 0 n5 0.5 n6 0.5

Normalize edil iş yakı lık matrisi A: n1 n2 n3 n4 n5 n6 n1 0 0 0.5 0.5 n2 0 0 0 1 0 0 n3 0 0 0.5 0.5 n4.2.2.2 0.2.2 n5 0 0 0.5 0.5 n6.25 0.25.25.25 0 s = p 0 n1 0 n2 0 n3 0 n4 0 n5 0.5 n6 0.5

p 1 i hesapla ası A T : n1 n2 n3 n4 n5 n6 n1 0 0 0.2 0.25 n2 0 0 0.2 0 0 n3 0 0 0.2 0.25 n4.5 1.5 0.5.25 n5 0 0 0.2 0.25 n6.5 0.5.2.5 0 p 0 : n1 0 n2 0 n3 0 n4 0 n5 0.5 n6 0.5 p 1 = 0.7 x + 0.3 s: n1 0 n2 0 n3 0 n4 0 n5 0.5 n6 0.5 c = 0.3 olsun p 1 = n1 0.087 n2 0.0 n3 0.087 n4 0.262 n5 0.238 n6 0.325

p 2 i hesapla ası A T : n1 n2 n3 n4 n5 n6 n1 0 0 0.2 0.25 n2 0 0 0.2 0 0 n3 0 0 0.2 0.25 n4.5 1.5 0.5.25 n5 0 0 0.2 0.25 n6.5 0.5.2.5 0 p 1 : n1 0.087 n2 0.0 n3 0.087 n4 0.262 n5 0.238 n6 0.325 p 2 = 0.7 x + 0.3 s n1 0 n2 0 n3 0 n4 0 n5 0.5 n6 0.5 p 2 = n1 0.094 n2 0.037 n3 0.094 n4 0.201 n5 0.244 n6 0.331

p 21 = p 22 n1 0.089 n2 0.032 n3 0.089 n4 0.225 n5 0.239 n6 0.327

Sorular Yakı lık sorguları için entegre ağları asıl sayısal olarak modelleyebiliriz? Farklı tür ağlarda yapıl ış yakı lık sorgu so uçları ı asıl irleştire iliriz? Farklı doku/hastalık ağları daki yakı lık sorgu so uçları ı asıl karşılaştıra iliriz?

Teşekkürler Çizgecik Sayı ı: Doktora öğre i Arzu Burçak Sönmez (ODTÜ Enformatik Enstitüsü Sağlık Bilişi i) Ağlarda yakı lık sorguları: Kathy Marcopol ve Ambuj K. Singh (UC Santa Barbara) Finansal destekler: TÜBİTAK #144E111 o lu araştır a projesi Bilim Akademisi Genç Bilim İ sa ları Ödül Progra ı (BAGEP) 2014-2016