ÇEVİRİ EDİTÖRÜNÜN ÖN SÖZÜ Değerli Okuyucular, Yaşam bilimlerinde (biyoloji, tıp, tarım, orman vs.) genetik ve genomik çalışmalar çok kapsamlı ve hızlı bir şekilde farklı araştırma kurumlarında yürütülmektedir. Bu çalışmalar sonucu her geçen gün artan bir şekilde veri üretilmektedir. Üretilen verilerden en iyi şekilde yararlanmak için çok etkin bilgisayar yazılımları ile hızlı ve kapasiteli bilgisayarlara gereksinim vardır. Üretilen verilerin büyük bir bölümü kamuya açık olarak uluslararası veri bankalarına aktarılmaktadır. Bu verilerden etkin bir şekilde yararlanabilmek için hem biyolojik verilere hakim, hem de bilgisayar programalarında uzman yetiştiren bir disipline gerek duyulmuştur. Bu disiplin biyoenformatik dir. Biyoenformatik çok hızlı bir şekilde gelişmektedir. Bu alanda uzmanlaşacak olan kişilere, özellikle biyologlara, yardımcı olması amacıyla bu kitabın tercüme edilmesine karar verilmiştir. Bu alanda çalışanların takdir edeceği gibi kitapdaki konuların tercümesi oldukça zordur. Tercümelerde mümkün olduğu kadar aslına bağlı kalmakla beraber, bazı durumlarda cümlenin anlamını en iyi şekilde vermek için uyarlama yapılmıştır. Tercüme ekibine, 6 ay gibi kısa sürede bu kitabın tercümesini yetiştirdikleri için çok teşekkür ediyorum. Tercüme ekibi kitapda geçen konularda araştırma yapan ya da verileri etkin kullanabilen uzmanlardır. Kitabın bu alanda çalışma yapacaklar için başvuru ve rehber kitap rolü görmesini diliyoruz. Saygılarımızla. Çeviri Grubu Adına Prof. Dr. Zeki Kaya xiii
Ön Söz Bu kitap nedir? Bu kitap, yaşam bilimleri öğrencilerine ve araştırmacılara biyoenformatiğin temellerini aktarmayı hedeflemektedir. Üniversite düzeyinde hesaba dayalı eğitim almamış okuyuculara, bu alanın anahtar metotlarının ardındaki sayısal düşünceyi iletmeyi hedeflemektedir. Bu bir tarif kitabıˮ değildir: biyoenformatik programlarının veya veritabanlarının işleyişinin teknik ayrıntılarından kaçınıp, sayısal düşünceye odaklanmaktadır. Deneyimlerimize ve düşüncelerimize göre, sayısal fikirler bir kez kavrandığı zaman öğrenciler mevcut biyoenformatik araçlarını daha verimli kullanabilecektir. Bu kavrayışlarını da, yeni sayısal hedeflerini oluşturarak ve bu alandaki bilim insanlarıyla daha etkili etkileşim kurarak daha üst seviyeye taşımak için kullanabileceklerdir. Kitap, her biri biyoenformatikteki sayısal metotları, çözmek üzere hazırlandığı biyolojik metotları problemleriyle beraber, bağımsız bölümlerden oluşmaktadır. Bölümleri gözden geçiren sorular her bölümün ardından verilmektedir. Öğretim materyalleri, sunumlar, sorular ve güncellemeleri içeren bir web sitesi (www. cambridge.org/b4b) öğrencilerin yanı sıra eğitimcilere de yardımcı olacaktır. Bu kitabın hedef kitlesi kimlerdir? Kitap, yaşam bilimleri lisans öğrencilerini hedef almaktadır ki okuyucunun matematik ve bilgisayar bilimleri altyapısı olduğunu varsaymadan gerekli olan matematiksel kavramları sunar. Kitap aynı zamanda yaşam bilimleri yüksek lisans öğrencileri ve araştırmacıları ve tıp öğrencileri için de uygundur. Her bölüm ayrı ayrı çalışılabilir ve bireysel olarak sınıfta ve serbest okumada kullanılabilir. xv
xvi Ön söz Neden bu kitap? 1998 yılında, Stanford üniversitesi profesörü Michael Levitt biyologlar henüz farkında olmasalar da, bilgisayarlı hesaplamaların biyolojiyi sonsuza dek değiştirdiğini ifade etti. On yıldan daha fazla bir süre sonra pek çok biyolog, geçtiğimiz yüzyıl için moleküler biyoloji nasıl temelse bu yüzyılın biyolojisi için de hesapsal biyolojinin temel olduğunu anladı. Biyoenformatik 1 modern biyolojinin önemli bir parçası haline geldi: eğer birisi bir anda BLAST gibi modern biyoenformatik araçlarını biyologların kullanımından kaldırırsa, biyolojik araştırmalar önemli ölçüde yavaşlayacaktır. Biyoenformatik araştırmacılarının biyomedikal camiaya sundukları geniş imkânları kullanmayan ileriye dönük biyolojik araştırma hayal edemiyoruz. Biyoenformatik kaynaklar iki çeşittir: Veritabanları ve algoritmalar. Binlerce veritabanı protein dizileri ve yapıları, gen tanımlamaları, evrim, ilaçlar, ekspresyon profilleri, tüm genom ve daha birçok biyolojik veriler hakkında bilgi içerir. Çok sayıda algoritma biyolojik datayı analiz etmek için geliştirilmiştir ve biyologlar için bu algoritmaların yazılım uygulamaları mevcuttur. Bu kaynakları etkili bir biçimde kullanmak biyoenformatiğin ne olduğunun ve neler yapabileceğinin temel anlayışını gerektirmektedir: hangi araçlar mevcuttur, onlar en iyi nasıl kullanılır ve sonuçları nasıl değerlendirilir ve daha da önemlisi ilgili araçlar mevcut olmadığında mantıklı bir biçimde biyoenformatiği kullanmayı başarabilmeyi ummak nedir? Biyoenformatik kaynak ve yöntemlerinin zenginliğine ve hatta donanımlı biyomedikal araştırmacılarının bu kaynakları yoğun bir şekilde kullanmalarına rağmen, biyoloji ve biyokimya ve aynı şekilde tıp öğrencilerinin biyoenformatiği kullanımları hâlâ başlangıç seviyesindedir. Biyologların bilişimsel eğitimi son 50 yıl içinde neredeyse hiç değişmemiştir. Çoğu üniversitede hâlâ yaşam bilimleri lisans öğrencileri için biyoenformatik kursları bulunmamakta ve olanlarda ise bu kursların sınırlı bilişimsel kültürle nasıl ve ne kadar öğretilebileceği sorusuyla mücadele edilmektedir. Bilgisayar bilimlerinde herhangi bir hazırlık yokken, geçtiğimiz on yılda üniversitelere giden biyologların gelecek on yıllarda kendi disiplinlerindeki hesaba dayalı bakış açıları eksik kalacaktır. Benzer şekilde, tıp doktorları (yakın bir gelecekte kişisel genomlar veya binlerce protein seviyelerini gösteren kan testi raporlarını analiz etmek zorunda kalacak kişiler) gelecek tıbbının sayısal sorunlarıyla karşılaşmak için hazırlıklı değildirler. Biyomedikal öğrencilerinin genellikle çok temel bir programlama bilişimsel geçmişine sahip olmaları, biyoenformatik derslerinin (açıldıkları takdirde), teknik ve ilgi çekmeyen bir ders olarak algılanmasına sebep olacak önemli bir risktir. Genellikle 1 Kitap içerisinde burada ve bundan sonrasında, biyoenformatik ve hesaba dayalı biyoloji birbirlerinin yerine kullanılmıştır.
Ön söz xvii yazılım araçları öğretilir ve daha sonrasında bunların ardındaki ayrıntılı algoritmik düşünceler anlaşılmaksızın kara kutular olarak kullanılırlar. Bu tarz kara kutu kullanımı, sonuçlardan az yararlanılması ya da fazlaca yorumlanmasına sebep olabilen durumları ortaya çıkarmaktadır. Dahası bu seviyede biyoenformatik çalışan öğrencilerin, gelecekteki kariyerlerinde kendi biyomedikal araştırmalarını yürütürken sayısal düşünceler üretme ihtimalleri düşük olacaktır. Bu sebeple, bize göre, bu düşünceler üzerine hem mevcut araçları daha iyi kullanabilmek hem de kendilerince yeni sayısal düşünceleri oluşturabilmek ve gelecekteki kariyerlerinde diğer sayısal biyologlarla daha iyi iletişim kurabilmek için biyologların daha derin hesaba dayalı bilgiyle donatılmaları temeldir. Bizler ve diğerleri biyologların 2 sayısal eğitiminde devrimi tartışırken diğer disiplinlerde matematiksel ve sayısal eğitimde bu tarz devrimlerin zaten başarıyla gerçekleştirildiğini fark ettik. Fizikçiler 150 yıl önce bir hesaplamalı devrim yoluna gittiler ve ekonomistler de son 20 yıl içerisinde bilgisayar müfredatını önemli bir biçimde geliştirdiler. Sonuç olarak, paradoksal bir biçimde, bu disiplinlerdeki öğrenciler biyoloji öğrencilerine göre modern biyomedikal araştırmaların hesaplama zorluklarına çok daha iyi hazırlanmış hale geldiler. Dahası, biyologlar her ne kadar az matematiksel altyapıya sahip olsalar da, bu aslında, modern matematiğe egemen olan soyut matematikten ziyade somut matematik (kalkülüs gibi) ve bilgisayar bilimleriyle sınırlanmıştır. 2009 yılında radikal bir tahminle 3 biyologların eğitiminin yakın bir gelecekte fizikçi ve ekonomistlerin bugünkü eğitimi gibi hesaplama donanımlı olacağını ileri sürdük. Bu senaryo birkaç yıl öncesine kadar inanılması güç olsa da, biyoenformatik eğitiminde önde gelen okullar (Harvey Mudd ya da Berkeley) bu amaca yönelik yolda ilerlemektedir. Biyoloji eğitiminin de gelişmeleri yakalama zamanı gelmiştir. Böyle bir değişim yaşam bilimi lisans öğrencileri için temel matematik dersleri içeriğinin gözden geçirilmesi ve belki öğretilen konuların güncellenmesini gerektirebilir. Öğrencilerin biyoenformatik anlayışı, bu tarz bir değişiklikten büyük fayda görecektir. Paralel olarak özel biyoenformatik sınıfları ve kurslar tesis edilmeli ve bunlara uygun ders kitapları oluşturulmalıdır. Önde gelen üniversitelerdeki pekçok lisans biyoenformatik programları, öğrencileri bir sonraki biyoenformatik kurs ve araştırmaları için hazırlayan biyolojik ve hesaplamalı kursların zorlu bir karışımını içermektedir. Sonuç olarak bazı lisans biyoenformatik kursları, bırakın lisans öğrencilerini yüksek lisans öğrencileri için bile oldukça karmaşıktır. Bu, bugün pek çok kampüste bir tür çelişkili duruma 2 W. Byalek ve D. Botsein. 21. Yüzyıl biyologları için başlangıç bilimi ve matematik eğitimi. Science, 303: 788-790, 2004. P.A.Pevzner. 21. Yüzyılda biyologları eğitmek: Biyoenformatik bilim insanları ya da biyoenformatik teknisyenleri. Bioinformatics, 20:2159-2161, 2004. 3 P.A. Pevzner and R. Shamir. Programlama biyolojiyi değiştirdi Biyoloji eğitimi zamanı yakalamalı. Science, 325:541-542, 2009.
xviii Ön söz sebep olmaktadır: biyoenformatik lisans öğrencilerini hedefleyen ancak biyoloji öğrencileri (lisans veya yüksek lisans) için uygun olmayan biyoenformatik dersleri mevcuttur. Bu da anlayışımıza göre henüz çözümlenmemiş şu çelişkiye yol açmaktadır: Eğitsel Sorun: (i) Sayısal ön gereklilik talebi asgari seviyede olan (ii) programlama bilgisi gerektirmeyen (iii) sayısal düşüncelerin anlamlı öğrenimini yavaş yavaş gerçekleştiren ve bunları uygulayabilmeyi garanti eden bir biyoenformatik dersi tasarlayınız. Bu sorun açıklığa kavuşturulmalıdır fakat biyoenformatikteki pek çok düşüncenin çoğu zaman diğer sayısal alanlarda ulaşılması zor olan sezgisel seviyeyle açıklanabileceğini düşünmekteyiz. Örneğin, sınırlı sayısal birikimi olan bir öğrenciye ferromagnetizmanın Ising modeli ardındaki matematiği açıklamak güçken, aynı öğrenciye genom oluşumu ardındaki algoritmik düşünceleri (Euler teoremi ve de Bruijn grafikleri) tanıtmak oldukça kolaydır. Bu nedenle biyologlara biyoenformatiği tanıtırken rekreasyonel matematik (Martin Gardner ve diğerlerince oldukça zekice geliştirilen) yaklaşımının biyolojik anlayışla bağdaştırıldığında uygulanabilir bir örneklem olduğunu iddia ediyoruz. Bu kitap, bu yöndeki ilk adımdır. Kitapta ne var? Her bölüm bir problem için biyolojik nedeni tarif etmekte ve daha sonra probleme atfen bir sayısal yaklaşım taslağı çizmektedir. Bölümler ayrı ayrı okunabilir, her biri temel üniversite düzeyinin ötesinde ihtiyaç duyulan sayısal altyapıyı sunmaktadır. Biyolojik konu yelpazesi oldukça geniştir; evrim, genom, düzenleyici ağlar, filogeni ve daha fazlasını içermektedir. Kullanılan hesaplama teknikleri, olasılık ve grafiklerden, kombinatorik ve istatistiğe, algoritmalar ve karmaşıklığa kadar çeşitlilik göstermektedir. Ancak, materyalin ulaşılabilir olması için çaba sarf edilmiş ve karmaşık detaylardan (bu kısım ilgili okuyucular tarafından referanslar kullanılarak doldurulabilir) kaçınılmıştır. Şekil 1 de her bir bölümün değindiği biyolojik konu ve analizlerde kullanılan sayısal alanlar gösterilmektedir. Doğal olarak pek çok bölüm çoklu biyolojik ve hesaplama alanları ihtiva etmektedir. Theodosius Dobzhansky nin ünlü alıntısını Biyolojide evrimin ışığı olmadıkça hiçbir şey anlamlı değildir takiben değinilen konuların neredeyse tümünde evrimin rol oynaması şaşırtıcı değildir.
Ön söz xix Şekil 1 Her bir bölüm için biyolojik ve sayısal konular arasındaki bağıntı. Aradaki bağlantılar bölümlerdir ve kenardakiler her bir bölümün kapsadığı biyolojik konulara (sağda) ve uyguladığı sayısal konulara (solda) bağlamaktadır. Uygulanan matematiksel kavramların pedagojik yaklaşımı, stili, uzunluğu ve derinliği bölümden bölüme büyük ölçüde değişebilir. Dahası, farklı bölümlerdeki aynı matematiksel kavramı (örnek, grafik teorisi) tarif eden notasyon ve sayısal sistem dahi değişebilir. Bilgisayar bilimcilerinin dediği gibi, bu bir hata değil özelliktir: yazarlara kendi pedagojik hedeflerine en iyi uyan yaklaşımı seçmede tam özgürlük sağlanmıştır. Aslında bilgisayar biliminin biyologlara nasıl tanıtılacağı üzerinde henüz bir fikir birliği yoktur ve önde gelen biyoenformatikçilerin aynı pedagojik sorunu nasıl ele aldıklarını görmenin önemli olduğunu düşünmekteyiz. Bu kitap nasıl gelişecek? Biyologlar için Biyoenformatik gelişmekte olan bir kitap projesidir: tüm eğitimcilerin kitabın gelecekteki basımlarına katkılarını bekliyoruz. Sayısal kültürün biyoloji eğitimine girişini, sürekli gelişen ve kendi kendini örgütleyen bir süreç olarak görüyoruz: 2. baskıdan itibaren öğrenciler ve eğitimcilerden gelen dönütler üzerine, notasyonlar ve pedagojik yapıyı birleştirmek için çalışacağız. Bu arada, eğitimcilerin öğretmeyi istedikleri kurslar için özel müstakil bölümleri seçme tercihleri olacaktır.
xx Ön söz Bu kitap nasıl kullanılır? Bölümler müstakil oldukları için her biri ayrı olarak çalışılabilir veya öğretilebilir ve herhangi bir sıraya göre takip edilebilir. Daha geniş bir bakış açısı için, beş biyolojik içeriğin her birinden bir örnek başlık kapsayacak şekilde seçim yapılabileceği gibi tek bir içerik daha derinlemesine incelenecek şekilde de seçilebilir. Her bir bölümü takip eden tekrar soruları materyalin özümsenmesi açısından yararlıdır. İnternet sitesinde verilen ek kaynaklar öğretmenlere derslerini hazırlamalarında ve öğrencilere de konunun daha geniş ve derin kavranması açısından yararlı olacaktır. Kitabın internet sitesi Bu kitap, öğretim materyallerini, sunumları ve diğer güncellemeleri içeren www. cambridge.org/b4b internet sitesi ile beraber sunulmaktadır. Bunlar, hem eğiticilere hem de öğrencilere yardımcı olacaktır. Yazarlar Bu kitaba katkıda bulunan bilim adamları hem araştırma hem de eğitim açısından tecrübeli, önde gelen sayısal biyologlardır. Bazıları sayısal araştırmalarının gelişmeye ihtiyacından dolayı yıllar içerisinde sayısalcı olan biyologlardır. Diğer kısmı ise aslen sayısal geçmişi olan ve sonrasında araştırma eğilimleri ve gelişen çalışma alanı sebebiyle biyolojiye kayan bilim insanlarıdır. Tümü biyoloji öğrencilerine sayısal düşünceleri aktarırken ihtiyaç ve zorlukları deneyimlemiş ve hepsi, bu durumu kitaba katkıda bulunma çabalarını haklı çıkaracak şekilde önemli bir konu olarak görmektedir. Bütün yazarlar projeye kendilerini adamış durumdadırlar.