Türkiye deki Üniversiteleri İnternet te Daha Görünür Kılan Faktörler Harald Schidbauer İstanbul Bilgi Üniversitesi İşlete Bölüü harald@bilgi.edu.tr Vehbi Sinan Tunalığlu İstanbul Bilgi Üniversitesi Bilgisayar Bilileri Bölüü vst@bilgi.edu.tr 8 Kası 2006 Can Burak Çilingir İstanbul Bilgi Üniversitesi Bilgisayar Bilileri Bölüü cbcilingir@bilgi.edu.tr Özet Akadei İnternet tarafından nasıl kabul görektedir? İnternet hangi özellikleri barındıran üniversiteleri daha görünür kılaktadır? Akadeik yayın sayısının, üniversitenin büyüklüğünün ya da yaşının bu knuda bir önei var ıdır? Özgür yazılı kullanıının ya da üniversitenin knuşlandığı şehrin İnternet araa trlarında indekslenesine bir katkısı labilir i? Bu srular dğrultusunda, Türkiye de faaliyet gösteren üniversitelerin İnternet te gösterdikleri varlığın hangi faktörlerle açıklanabilir, hangileriyle açıklanaaz lduğu yönündeki bulgularıızı sunaktayız. 1 Giriş İnternet, akadeik alanda faaliyet gösteren kuruluşların he perasynel anlada veri, bilgi ve iletişi gereksinilerini karşılaakta, he de bu kuruluşların prsynu için öneli bir bşluğu dlduraktadır. Benzer şekilde İnternet de, akadeik kuruluşlar tarafından gerek alt yapı, gerek standartlar ve gerekse bilgi alanında yapılan çalışalarla beslenektedir. Bu bağlada, İnternet ve akadeik kuruluşun geri besleeli bir ekaniza çerçevesinde sıkı bir ilişkisi söz knusudur. İnternet kii akadeik kuruluşların ön plana çıkasına ikan sağlarken, kiilerini daha zr görünür kılaktadır. Bu duruun gözlelenesi ve istatistiki yöntelerle açıklanası ükün üdür? Üniversiteler, kendilerini İnternet te daha görünür kılak için neler yapalıdırlar? Bu çalışada, Türkiye de faaliyet gösteren üniversitelerin İnternet te gösterdikleri varlığın hangi faktörlerle açıklanabilir, hangileriyle açıklanaaz lduğu yönündeki bulgularıızı sunaktayız. 2 Veri Seti 2.1 Hedef Değişken Giriş bölüünde anlattıklarıızın ışığında, araştıraızda açıklaak istediğiiz değişken larak, Türkiye de faaliyet gösteren devlet ve vakıf üniversitelerinin İnternet teki varlıklarını seçtik. Halihazırda, İnternet in anni ve gayrı-hiyerarşik dğası gereği, böyle bir bilginin resi bir kuru tarafından sunulsa dahi geçerliliğini nesnel kşullar altında dğrulaak ükün layabilir. Bu sebepten, bahsi geçen değişkenin perasynalize edilesi zr bir iştir. Bu engeli aşak için seçtiğiiz yönte, yğun larak başvurulan bir araa trunda indekslenen üniversite sayfalarının sayısını kullanaktır. 1
Ggle'da Indekslenen Sayfa Sayilari Ggle'da Indekslenen Sayfa Sayilari Sayfa Sayisi 0e+00 1e+05 2e+05 3e+05 4e+05 5e+05 6e+05 lg(sayfa Sayisi) 5 6 7 8 Şekil 1: Üniversitelerin İnternet teki varlığına ilişkin verinin iki çubuklu gösterii Universitelerin Yas Verisi Universitelerin Lgaritali Yas Verisi Yas 0 20 40 60 80 100 lg(yas) 0 1 2 3 4 Şekil 2: Üniversitelerin yaş bilgisinin iki çubuklu gösterii Kuruluş Tipi Sayı 54 Vakıf 26 2 Tabl 1: Üniversitelerin kuruluş tiplerine göre sayıları Veriler Ggle araa trundan elde edildi. Herbir veri, bahsi geçen üniversitenin alan adı ve alt alan adlarında sunulakta lan web sayfalarının kaç tanesinin Ggle tarafından indekslendiğine işaret etektedir. Bu sayılar Ggle tarafından her araa sayfasında yaklaşık larak sunulaktadır. Üniversitelerin İnternet teki varlığına ilişkin verinin iki çubuklu gösterii 1 nuaralı şekilde veriliştir. 2.2 Açıklayıcı Değişkenler 2.2.1 Gelenek ve Genel Yapı Geleneğin zaanla luşup kurusallaşacağı varsayıından yla çıkarak, üniversitelerin kuruluş tarihlerini, dlayısıyla yaşlarını, geleneği tesil eden bir değişken larak kullanıyruz. Benzer şekilde, genel yapı ise üniversitenin devlet ya da vakıf kuruluşu lasıyla tesil ediliyr. Üniversitelerin yaşlarına dair verinin iki çubuklu gösterii 2 nuaralı şekilde sunulurken, üniversitelerin kuruluş tiplerine göre sayıları da 1 nuaralı tablda veriliştir. 2
Universitelerin Yayin ve Atif Verisi Universitelerin Yayin ve Atif Verisi Yayin ve Atif Sayisi 0 20 40 60 80 100 lg(yayin ve Atif Sayisi) 0 1 2 3 4 Şekil 3: Üniversitelerin yayın ve atıf verisi 2.2.2 Akadeik Aktivite Akadeik aktiviteyi, üniversitelere ilişkin yayın ve atıf sıralaalarından yla çıkarak perasynalize ediyruz. Bu veriyi Ulusal Akadeik Ağ ve Bilgi Merkezi nin veritabanından [3] elde ettik. Veri, indeks tipine bakılaksızın bütün dküan tipleri için her bir üniversitenin 2005 yılına dair kayıtlarından üteşekkildir. Üniversite başına düşen akadeik yayın ve atıfın ikili çizgi gösterii 3 nuaralı şekilde veriliştir. 2.2.3 Eğiti Aktivitesi Üniversitelerin eğiti yükü, tpla öğrenci ve akadeisyen sayıları tarafından tesil ediliyr. Bu veriyi tplaak için Tebesir.c [4] sitesinde yer alan Üniversite Rehberi başlığında yayınlanış üniversite tanıtı bilgilerinden faydalandık. Verilerin tutarlılığını dğrulaak için Milliyet.c [4] sitesinde yayınlanan diğer aa nispeten eski bilgilerden üteşekkil Üniversite Rehberinden yararlandık. Üniversitelerin öğrenci ve akadeisyen sayıları verilerinin ikili çizgi gösterii 4 nuaralı şekilde veriliştir. 2.2.4 İletişi Teknljileri Bağlaında Altyapı Çalışaları IP adresinden alan adı srgulaasına gelen cevabın akinanın ana alan adını içereesi kiileri tarafından güvenlik açığı başlığı altında yrulanırken, bazı uzanlar duble reverse lkup is nt a security easure başlıklı yazıda [2] bahsedilen sebeplerden dlayı duruu böyle yrulaaaktadır. Yine aynı yazıda bahsi geçen, reverse DNS kaydının bulunaası ya da akinanın kendi alan adını içereesi 1 bu araştıraızda güvenlik açığına işaret etekten ziyade, altyapı çalışalarının eksikliğini gösterektedir. Bir üniversitenin kendi İnternet altyapısını yönetedeki yetisi ve gayretini bu bilgi dğrultusunda perasynalize ediyruz. Bu aaçla, üniversitelerin alan adlarının reverse DNS kayıtlarında kendi sunucularını ı yksa başka veri erkezlerini i gösterdikleri bilgisine başvuruyruz. Üniversitelerin 52 sinde bu kayıt evcut iken, 30 unda ya reverse DNS kaydı yer alaakta, ya da kendilerine işaret eteektedir. 2.2.5 Özgür Yazılı Kullanıı İnternet altyapısının teel öğelerinden biri lan Unix kültürü araştıra labratuvarlarında dğuş, akadeik kuruluşların etkisiyle yayılış ve gelişiştir. Günüüzde gerek teknljik ve ticari - 1 Örneğiizde üniversitenin edu.tr uzantılı alan adı 3
Universitelerin Ogrenci Sayilari Universitelerin Ogrenci Sayilari Ogrenci Sayisi 0 10000 20000 30000 40000 50000 60000 lg(ogrenci Sayisi) 7 8 9 10 11 Universitelerin Akadeisyen Sayilari Universitelerin Akadeisyen Sayilari Akadeisyen Sayisi 0 1000 2000 3000 4000 5000 lg(akadeisyen Sayisi) 5 6 7 8 Şekil 4: Üniversitelerin öğrenci ve akadeisyen sayıları 4
İşleti Sistei Tipi Sayı özgür yazılı 26 üseccel yazılı 28 28 Tabl 2: İşleti sistei tiplerine göre sayılar Şehir Sayı Şehir Sayı Şehir Sayı ADA 1 AFYON 1 10 ANTALYA 1 AYDIN 1 BALIKESIR 1 BOLU 1 BURSA 1 CAKKALE 1 DENIZLI 1 DIYARBAKIR 1 EDIRNE 1 ELAZIG 1 ERZURUM 1 ESKISEHIR 2 GAZIANTEP 1 GEBZE 1 HATAY 1 ICEL 3 ISPARTA 1 22 IZMIR 5 KMARAS 1 KARS 1 KAYSERI 1 KIRIKKALE 1 KKTC 3 KOCAELI 1 KONYA 1 KUTAHYA 1 MALATYA 1 MANISA 1 MUGLA 1 NEVSEHIR 1 NIGDE 1 SAKARYA 1 SAMSUN 1 SANLIURFA 1 SIVAS 1 TOKAT 1 TRABZON 1 VAN 1 ZONGULDAK 1 Tabl 3: Şehirlere göre sayılar deli, gerekse ssyal yapısı gereği özgür yazılı yine akadeik caia tarafından büyük ölçüde kabul görektedir. Bunun hedef değişken üzerindeki lası etkisinin tespiti için web sunucularında kullanılan işleti sisteini veri larak kullanıyruz. Bu veriyi tplaak için kullandığıız araçlar web uygulaasını çalıştıran sunucu tarafından dışarıya verilen servislerden gelen verileri tpladı. Bu servisler, birazdan örnekleyeceğiiz gibi, çeşitli şekilde içerisinde işleti sistei ile ilgili veri barındıran kısa etinler 2 sunuyrlar. SMTP sunucusundan gelen bağlantı başlata verisi: 220 cs.bilgi.edu.tr ESMTP Exi 4.50 Mn, 10 Oct 2006 23:02:21 +0200 (Bu örnekte işleti sistei verisi bulunaaktadır). HTTP sunucusunun verdiği cevapta bulunan Server başlığı. Aradığıız veriyi bu servislerden edineediğiiz durularda, nap [1] adlı yazılıın bulgularını kullandık. Üniversitelerin web sunucularında kullanakta ldukları işleti sistelerine dair verinin özeti 2 nuaralı tablda sunuluştur. 2.2.6 Cğrafi Etkenler Üniversitelerin knuşlandığı şehirlerin, dlayısı ile degrafik yapının kabaca bir tesilinin hedef değişkeniiz üzerindeki etkisini test etek için, Yükseköğreti Kurulu nun sitesinde yayınlanan verilerden [5] faydalanıyruz. Üniversitelerin knuşlandığı şehirlerin verisine dair özeti 3 nuaralı tablda bulabilirsiniz. 2.3 Metdlji Veri setiizdeki örüntüleri keşif için iki yönte uyguladık. Bu yöntelerden birincisi, verilerin farklı kbinasynlarıyla çizilen grafikleri üzerinden çıkarılarda bulunak; ikincisi ise bir 2 banner 5
dğrusal regresyn kullanarak, hedef değişken ve açıklayıcı değişkenler arasındaki ilişkiyi delleektir. Bulgular bölüünde, yeri geldikçe iki yöntee de değineceğiz. 3 Bulgular ve Snuç Üniversitelerin İnternet teki varlıklarının açıklanasında, 2 nuaralı bölüde bahsi geçen değişkenler arasından en önelisi akadeik aktivite larak öne çıkaktadır. Bir diğer öneli bulgu ise, iletişi teknljilerindeki kpetanlığının, üniversitenin İnternet teki varlığını arttırdığı bilgisinin del açısından anlalı lduğu ve delin açıklaa gücünü arttırdığı yönündeki göstergedir. Öte yandan, eğiti aktivitesi, bir diğer deyişle de üniversitenin büyüklüğü, önesiz bir değişken larak dikkati çekektedir. Aynı şekilde, ilginçtir ki, üniversitenin yaşının hedef değişken üzerindeki etkisi del açısından önesizdir. Mdel bağlaında sn bulguuz, üniversite tipinin vakıf lduğu durularda, diğer kşullar aynı kalak kşuluyla, hedef değisken üzerinde lulu bir etkisi vardır. Bu duruu daha net bir şekilde gösterek aacıyla 5 nuaralı şekli sunaktayız. Mdeliizin sn hali aşağıdaki gibidir: Call: l(frula = lg.ggle.estiated.search.result.size ~ lg.n.f.published.papers + des.reverse.dns.reslve.t.self + uni.type) Residuals: Min 1Q Median 3Q Max -2.6595-0.7410 0.0688 0.6019 2.3943 Cefficients: Estiate Std. Errr t value Pr(> t ) (Intercept) 4.8816 0.6318 7.726 5.83e-11 *** lg.n.f.published.papers 0.8383 0.1164 7.199 5.40e-10 *** des.reverse.dns.reslve.t.self1 0.5936 0.2735 2.171 0.0333 * uni.type 0.9001 0.3758 2.395 0.0193 * --- Signif. cdes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard errr: 1.083 n 70 degrees f freed Multiple R-Squared: 0.5259,Adjusted R-squared: 0.5056 F-statistic: 25.88 n 3 and 70 DF, p-value: 2.244e-11 Verilerin var lan haliyle web sunucusunda çalışan işleti sisteini dele dahil ettiğiizde he delin gücü düşektedir, he de bu değişkenin hedef değişken üzerindeki etkisi anlasız çıkaktadır. Bunun sebebinin değişkendeki evcut layan satırlardan kaynaklandığını düşünüyruz. Çünkü, aslında değişkenin bu haliyle bile bir bilgi sağladığını, sunduğuuz 6 nuaralı şekilde görebilirsiniz. Grafiğin üst sağ bölüünde yğunlaşan 3 özgür yazılı küesi ve sl alt bölüde yğunlaşan üseccel yazılı küesi, gerek akadeik gerekse İnternet bağlaında öne çıkan üniversitelerin ve ta tersinin tercihlerini rtaya kyaktadır. Sn larak, üniversitenin faaliyet gösterdiği şehrin hedef değişken üzerindeki etkisi yine bir saçılı grafiğiyle anlaşılabilir. Büyük şehir etkisi larak betileyebilecegiiz bu etkiyi 7 nuaralı şekilde görebilirsiniz: Ankara ve İstanbul çk büyük randa regresyn çizgisinin üzerinde kalaktadır. Snuç larak, Türkiye de faaliyet gösteren üniversitelerin İnternet te gösterdikleri göreceli varlıklarının aşağıdaki faktörler tarafından açıklanabilir ya da açıklanaaz lduğunu bilgilerinize sunuyruz: 3 Herhangi bir spekülasyna yl açaak için larak gözüken gözlelerin çğunda web sunucusunun Unix dagası sunduğunun ve uhteelen bu sunucunun işleti sistei larak özgür yazılı kullandığının bilgisini sadece bir dipnt larak düşüyruz. 6
Universite tipi ve araa snuclari yayinlar Uni. Icin Regresyn Cizgisi Uni. Icin Regresyn Cizgisi lg(araa snuclari) 6 8 10 12 1 2 3 4 5 6 7 lg(yayin sayisi) Şekil 5: Üniversite tipinin hedef değişken üzerindeki etkisi Web sunucusu isleti sistei ve araa snuclari yayinlar Ozgur Yazili Museccel Yazili lg(araa snuclari) 6 8 10 12 1 2 3 4 5 6 7 lg(yayin sayisi) Şekil 6: İşleti sistei tipinin hedef değişken üzerindeki etkisi 7
Sehir ve araa snuclari yayinlar lg(araa snuclari) 6 8 10 12 KKTC K.MARAS MALATYA ESKISEHIR IZMIR IZMIR KAYSERI ADA GAZIANTEP BALIKESIR ICEL ANTALYA AYDIN BURSA KKTC VAN TRABZON ISPARTA KOCAELI CAKKALE ZONGULDAK BOLU DENIZLI KONYA IZMIR EDIRNE SAMSUN GEBZE SIVAS ERZURUM DIYARBAKIR MANISA KUTAHYA NIGDE ELAZIG AFYONSANLIURFA ESKISEHIR MUGLA TOKAT HATAY KIRIKKALE SAKARYA IZMIR KARS 1 2 3 4 5 6 7 lg(yayin sayisi) Şekil 7: Şehrin hedef değişken üzerindeki etkisi Akadeik aktivite lulu yönde etkileektedir. Eğiti aktivitesi kayda değer bir etki göstereektedir. Üniversitenin kendi İnternet alt yapısını yönete yönündeki ısrarlı ve başarılı tutuu lulu bir etki sergileektedir. Verideki yetersizlikler nedeniyle özgür yazılı kullanıı del içerisinde etki yaratıyr ise de, sanıız özgür yazılı kullanıı knusundaki eğiliin üniversitenin İnternet te varlık gösteresini lulu yönde etkileekte lduğu yönündedir. Vakıf ya da devlet üniversitesi lak araştıraız bağlaında bir örüntü sergileektedir ve diğer değişkenleriiz sabit kalak kşuluyla vakıf üniversiteleri İnternet te daha fazla varlık gösterektedir. Üniversitenin faaliyet gösterdiği şehir uhteelen vakıf/devlet ikileine bağlı larak İnternet teki varlığı etkileektedir. Kaynaklar [1] http://insecure.rg/nap/nap-fingerprinting-article.txt [2] duble reverse lkup is nt a security easure, Jnathan de Byne Pllard. http:// hepages.tesc.net/j.debynepllard/fga/dns-avid-duble-reverse.htl ya da yansı: http://www.canb.net/s/htl/dns-avid-duble-reverse.htl [3] Ulusal Akadeik Ağ ve Bilgi Merkezi, http://www.ulakbi.gv.tr/ [4] Tebesir.c, http://www.tebesir.c/ [5] Yükseköğreti Kurulu, http://www.yk.gv.tr/ 8