VERİ MADENCİLİĞİ Sosyal Ağlar

Benzer belgeler
UYUM ĐYĐLĐĞĐ TESTĐ. 2 -n olup. nin dağılımı χ dir ve sd = (k-1-p) dir. Burada k = sınıf sayısı, p = tahmin edilen parametre sayısıdır.

Sosyal Ağlar ve Yayılım

ÇOKLU REGRESYON MODELİ, ANOVA TABLOSU, MATRİSLERLE REGRESYON ÇÖZÜMLEMESİ,REGRES-YON KATSAYILARININ YORUMU

Sürekli Olasılık Dağılım (Birikimli- Kümülatif)Fonksiyonu. Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK

dir. Bir başka deyişle bir olayın olasılığı, uygun sonuçların sayısının örnek uzaydaki tüm sonuçların sayısına oranıdır.

Veride etiket bilgisi yok Denetimsiz öğrenme (unsupervised learning) Neden gereklidir?

VERİ MADENCİLİĞİ Farklı Demetleme Yöntemleri

VEKTÖRLER VE VEKTÖREL IŞLEMLER

3. Parçaları Arasında Aralık Bulunan Çok Parçalı Basınç Çubukları

ELEKTRİK DEVRE TEMELLERİ

Korelasyon ve Regresyon

Merkezi Eğilim (Yer) Ölçüleri

BÖLÜM 5 İKİ VEYA DAHA YÜKSEK BOYUTLU RASGELE DEĞİŞKENLER İki Boyutlu Rasgele Değişkenler

YÖNETİM VE EKONOMİ Yıl:2006 Cilt:13 Sayı:1 Celal Bayar Üniversitesi İ.İ.B.F. MANİSA

X, R, p, np, c, u ve diğer kontrol diyagramları istatistiksel kalite kontrol diyagramlarının

Sosyal Ağlar ve Kütüphaneler. Tuba Akbaytürk Çanak

Çizgeler (Graphs) Doç. Dr. Aybars UĞUR

BMT 206 Ayrık Matematik. Yük. Müh. Köksal GÜNDOĞDU 1

2 MANYETİZMA. 7. Etki ile mıknatıslanmada mıknatısın 5. K L M F F S N S N S N

6. NORMAL ALT GRUPLAR

Tanımlayıcı İstatistikler

16. Dörtgen plak eleman

Bilgisayarla Görüye Giriş

İÇME SUYU ŞEBEKELERİNİN GÜVENİLİRLİĞİ

ANOVA. CRD (Completely Randomized Design)

VERİ MADENCİLİĞİ Demetleme Yöntemleri

Sosyal Ağlar, Analiz Yöntemleri ve Araçları. Mehmet Gençer

Uzay Çetin. Netlogo ve R ile Sosyal Ağ Analizi uygulaması Nejat Kutup, Uzay Çetin

Doğrusal Korelasyon ve Regresyon

BETONARME YAPI TASARIMI

kadar ( i. kaynağın gölge fiyatı kadar) olmalıdır.

GM-220 MÜH. ÇALIŞ. İSTATİSTİKSEL. Frekans Dağılımı Oluşturma Adımları VERİLERİN SUNUMU. Verilerin Özetlenmesi ve Grafikle Gösterilmesi

A İSTATİSTİK. 4. X kesikli rasgele (random) değişkenin moment çıkaran. C) 4 9 Buna göre, X in beklenen değeri kaçtır?

Gephi Uygulamalı Sosyal Ağ Analizi

PARAMETRİK OLMAYAN HİPOTEZ TESTLERİ Kİ-KARE TESTLERİ

OLASILIK. Bölüm 4. Temel Tanımlar ve Kavramlar-I. Olasılık

ITAP_Exam_20_Sept_2011 Solution

Bir Alışveriş Merkezinde Hizmet Sektörü Đçin En Kısa Yol Problemi ile Bir Çözüm

Sıklık Tabloları ve Tek Değişkenli Grafikler

PARÇALI DOĞRUSAL REGRESYON

Communication Theory

Rasgele Değişken Üretme Teknikleri

Cebir Notları. Karmaşık Sayılar Testi z = 1 2i karmaşık sayısının çarpmaya göre tersinin eşleniğinin sanal kısmı kaçtır?

Manyetizma Testlerinin Çözümleri. Test 1 in Çözümü

Çok Parçalı Basınç Çubukları

ITAP Fizik Olimpiyat Okulu

YZM 2116 Veri Yapıları

OLASILIK KURAMI. Temel Tanımlar ve Kavramlar-III. Temel Tanımlar ve Kavramlar-II. Temel Tanımlar ve Kavramlar-I OLASILIK

SEK Yönteminin Güvenilirliği Sayısal Bir Örnek. Ekonometri 1 Konu 11 Sürüm 2,0 (Ekim 2011)

Fizik 101: Ders 15 Ajanda

VERİ YAPILARI. GRAPH LAR Düzce Üniversitesi Teknoloji Fakültesi ÖĞR.GÖR.GÜNAY TEMÜR 1

5.3. Tekne Yüzeylerinin Matematiksel Temsili

11. z = 1 2i karmaşık sayısının çarpmaya göre tersinin eşleniğinin sanal kısmı kaçtır? 14. eşitliğini sağlayan z karmaşık sayısı kaçtır? 15.

Levent Özen.

AJANDA LİTERATÜR TARAMASI

Tek Yönlü Varyans Analizi (ANOVA)

Makine Öğrenmesi 6. hafta

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi

KULLANILMASI. GiRiş. KAVRAM HARiTASı NEDiR

Doku ve Hastalıklara Özgü Büyük Ölçekli Biyolojik Ağları Oluşturul ası ve Analizi

KARMAŞIK SAYILAR. Derse giriş için tıklayın...

TE;ŞHİS MODELLERf ;; KİSİLERARASI CATISMA VE CATISMAYI. Dilaver TENGİLİl\10GLU*

TEKNOLOJĐK ARAŞTIRMALAR

Tek Yönlü Varyans Analizi

( ) 3.1 Özet ve Motivasyon. v = G v v Operasyonel Amplifikatör (Op-Amp) Deneyin Amacı. deney 3

ITAP Fizik Olimpiyat Okulu

DENEY 4: SERİ VE PARALEL DEVRELER,VOLTAJ VE AKIM BÖLÜCÜ KURALLARI, KIRCHOFF KANUNLARI

T.C. AİLE ve SOSYAL POLİTİKALAR BAKANlIGI. SOSYAL YARDIMLAR GENEL MÜOÜRlÜGÜ ÜSKÜOAR SOSYAL YARDıMLAŞMA VE DAYANIŞMA VAKfı HANE BEYAN FORMU.

Türk Dilinin Biçimbilim Yapısından Yararlanarak Türkçe Metinlerin Farklı İmgelere Ayrılarak Kodlanması ve Sıkıştırılması

Metin Madenciliği ile Soru Cevaplama Sistemi

TRANSFORMATÖRLER BÖLÜM 7. Alıştırmalar. Transformatörler. Sınıf Çalışması

İki veri setinin yapısının karşılaştırılması

uzayında vektörler olarak iç çarpımlarına eşittir. Bu iç çarpım simetrik ve hem w I T s formuna karşılık gelir. Buna p u v u v v v

TESADÜFİ DEĞİŞKENLERLE İLGİLİ BAZI YAKINSAKLIK ÇEŞİTLERİNİN KARŞILAŞTIRILMASI

ENDÜSTRİNİN DEĞİŞİK İŞ KOLLARINDA İHTİYAÇ DUYULAN ELEMANLARIN YÜKSEK TEKNİK EĞİTİM MEZUNLARINDAN SAĞLANMASINDAKİ BEKLENTİLERİN SINANMASI

Kİ-KARE TESTLERİ. şeklinde karesi alındığında, Z i. değerlerinin dağılımı ki-kare dağılımına dönüşür.

Önerilen süre dakika (22 puan) dakika (16 puan) dakika (38 puan) 4. 9 dakika (24 puan) Toplam (100 puan) Ġsim

OLASILIĞA GİRİŞ. Biyoistatistik (Ders 7: Olasılık) OLASILIK, TIP ve GÜNLÜK YAŞAMDA KULLANIMI

bir yol oluşturmaktadır. Yine i 2 , de bir yol oluşturmaktadır. Şekil.DT.1. Temel terimlerin incelenmesi için örnek devre

BAŞKENT ÜNİVERSİTESİ MAKİNE MÜHENDİSLİĞİ BÖLÜMÜ MAK MAKİNE MÜHENDİSLİĞİ LABORATUVARI DENEY - 8

Elektrik ve Manyetizma

Sistemde kullanılan baralar, klasik anlamda üç ana grupta toplanabilir :

YER ÖLÇÜLERİ. Yer ölçüleri, verilerin merkezini veya yığılma noktasını belirleyen istatistiklerdir.

Bölüm 3. Tanımlayıcı İstatistikler

Algoritma Geliştirme ve Veri Yapıları 10 Graf Veri Modeli. Mustafa Kemal Üniversitesi

Standart Model (SM) Lagrange Yoğunluğu. u, d, c, s, t, b. e,, Şimdilik nötrinoları kütlesiz Kabul edeceğiz. Kuark çiftlerini gösterelim.

İSTATİSTİK DERS NOTLARI

Farklı Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = σ i2. Eşit Varyans. Hata. Zaman

TRANSPORT PROBLEMI için GELIsTIRILMIs VAM YÖNTEMI

TEKLİF MEKTUBU SAĞLIK BAKANLIĞI_. '.. m

Işığın Kırılması Test Çözümleri. Test 1'in Çözümleri 3. K

DERSİN ADI PAZARTESİ YİYECEK İÇECEK SERVİSİ I 09: SALI YABANCI DİL I 15: ÇARŞAMBA TÜRK DİLİ I 13:00 204

Elektrik Akımı. Test 1 in Çözümleri. voltmetresi K-M arasına bağlı olduğu için bu noktalar arasındaki potansiyel farkını ölçer. V 1. = i R KM 1.

MIT Açık Ders Malzemeleri Bu materyallerden alıntı yapmak veya Kullanım Koşulları hakkında bilgi almak için

T. C. GÜMÜŞHANE ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ MAKİNE MÜHENDİSLİĞİ BÖLÜMÜ MAKİNE MÜHENDİSLİĞİ DENEYLER 1 ÇOKLU ISI DEĞİŞTİRİCİSİ DENEYİ

Transkript:

Sosyal Ağ VERİ MADENCİLİĞİ Sosyal Ağlar Yrd. Doç. Dr. Şule Gündüz Öğüdücü Sosyal ağ kşler arasındak lşklern oluşturduğu br yapıdır Sosyal ağ ncelemes: ağ yapısının, kşler ya da gruplar (topluluklar) arasındak lşklern ve blg akışının ncelenmes L.C. Freeman, Vsualzng Socal Networks. Journal of Socal Structure, 000. Sosyal İlşkler: Çzge Düğümler: Kşler Ayrıtlar: sosyal lşkler ale, arkadadaş, ş Çzge G(V,E) V: düğümler kümes E: Ayrıtlar kümes Benzerlk Matrs S. Mlgram (967) Yakınlığın Altı Dereces: Sx Degrees of Separaton 3 Sosyal Ağların Özellkler Farklı (doğal) ağlar sosyal, byolojk, teknk, çerk.. Ortak özellkler Çok büyük, dnamk: düğümler, ayrıtlar ekleneblr/slneblr düğümler hang düğümlerle lşkde olacaklarına kendler karar veryorlar düğümler arası etkleşm ayrıtlarla sınırlı uzaklık/benzerlk çn soyut blg: coğraf, çerk, lşkler Sosyal ağ kuramı: lnk analz Farklı ağların genel özellkler nelerdr? Bu özellkler nasıl belrlenr, nasıl ölçülür? 4 Sosyal Ağların Özellkler Tanımlar Uzunluk (d G (s,t)): Ik düğüm (s,t) arasındak en büyük, en küçük, ortalama uzaklık Ik düğüm arasında bulunan yoldak ayrıt sayısı Ik düğüm arasında bulunan yoldak ayrıtların ağırlıklarının toplamı Derece: yönlü se düğüme gelen (n-lnk) / düğümden çıkan (out-lnk) bağlantıların sayısı Merkez: Ağdak dğer düğümlern bağlı olduğu br ya da br kaç düğüm Yoğunluk: Ağdak bağlantı sayısının olası bütün bağlantı sayısına oranı 5 σ st σ ts s ve t (s,t V) düğümler arasındak en kısa yol sayısı -> σ ss σ st (v): v V düğümünün üzernde bulunduğu s ve t düğümler arasındak en kısa yol sayısı C ( v) c t V d ( v, t) CG ( v) max d ( v, t) G t V Cs ( v) σ ( v) C ( v) B st s v t V s v t V G σ st ( v) σ st closeness centralty (Sabduss, 966) graph centralty (Hage and Harary, 995) stress centralty (Shmbel, 953) betweenness centralty (Freeman, 977; Anthonsse, 97) Ulrk Brandes, A Faster Algorthm for Betweenness Centralty, Journal of Mathematcal Socology 5():63-77, (00). 6

Tanımlar Sosyal Ağların Yeteneğ Hzp (Clque): seçleblecek her düğüm çft arasında br bağ olan alt çzge tam bağlı alt çzge Daha zayıflatılmış N-Hzp (N-Clque): Br düğümün çnde bulunduğu alt çzgedek dğer tüm düğümlere olan uzaklığı en çok N olablr N-Klan (N-Clan): N-Hzptek düğüm çftler arasındak yollar üstündek düğümler de N-Hzp üyes K-Plexes: Br düğümün n düğümden oluşan br N-Hzp çndek en az n-k düğüm le doğrudan bağlı olması Kestleme noktası (Cut Ponts): Bağlı olan br G çzgesnden, v düğümü ve bu düğüme bağlı olan bütün ayrıtlar çıkarıldığında oluşan G-v çzges bağlı değl se v kestleme noktasıdır. Özellk Derece (Degree) Yakınlık Ara düğüm Tanım Br düğümün bağlantı sayısı Dğer düğümlere olan yolun uzunluğu İk düğüm arasında yer alan düğüm Etk daha fazla seçenek Dğer düğümlerle doğrudan etkleşm Dğer k düğüm arasında lşkye sağlamak/kesmek 7 8 Problemler Web de Sosyal Ağlar Bağlı parçalar: kaç parça, büyüklükler ne, ne kadar bağlılar Ağ çapı: en uzak ortalama Bağlı olmayan düğümler / parçalar Küçük dünya özellğ Demetleme Gruplaşan lşkler/düğümler Örtüşen gruplar Grup ç ve gruplar arası lşklern oranı Grup ç ve gruplar arası lşklern rolü Ağın yapısı düğümlern dereces k : düğümünün dereces, N : düğümünün komşular kümes lşklern ağırlığının dağılımı ağ çnde öneml rolü olan düğümler: k grubu brbrne bağlayan Facebook Myspace LnkedIn Classmates Orkut Bebo Medya paylaşım steler: YouTube Flckr 9 0 Sosyal Ağlar çn Modeller Rassal çzgeler (Random Graphs: Erdös-Rény models) Watts-Strogatz modeller Scale-free Networks Boyd, D. M., & Ellson, N. B. (007). Socal network stes: Defnton, hstory, and scholarshp. Journal of Computer-Medated Communcaton, 3(), artcle. http://jcmc.ndana.edu/vol3/ssue/boyd.ellson.html

Rassal Ağlar Erdös-Rény (ER) Model: 959 yılında Paul Erdös ve Alfred Rény düğüm sayısı N, k düğüm arasında ayrıt olasılığı p, G(N,p) p /N, p /N, p /N, p0/n, p log(n)/n... N(N-)/ adet hlel yazı tura atma Derece dağılımı N çok büyük olduğunda Posson dağılımı G(N,p) le br çzge oulştur, rastgele br u düğümü Pr[deg(u) k]? Posson dağılımı ortalama λ p(n-) ~ pn Demetleme katsayısı (clusterng C coeffcent ) küçük C k λ e f ( k; λ) k! { e } λ : v j, vk N, e k ( k ) N C jk jk E 3 Erdös-Rény Model (960) Connect wth probablty p p/6 N0 k ~.5 Pál Erdös (93-996) Posson dstrbuton 4 Watts-Strogatz modeller: Caveman and Solara Erdos-Reny Ortak komşuları olması k düğüm arasında ayrıt olma olasılığını artırmıyor her ayrıt daha önceklerden bağımsız olarak oluşuyor Gerçekte oluşan ağ yapısına uygun değl k kşnn tanışma olasılığı ortak arkadaşları varsa daha fazladır Web de k sayfa brbrne bağlı se büyük olasılıkla aynı konudadırlar Watts Caveman: ayrıtların genel olarak yoğunluğu az k düğümün ortak komşuları varsa aralarında ayrıt olma olasılığı büyük Watts Solara ayrıtların genel olarak yoğunluğu az, br düğümün komşuları arasında ayrıt olma olasılığı farklı değl Erdos-Reny çzgesne benzer α-model α-model çn parametreler N düğüm sayısı k: ortalama derece p: k düğüm arasında ayrıt olma olasılığı α: yakın lşklern olasılığını artırmak çn parametre u,v düğüm çft çn m(u,v): ortak komşu sayısı R(u,v): k düğümün arasında ayrıt olma eğlm (propensty) m(u,v) > k, R(u,v) m(u,v) 0, R(u,v) p dğer durumlarda R(u,v) p + (m(u,v)/k)^α (-p) α çn Erdös-Reny çzgelerne benzyor 5 6 Watts-Strogatz Model Small Worlds - Occam s Razor Br dare etrafında eşt dağılmış N düğüm Her düğümün en yakın k komşusu arasında k ayrıt (yakın lşk) p olasılığı le br düğüme az sayıda rastgele ayrıt ekle (uzak lşk) farklı p değerler çn farklı çzgeler küçük α değerler çn demetleme katsayısı büyük Erdos-Reny çapı küçük α-model büyük demetleme katsayısı Occam s Razor farklı özellkler çn bast tek br model Watt s small world: çapı küçük demetleme katsayısı büyük Collectve dynamcs of 'small-world' networks Duncan J. Watts & Steven H. Strogatz 7 8 3

Örnek üç gerçek ağ üzernde nceleme Oyuncular batı bölgesndek güç santraller C.elegans snr sstem Small World Serbest Ölçekl Ağlar (Scale free): Örnek web düğümler web sayfaları ayrıtlar bağlantılar n k d c Actors 5,6 6 3.65 0.79 Power-grd 4,94.67 8.7 0.08 web örümcekler/web robotlar C.elegans 8 4.65 0.8 9 0 Serbest Ölçekl Ağlar Serbest Ölçekl Ağlar Düğüm sayısı N sabt değl Ağ sürekl yen düğümlern eklenmes/slnmes le değşyor web: yen sayfalar/steler eklenyor/slnyor yayınlar: yen yayınlar eklenyor Eklenen düğümlerle oluşan ayrıtlar ünform değl çok sayıda sayfanın/stenn bağlantı verdğ sayfaya/steye bağlantı verme olasılığı yüksek çok sayıda yayının referans gösterdğ yayının referans gösterlme olasılığı yüksek Pareto veya power law dağılımı çapı küçük (~log(n)) demetleme katsayısı çok büyük değl yakın komşuları le ayrıt olma olasılığı yüksek değl hub olan düğümlerle ayrıt oluşturma olasılığı yüksek Topluluk Belrleme Metabolk Proten S. Fortunato and C. Castellano, Communty Structure n Graphs, ArXv e-prnts Br çzge çnde ortak özellkler/görevler olan düğümler topluluğu aynı konudak web sayfaları benzer şleve sahp protenler aynı konuda çalışan nsan grupları aynı lg alanına sahp nsan grupları Topluluk çndek topolojk konumlarına göre düğümler sınıflandırılablr topluluğun merkeznde yer alan düğüm topluluğun sınırında yer alan düğüm Sosyal Ekonomk 3 4 4

Topluluk Tanımı Dar tanım Genş tanım Düğüm benzerlğ Dar Tanım Sadece alt çzgedek lşklere göre toplulukları belrlyor Örnek: Hzp, n-klan, k-plexes 5 6 Genş Tanım Düğüm benzerlğ Topluluk çzgnn yapısal br brm Düğümler brbrne benzer se aynı toplulukta Altçzgeler hem kend çndek lşkler hem de çzgenn ger kalanıyla olan lşkler le belrlenyor Null model: çnde topluluk bulunmayan çzge dar genş Erdös-Reny Newman-Grvan: düğümlern orjnal çzge le aynı dereceye sahp olduğu rassal çzge 7 8 Çzge Parçalama Örtüşen Topluluklar Graph Parttonng: Çzgey br düğüm br grupta kalacak şeklde gruplara (altçzgelere) bölme Problem: Gerçek dünyada br nesne brden fazla gruba üye olablr Örtüşen topluluklar Hyerarşk yapı G. Palla, I. Derény, I. Farkas, T. Vcsek, Uncoverng the overlappng communty structure of complex networks n nature and socety Nature 435, 84, 005 http://www.cfnder.org/ 9 30 5

Hyerarşk Yapı Altçzgeler tekrar parçalanablr Çzge Parçalama Hangs daya y A. Clauset, C. Moore, M.E.J. Newman, Herarchcal structure and predcton of mssng lnks Nature 453, 98, 008 3 3 İk Farklı Sonuç Brmsellk Üstünlüklern karşılaştırmak çn br krter Q Q(P) > Q(P) veya Q(P) < Q(P)? Modularty: Btşklk Matrs: m k u uv u, v V v V A A uv (u,v) E A uv 0 dger C { c, c,...}, c c ( j) e j a v c u c, v c j Q( G, C) j U c C A / m v uv k / m ( e a ) c V 33 34 Grvan-Newman Algortması Grvan-Newman Algortması M. Grvan & M.E.J Newman, Communty structure n socal and bologcal networks, PNAS 99, 78-786 (00) Toplulukları brbrne bağlayan ayrıtları belrle Betweenness bu ayrıtları slme brbrnden ayrık demetler. Bütün ayrıtların betweenness değerler hesaplanır. En büyük betweenness değerne sahp ayrıt slnr 3. Kalan ayrıtların betweenness değerler hesaplanır 4.. adıma ger dönülür 35 36 6

Gelştrlmş Grvan-Newman Algortması M.E.J. Newman & M. Grvan, Fndng and evaluatng communty structure n networks, Phys. Rev. E 69, 063 (004). Her düğüm br demet. Q değern en büyütecek k düğümü brleştr 3. Bütün düğümler tek demet olana kadar şleme devam et 4. En fazla Q değerne sahp demetlemey seç Problemler Örtüşen topluluklar Yönlü çzgeler Ağırlıklı çzgeler Karmaşıklık 37 38 7