İş Zekası Hafta 8 Web Analitiği, Web Madenciliği ve Sosyal Analitik Business Intelligence and Analytics: Systems for Decision Support 10e isimli eserden adapte edilmiştir
Bölüm Amaçları Web madenciliğini tanımlamak, taksonomisini ve uygulama alanlarını anlayabilmek Web içerik madenciliği ile web yapısı madenciliğini ayırt etmek Web arama motorlarını anlayabilmek Arama motoru optimizasyonu hakkında detayları öğrenmek Web kullanımı madenciliğini tanımlamak ve uygulama alanlarını anlamak Web analitiği olgunluk modelini tanımlamak Sosyal ağlar ve sosyal analitiği anlamak Müşterilerin daha iyi bağlanması için sosyal medya madenciliğinin kullanımını anlamak 10e isimli eserden adapte edilmiştir 2/36
Açılış Vakası Security Fisrt Insurance firması müşterileri ile bağlantılarını geliştiriyor!!! Genel Bilgiler Problem Tanımı Önerilen Çözüm Sonuçlar Vaka sorularının cevapları ve genel tartışmalar SFI ne yapıyor? SFI nin karşılaştığı temel engeller nelerdir Önerilen çözüm nedir ve hangi analitik bileşenleri içerir Web analitiği, metin madenciliği ve duygu analizi arasındaki bağlantıyı nasıl yorumlarsınız? İlk sonuçlar nedir? Herhangi bir sürpriz var mı? 10e isimli eserden adapte edilmiştir 3/36
Wen Madenciliği Genel Görünümü Web en büyük veri deposudur Veriler HTML, XML ve metinler ile tutulur Web verisini işlerken hangi zorluklar ile karşılaşılabilir Web efektif bir madencilik için çok büyüktür Web fazlasıyla karmaşıktır Web fazlasıyla dinamiktir Web belli bir alan odaklı değildir Kısaca web «HERŞEY»i içerir. Zorluklar büyük ama «FIRSATLAR» da bir o kadar fazla!!! 10e isimli eserden adapte edilmiştir 4/36
Web Madenciliği Web madenciliği (Web veri madenciliği) web verileri arasındaki (metin, link, kullanım, log ) ilişkileri ortaya çıkarma sürecidir Web madenciliği = internette üretilen veriler üzerindeki veri madenciliği??? Web verileri İçerik, link, log Web madenciliği vs. web analitik 10e isimli eserden adapte edilmiştir 5/36
Web Madenciliği Veri Madenciliği Metin Madenciliği WEB MADENCİLİĞİ Web İçerik Madenciliği Kaynak: Genellikle yapısal olmayan web sayfaları (HTML, XML) Web Yapısı Madenciliği Kaynak: Web sayfalarında yer alan linkler (bağlantılar) Web Kullanım Madenciliği Kaynak: Web sayfası ziyaretlerinin ayrıntılı bilgileri (tıklama, log) Arama Motorları Duygu Analizi Semantik Web Web Analitiği Sayfa Sıralamaları Bilgi Kazanımı Grafik Madenciliği Sosyal Analitik Tıklama Analizi Arama Motoru Optimizasyonu Sosyal Ağ Analizi Sosyal Medya Analizi Log Analizi Pazarlama İlişkilendirmesi Müşteri Analitiği 360 o Müşteri Görünümü 10e isimli eserden adapte edilmiştir 6/36
Web İçeriği / Yapısı Madenciliği Web de yer alan metinsel ifadeler üzerindeki madencilik Veriler web böcekleri (Crawler) / Örümcekleri (Spiders) yardımıyla toplanır Web sayfaları hiperlinkler içerir Güvenilir sayfalar Hublar Hiperlik indirgemeli topik arama (HITS) algoritması 10e isimli eserden adapte edilmiştir 7/36
Arama Motorları Arama motorları internetin temel yükünü çekenlerdir. 10e isimli eserden adapte edilmiştir 8/36
Arama Motoru Yapısı Search Query Processed Query List of URLs to Crawl Crawling the Web Metadata Index Ranked- Ordered Pages ListofMatched Pages Processed Pages Unprocessed Web Pages 10e isimli eserden adapte edilmiştir 9/36
1. Geliştirme Çevrimi Web böceği Arama Motoru Anatomisi Doküman İndeksleyicisi Adımlar 1. Doküman ön işleme Toplama, depolama ve organize etme 2. Dokümanı öğelerine ayırma 3. Terim Doküman Matrisi oluşturma Değerler nasıl temsil edilmeli (sayısal, ikili) Terim Frekansı / Ters Dokuman Frekansı 10e isimli eserden adapte edilmiştir 10/36
2. Yanıt Çevrimi Arama Motoru Anatomisi Sorgu Analizcisi Doküman Sıralayıcısı / Eşleştiricisi Peki Google Nasıl Yapıyor? Googlebot (Web Böceği) Google Indexer Google Query Processor 10e isimli eserden adapte edilmiştir 11/36
PageRank bir link analizi agoritmasıdır Larry Page 1996 yılında Stanford Üniversitesinde bir proje sonucu ortaya konmuştur Google ın tarifindeki «gizli sos» tur!!! PageRank Algoritması 10e isimli eserden adapte edilmiştir 12/36
Arama Motoru Optimizasyonu (SEO) Bir sitenin arama motoru sorgularında üst sıralarında çıkmak için yaptığı aktivitelerdir. Internet pazarlama stratejisinin bir parçasıdır Temel olarak arama motorunun nasıl çalıştığının anlaşılmasına bağlıdır İçerik, HTML, Anahtar Kelimeler, Dış Linkler Indeksleme Site yöneticisinin URL yüklemesi (x) Webin sürekli ve proaktif biçimde taranması (Ok) 10e isimli eserden adapte edilmiştir 13/36
Popüler Arama Motorları 10e isimli eserden adapte edilmiştir 14/36
SEO Yöntemleri Arama Motoru öneri teknikleri (Beyaz-Şapka SEO) İyi web sitesi tasarımı, isabetli içerik gibi ölçütler ile değerlendirme (Kullanıcılar içindir, motorlar için değil) Arama motoru red etme teknikleri (Kara-Şapka SEO) Spamdexing (spam indeksler sunulması, hatalı içerikler sunulması, hatalı yönlendirmeler) Deception (İnsan ve Makine için farklı anlama gelebilecek sonuçlar) 10e isimli eserden adapte edilmiştir 15/36
Web Kullanım Madenciliği Web sitesi kullanıcı ziyaretleri ve kullanıcı etkileşimlerinden elde edilen veriler üzerinde madencilik işlemleri Veriler sunucu erişim loglarında, başvurucu (referer) loglarında, etmen loglarında ve kullanıcı tarafındaki çerezlerde (Cookies) tutulur. Kullanıcı karakteristikleri ve kullanım profilleri Metadata (sayfa nitelikleri, içerik nitelikleri, kullanım verileri) Tıklama verisi Tıklama Analizi Tatil sitesi kullanıcıları öncesinde uçak biletleri bakıyor. İçerikler kullanıcıların %70 si tarafından saat 21:00 23:00 arasında indiriliyor. 10e isimli eserden adapte edilmiştir 16/36
Web Kullanımı Madenciliği Uygulamaları Kullanıcı ömrü (yaşam boyu) değerinin belirlenmesi Ürünler arasında çapraz pazarlama stratejileri tasarlanması Promosyon kampanyalarını değerlendirilmesi Müşteri erişim kalıpları dikkate alınarak kampanyaların (hediye çeki, kupon vs) kullanıcı gruplarına atanması Kullanıcı davranışlarını tahmin etme (önceki davranışlardan öğrenilen kurallar yardımıyla) Kullanıcılara ilgileri dahilinde dinamik içerikler sunma 10e isimli eserden adapte edilmiştir 17/36
Tıklama Analizi 10e isimli eserden adapte edilmiştir 18/36
Web Analitiği Metrikleri Nasıl kullanıyor? Web Sitesi Kullanılabilirliği Sayfa görüntüleme sayısı Sitede harcanan zaman İndirmeler Tıklama haritası Tıklama Yolları Nereden Geldi? Trafik Kaynağı Referans web sitesi Arama motorları Direkt Çevrimdışı kampanyalar Çevrimiçi kampanyalar Web Analitiği Ziyaretçi Profilleri Anahtar Kelimeler İçerik grupları Coğrafya Erişim Zamanı Arama sonuç sayfası Kullanıcılarım kimler? Dönüşüm İstatistikleri Yeni ziyaretçi Geri dönen ziyaretçi İpuçları Satışlar / Dönüşümler Terk etme oranları İşim için ne anlama geliyor? 10e isimli eserden adapte edilmiştir 19/36
Bir Web Analitiği Gösterge Paneli 10e isimli eserden adapte edilmiştir 20/36
İş Analitiği Olgunluk Modeli Olgunluk İşletme modellerinin yeterliliği, biçimselliği ve optimizasyonu İş Zekası Olgunluk Modeli (TDWI - The Data Warehouse Institute) Yönetsel Raporlama Veri Marketi Veri Ambarı Kurumsal Veri Ambarı İş Zekası Hizmetleri İş Analitiği Olgunluk Modeli (INFORMS - The Institute for Operations Research and the Management Sciences ) Tanımlayıcı Analitik Kestirimci Analitik Öngörücü Analitik 10e isimli eserden adapte edilmiştir 21/36
İş Analitiği Olgunluk Modeli 10e isimli eserden adapte edilmiştir 22/36
Web Analitiği Araçları Google Web Analytics (google.com/analytics) Yahoo! Web Analytics (web.analytics.yahoo.com) Open Web Analytics (openwebanalytics.com) Piwik (PIWIK.ORG) FireStats (firestats.cc) Site Meter (sitemeter.com) Woopra (woopra.com) AWStats (awstats.org) Snoop (reinvigorate.net) 10e isimli eserden adapte edilmiştir 23/36
Web Sitesi Optimizasyonu Eko Sistemi Web site optimizasyonu girdilerinin iki boyutlu gösterimi AMAÇ: Müşteri Deneyimi Yönetimi (CEM) Müşterinin Sesi (VOC) 10e isimli eserden adapte edilmiştir 24/36
Web Sitesi Optimizasyonu Eko Sistemi Süreç Görünümü 10e isimli eserden adapte edilmiştir 25/36
VOC Stratejisi Çatısı 10e isimli eserden adapte edilmiştir 26/36
Sosyal Analitik Sosyal Ağ Analizi Sosyal Ağ: Birbiriyle bağlantılı bireyler tarafından oluşturulan sosyal yapı Sosyal dinamiklerin analiz edilmesi İnterdisipliner bir alan Sosyal Psikoloji Sosyoloji İstatistik Sosyal ağlar bireyler, gruplar, organizasyonlar ve toplumlar arasındaki ilişkileri çalışmada önemlidir. 10e isimli eserden adapte edilmiştir 27/36
Sosyal Ağ Analizi Metrikleri Connections Homophily Multiplexity Network closure Propinquity Segmentation Cliques and social circles Clustering coefficient Cohesion Distribution Bridge Centrality Density Structural holes Tie strength 10e isimli eserden adapte edilmiştir 28/36
Sosyal Medya Tanımlar ve Kavramlar Bireyler arasında sosyal etkileşimleri mümkün kılan teknolojiler bütünü Web 2.0 teknolojisine dayanır İşbirlikçi Projeler (Wiki) Blog ve Mikro Bloglar (Twitter) İçerik toplulukları (Youtube) Sosyal ağ siteleri (Facebook) Sanal oyun Ağları (WoW) Sanal sosyal dünya (Second Life) 10e isimli eserden adapte edilmiştir 29/36
Sosyal Medya Web tabanlı sosyal medyanın ayıt edici özellikleri (Endüstriyel medyadan Tv, gazete, film ) Kalitenin çok değişken olması Ulaşım noktası açısından belli bir odakta merkezileştirilmiş değildir. Yenilenme, güncellenme frekansı çok daha sık Hiçbir maliyet ödenmeden her yerden rahatça ulaşılabilir. Kullanım kolaylığından dolayı sosyal medya üretimi minimal düzeyde uzmanlık gerektirir. Sosyal medya üzerinden iletişim anında tepkiler direktdir. Klasik medyanın aksine sosyal medya ürünleri güncellenebilir. 10e isimli eserden adapte edilmiştir 30/36
İnsanlar Sosyal Medyayı Nasıl Kullanıyor? Creators Critics Joiners Collectors Spectators Inactives Time 10e isimli eserden adapte edilmiştir 31/36
Sosyal Medya Analitiği Sosyal Medya tarafından üretilen içeriklerin, etkileşimlerin sistematik bir biçimde analiz edilip firmaya rekabet avantajı getirecek şekilde kullanılması HBR Analitik Anketi (2010) Şirketlerin %75 i müşterilerin kendileri hakkında ne konuştuklarında bihaber %31 i sosyal medya etkinliğini ölçmemiş %23 ü sosyal medya analitiği araçlarını kullanıyor %7 si pazarlama stratejilerine sosyal medyayı eklemiş Sosyal medya etkinliğini ölçmek Tanımlayıcı istatistik (Frekans sayımı) Sosyal ağ analizi Gelişmiş Analitik kestirimci analitik ve metin madenciliği 10e isimli eserden adapte edilmiştir 32/36
Sosyal Medya Analitiği 10e isimli eserden adapte edilmiştir 33/36
En iyi nasıl yürütülür Sosyal Medya Analitiği Ölçümleri bir derecelendirme sistemi yerine, klavuz sistem olarak düşünün Anlaşılması zor duyguları takip et (Duygu Analizi) Metin analizi aracını sürekli geliştir Dalgacık etkisine dikkat et (Acaba viral mi olacak yoksa hemen çöp mü) Markadan öteye bak (Sorun markanın kendisi mi, yok ürünleri ve hizmetlerimi) En güçlü etkileyicilerini tanımla Analitik aracınızın isabetini sonuçlar üretip üretmediğini dikkatlice izle Sosyal medyadan öğrendiklerini planlama çevrimine dahil et 10e isimli eserden adapte edilmiştir 34/36
Sosyal Medya Analitiği Araçları Attensity360 Radian6/Salesforce Cloud Sysomos Collective Intellect Webtrends Crimson Hexagon Converseon SproutSocial 10e isimli eserden adapte edilmiştir 35/36
Sosyal Medya Analitiği 10e isimli eserden adapte edilmiştir 36/36