Büyük Veri Analitiği (Big Data Analytics)

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "Büyük Veri Analitiği (Big Data Analytics)"

Transkript

1 Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman, Stanford University, kitabı kullanılarak hazırlanmıştır. Genel bilgiler Değerlendirme Arasınav : 25% Ödevler : 15% Final Projesi : 30% Final Sınavı : 30% Ders kaynakları Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman, Stanford University, Real-Time Big Data Analytics: Emerging Architecture, Mike Barlow, O Reilly Media, Big Data, Data Mining, and Machine Learning: Value Creation for Business Leaders and Practitioners, Jared Dean, Wiley, Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data, EMC Education Services, e-posta web : [email protected] : 2 1

2 Genel bilgiler Araştırma ödevleri Haftalık konu ile ilgili bir makale incelenerek detaylı rapor hazırlanacaktır. İncelenen makalede ilgili yöntemin/algoritmanın/yaklaşımın kullanılmasının gerekçeleri, elde edilen sonuçları değerlendirilecektir. İncelenen makale son 3 yılda yayınlanmış olacaktır. Makale SCI-E tarafından taranan bir dergide yayınlanmış olacaktır. SCI-E tarafından tarandığını gösterir bilgi ödeve eklenecektir. Hazırlanan rapora makalenin tam metni de eklenecektir. 3 Genel bilgiler Final Projeleri Bir yöntemin/algoritmanın bir alana uygulamasını içerecektir. Geliştirilecek uygulamanın algoritma kısmında hazır araç, fonksiyon veya kütüphane kullanılmayacaktır. Hazırlanan projenin tüm dokümanları CD ile, proje raporu ise çıktı ile teslim edilecektir. 4 2

3 Genel bilgiler Ders içeriği 1. Büyük Veri Madenciliği 2. MapReduce 3. Benzer elemanların bulunması 4. Uzaklık ölçütleri 5. Data stream madenciliği 6. Link analizi 7. Frequent itemset ler 8. Öbekleme 9. Web reklamcılığı 5 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 6 3

4 Veri ve Bilgi Bilgi, insanoğlu için vazgeçilmez unsurların başında gelir. Günümüzde bilginin elde edilmesi, paylaşılması ve oluşturulması üzerinde teknolojik gelişmeler oldukça etkilidir. Yeni teknolojilerin ortaya çıkması toplumsal yaşamın değişmesine, yeni ilişkiler ağının ortaya çıkmasına ve bilgilerin sürekli olarak yenilenmesine neden olmaktadır. Sözlük anlamıyla bilgi; öğrenme, araştırma ve gözlem yoluyla elde edilen her türlü gerçek ve kavrayışın tümüdür. Bilgi, önceden belirlenen bir dizi sistematik kural ve prosedüre uygun bir biçimde işlenmiş enformasyondur. 7 Veri ve Bilgi Veri ve bilgi arasındaki ilişki aşağıda görülmektedir*. *Data and knowledge mining with big data towards smart production, Cheng, Ken Chen, Hemeng Sun, Yongping Zhang, Fei Tao, Journal of Industrial Information Integration, 9, 1-13,

5 Veri ve Bilgi Türk Dil Kurumuna göre; Veri (data): olgu, kavram veya komutların, iletişim, yorum ve işlem için elverişli biçimli gösterimi, Enformasyon (Information): haber alma, haber verme, haberleşme, Bilgi (knowledge): veriye yöneltilen anlam, insan aklının erebileceği olgu, gerçek ve ilkelerin bütünü, Anlayış (understanding): görüş ve inanış etmenlerinin etkisiyle beliren düşünme yolu, düşünüş biçimi, zihniyet, mantalite, Bilgelik (wisdom): herkesin ulaşamadığı derin, kapsamlı, bütünsel bilgi olarak tanımlanmaktadır. 9 Veri ve Bilgi Veri ve bilgelik arasındaki ilişki aşağıda görülmektedir*. * 10 5

6 Veri ve Bilgi Veri (Data): sayılar, rakamlar, sözcükler, metinler, resimler, olaylar vb. biçiminde temsil edilen ham gerçekliklerdir. (Örn: 54000, 01/22/2006) Enformasyon (Information): herhangi bir konu ile ilgili bir bilinmeyeni giderme konusunda yardımcı olan tanımlayıcı ifadelerdir (Örn: Nazlı nın bankada TL si var, Kemal in doğum tarihi 01/22/2006). Bilgi (Knowledge): işlenmiş enformasyondur (Örn: Nazlı nın bankada biriken TL si beklediğinden fazladır). Anlayış (Understanding): sonuç veya bilgi ile ilgili neden bulma veya kavrama süredir (Örn: Nazlı banka işlemlerine bakınca tanımadığı birisinin TL yatırdığını farketti. Bu nedenle bankadaki parası yüksekmiş.). Bilgelik (Wisdom): başka bir bakış açısıyla, değişen şartlar çerçevesinde ileriyi görebilme veya gözlem etkilerine göre prensipler ortaya koyma yeteneğidir. 11 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 12 6

7 Büyük Veri Analitiği Büyük veri, kendine özgü özelliklere sahip olan ve genellikle yüksek hacimlerdeki ve çok farklı kaynaklardan elde edilen veridir. Büyük veri analiz yöntemleri, farklı kaynaklardan elde edilen düzenli veya düzensiz verileri anlamlı ve işlenebilir hale dönüştürür. Dünyadaki verilerin %90 ı son 3-4 yılda oluşturulmuştur. Sosyal medya, blog, fotoğraf, müzik, video, IoT, log dosyaları, 13 Büyük Veri Analitiği Büyük veri terimi ilk ortaya çıktığından itibaren farklı sayıdaki özellikler ile ifade edilmiştir. Bütyük veri özellikleri 3V, 5V, 7V, 10V ve hatta 42V olarak ifade edilmiştir. Yaygın kullanılan 10V: 1. Volume 2. Velocity 3. Variety 4. Variability 5. Veracity 6. Validity 7. Vulnerability 8. Volatility 9. Visualization 10. Value 14 7

8 Volume Büyük Veri Analitiği Büyük verinin en çok bilinen karakteristiğidir. YouTube a her bir dakikada 300 saatlik video yüklenmektedir yılında 1.1 trilyon fotoğraf çekildiği tahmin edilmektedir yıllında cep telefonu veri trafiğinin 6.2 exabyte olduğu tahmin edilmektedir. Twitter kullanıcıları her bir dakikada tweet atmaktadır. Apple kullanıcıları her bir dakikada uygulama indirmektedir. Facebook kullanıcıları her bir dakikada içerik paylaşmaktadır. E-posta kullanıcıları her bir dakikada mesaj göndermektedir. Google her bir dakikada arama sorgusu almaktadır. 15 Velocity Büyük verinin üretilme, tüketilme, oluşturulma ve güncellenme hızını ifade eder. Facebook günde 600 terabyte verinin geldiğini ifade etmektedir. Google her saniyede sorguya cevap ürettiğini ifade etmektedir. Günde 3,5 milyar sorguya cevap verdiği söylenebilir. Variety Büyük Veri Analitiği Büyük verideki çeşitliliği ifade eder. Büyük veride yapılandırılmış, yarı yapılandırılmış ve çoğunlukla yapılandırılmamış veri bulunur (ses, video, görüntü, sosyal medya güncellemeleri, log dosyaları, click verileri, makine ve sensör verileri vb.). 16 8

9 Variability Büyük veride bazı farklı verilerde olabilir. Bunlar, veride tutarsızlıklara neden olabilir. Bu verilerin anomaly veya outlier algılama yöntemleri ile bulunup yapılan analizlerin daha anlamlı hale getirilmesi gereklidir. Veracity Büyük Veri Analitiği Veri kaynaklarının güvenilirliğini ifade eder. Büyük veride yukarıda bahsedilen özellikler artarken verinin güvenilirliği ve doğruluğu düşer. Verinin kim tarafından oluşturulduğu, hangi metodoloji ile toplandığı, aynı türdeki kaynaklardan mı toplandığı, veriyi toplayanın özetleme yapıp yapmadığı, veri başka birisi tarafından değiştirildi mi gibi sorulara cevap aranır. 17 Validity Büyük Veri Analitiği Verinin nasıl doğrulandığı ve geçerliliğinin nsaıl test edildiğiyle ilgilenir. Verinin analiz işleminden önce doğrulanması gereklidir. Vulnerability Büyük veri yeni güvenlik konularını da beraberinde getirir. Verinin hack lenmemesi, kaynağından elde edildikten sonra bozulmadan ve güvenlik saldırısı sonucu değişmeden alınması gereklidir. Volatility Verinin, güncel olup olmadığı, kullanılabilir olup olmadığı ile ilgilenir. Güncel veriyle istenen sonuçlar elde edilebilir. Kurumlarda veya büyük şirketlerde veri sürekli saklanır ve elde edilen büyük verinin önemli bir kısmı güncelliğini yitirebilir. 18 9

10 Visualization Büyük verinin görselleştirilmesi sonuçların kolay anlaşılması ve analiz edilmesi için gereklidir. Günümüzde büyük veri görselleştirmeyle ilgili hafıza kısıtları gibi teknik kısıtlar halen bulunmaktadır. Klasik grafik araçları ve yöntemleriyle büyük verideki milyarlarca noktanın görselleştirilmesi mümkün değildir. Bunun için kümeleme, ağaç haritaları, dairesel ağ diyagramları gibi görselleştirme yöntemlerinin kullanılması gereklidir. Value Büyük Veri Analitiği Büyük veriden anlamlı ve değerli bilgiyi çıkarmadıkça diğer bütün karakteristikleri anlamsızdır. Anlamlı ve değerli bilgiyi elde etmek için veri madenciliği yöntemleri gibi karmaşık süreçlerin uyarlanıp kullanılması gereklidir. 19 Büyük Veri Analitiği Büyük veri analitiği, büyük ve çeşitli veri setleri üzerinde işlem yaparak gizli örüntüleri çıkarma, bilinmeyen ilişkileri keşfetme sürecidir. Kullanılan yöntemlerle elde edilen bilgi firmalara, kurumlara veya ticari girişimlere yönelik önemli bilgiler sağlamaktadır. Büyük veri analitiği uygulamaları veri bilimcilere modelleri tahmin etme, istatistikçilere ve diğer analiz alanında çalışan profesyonellere büyüyen verileri kolay analiz yapma yeteneği kazandırır. Büyük veri analitiği klasik yöntemlerle yönetilmesi çok zor olan çok büyük, yapılandırılmamış ve çok hızlı değişen veriyle uğraşır ve anlamlı örüntüler elde eder. Büyük veri analitiği yöntemleri veriyi saklamak, veriyi elde etmek ve analiz etmek için gelişmiş teknolojiyi kullanır

11 Büyük Veri Analitiği Büyük veri; analiz türü, işleme yöntemi, veri frekansı, veri türü, içerik biçimi, veri kaynağı, veri tüketicisi ve donanıma göre sınıflandırılabilir Büyük Veri Analitiği Büyük verinin kullanım alanları Büyük veri günümüzde, veri madenciliği, makine öğrenmesi, örüntü tanıma, istatistik, görselleştirme, yüksek performanslı hesaplama, veritabanı teknolojisi, algoritma gibi çok farklı disiplinlerde yaygın bir şekilde kullanılmaktadır

12 Büyük verinin kullanım alanları Büyük veri uygulamaları farklı uygulama alanlarında başarılı bir şekilde kullanılmaktadır. İşletme Büyük Veri Analitiği Özellikle büyük ölçekli işletmeler müşteri analizi, müşteriye özel tavsiye, reklam veya öneri oluşturma, ürün dağıtımı ve lojistik optimizasyonu gibi çok sayıdaki alanda büyük veri analiz yöntemlerini kullanmaktadır. Perakende Satış Personel gelir optimizasyonu, müşteri davranış analizi, müşteri ilişkileri analizi, ürün çeşitliliği, kampanya yönetimi ve fiyat optimizasyonu gibi uygulamalarda büyük veri analiz yöntemleri kullanılmaktadır. 23 Kamu Verilere kolay ve güvenli erişebilirliği sağlama, gizlilik ve şeffaflık oluşturma, uygun ürün ve hizmetlerin sunumu, risk ve sahtekarlığı azaltmaya yönelik alanlarda büyük veri analiz yöntemleri kullanılmaktadır. Teknoloji Gerçek zamanlı analiz ve işlem (menü) özelleştirme, işlem süresini azaltma, riskleri azaltma, otomatik sistemler ile karar verme gibi alanlarda büyük veri analiz yöntemleri kullanılmaktadır. Eğitim Büyük Veri Analitiği Eğitimde öğrenci analizi, ders planlaması gibi alanlarda büyük veri analiz yöntemleri kullanılmaktadır

13 Kişisel Konum Verileri Konum tabanlı reklam, akıllı yönlendirme, acil müdahale gibi alanlarda büyük veri analiz yöntemleri kullanılmaktadır. Sağlık Büyük Veri Analitiği Hastalık tespiti, hasta izlenmesi, kişisel DNA analizi gibi alanlarda büyük veri analiz yöntemleri kullanılmaktadır. Bankacılık Geçmiş verinin, nakit hareketlerinin, öngörülebilen felaketlerin, soygunların ve müşteri davranışlarının anlaşılmasında büyük veri analiz yöntemleri kullanılmaktadır. 25 Büyük Veri Analitiği Akış verisi Akış verisi geldiği anda işlem yapılmazsa (depolama, data process vs.) kalıcı şekilde kaybedilebilir. Veriyi işleme hızından daha hızlı veri gelmesi durumunda da kaybedilebilir. Akış verisinde işlem yapan algoritmalar akış verisini genellikle özetleyerek kullanırlar. Akış verisi madenciliği algoritmaları, faydalı örnekleri seçer ve istenmeyen örnekleri filtrelerler. Başka bir özetleme yaklaşımında ise, sabit boyutlu bir pencere içerisindeki elemanlarla (belirli bir süre için geçmiş veri) özetleme yapılmaktadır

14 Büyük Veri Analitiği Akış verisi Akış verisinin özetlenmesiyle birlikte daha küçük alanda saklanması da sağlanmış olur. Akış işlemcisi bir tür veri yönetim sistemi olarak görülebilir. Sisteme çok sayıda farklı stream den veri gelebilir. Veri türleri, veri oranları ve veri gelme aralıklarının dağılımları farklı olabilir. 27 Büyük Veri Analitiği Akış verisi 28 14

15 Büyük Veri Analitiği Akış verisi kaynakları Sensor data Bir okyanus yüzeyindeki ısı sensörü her saat ölçtüğü ısı değerini reel sayı olarak bir istasyona gönderirse, veri oranı çok düşük olduğundan günümüz teknolojisinde tüm veri ana hafızada tutulabilir. GPS birimindeki sensör yüzeydeki yükseklik değişimini ölçüp bir istasyona gönderirse, bu durumda veri oranı yüksektir ve ancak ana hafızada veya ayrı bir diskte tutulabilir. Bir okyanusun tüm davranışını ölçmek istersek, milyonlarca sensör kullanılır ve günlük birkaç terabyte veri alınabilir. 29 Büyük Veri Analitiği Akış verisi kaynakları Image data Uydulardan sürekli dünyaya ilişkin görüntüler alınıp yeryüzündeki istasyonlara gönderilir. Bu görüntü verilerinin boyutları günlük birkaç terabyte düzeyinde olabilir. Şehirlerdeki güvenlik kameraları uyduya göre düşük çözünürlüktedir, ancak her birisi akış verisi oluşturur. Londra da 6 milyon kamera olduğu belirtilmektedir ve her birisi Akış verisi oluşturur

16 Büyük Veri Analitiği Akış verisi kaynakları İnternet ve Web trafiği İnternet anahtarlama düğümleri (router) IP paketlerinden oluşan stream leri alır ve çıkış portlarına yönlendirme yapar. Anahtarlama elemanlarının görevi sorgulama veya saklama değildir. Günümüzde anahtarlama elemanlarının kapasitesinin artırılmasına (DOS ataklarının algılanması, tıkanıklık denetimi yapılması) yönelik eğilim vardır. Web siteleri her gün milyonlarca sorgu almaktadır (Google her gün yüzlerce milyon arama sorgusu almaktadır, Yahoo milyarlarca click almaktadır.). Bu tür verilerden faydalı bilgiler elde edilebilir (sorgulardaki ani yükselme, click sayısındaki ani yükselme veya düşme). 31 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 32 16

17 Veri Madenciliği Veri madenciliğinin en yaygın kabul edilen tanımı, bilgi için model keşfetmek şeklindedir. Veri için oluşturulan modeller farklı şekillerde ve farklı amaçlar için oluşturulabilir. Veriden elde edilmek istenen sonuca göre model oluşturma süreçleri farklıdır. Oluşturulan modellerin istenen amaca uygunluğunun test edilerek doğrulanması gereklidir. 33 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 34 17

18 İstatistiksel model Veri madenciliği terimini ilk defa istatistikçiler kullanmıştır. Veri madenciliği, veri tarafından doğrudan desteklenmeyen bilginin çıkartılması olarak ifade edilmiştir. İstatistiksel model, veriden elde edilen bir dağılımı ifade eder. İstatistikçiler veri madenciliğini istatistiksel model oluşturma olarak görürler. 35 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 36 18

19 Makine öğrenmesi Makine öğrenmesinde, veri bir eğitim kümesi olarak alınır ve bir algoritmanın öğrenmesi için kullanılır. Makine öğrenmesi, Bayes ağları, destek vektör makinesi, yapay sinir ağları, karar ağaçları gibi modelleri kullanır. Makine öğrenmesi yöntemleri çok az bilgi kullanarak istenen amaca yönelik sonuçlar oluşturabilir. 37 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 38 19

20 Modellemede hesaplamalı yaklaşımlar Bilgisayar bilimlerinde, veri madenciliğine bir algoritmik problem olarak bakılır. Verilerden birtakım parametreler elde edilir. Makine öğrenmesi yöntemleri çok az bilgi kullanarak istenen amaca uygun sonuçlar oluşturabilir. Veri, kesin olarak veya yaklaşık olarak özetlenebilir. Verideki bazı önemli özellikler çıkartılır diğerleri göz ardı edilir. 39 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 40 20

21 Özetleme Web madenciliğindeki özetleme yöntemlerinde, Web in karmaşık yapısı her sayfa için basit verilerle özetlenebilir. Kullanıcıların arama yaptıkları sorgulara göre sayfaların önemi belirlenebilir (PageRank). Özetlemenin diğer bir uygulama alanı ise öbeklemedir (clustering). Veriler çok boyutlu uzayda birer nokta olarak alınır ve birbirine yakın olanlar aynı kümeye atanır. Oluşturulan cluster, merkez nokta veya başka bir özellik hesaplanarak elde edilen özet veri tarafından ifade edilebilir. 41 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 42 21

22 Özellik çıkarımı Büyük ölçekli verideki elemanlar arasındaki ilişki, aralarındaki bağlantı kullanılarak ifade edilir. Frequent itemset, veri içerisindeki elemanların birlikte bulunma oranlarına göre özellik çıkarımı yapar. Örneğin, market alışverişinde, belirli oranın üzerinde aynı alışverişte birlikte alınan ürünler. Similar items, büyük veri kümesi içerisinde birbirine benzeyen elemanları bularak özellik çıkarımı yapar. Örneğin, benzer ürün grubuyla ilgilinen kullanıcılar kümesi. 43 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 44 22

23 Toplam bilgi farkındalığı 2002 yılında Amerika hükümeti, kredi kartı makbuzları, otel kayıtları, seyahat verileri ve diğer çok farklı türdeki verilerin tamamında veri madenciliği yöntemlerini uygulayarak terörist aktiviteleri izlemeyi planladığını duyurmuştur (Total Information Awareness (TIA) isimli proje). Bu proje kongre tarafından gizlilik ve güvenlik nedenlerinden ötürü iptal edilmiştir. Bu kadar büyük veri içerisindeki bazı davranışlar terörist aktivite olmamasına rağmen terörist gibi algılanabilir. Gerçekten bazı şüpheli davranışların da terörizmle ilgisi olmayabilir. Terörist aktiviteyi tam olarak tanımlayıp ilgili olanların polis tarafından izlenmesi güvenlik, gizlilik ve maliyet açısından gereklidir. 45 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 46 23

24 Bonferroni prensibi Bir veri tamamen rastgele bile olsa aranan olayın olma olasılığı vardır. Verinin boyutu arttıkça aranan bu olayın olma sıklığı da artar. Beklenmediği kadar çok tekrar eden (önemli görünen) bu olay gerçekte önemli olmayabilir. Bonferroni prensibi, sanki gerçekmiş gibi görünen rastgele tekrar eden bu olayları belirlemeyi sağlar. Eğer bir olayın veri içerisindeki tekrarlanma sayısı, gerçek örneklerden ve beklenenden çok fazla ise sahtedir. Örneğin büyük bir veri içerisinde kişilerin belirlenmiş davranışlarına göre terörist sayısı çok az olmalıdır. Bu sayı beklenenden çok fazla çıkarsa elde edilen sonuçlar gerçek dışıdır. 47 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 48 24

25 Verilerin standartlaştırılması bazı uygulamalarda gereklidir. Öklid uzaklığına dayalı kümelemede veri standartlaştırma zorunludur. Örnek Veri Standartlaştırma İki nitelik değerinden birisi 0-1, diğeri ise aralığında olsun. x i = (0.9, 720) ve x j = (0.1, 20) ise aralarındaki uzaklık, olur. İki nitelik değerleri de 0-1 aralığında ölçeklenirse, 20 -> 0,02 ve 720 -> 0,72 olur. Uzaklık değeri 1,063 olur. 49 Veri Standartlaştırma Interval-scaled attributes Aralıklı ölçeklendirme yönteminde en yaygın olarak aşağıdaki yöntemler kullanılır: range (min-max) z-score 50 25

26 Veri Standartlaştırma range (min-max) Her nitelik için değerler minimum ve maksimum değerler arasındaki değere göre, 0-1 arasında değer alır. Burada, min(f) f niteliğinin minimum değerini, max(f) f niteliğinin maksimum değerini ve x if ise i. gözlemin f. nitelik değerini ifade eder. 51 z-score Veri Standartlaştırma Her nitelik için ortalama değerden uzaklığa ve nitelik değerlerindeki standart sapmaya göre yeni değeri hesaplanır. Burada, f f niteliğinin standart sapması, µ f f niteliğinin ortalama değeri ve z(x if ) ise i. gözlemin f. nitelik değerinin yeni değerini ifade eder

27 Veri Standartlaştırma Ratio-scaled attributes Bazı uygulamalarda nitelik değeri üssel değişebilir. Burada, A ve B katsayılar ve t nitelik değeridir. Bu tür durumlarda logaritmik değer ile standartlaştırma yapılır. 53 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 54 27

28 Dokümanlardaki kelimelerin önemi Çoğu veri madenciliği uygulamasında, dokümanların konularına göre gruplandırılması gerekir. Dokümanların konuları belirli anahtar kelimelere göre belirlenebilir. Bir dokümanda sık geçen kelimelerin o doküman için önemli olduğu tahmin edilebilir. Bazen sık kullanılan kelimeler konu belirlemek için uygun olmayabilir. the, and gibi kelimeler (stop words) İngilizce dokümanlarda çok sık kullanılır. Bir dokümanda bir kelimenin az kullanılması da konu belirlemek için tek başına yeterli değildir. 55 Dokümanlardaki kelimelerin önemi Kelimelerin bir dokümanda bulunma sıklığı (term frequency) ile diğer tüm dokümanlarda bulunma sıklığı (inverse document frequency) birlikte daha anlam sonuç vermektedir. Burada, f ij ile i.kelimenin j.dokümandaki frekansı gösterilmektedir. max k f kj ile j.dokümanda en sık geçen kelimenin frekansı ifade edilmektedir. Burada, N tüm doküman sayısını, n i ise i.kelimenin geçtiği doküman sayısını ifade etmektedir Bu iki değerin çarpımı ile bir kelimenin bir doküman için önemi hesaplanır

29 Örnek Dokümanlardaki kelimelerin önemi Veritabanında 2 20 doküman olsun. Bir w kelimesi 2 10 dokümanda geçiyorsa IDF w = log 2 (2 20 / 2 10 ) = 10 olur. Bir j dokümanında w kelimesi 20 kez geçiyorsa ve bu en sık geçen kelime ise TF wj = 1 olur. TF.IDF wj = 10 olur. Bir k dokümanında w kelimesi 1 kez geçiyorsa ve en sık geçen başka bir kelime ise 20 kez geçiyorsa TF wk = 1/20 olur. TF.IDF wk = 10 x (1 / 20) = 1/2 olur. 57 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 58 29

30 Hash fonksiyonları Hash fonksiyonu, bir h anahtarı alır ve bir sonuç değer üretir. Bu sonuç değer, 0 ile B-1 arasında bir tamsayı olabilir. Burada, B maksimum değer aralığını gösterir. Anahtar sayısı ile sonuç sayısı birbirine eşit olabilir. Bu durumda, her anahtar sadece bir sonuç üretebilir veya her sonuç için sadece bir anahtar olabilir. Anahtar sayısı ile sonuç sayısı birbirinden farklı olabilir. Bu durumda, her anahtar birden fazla sonuç üretir veya her sonuç için birden fazla anahtar vardır. h (x) = x mod B 59 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 60 30

31 İndeksler İndeks, nesnelere (kayıtlara) etkin bir şekilde ulaşmak için kullanılan veri yapısıdır. İndeks, genellikle kayıt içerisindeki bir alan (field) kullanılarak oluşturulur. Hash tablosu ile indeks oluşturulabilir. Field, hash fonksiyonu için anahtar değeri ifade eder ve hash fonksiyonunun sonucu kullanılarak kaydın tamamı elde edilir. Sonuç değer, hafızada bir adres, diskte bir blok, vb. olabilir. 61 İndeksler telefon numarası hash key olarak kullanılarak kayda ulaşılıyor

32 Konular Veri ve Bilgi Büyük Veri Analitiği Veri Madenciliği İstatistiksel model Makine öğrenmesi Modellemede hesaplamalı yaklaşımlar Özetleme Özellik çıkarımı Veri Madenciliğinde İstatistiksel Limitler Toplam bilgi farkındalığı Bonferroni prensibi Temel Bilgiler Veri standartlaştırma Dokümanlardaki kelimelerin önemi Hash fonksiyonları İndeksler İkincil depolama birimi 63 İkincil depolama birimi Disk üzerindeki veriye ulaşma süresi hafızaya göre çok uzundur. Disk üzerindeki bir bloğa erişim hızı hafızaya göre kez daha yavaştır. Her hash anahtarıyla hesaplanan sonuç değere göre ayrı ayrı okuma yapmak performansı çok düşürür. Diskler mantıksal olarak silindir şeklinde organize edilir ve çok sayıdaki track üzerindeki sektör farklı okuma kafaları ile aynı anda okunur

33 Ödev Doküman özetleme hakkında bir araştırma ödevi hazırlayınız

Büyük Veri Analitiği (Big Data Analytics)

Büyük Veri Analitiği (Big Data Analytics) Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David

Detaylı

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data

Detaylı

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data

Detaylı

Büyük Veri Analitiği (Big Data Analytics)

Büyük Veri Analitiği (Big Data Analytics) Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan

Detaylı

Büyük Veri Analitiği (Big Data Analytics)

Büyük Veri Analitiği (Big Data Analytics) Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David

Detaylı

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data

Detaylı

Büyük Veri Analitiği (Big Data Analytics)

Büyük Veri Analitiği (Big Data Analytics) Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David

Detaylı

Büyük Veri Analitiği (Big Data Analytics)

Büyük Veri Analitiği (Big Data Analytics) Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David

Detaylı

VERİ MADENCİLİĞİ Metin Madenciliği

VERİ MADENCİLİĞİ Metin Madenciliği VERİ MADENCİLİĞİ Metin Madenciliği Yrd. Doç. Dr. Şule Gündüz Öğüdücü 1 2 Metin için Veri Madenciliği Metin Madenciliğinde Sorunlar Metin madenciliği: Veri madenciliği teknikleri ile yazılı belgeler arasındaki

Detaylı

Zeki Optimizasyon Teknikleri

Zeki Optimizasyon Teknikleri Zeki Optimizasyon Teknikleri Ara sınav - 25% Ödev (Haftalık) - 10% Ödev Sunumu (Haftalık) - 5% Final (Proje Sunumu) - 60% - Dönem sonuna kadar bir optimizasyon tekniğiyle uygulama geliştirilecek (Örn:

Detaylı

Zeki Optimizasyon Teknikleri

Zeki Optimizasyon Teknikleri Zeki Optimizasyon Teknikleri Genetik Algoritma (Genetic Algorithm) Doç.Dr. M. Ali Akcayol Genetik Algoritma 1970 li yıllarda John Holland tarafından geliştirilmiştir. 1989 yılında David E. Goldberg Genetik

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Giriş Bilgi Erişiminde Temel Yaklaşımlar Bilgi Erişim Modelleri Boolean model Vector space

Detaylı

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI 10 Aralık 2011, Cumartesi Fen ve Mühendislik Alanlarındaki Çeşitli Araştırma Projelerinden Örneklemeler İçerik

Detaylı

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN [email protected] İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine

Detaylı

Büyük Veri ve Endüstri Mühendisliği

Büyük Veri ve Endüstri Mühendisliği Büyük Veri ve Endüstri Mühendisliği Mustafa Gökçe Baydoğan Endüstri Mühendisliği Bölümü Boğaziçi Üniversitesi İstanbul Yöneylem Araştırması/Endüstri Mühendisliği Doktora Öğrencileri Kolokyumu 21-22 Nisan

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall

Detaylı

Zeki Optimizasyon Teknikleri

Zeki Optimizasyon Teknikleri Zeki Optimizasyon Teknikleri Tabu Arama (Tabu Search) Doç.Dr. M. Ali Akcayol Tabu Arama 1986 yılında Glover tarafından geliştirilmiştir. Lokal minimum u elimine edebilir ve global minimum u bulur. Değerlendirme

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing

Detaylı

Makine Öğrenmesi 2. hafta

Makine Öğrenmesi 2. hafta Makine Öğrenmesi 2. hafta Uzaklığa dayalı gruplandırma K-means kümeleme K-NN sınıflayıcı 1 Uzaklığa dayalı gruplandırma Makine öğrenmesinde amaç birbirine en çok benzeyen veri noktalarını aynı grup içerisinde

Detaylı

VERİ MADENCİLİĞİNE BAKIŞ

VERİ MADENCİLİĞİNE BAKIŞ VERİ MADENCİLİĞİNE BAKIŞ İçerik Veri Madenciliği Neden Veri Madenciliği? Veri ve Veri Madenciliğinin Önemi Günümüzde Kullanılan Veri Madenciliğinin Çeşitli İsimleri Veri Madenciliği Nedir? Neden Veri Madenciliği?

Detaylı

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı Veri Madenciliği, örüntü tanıma, istatistik ve matematiksel yöntemlerin kullanımıyla devasa miktardaki güncel ya da geçmiş veri içerisinden ilgi çekici ( önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel

Detaylı

Büyük Veri Analitiği (Big Data Analytics)

Büyük Veri Analitiği (Big Data Analytics) Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David

Detaylı

IT-515 E-Devlet ve e-dönüşüm Türk Hava Kurumu Üniversitesi Bilişim Teknolojileri Yüksek Lisans Programı 2014

IT-515 E-Devlet ve e-dönüşüm Türk Hava Kurumu Üniversitesi Bilişim Teknolojileri Yüksek Lisans Programı 2014 IT-515 E-Devlet ve e-dönüşüm Türk Hava Kurumu Üniversitesi Bilişim Teknolojileri Yüksek Lisans Programı 2014 Geleceği (Kamuda Mevcut Ahmet Sözer [email protected] Ders Öğretim Görevlileri Dr. İzzet

Detaylı

BÜYÜK VERI UYGULAMALARı DERS 7. Doç. Dr. Yuriy Mishchenko

BÜYÜK VERI UYGULAMALARı DERS 7. Doç. Dr. Yuriy Mishchenko 1 BÜYÜK VERI UYGULAMALARı DERS 7 Doç. Dr. Yuriy Mishchenko PLAN Azure ML hizmeti kullanılmasına bir pratik giriş 2 3 MS AZURE ML 4 MS AZURE ML Azure Microsoft tarafından sağlanan bulut hesaplama hizmetleri

Detaylı

Veritabanı Yönetimi Bilgisayarların. Keşfi Hedefler. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi

Veritabanı Yönetimi Bilgisayarların. Keşfi Hedefler. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi Hedefler Veritabanı Yönetimi Bilgisayarların Discovering Keşfi 2010 Computers 2010 Living in a Digital World Dijital Dünyada Yaşamak Veritabanı terimini tanımlamak ve bir veritabanının veri ve bilgi ile

Detaylı

Veri Yapıları. Öğr.Gör.Günay TEMÜR Düzce Üniversitesi Teknolojis Fakültesi

Veri Yapıları. Öğr.Gör.Günay TEMÜR Düzce Üniversitesi Teknolojis Fakültesi Veri Yapıları Öğr.Gör.Günay TEMÜR Düzce Üniversitesi Teknolojis Fakültesi Hash Tabloları ve Fonksiyonları Giriş Hash Tabloları Hash Fonksiyonu Çakışma (Collision) Ayrık Zincirleme Çözümü Linear Probing

Detaylı

Akdeniz Üniversitesi

Akdeniz Üniversitesi F. Ders Tanıtım Formu Dersin Adı Öğretim Dili Bilgisayar II Türkçe Dersin Verildiği Düzey Ön Lisans ( ) Lisans (x) Yüksek Lisans( ) Eğitim Öğretim Sistemi Örgün Öğretim (x) Dersin Türü Zorunlu (x) Seçmeli

Detaylı

Seo Eğitimi (300 Sattlik Eğitim) Seo. Genel Amaçları. Seo da Kullanılan Terimler. Nedir? Nasıl Çalışır? Nasıl Olmalıdır?

Seo Eğitimi (300 Sattlik Eğitim) Seo. Genel Amaçları. Seo da Kullanılan Terimler. Nedir? Nasıl Çalışır? Nasıl Olmalıdır? Seo Eğitimi (300 Sattlik Eğitim) Seo Genel Amaçları Seo da Kullanılan Terimler Nedir? Nasıl Çalışır? Nasıl Olmalıdır? Sitenizi Google 'a kaydetmek. Meta Tag Meta Tag kullanımları Dinamik yapılı meta tag

Detaylı

Metin Sınıflandırma. Akış

Metin Sınıflandırma. Akış Metin Sınıflandırma Mehmet Fatih AMASYALI BLM 5212 Doğal Dil İşlemeye Giriş Ders Notları Akış Görev Eğiticili Eğiticisiz Öğrenme Metin Özellikleri Metin Kümeleme Özellik Belirleme Çok Boyutlu Verilerle

Detaylı

VERİ KAYNAKLARI. Bilgi sisteminin öğelerinden biride veri

VERİ KAYNAKLARI. Bilgi sisteminin öğelerinden biride veri VERİ KAYNAKLARI YÖNETİMİ İ İ 5. ÜNİTE GİRİŞ Bilgi sisteminin öğelerinden biride veri yönetimidir. Geleneksel yada çağdaş, birinci yada ikinci elden derlenen veriler amaca uygun veri formlarında tutulur.

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Genel bilgiler Değerlendirme Arasınav : 25% Ödevler : 15% Final Projesi : 30% Final Sınavı : 30%

Detaylı

IBM Big Data. Emre Uzuncakara [email protected] Big Data Sales. 2009 IBM Corporation

IBM Big Data. Emre Uzuncakara emre@tr.ibm.com Big Data Sales. 2009 IBM Corporation IBM Big Data Emre Uzuncakara [email protected] Big Data Sales Büyük Veri Nedir? Hız Hacim 12 terabyte Günlük Tweet verisi Ürün Analizi 350 5 Çeşitlilik milyon Ticari hareket - saniyede Potansiyel suistimal

Detaylı

«Pek çok küçük şey, doğru reklamla devleşmiştir.» Mark Twain

«Pek çok küçük şey, doğru reklamla devleşmiştir.» Mark Twain Video Reklamlar «Pek çok küçük şey, doğru reklamla devleşmiştir.» Mark Twain 1 2 3 4 Türkiye deki Arama Türkiye Pazarında Arama Hacmi Türkiye de Beyazperde Nerede? Rakip Analizi, Yıllık Analiz YouTube

Detaylı

Akdeniz Üniversitesi

Akdeniz Üniversitesi F. Ders Tanıtım Formu Dersin Adı Öğretim Dili Akdeniz Üniversitesi Bilgi ve İletişim Teknolojisi Türkçe Dersin Verildiği Düzey Ön Lisans (x) Lisans ( ) Yüksek Lisans( ) Doktora( ) Eğitim Öğretim Sistemi

Detaylı

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ 127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi

Detaylı

COĞRAFİ BİLGİ SİSTEMLERİ

COĞRAFİ BİLGİ SİSTEMLERİ COĞRAFİ BİLGİ SİSTEMLERİ HARİTA TABANLI PLANLAMA VE YÖNETİM Prof.Dr. Vahap TECİM Dokuz Eylül Üniversitesi HARİTADAN DA ÖTE COĞRAFİ BİLGİ SİSTEMLERİ BİLGİ SİSTEMİ Donanım Yazılım Veriler Personel Yeryüzü

Detaylı

BÜYÜK VERİ. Abdulkadir ŞAN Proje Yöneticisi 7/1/2014 VERİ SİSTEMLERİ. Anayurt Güvenliği Md. Yrd. Metin Madenciliği ve Kaynaştırma Sistemleri

BÜYÜK VERİ. Abdulkadir ŞAN Proje Yöneticisi 7/1/2014 VERİ SİSTEMLERİ. Anayurt Güvenliği Md. Yrd. Metin Madenciliği ve Kaynaştırma Sistemleri BÜYÜK VERİ Abdulkadir ŞAN Proje Yöneticisi 1 VERİ SİSTEMLERİ Relational Database DataWarehouse 2 1 VERİ TÜRLERİ 3 BÜYÜK VERİ NEDİR? Verinin çok büyük bir kısmı YAPISAL OLMAYAN veridir ve şimdi bu veriyi

Detaylı

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Ders 1- Yapay Zekâya Giriş. Erhan AKDOĞAN, Ph.D.

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Ders 1- Yapay Zekâya Giriş. Erhan AKDOĞAN, Ph.D. Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ Ders 1- Yapay Zekâya Giriş Erhan AKDOĞAN, Ph.D. Yapay Zekâ nedir?! İnsanın düşünme ve karar verme yeteneğini bilgisayarlar aracılığı ile taklit etmeye

Detaylı

DENİZ HARP OKULU TEMEL BİLİMLER BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

DENİZ HARP OKULU TEMEL BİLİMLER BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ DENİZ HARP OKULU TEMEL BİLİMLER BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ Dersin Adı Kodu Sınıf/Y.Y. Ders Saati (T+U+L) Kredi AKTS OLASILIK VE İSTATİSTİK FEB-222 2/ 2.YY 3+0+0 3 3 Dersin Dili Dersin Seviyesi

Detaylı

BSM 532 KABLOSUZ AĞLARIN MODELLEMESİ VE ANALİZİ OPNET MODELER

BSM 532 KABLOSUZ AĞLARIN MODELLEMESİ VE ANALİZİ OPNET MODELER BSM 532 KABLOSUZ AĞLARIN MODELLEMESİ VE ANALİZİ OPNET MODELER Yazılımı ve Genel Özellikleri Doç.Dr. Cüneyt BAYILMIŞ Kablosuz Ağların Modellemesi ve Analizi 1 OPNET OPNET Modeler, iletişim sistemleri ve

Detaylı

Başlıca Ürün-Bilgi Sistemleri

Başlıca Ürün-Bilgi Sistemleri BİLGİ SİSTEMLERİ Başlıca Ürün-Bilgi Sistemleri Süreç İşleme Sistemleri, Ofis Otomasyon Sistemleri ve Bilgi İşleme Sistemleri, Yönetim Bilişim Sistemleri, Karar Destek Sistemleri, Uzman Sistemler ve Yapay

Detaylı

Mesleki Terminoloji II Veri Madenciliği

Mesleki Terminoloji II Veri Madenciliği Mesleki Terminoloji II Veri Madenciliği Burak Düşün - 14011055 Akif Berkay Gürcan - 14011023 Veri Madenciliği Nedir? Veri madenciliği, büyük miktarda verinin anlamlı örüntüler bulmak amacıyla otomatik

Detaylı

DOKUZ EYLÜL ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ DEKANLIĞI DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CME 4410

DOKUZ EYLÜL ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ DEKANLIĞI DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CME 4410 Dersi Veren Birim: Bilgisayar Mühendisliği Dersin Türkçe Adı: ÖRÜNTÜ TANIMAYA GİRİŞ Dersin Orjinal Adı: INTRODUCTION TO PATTERN RECOGNITION Dersin Düzeyi:(Ön lisans, Lisans, Yüksek Lisans, Doktora) Lisans

Detaylı

Akdeniz Üniversitesi

Akdeniz Üniversitesi F. Ders Tanıtım Formu Dersin Adı Öğretim Dili Akdeniz Üniversitesi Bilgi Teknolojileri Kullanımı Türkçe Dersin Verildiği Düzey Ön Lisans ( ) Lisans (x) Yüksek Lisans( ) Doktora( ) Eğitim Öğretim Sistemi

Detaylı

AJANS SUNUMU.

AJANS SUNUMU. AJANS SUNUMU SİZİN İÇİN NELER YAPIYORUZ! WEB SİTE TASARIMI WEB SİTE YAZILIMI SOSYAL MEDYA İÇERİK YÖNETİMİ E-TİCARET YÖNETİMİ SEO DİJİTAL MEDYA REKLAMLARI E-POSTA PAZARLAMA Pazarlama ürettiğiniz şey neyse,

Detaylı

VERİ YAPILARI. Yrd. Doç. Dr. Murat GÖK Bilgisayar Mühendisliği Bölümü YALOVA ÜNİVERSİTESİ HASH TABLOLARI.

VERİ YAPILARI. Yrd. Doç. Dr. Murat GÖK Bilgisayar Mühendisliği Bölümü YALOVA ÜNİVERSİTESİ HASH TABLOLARI. VERİ YAPILARI HASH TABLOLARI Yrd. Doç. Dr. Murat GÖK Bilgisayar Mühendisliği Bölümü YALOVA ÜNİVERSİTESİ [email protected] Hash tabloları Hash tablo veri yapısı ile veri arama, ekleme ve silme işlemleri

Detaylı

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veritabanı Sistemleri

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veritabanı Sistemleri Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veritabanı Sistemleri Konular Büyük Resim Ders Tanıtımı Niçin Veritabanı? Veri ve Bilgi Kavramları Klasik Dosya Yapıları Klasik Dosya Sistemlerinin Zayıflıkarı

Detaylı

Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü. Bilgisayar Mühendisliği

Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü. Bilgisayar Mühendisliği Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü Bilgisayar Mühendisliği Bilgisayar Mühendisliği Günümüzde, finans, tıp, sanat, güvenlik, enerji gibi bir çok sektör, bilgisayar mühendisliğindeki gelişimlerden

Detaylı

Bilgisayar Grafiği. Volkan KAVADARLI

Bilgisayar Grafiği. Volkan KAVADARLI Bilgisayar Grafiği Volkan KAVADARLI 11011032 Bilgisayar Grafiği? Özel bir grafik donanımı ve yazılımının yardımıyla bir bilgisayar tarafından görüntü verisinin temsilini kullanarak oluşturulmuş görüntüler.

Detaylı

K En Yakın Komşu Methodu (KNearest Neighborhood)

K En Yakın Komşu Methodu (KNearest Neighborhood) K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre

Detaylı

Zeki Optimizasyon Teknikleri

Zeki Optimizasyon Teknikleri Zeki Optimizasyon Teknikleri (nt lgorithm) Doç.Dr. M. li kcayol 996 yılında Marco Dorigo tarafından ortaya atılmıştır. Temel olarak karıncaların yiyecek madde ile yuvaları arasındaki en kısa yolu bulmalarından

Detaylı

SİBER SUÇLARA KARŞI SİBER ZEKA

SİBER SUÇLARA KARŞI SİBER ZEKA SİBER SUÇLARA KARŞI SİBER ZEKA Aytuğ Çelikbaş Sistem Mühendisi Copyright 2013 EMC Corporation. All rights reserved. 1 2 Ajanda Günümüz Tehditleri Güvenlikte Büyük Veri Yaklaşımları Siber İstihbarat Atak

Detaylı

Akdeniz Üniversitesi

Akdeniz Üniversitesi F. Ders Tanıtım Formu Dersin Adı Öğretim Dili Akdeniz Üniversitesi Bilgisayar I Türkçe Dersin Verildiği Düzey Ön Lisans ( ) Lisans (x) Yüksek Lisans( ) Doktora( ) Eğitim Öğretim Sistemi Örgün Öğretim (x)

Detaylı

Manisa Celal Bayar Üniversitesi Yazılım Mühendisliği Bölümü YZM Veri Yapıları Dersi. Proje#2

Manisa Celal Bayar Üniversitesi Yazılım Mühendisliği Bölümü YZM Veri Yapıları Dersi. Proje#2 Manisa Celal Bayar Üniversitesi Yazılım Mühendisliği Bölümü YZM 2116- Veri Yapıları Dersi Proje#2 İkili Arama Ağacı, Heap, Hash Tabloları ve Çizgeler Veriliş Tarihi: 24.04.2018 Son Teslim Tarihi: 25.05.2018

Detaylı

Fonksiyon Optimizasyonunda Genetik Algoritmalar

Fonksiyon Optimizasyonunda Genetik Algoritmalar 01-12-06 Ümit Akıncı Fonksiyon Optimizasyonunda Genetik Algoritmalar 1 Fonksiyon Optimizasyonu Fonksiyon optimizasyonu fizikte karşımıza sık çıkan bir problemdir. Örneğin incelenen sistemin kararlı durumu

Detaylı

Karar Destek Sistemi

Karar Destek Sistemi Karar Destek Sistemi Müşteri Seçimi ve Rut Optimizasyonu Üretilen bir mamülün/hizmetin üretici firma ya da pazarlama şirketlerince, satış noktalarına verimli olarak yapılan müşteri ziyaretlerine rut diyebiliriz.

Detaylı

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ 1 BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel

Detaylı

VERI TABANLARıNDA BILGI KEŞFI

VERI TABANLARıNDA BILGI KEŞFI 1 VERİ MADENCİLİĞİ VERI TABANLARıNDA BILGI KEŞFI Veri Tabanlarında Bilgi Keşfi, veriden faydalı bilginin keşfedilmesi sürecinin tamamına atıfta bulunmakta ve veri madenciliği bu sürecin bir adımına karşılık

Detaylı

Kelime Gösterimleri (Word Representation Word Embeddings)

Kelime Gösterimleri (Word Representation Word Embeddings) Kelime Gösterimleri (Word Representation Word Embeddings) Kelime, cümlede kullanımına göre farklı anlamlar kazanabilir Anlamsal bilginin çıkarılması metinlerin işlenmesinde önemlidir Kelimelerin işlenebilir

Detaylı

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN [email protected] Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme

Detaylı

Yrd. Doç. Dr. Gökçe BECİT İŞÇİTÜRK. Gökçe BECİT İŞÇİTÜRK 1

Yrd. Doç. Dr. Gökçe BECİT İŞÇİTÜRK. Gökçe BECİT İŞÇİTÜRK 1 Yrd. Doç. Dr. Gökçe BECİT İŞÇİTÜRK Gökçe BECİT İŞÇİTÜRK 1 Gökçe BECİT İŞÇİTÜRK 2 Kullanıcıların site içeriğini belirlemede rol oynadığı, Dinamik, Teknik bilgi gerektirmeyen, Çok yönlü etkileşim sağlayan,

Detaylı

DİJİTAL & SOSYAL MEDYA NIN GELENEKSEL MEDYA YA GÖRE AVANTAJLARI

DİJİTAL & SOSYAL MEDYA NIN GELENEKSEL MEDYA YA GÖRE AVANTAJLARI Düzen Değişti HAMİNNE DİJİTAL MEDYA & SOSYAL AĞ PAZARLAMA Haminne, dijital medya ve sosyal ağlar üzerinde; lokal ve ulusal pazarlama çözümleri üreten, şehir hedefli yayın ve yayıncıları ile yüz binlerce

Detaylı

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara Veri Madenciliğine Genel Bir Bakış Veri Madenciliğinin Görevleri Sınıflama Seri Sınıflama Algoritmaları Paralel Sınıflama

Detaylı

UZAKTAN EĞİTİM MERKEZİ

UZAKTAN EĞİTİM MERKEZİ ÜNİTE 2 VERİ TABANI İÇİNDEKİLER Veri Tabanı Veri Tabanı İle İlgili Temel Kavramlar Tablo Alan Sorgu Veri Tabanı Yapısı BAYBURT ÜNİVERSİTESİ UZAKTAN EĞİTİM MERKEZİ BİLGİSAYAR II HEDEFLER Veri tabanı kavramını

Detaylı

Ders Adı : Nesne Tabanlı Programlama-I Ders No : Teorik : 3 Pratik : 1 Kredi : 3.5 ECTS : 4. Ders Bilgileri.

Ders Adı : Nesne Tabanlı Programlama-I Ders No : Teorik : 3 Pratik : 1 Kredi : 3.5 ECTS : 4. Ders Bilgileri. Image not found http://bologna.konya.edu.tr/panel/images/pdflogo.png Ders Adı : Nesne Tabanlı Programlama-I Ders No : 0690130114 Teorik : 3 Pratik : 1 Kredi : 3.5 ECTS : 4 Ders Bilgileri Ders Türü Öğretim

Detaylı

Büyük, Dağıtık, Veri Yoğunluklu Uygulamalarda Programlama Paradigmaları

Büyük, Dağıtık, Veri Yoğunluklu Uygulamalarda Programlama Paradigmaları Büyük, Dağıtık, Veri Yoğunluklu Uygulamalarda Programlama Paradigmaları Güven Fidan AGMLAB Bilişim Teknolojileri 18/10/11 GRID ÇALIŞTAYI 2007 1 MapReduce Nedir? Büyük data kümelerini işlemek ve oluşturmak

Detaylı

Uzaktan Algılama Teknolojileri

Uzaktan Algılama Teknolojileri Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk [email protected] Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve

Detaylı

Ekin SAFE TRAFFIC Plaka Tanıma Sistemi

Ekin SAFE TRAFFIC Plaka Tanıma Sistemi Ekin SAFE TRAFFIC Plaka Tanıma Sistemi Leader in Safe City Technologies Ekin Plaka Tanıma Sistemi, yüksek çözünürlüklü video tabanlı plaka tanıma teknolojisini kullanarak görüş alanındaki tüm araçların

Detaylı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Hatice NİZAM İstanbul Üniversitesi Bilgisayar Mühendisliği Bölümü [email protected] Saliha Sıla AKIN ERS Turizm Yazılım Şirketi, Bilgisayar

Detaylı

YZM VERİ YAPILARI DERS#9: HASH FONKSİYONLARI

YZM VERİ YAPILARI DERS#9: HASH FONKSİYONLARI YZM 2116- VERİ YAPILARI DERS#9: HASH FONKSİYONLARI İÇERİK Bu bölümde, Giriş Hash Tabloları Hash Fonksiyonu Çakışma (Collision) Ayrık Zincirleme Çözümü Linear Probing Çözümü Quadratic Probing Çözümü konusuna

Detaylı

INS4801 Coğrafi Bilgi Sistemleri (CBS) (3 + 0)

INS4801 Coğrafi Bilgi Sistemleri (CBS) (3 + 0) Dokuz Eylül Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü INS4801 Coğrafi Bilgi Sistemleri (CBS) (3 + 0) Prof.Dr.YALÇIN ARISOY [email protected] DERSİN KAPSAMI: Coğrafi Bilgi Sistemlerine

Detaylı

Data Science Boot Camp

Data Science Boot Camp Data Science Boot Camp Eğitim Detayları Eğitim Süresi : 3 Gün Kontenjan : 12 Ön Koşullar : Eğitim Hakkında Data Science Boot Camp Sertifikasyon Programı Introductory Python, Data Science with Python: Data

Detaylı

Ekin SAFE TRAFFIC Kırmızı Işık İhlal Tespit Sistemi

Ekin SAFE TRAFFIC Kırmızı Işık İhlal Tespit Sistemi Ekin SAFE TRAFFIC Kırmızı Işık İhlal Tespit Sistemi Leader in Safe City Technologies Ekin Kırmızı Işık İhlal Tespit Sistemi, yüksek çözünürlüklü video tabanlı plaka tanıma teknolojisini kullanarak görüş

Detaylı

Dosya Saklama Ortamları (Sabit Diskler) Kütük Organizasyonu 1

Dosya Saklama Ortamları (Sabit Diskler) Kütük Organizasyonu 1 Dosya Saklama Ortamları (Sabit Diskler) Kütük Organizasyonu 1 Depolama Aygıtları 1- Birincil Depolama Aygıtları Hızlı Erişim Süresine Sahiptirler Fiyatı daha fazladır. Daha küçük kapasiye sahiptir 2. İkincil

Detaylı

TEMEL BĐLGĐ TEKNOLOJĐLERĐ KULLANIMI BÜLENT TURAN

TEMEL BĐLGĐ TEKNOLOJĐLERĐ KULLANIMI BÜLENT TURAN 1 Bilgi Teknolojileri nedir? 2 TEMEL BĐLGĐ TEKNOLOJĐLERĐ KULLANIMI BÜLENT TURAN Bilgi ve iletişim teknolojileri bilginin meydana getirilmesi, yönetilmesi, saklanması, yayılması için kullanılan çeşitli

Detaylı

Kamu Sektörü İçin SAP Karar Destek Sistemleri Zirvesi. Gökhan NALBANTOĞLU / CEO, Ereteam 9 Aralık 2014, Salı

Kamu Sektörü İçin SAP Karar Destek Sistemleri Zirvesi. Gökhan NALBANTOĞLU / CEO, Ereteam 9 Aralık 2014, Salı Kamu Sektörü İçin SAP Karar Destek Sistemleri Zirvesi Gökhan NALBANTOĞLU / CEO, Ereteam 9 Aralık 2014, Salı Gündem Biz Kimiz? Geçmişten Günümüze, Ereteam Neden Karar Destek Sistemleri? Kamu Kurumlarının

Detaylı

Akdeniz Üniversitesi

Akdeniz Üniversitesi F. Ders Tanıtım Formu Dersin Adı Öğretim Dili Bilişim Teknolojileri Türkçe Dersin Verildiği Düzey Ön Lisans ( ) Lisans (x) Yüksek Lisans( ) Doktora( ) Eğitim Öğretim Sistemi Örgün Öğretim (x) İkinci Örgün

Detaylı

Bilişim Sistemleri. Modelleme, Analiz ve Tasarım. Yrd. Doç. Dr. Alper GÖKSU

Bilişim Sistemleri. Modelleme, Analiz ve Tasarım. Yrd. Doç. Dr. Alper GÖKSU Bilişim Sistemleri Modelleme, Analiz ve Tasarım Yrd. Doç. Dr. Alper GÖKSU Ders Akışı Hafta 5. İhtiyaç Analizi ve Modelleme II Haftanın Amacı Bilişim sistemleri ihtiyaç analizinin modeli oluşturulmasında,

Detaylı

Çok Önemli Not : ilgili yasaya ilişkin görüş ve yorumlarını yansıtmaktadır. Hiçbir kurum ve kuruluşu bağlayıcı niteliği yoktur.

Çok Önemli Not : ilgili yasaya ilişkin görüş ve yorumlarını yansıtmaktadır. Hiçbir kurum ve kuruluşu bağlayıcı niteliği yoktur. 5651 Sayılı Yasanın Getirdiği Yükümlülükler Çok Önemli Not : Bu dokümanda belirtilenler tamamen kuruluşumuzun ilgili yasaya ilişkin görüş ve yorumlarını yansıtmaktadır. Hiçbir kurum ve kuruluşu bağlayıcı

Detaylı

Nesnelerin İnternetinde Veri Analizi

Nesnelerin İnternetinde Veri Analizi Nesnelerin İnternetinde Veri Analizi Bölüm 2. Veri madenciliği w3.gazi.edu.tr/~suatozdemir Veritabanı teknolojisinin gelişimi 2 Neden veri madenciliği? Bilgisayarların ucuzlayıp aynı zamanda çok güçlü

Detaylı

VERİ MADENCİLİĞİ (Web Madenciliği)

VERİ MADENCİLİĞİ (Web Madenciliği) VERİ MADENCİLİĞİ (Web Madenciliği) Yrd.Doç.Dr. Kadriye ERGÜN [email protected] Kaynak: M. Ali Akcayol, Gazi Üniversitesi, Bilgisayar Mühendisliği Bölümü Ders Notları İçerik İnternet World Wide Web

Detaylı

Kümeleme Algoritmaları. Tahir Emre KALAYCI

Kümeleme Algoritmaları. Tahir Emre KALAYCI Tahir Emre KALAYCI 2010 Gündem En önemli gözetimsiz öğrenme (unsupervised learning) problemi olarak değerlendirilmektedir Bu türdeki diğer problemler gibi etiketsiz veri kolleksiyonları için bir yapı bulmakla

Detaylı

Büyük Verinin Büyük Güvenlik İhtiyacı. Yavuz S. Selim Yüksel Bilişim Teknolojileri ve Siber Güvenlik Derneği Yönetim Kurulu Başkanı

Büyük Verinin Büyük Güvenlik İhtiyacı. Yavuz S. Selim Yüksel Bilişim Teknolojileri ve Siber Güvenlik Derneği Yönetim Kurulu Başkanı Büyük Verinin Büyük Güvenlik İhtiyacı Yavuz S. Selim Yüksel Bilişim Teknolojileri ve Siber Güvenlik Derneği Yönetim Kurulu Başkanı Yaklaşık 300 sensör bulunan bir formula 1 aracı Saniyede 1.2GB veri üretiyor

Detaylı

Yaklaşık Düşünme Teorisi

Yaklaşık Düşünme Teorisi Yaklaşık Düşünme Teorisi Zadeh tarafından 1979 yılında öne sürülmüştür. Kesin bilinmeyen veya belirsiz bilgiye dayalı işlemlerde etkili sonuçlar vermektedir. Genellikle bir f fonksiyonu ile x ve y değişkeni

Detaylı

YZM 2116 Veri Yapıları

YZM 2116 Veri Yapıları YZM 2116 Veri Yapıları Yrd. Doç. Dr. Deniz KILINÇ Celal Bayar Üniversitesi Hasan Ferdi Turgutlu Teknoloji Fakültesi Yazılım Mühendisliği Bu bölümde, Giriş Hash Tabloları Hash Fonksiyonu Çakışma (Collision)

Detaylı

BİLİŞİM İLE TANIŞIYORUM BİLİŞİM TEKNOLOJİLERİNİN KULLANILDIĞI ALANLAR

BİLİŞİM İLE TANIŞIYORUM BİLİŞİM TEKNOLOJİLERİNİN KULLANILDIĞI ALANLAR BİLİŞİM İLE TANIŞIYORUM Teknoloji: İnsanoğlunun tasarlayarak ürettiği ya da uygulamaya koyduğu faydalı, faydasız veya zararlı her türlü aletler ve araçlardır. Bir aracın teknolojik olması için elektronik

Detaylı

Öğretim Teknolojilerinde Yeni Eğilimler. Yrd.Doç.Dr. Nuray Gedik Güz 2012

Öğretim Teknolojilerinde Yeni Eğilimler. Yrd.Doç.Dr. Nuray Gedik Güz 2012 Öğretim Teknolojilerinde Yeni Eğilimler Yrd.Doç. Güz 2012 Teknoloji ve Medya 1950 ler 1980 lerde bilgisayar Teknoloji ve Medya: Eğilimler Toplum ve Medya 1 yılda basılan kitap 967,474 1 günde dağıtılan

Detaylı

Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan. blog.mustafabaydogan.

Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan.   blog.mustafabaydogan. Veri Madenciliği Yrd. Doç. Dr. Mustafa Gökçe Baydoğan [email protected] www.mustafabaydogan.com blog.mustafabaydogan.com İçerik p Veri Madenciliği nedir? n Bir örnek p Boğaziçi Üniversitesi

Detaylı

Nesnelerin İnterneti Güvenlik ve Güç Tüketimi. Özen Özkaya

Nesnelerin İnterneti Güvenlik ve Güç Tüketimi. Özen Özkaya Nesnelerin İnterneti Güvenlik ve Güç Tüketimi Özen Özkaya 24 MAYIS 2017 EMO SEMİNER DİZİSİ - 2 bilgisayarların Analog vs. digital company culture interneti... Nesnelerin interneti, 4. sanayi devrimi ile

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Birliktelik Kuralları Birliktelik Kurallarının Temelleri Support ve Confidence Apriori Algoritması

Detaylı

Daha komplike uygulamalar elektronik ticaret, elektronik kimlik belgeleme, güvenli e-posta,

Daha komplike uygulamalar elektronik ticaret, elektronik kimlik belgeleme, güvenli e-posta, Çift Anahtarlı (Asimetrik Şifreleme) Bilgi Güvenliği: Elektronik iletişim, günümüzde kağıt üzerinde yazı yazarak yapılan her türlü iletişimin yerine geçmeye adaydır. Çok uzak olmayan bir gelecekte kişi/kuruluş/toplumların,

Detaylı

İşletme Bilgi Yönetimi. Doç. Dr. Serkan ADA

İşletme Bilgi Yönetimi. Doç. Dr. Serkan ADA İşletme Bilgi Yönetimi Doç. Dr. Serkan ADA Bilgi Toplanmış, organize edilmiş, yorumlanmış ve belli bir yöntemle etkin karar vermeyi gerçekleştirmek amacıyla ilgili birime sevkedilmiş, belirli bir amaç

Detaylı

Ana müşteri hizmeti. boschsecurity.com/instoreanalytics. Mağaza İçi Analiz Operasyon Modülü

Ana müşteri hizmeti. boschsecurity.com/instoreanalytics. Mağaza İçi Analiz Operasyon Modülü Ana müşteri hizmeti boschsecurity.com/instoreanalytics Mağaza İçi Analiz Operasyon Modülü Mükemmel müşteri hizmeti, mağazanızı diğerlerinden ayırarak sadakati ve satışları artırmaya yardımcı olabilir.

Detaylı

Büyük Veri Analitiği (Big Data Analytics)

Büyük Veri Analitiği (Big Data Analytics) Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David

Detaylı

ICATT ÇEVİRİ UYGULAMASI SİSTEM MİMARİSİ VE VERİTABANI TASARIMI

ICATT ÇEVİRİ UYGULAMASI SİSTEM MİMARİSİ VE VERİTABANI TASARIMI ICATT ÇEVİRİ UYGULAMASI SİSTEM MİMARİSİ VE VERİTABANI TASARIMI İÇİNDEKİLER 1. GİRİŞ 1.1. KAPSAM 1.2. SİSTEM ÖZETİ 1.3. DOKÜMAN ÖZETİ 2. ÇALIŞMA KONSEPTİ 2.1. Yeni Kullanıcı Oluşturmak 2.2. Şirket Bilgilerini

Detaylı

Web Sayfasında Google Analitik Kullanımı ve Kullanıcı Davranışlarının Belirlenmesi: İstanbul Ticaret Üniversitesi Kütüphane Web Sayfası.

Web Sayfasında Google Analitik Kullanımı ve Kullanıcı Davranışlarının Belirlenmesi: İstanbul Ticaret Üniversitesi Kütüphane Web Sayfası. Web Sayfasında Google Analitik Kullanımı ve Kullanıcı Davranışlarının Belirlenmesi: İstanbul Ticaret Üniversitesi Kütüphane Web Sayfası Erdem Eralp Amaç Kullanıcı Beklentileri Hizmet Analizleri Farkındalık

Detaylı

İ.Ü. AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ Tanıtım Faaliyetleri Standartları Standardı

İ.Ü. AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ Tanıtım Faaliyetleri Standartları Standardı Dök. No: AUZEF-SS-2.1-10 Yayın Tarihi:30.06.2014 Rev.No:00 Rev Tarihi: Sayfa 1 / 8 1. AMAÇ... 3 2. KAPSAM... 3 3. SORUMLULAR... 3 4. TANIMLAR... 3 5. AUZEF Tanıtım Faaliyetlerin Standartları... 3 5.1.

Detaylı