VERİ MADENCİLİĞİ (Veri Ön İşleme-2)
|
|
- Gizem Şahan
- 5 yıl önce
- İzleme sayısı:
Transkript
1 VERİ MADENCİLİĞİ (Veri Ön İşleme-2)
2 Veri Dönüşümü Veri, veri madenciliği uygulamaları için uygun olmayabilir Seçilen algoritmaya uygun olmayabilir Çözüm Veri belirleyici değil Veri düzeltme Normalizasyon
3 Normalizasyon min-max normalizasyon ondalık normalizasyon min-max normalleştirmesi ile Ondalık ölçekleme ile orijinal veriler yeni veri normalleştirmede ise, ele aralığına doğrusal dönüşüm alınan değişkenin ile dönüştürülürler. Bu veri değerlerinin ondalık kısmı aralığı genellikle 0-1 hareket ettirilerek aralığıdır. normalleştirme z-score normalizasyon gerçekleştirilir. Hareket edecek ondalık nokta sayısı, z Skor normalleştirmede değişkenin maksimum (veya 0 ortalama mutlak değerine bağlıdır. normalleştirme) ise Ondalık ölçeklemenin değişkenin her hangi bir y formülü aşağıdaki şekildedir: değeri, değişkenin ortalaması Örneğin 900 maksimum ve standart sapmasına bağlı olarak bilinen Z dönüşümü ile normalleştirilir. değer ise, n=3 olacağından 900 sayısı 0,9 olarak normalleştirilir.
4 Normalizasyon
5 Normalizasyon Min-max normalizasyon: v ' v mina maxa min Ör. Yıllık gelir $12,000 ile $98,000 arasını [0.0, 1.0] aralığına normalize edelim. $73,000 kaça denk gelir? Z-score normalizasyon (μ: ortalama, σ: standard sapma): v v ' A Ör. Let μ = 54,000, σ = 16,000. Öyleyse: Ondalıklı Normalizasyon v' v 10 j A A ( new_ max $73,000 kaça denk gelir? v = 0.73 A new_ mina) new_ min 73,600 12,000 (1.0 0) ,000 12,000 73,600 54, ,000 5 A
6 Nitelik Oluşturma Yeni nitelikler yarat orjinal niteliklerden alan=boy x en veri daha daha önemli bilgi içersin madenciliği algoritmalarının başarımı iyi olsun
7 Veri Azaltma
8 Veri Azaltma Veri miktarı çok fazla olduğu zaman veri madenciliği algoritmalarının çalışması ve sonuç üretmesi çok uzun sürebilir Veri azaltma veriyi azaltma başarımı artırır sonucun (nerdeyse) hiç değişmemesi gerekir nitelik azaltma veri sıkıştırma veri ayrıklaştırma veri küçültme
9 Nitelik Azaltma Nitelikler kümesinin bir alt kümesi seçilerek veri madenciliği işlemi yapılır. d boyutlu veri kümesi k<d olacak şekilde k boyuta taşınır. Nitelik seçme Veri madenciliği uygulaması için gerekli olan niteliklerin seçilmesi
10 Örnek
11 Veri Sıkıştırma Verinin boyutunu azaltır daha az saklama ortamı veriye ulaşmak daha çabuk Kayıplı ve kayıpsız veri sıkıştırma bazı yöntemler bazı veri tiplerine uygun Eğer veri madenciliği yöntemi sıkıştırılmış veri üzerinde doğrudan çalışabiliyorsa elverişli
12 Veri Sıkıştırma Orijinal veri Sıkıştırılmış veri kayıpsız Orijinale Benzeyen Veri
13 Veri Ayrıklaştırma Bazı veri madenciliği algoritmaları sadece ayrık veriler ile çalışır. Sürekli bir nitelik değerini bölerek her aralığı etiketler. Verinin değeri, bulunduğu aralığın etiketi ile değişir. Veri boyutu küçülür.
14 Veri Ayrıklaştırma Müşteri Yaşına göre ayrıklaştırma Bebek Çocuk Genç Yetişkin Yaşlı İleri yaş Orta Yaş Çok yaşlı
15 Veri Küçültme Veriyi farklı şekillerde gösterme histogram kümeleme örnekleme
16 Histogram ile Veri Küçültme Verinin dağılımı Veriyi bölerek her bölüm için veri değerini gösterir (toplam, ortalama)
17 Kümeleme ile Veri Küçültme Veri kümelere ayrılır Veri kümeleri temsil eden örnekler merkezleri) ve aykırılıklar ile temsil Etkisi verinin dağılımına bağlı. (küme edilir
18 Kümeleme ile veri küçültme Kümelenmiş veri Her kümeden orantılı sayıda temsilci seçimi
19 Örnekleme ile Veri Küçültme Büyük veri kümesini daha küçük bir alt küme ile temsil etme Alt küme nasıl seçiliyor? yerine yerine koymadan örnekleme (SRSWOR) koyarak örnekleme (SRSWR) katman örnekleme (katman: nitelik değerine göre grup)
20 Raw Data Örnekleme
21 Benzerlik ve Farklılık
22 Benzerlik ve Farklılık Benzerlik iki nesnenin benzerliğini ölçen sayısal değer nesneler birbirine daha benzer ise daha genelde 0-1 aralığında değer alır Farklılık büyük iki nesnenin birbirinden ne kadar farklı olduğunu gösteren sayısal değer nesneler birbirine daha benzer ise daha küçük en küçük farklılık genelde 0 üst sınır değişebilir.
23 Uzaklık Çeşitleri Öklid Minkowski (Manhattan)
24 Öklid Uzaklığı
25 Öklid Uzaklığı p1 p3 p4 p point x y p1 0 2 p2 2 0 p3 3 1 p4 5 1 p1 p2 p3 p4 p p p p Uzaklık Matrisi
26 Minkowski Uzaklığı
27 Minkowski Uzaklığı Manhattan Uzaklık Matrisi point x y p1 0 2 p2 2 0 p3 3 1 p4 5 1 L1 p1 p2 p3 p4 p p p p Öklid Uzaklık Matrisi L2 p1 p2 p3 p4 p p p p
28 Benzerlik Özellikleri İki nesne arası benzerlik özellikleri sim(i,j)>=0 sim(i,j)=sim(j,i)
29 İkili Değişkenler Arası Benzerlik
30 Örnek
VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme
DetaylıKonular. VERİ MADENCİLİĞİ Veri Önişleme. Değer Kümeleri. Veri Nedir? Nitelik Türleri. Konular. Veri Veri Önişleme Benzerlik ve farklılık
0 VERİ MADENCİLİĞİ Veri Önişleme Yrd. Doç. Dr. Şule Gündüz Öğüdücü Veri Nedir? nesneler ve nesnelerin niteliklerinden oluşan küme kayıt (record), varlık (entity), örnek (sample, instance) nesne için kullanılabilir.
DetaylıVERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine
DetaylıVERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Sınıflandırma yöntemleri Karar ağaçları ile sınıflandırma Entropi Kavramı ID3 Algoritması C4.5
DetaylıYZM 3217 YAPAY ZEKA DERS#10: KÜMELEME
YZM 317 YAPAY ZEKA DERS#10: KÜMELEME Sınıflandırma (Classification) Eğiticili (supervised) sınıflandırma: Sınıflandırma: Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğunu bilinir Eğiticisiz (unsupervised)
DetaylıSürekli Rastsal Değişkenler
Sürekli Rastsal Değişkenler Normal Dağılım: Giriş Normal Dağılım: Tamamen ortalaması ve standart sapması ile tanımlanan bir rastsal değişken, X, için oluşturulan sürekli olasılık dağılımına normal dağılım
DetaylıVERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan
DetaylıMerkezi Limit Teoremi
Örnekleme Dağılımı Merkezi Limit Teoremi Şimdiye kadar normal dağılıma uygun olan veriler ile ilgili örnekler incelendi. Çarpıklık gösteren veriler söz konusu olduğunda ne yapılması gerekir? Hala normal
DetaylıTEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ
TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ 1 İstatistik İstatistik, belirsizliğin veya eksik bilginin söz konusu olduğu durumlarda çıkarımlar yapmak ve karar vermek için sayısal verilerin
DetaylıDers 8: Verilerin Düzenlenmesi ve Analizi
Ders 8: Verilerin Düzenlenmesi ve Analizi Betimsel İstatistik Merkezsel Eğilim Ölçüleri Dağılım Ölçüleri Grafiksel Gösterimler Bir kitlenin tamamını, ya da kitleden alınan bir örneklemi özetlemekle (betimlemekle)
DetaylıKümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir
Kümeleme Analizi: Temel Kavramlar ve Algoritmalar Kümeleme Analizi Nedir? Her biri bir dizi öznitelik ile, veri noktalarının bir kümesi ve noktalar arasındaki benzerliği ölçen bir benzerlik ölçümü verilmiş
DetaylıJEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA
JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ Prof. Dr. Mualla YALÇINKAYA Karadeniz Teknik Üniversitesi, Harita Mühendisliği Bölümü Trabzon, 2018 VERİLERİN İRDELENMESİ Örnek: İki nokta arasındaki uzunluk 80 kere
DetaylıK En Yakın Komşu Methodu (KNearest Neighborhood)
K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre
DetaylıKümeleme Algoritmaları. Tahir Emre KALAYCI
Tahir Emre KALAYCI 2010 Gündem En önemli gözetimsiz öğrenme (unsupervised learning) problemi olarak değerlendirilmektedir Bu türdeki diğer problemler gibi etiketsiz veri kolleksiyonları için bir yapı bulmakla
Detaylı13. Olasılık Dağılımlar
13. Olasılık Dağılımlar Mühendislik alanında karşılaşılan fiziksel yada fiziksel olmayan rasgele değişken büyüklüklerin olasılık dağılımları için model alınabilecek çok sayıda sürekli ve kesikli fonksiyon
DetaylıDr. Hidayet Takçı. Veri Madenciliği Dersi GYTE Dr. Hidayet Takçı 10/05/2008 1
İkinci Ders Veri Madenciliği: Veri Dr. Hidayet Takçı Veri Madenciliği Dersi GYTE Dr. Hidayet Takçı 10/05/2008 1 Veri Nedir? Sayısal veya mantıksal her türlü değer bir veridir. Öznitelik Bir nesneye ait
DetaylıBu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır.
ÇOK ÖLÇÜTLÜ KARAR VERME TOPSIS (Technique For Order Preference By Similarity To Ideal Solution) PROF. DR. İBRAHİM ÇİL 1 Bu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır.
DetaylıÖrnekleme Yöntemleri
Örnekleme Yöntemleri Evren & Örneklem (Fraenkel & Wallen, 1990) Evren & Örneklem 2 Evren Evren, araştırma sonuçlarının genelleneceği (geçerli olacağı) büyük grup. Hedef evren, araştırmacının ulaşmak istediği,
DetaylıTANIMLAYICI İSTATİSTİKLER
TANIMLAYICI İSTATİSTİKLER Tanımlayıcı İstatistikler ve Grafikle Gösterim Grafik ve bir ölçüde tablolar değişkenlerin görsel bir özetini verirler. İdeal olarak burada değişkenlerin merkezi (ortalama) değerlerinin
DetaylıBULANIK MANTIK ile KONTROL
BULANIK MANTIK ile KONTROL AFYON KOCATEPE ÜNİVERSİTESİ Bulanık mantığın temel prensipleri: Bulanık küme sözel değişkenleri göstermek için kullanılır. Az sıcak, biraz soğuk gibi bulanık mantık üyelik fonksiyonları
DetaylıDers 9: Kitle Ortalaması ve Varyansı için Tahmin
Ders 9: Kitle Ortalaması ve Varyansı için Tahmin Kitle ve Örneklem Örneklem Dağılımı Nokta Tahmini Tahmin Edicilerin Özellikleri Kitle ortalaması için Aralık Tahmini Kitle Standart Sapması için Aralık
DetaylıBüyük boyutun laneti (Curse of Dimensionality)
Büyük boyutun laneti (Curse of Dimensionality) p Veri boyutu arttıkça örnekler (noktalar) uzay içinde çok fazla dağınık hale gelir. p Noktaların yoğunluğu ya da aralarındaki uzaklık bir çok problem için
DetaylıHafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti
Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr
DetaylıHafta 03/04 - Uzaklık/Benzerlik - En Yakın Komşular - Karar Ağaçları
Hafta 03/04 - Uzaklık/Benzerlik - En Yakın Komşular - Karar Ağaçları BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr
DetaylıCBS ve Coğrafi Hesaplama
Yıldız Teknik Üniversitesi CBS ve Coğrafi Hesaplama 2. Bölüm Yrd. Doç. Dr. Alper ŞEN Harita Mühendisliği Bölümü Kartografya Anabilim Dalı web: http://www.yarbis.yildiz.edu.tr/alpersen/ E mail: alpersen@yildiz.edu.tr
DetaylıMakine Öğrenmesi 2. hafta
Makine Öğrenmesi 2. hafta Uzaklığa dayalı gruplandırma K-means kümeleme K-NN sınıflayıcı 1 Uzaklığa dayalı gruplandırma Makine öğrenmesinde amaç birbirine en çok benzeyen veri noktalarını aynı grup içerisinde
DetaylıİÇİNDEKİLER ÖNSÖZ Bölüm 1 KÜMELER Bölüm 2 SAYILAR
İÇİNDEKİLER ÖNSÖZ III Bölüm 1 KÜMELER 11 1.1. Küme 12 1.2. Kümelerin Gösterimi 13 1.3. Boş Küme 13 1.4. Denk Küme 13 1.5. Eşit Kümeler 13 1.6. Alt Küme 13 1.7. Alt Küme Sayısı 14 1.8. Öz Alt Küme 16 1.9.
DetaylıGenel Graf Üzerinde Mutlak 1-merkez
Genel Graf Üzerinde Mutlak 1-merkez Çözüm yöntemine geçmeden önce bazı tanımlara ihtiyaç vardır. Dikkate alınan G grafındaki düğümleri 1 den n e kadar numaralandırın. Uzunluğu a(i, j)>0 olarak verilen
Detaylı8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,
İSTATİSTİK 8.Hafta Değişkenlik Ölçüleri Hedefler Bu üniteyi çalıştıktan sonra; Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek, Serilerin birbirlerine değişkenliklerini yorumlayabileceksiniz. 2
Detaylı7. BÖLÜM İÇ ÇARPIM UZAYLARI İÇ ÇARPIM UZAYLARI İÇ ÇARPIM UZAYLARI İÇ ÇARPIM UZAYLARI .= 1 1 + + Genel: Vektörler bölümünde vektörel iç çarpım;
İÇ ÇARPIM UZAYLARI 7. BÖLÜM İÇ ÇARPIM UZAYLARI Genel: Vektörler bölümünde vektörel iç çarpım;.= 1 1 + + Açıklanmış ve bu konu uzunluk ve uzaklık kavramlarını açıklamak için kullanılmıştır. Bu bölümde öklit
DetaylıT.C. DOKUZ EYLÜL ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ EKONOMETRİ ANABİLİM DALI EKONOMETRİ DOKTORA PROGRAMI
T.C. DOKUZ EYLÜL ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ EKONOMETRİ ANABİLİM DALI EKONOMETRİ DOKTORA PROGRAMI Genişletilmiş Lagrange Yöntemi Hazırlayan: Nicat GASIM Öğretim Üyesi Prof. Dr. İpek Deveci KARAKOÇ
DetaylıVerilerin Özetlenmesinde Kullanılan Sayısal Yöntemler
Verilerin Özetlenmesinde Kullanılan Sayısal Yöntemler Merkezi Eğilim Ölçüleri Merkezi eğilim ölçüsü, bir veri setindeki merkezi, yada tipik, tek bir değeri ifade eder. Nicel veriler için, reel sayı çizgisindeki
DetaylıSÜREKLĠ OLASILIK DAĞILIMLARI
SÜREKLĠ OLASILIK DAĞILIMLARI Sayı ekseni üzerindeki tüm noktalarda değer alabilen değişkenler, sürekli değişkenler olarak tanımlanmaktadır. Bu bölümde, sürekli değişkenlere uygun olasılık dağılımları üzerinde
DetaylıİMGE İŞLEME Ders-9. İmge Sıkıştırma. Dersin web sayfası: (Yrd. Doç. Dr. M.
İMGE İŞLEME Ders-9 İmge Sıkıştırma (Yrd. Doç. Dr. M. Kemal GÜLLÜ) Dersin web sayfası: http://mf.kou.edu.tr/elohab/kemalg/imge_web/odev.htm Hazırlayan: M. Kemal GÜLLÜ İmge Sıkıştırma Veri sıkıştırmanın
DetaylıSÜREKLİ OLASILIK DAĞILIŞLARI
SÜREKLİ OLASILIK DAĞILIŞLARI Sürekli verilerin göstermiş olduğu dağılışa sürekli olasılık dağılışı denir. Sürekli olasılık dağılışlarının fonksiyonlarına yoğunluk fonksiyonu denilmekte ve bu dağılışlarla
DetaylıANADOLU ÜNİVERSİTESİ. ENM 317 Prof. Dr. Nihal ERGİNEL
ANADOLU ÜNİVERSİTESİ ENM 317 Prof. Dr. Nihal ERGİNEL 2 ÖRNEKLEME Anakütleden n birimlik örnek alınması ve anakütle parametrelerinin örnekten tahmin edilmesidir. 3 ÖRNEKLEME ALMANIN NEDENLERİ Anakütleye
DetaylıBÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ
1 BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel
DetaylıCopyright 2004 Pearson Education, Inc. Slide 1
Slide 1 Bölüm 2 Verileri Betimleme, Keşfetme, ve Karşılaştırma 2-1 Genel Bakış 2-2 Sıklık Dağılımları 2-3 Verilerin Görselleştirilmesi 2-4 Merkezi Eğilim Ölçüleri 2-5 Değişimin Ölçülmesi 2-6 Nispi Sabitlerin
DetaylıÇok fazla bilgiden gizli kalmış örüntüleri ortaya çıkarma sürecine Veri Madenciliği denir.
Veri Madenciliği Çok fazla bilgiden gizli kalmış örüntüleri ortaya çıkarma sürecine Veri Madenciliği denir. istatistik + makine öğrenmesi + yapay zeka = veri madenciliği Veri madenciliği süreçleri CRISP-DM
DetaylıÖrneklem. Yöntemleri FBED511 Eğitim Bilimlerinde Temel Araştırma Yöntemleri 1. Evren & Örneklem. Evren. Örneklem ve örnekleme
Yöntemleri & EBE Z Eğitimde Araştırma Yöntemleri (Fraenkel & Wallen, 1990), araştırma sonuçlarının genelleneceği (geçerli olacağı) büyük grup. Hedef evren, araştırmacının ulaşmak istediği, ancak ulaşması
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall
DetaylıÜniversite Öğrencileri İçin Bilgisayar Okuryazarlığını Etkileyen Faktörlerin Etkisinin Veri Madenciliği İle Analizi
Üniversite Öğrencileri İçin Bilgisayar Okuryazarlığını Etkileyen Faktörlerin Etkisinin Veri Madenciliği İle Analizi Computer Literacy For College Students Analysis of Factors Affecting The Effect of Data
DetaylıYapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( )
İKİ DEĞİŞKENLİ OLASILIK Rassal bir deneme yapılmakta ve farklı iki olay ile ilgilenilmektedir. A 1, A 2,,A i olayları bağdaşmaz ve bütünü kapsayıcıdır. B 1, B 2,,B j olayları bağdaşmaz ve bütünü kapsayıcıdır.
DetaylıGenel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.
4.SUNUM Genel olarak test istatistikleri Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri olmak üzere 2 grupta incelenebilir. 2 Ranj Çeyrek Kayma Çeyrekler Arası Açıklık Standart Sapma Varyans
DetaylıSÜREKSİZ(DISCRETE) OLASILIK DAĞILIMLARI
SÜREKSİZ(DISCRETE) OLASILIK DAĞILIMLARI Yrd. Doç.Dr. İrfan Yolcubal Kocaeli Üni. Jeoloji Müh. Random Değişken: Nümerik olarak ifade edilen bir deneyin sonuçları Süreksiz(Discrete) Random Değişken: Randomdeğişken
DetaylıİÇİNDEKİLER ÖN SÖZ...
İÇİNDEKİLER ÖN SÖZ... v GİRİŞ... 1 1. İSTATİSTİK İN TARİHÇESİ... 1 2. İSTATİSTİK NEDİR?... 3 3. SAYISAL BİLGİDEN ANLAM ÇIKARILMASI... 4 4. BELİRSİZLİĞİN ELE ALINMASI... 4 5. ÖRNEKLEME... 5 6. İLİŞKİLERİN
DetaylıKONU 4: DOĞRUSAL PROGRAMLAMA MODELİ İÇİN ÇÖZÜM YÖNTEMLERİ I
KONU 4: DOĞRUSAL PROGRAMLAMA MODELİ İÇİN ÇÖZÜM YÖNTEMLERİ I 4.1. Dışbükeylik ve Uç Nokta Bir d.p.p. de model kısıtlarını aynı anda sağlayan X X X karar değişkenleri... n vektörüne çözüm denir. Eğer bu
DetaylıKitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.
BÖLÜM 1: FREKANS DAĞILIMLARI 1.1. Giriş İstatistik, rasgelelik içeren olaylar, süreçler, sistemler hakkında modeller kurmada, gözlemlere dayanarak bu modellerin geçerliliğini sınamada ve bu modellerden
DetaylıÖrüntü Tanıma (EE 448) Ders Detayları
Örüntü Tanıma (EE 448) Ders Detayları Ders Adı Ders Kodu Dönemi Ders Saati Uygulama Saati Laboratuar Saati Kredi AKTS Örüntü Tanıma EE 448 Bahar 3 0 0 3 5 Ön Koşul Ders(ler)i Dersin Dili Dersin Türü Dersin
DetaylıErciyes Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, Sayı: 21, Temmuz-Aralık 2003, ss. 67-76. VERİ ÖN İŞLEME
Erciyes Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, Sayı: 21, Temmuz-Aralık 2003, ss. 67-76. VERİ ÖN İŞLEME Ayşe OĞUZLAR ÖZET Veri madenciliği, (data mining-dm) son 10 yılda dünyada hızla
DetaylıDers 10. Prof.Dr.Haydar Eş Prof.Dr.Timur Karaçay. Simpleks Yöntemine Giriş Alıştırmalar 10
Bölüm 10 Ders 10 Simpleks Yöntemine Giriş 10.1 Alıştırmalar 10 Prof.Dr.Haydar Eş Prof.Dr.Timur Karaçay 197 198 BÖLÜM 10. DERS 10 1. Soru 1 1. Aşağıda verilen simpleks tablolarında temel, temel olmayan,
DetaylıDers 4: Rastgele Değişkenler ve Dağılımları
Ders 4: Rastgele Değişkenler ve Dağılımları Rastgele değişken kavramı Kesikli ve sürekli rastgele değişkenler İki boyutlu rastgele değişkenler Beklenen değer Varyans Örnek uzaydaki her elemanı bir sayıyla
DetaylıVERİ MADENCİLİĞİNİN GÖREVLERİ
VERİ MADENCİLİĞİNİN GÖREVLERİ VERİ MADENCİLİĞİNİN GÖREVLERİ Classification (Sınıflandırma) Karakterizasyon (Betimleme) Regression (İlişki Çıkarımı) Clustering (Kümeleme) Association (İlişki Analizi) Forecasting
DetaylıProf.Dr.A.KARACABEY Doç.Dr.F.GÖKGÖZ RANDOM DEĞİŞKEN
SÜREKSİZ (DISCRETE) OLASILIK DAĞILIMLARI 1 RANDOM DEĞİŞKEN Nümerik olarak ifade edilebilen bir deneyin sonuçlarına rassal (random) değişken denir. Temelde iki çeşit random değişken vardır. ##süreksiz(discrete)
DetaylıDr. Hidayet Takçı. Veri Madencilii Dersi GYTE Dr. Hidayet Takçı 10/05/2008 1
Dr. Hidayet Takçı Veri Madencilii Dersi GYTE Dr. Hidayet Takçı 10/05/2008 1 Sayısal veya mantıksal her türlü deer bir veridir. Öznitelik Bir nesneye ait özellik veya onun bir karakteristiidir Örnek: bir
Detaylıİstatistik Nedir? İstatistiğin Önemi Nedir? Tanımlayıcı ve Çıkarımcı İstatistik ttitik Tanımlayıcı İstatistik Türleri Çıkarımcı İstatistiğin i iği
İSTATİSTİK E GİRİŞ TEMEL KAVRAMLAR İstatistik Nedir? İstatistiğin Önemi Nedir? Tanımlayıcı ve Çıkarımcı İstatistik ttitik Tanımlayıcı İstatistik Türleri Çıkarımcı İstatistiğin i iği Elemanlarıl AMAÇ İstatistiğe
DetaylıDr. Y. İlker TOPCU. Dr. Özgür KABAK web.itu.edu.tr/kabak/
Dr. Y. İlker TOPCU www.ilkertopcu.net www.ilkertopcu.org www.ilkertopcu.info facebook.com/yitopcu twitter.com/yitopcu instagram.com/yitopcu Dr. Özgür KABAK web.itu.edu.tr/kabak/ ÇOK ÖLÇÜTLÜ KARAR VERME
Detaylırasgele değişkeninin olasılık yoğunluk fonksiyonu,
3.6. Bazı Sürekli Dağılımlar 3.6.1 Normal Dağılım Normal dağılım hem uygulamalı hem de teorik istatistikte kullanılan oldukça önemli bir dağılımdır. Normal dağılımın istatistikte önemli bir yerinin olmasının
DetaylıOluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir
Bilimsel Araştırma Yöntemleri Prof. Dr. Şener Büyüköztürk Doç. Dr. Ebru Kılıç Çakmak Yrd. Doç. Dr. Özcan Erkan Akgün Doç. Dr. Şirin Karadeniz Dr. Funda Demirel Örnekleme Yöntemleri Evren Evren, araştırma
DetaylıVeri Madenciliği Uygulamalarında Özellik Seçimi İçin Finansal Değerlere Binning ve Five Number Summary Metotları ile Normalizasyon İşleminin Uygulanması Ali Tunç 1, İlker Ülger 1 1 Kuveyttürk Katılım Bankası
DetaylıBULANIK MANTIK DENETLEYİCİLERİ. Bölüm-4 Bulanık Çıkarım
BULANIK MANTIK DENETLEYİCİLERİ Bölüm-4 Bulanık Çıkarım 1 Bulanık Çıkarım Bölüm 4 : Hedefleri Bulanık kuralların ve bulanık bilgi tabanlarının nasıl oluşturulacağını anlamak. Gerçekte bulanık muhakeme olan
DetaylıBÖLÜM 3 KURAMSAL ÇATI VE HİPOTEZ GELİŞ
BÖLÜM 3 KURAMSAL ÇATI VE HİPOTEZ GELİŞ İŞTİRME Araştırma rma SüreciS 1.Gözlem Genel araştırma alanı 3.Sorunun Belirlenmesi Sorun taslağının hazırlanması 4.Kuramsal Çatı Değişkenlerin açıkça saptanması
DetaylıMIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009
MIT OpenCourseWare http://ocw.mit.edu 14.30 Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 Bu materyale atıfta bulunmak ve kullanım koşulları için http://ocw.mit.edu/terms sayfasını ziyaret ediniz.
DetaylıSÜREKLİ OLASILIK DAĞILIMI
SÜREKLİ OLASILIK DAĞILIMI Normal Olasılık Dağılımı Akülerin dayanma süresi, araçların belli bir zamanda aldığı yol, bir koşuya katılanların bitirme süresi gibi sayılamayacak kadar çok değer alabilen sürekli
DetaylıK-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi
K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi Erdal TAŞCI* Aytuğ ONAN** *Ege Üniversitesi Bilgisayar Mühendisliği Bölümü **Celal Bayar Üniversitesi
DetaylıMONTE CARLO BENZETİMİ
MONTE CARLO BENZETİMİ U(0,1) rassal değişkenler kullanılarak (zamanın önemli bir rolü olmadığı) stokastik ya da deterministik problemlerin çözümünde kullanılan bir tekniktir. Monte Carlo simülasyonu, genellikle
DetaylıSÜREKLİ( CONTINUOUS) OLASILIK
SÜREKLİ( CONTINUOUS) OLASILIK DAĞILIMLARI Sürekli bir random değişken (a,b) aralığındaki her değeri alabiliyorsa bu değişkene ait olasılık dağılım fonksiyonunun grafiğinde eğri altında kalan alan bize
DetaylıBİLGİSAYAR PROGRAMLAMA
BİLGİSAYAR PROGRAMLAMA Yrd. Doç. Dr. Beytullah EREN beren@sakarya.edu.tr 0264 295 5642 Excel - Hücreler Excel de hücrelere hangi değerler girilebilir? Metin Rakam Tarih ve Saat Formül 1 HÜCRE SEÇİMİ Matematikteki
DetaylıBilgisayarla Görüye Giriş
Bilgisayarla Görüye Giriş Ders 4 İkili Görüntüler, Topoloji ve Morfoloji Alp Ertürk alp.erturk@kocaeli.edu.tr İkili (binary) görüntüler Gri skala veya renkli bir görüntünün eşiklenmesi ile elde edilirler.
DetaylıÖrnekleme Teknikleri
Örnekleme Teknikleri Örnekleme Kavramı Sınıftaki öğrencilerin yaş ortalamasını tahmin etmek istiyoruz. Şehirde yaşayan kişilerin aylık ortalama gelir miktarı Seçim sonuçları Örnekleme Önemli Kavramlar
DetaylıSayılar Teorisi SAYILAR TEORİSİ VE SAYILAR
Sayılar Teorisi SAYILAR TEORİSİ VE SAYILAR Sayılar; insanların ilk çağlardan beri ihtiyaç duyduğu bir gereksinim olmuştur; sayılar teorisi de matematiğin en eski alanlarından birisidir. Sayılar teorisi,
DetaylıYZM ALGORİTMA ANALİZİ VE TASARIM DERS#9: AÇGÖZLÜ ALGORİTMALAR
YZM 3207- ALGORİTMA ANALİZİ VE TASARIM DERS#9: AÇGÖZLÜ ALGORİTMALAR Aç Gözlü (Hırslı) Algoritmalar (Greedy ) Bozuk para verme problemi Bir kasiyer 48 kuruş para üstünü nasıl verir? 25 kuruş, 10 kuruş,
DetaylıÇok-öbekli Veri için Aradeğerlemeci Ayrışım
Interpolative Decomposition for Data with Multiple Clusters Çok-öbekli Veri için Aradeğerlemeci Ayrışım İsmail Arı, A. Taylan Cemgil, Lale Akarun. Boğaziçi Üniversitesi, Bilgisayar Mühendisliği 25 Nisan
DetaylıKorelasyon. Korelasyon. Merkezi eğilim ve değişim ölçüleri bir defada sadece bir değişkenin özelliklerini incelememize imkan tanır.
Korelasyon Korelasyon Merkezi eğilim ve değişim ölçüleri bir defada sadece bir değişkenin özelliklerini incelememize imkan tanır. Biz şimdi, bir değişkenin özelliklerini diğer değişkenle olan ilişkisine
DetaylıİSTATİSTİKSEL TAHMİNLEME. Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir.
İSTATİSTİKSEL TAHMİNLEME Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir. 1 ŞEKİL: Evren uzay-örneklem uzay İstatistiksel tahmin
DetaylıTanımı Amacı Özellikleri Kullanım Alanları Varsayımları Yöntemleri Uygulama aşamaları. Neleri göreceğiz?
KÜMELEME Tanımı Amacı Özellikleri Kullanım Alanları Varsayımları Yöntemleri Uygulama aşamaları Neleri göreceğiz? Tanımı Veriyi birbirlerine benzeyen elemanlardan oluşan kümelere ayırarak, heterojen bir
DetaylıKaynak: A. İŞLİER, TESİS PLANLAMASI, 1997
Mühendislik Fakültesi Endüstri Mühendisliği Bölümü Doç. Dr. Nil ARAS ENM411 Tesis Planlaması 2016-2017 Güz Dönemi Kaynak: A. İŞLİER, TESİS PLANLAMASI, 1997 2 Tesis Yer Seçimi Problemi (TYSP) TEK AMAÇLI
DetaylıBoosting. Birol Yüceoğlu Migros T.A.Ş.
Boosting Birol Yüceoğlu Migros T.A.Ş. www.veridefteri.com biroly@migros.com.tr İçerik Karar ağaçları Bagging Boosting Ana fikir Boosting vs. Bagging LightGBM Scikit-learn AdaBoost Calibration Gradient
DetaylıTemel Mikroişlemci Tabanlı Bir Sisteme Hata Enjekte Etme Yöntemi Geliştirilmesi. Buse Ustaoğlu Berna Örs Yalçın
Temel Mikroişlemci Tabanlı Bir Sisteme Hata Enjekte Etme Yöntemi Geliştirilmesi Buse Ustaoğlu Berna Örs Yalçın İçerik Giriş Çalişmanın Amacı Mikroişlemciye Hata Enjekte Etme Adımları Hata Üreteci Devresi
DetaylıBTP 207 İNTERNET PROGRAMCILIĞI I. Ders 8
BTP 27 İNTERNET PROGRAMCILIĞI I Ders 8 Değişkenler 2 Tamsayı Değerler (Integer) Tamsayılar, tabanlı (decimal), 8 tabanlı (octal) veya 6 tabanlı (hexadecimal) olabilir. 8 tabanındaki sayıları belirtmek
DetaylıLAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ TELAFĐ SINAVI SORULARI
LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I 2015-2016 BAHAR DÖNEMĐ TELAFĐ SINAVI SORULARI Tarih/Saat/Yer: 20.06.16/15:00-16:30/AS010 Instructor: Prof. Dr. Hüseyin Oğuz Öğrenci
DetaylıİÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37
İÇİNDEKİLER BÖLÜM 1 Değişkenler ve Grafikler 1 İstatistik 1 Yığın ve Örnek; Tümevarımcı ve Betimleyici İstatistik 1 Değişkenler: Kesikli ve Sürekli 1 Verilerin Yuvarlanması Bilimsel Gösterim Anlamlı Rakamlar
DetaylıUygulama 3 Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH
BİYOİSTATİSTİK Uygulama 3 Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr Olasılık Hatırlatma Olasılık teorisi,
DetaylıBÖLÜM 12 STUDENT T DAĞILIMI
1 BÖLÜM 12 STUDENT T DAĞILIMI 'Student t dağılımı' ya da kısaca 't dağılımı'; normal dağılım ve Z dağılımının da içerisinde bulunduğu 'sürekli olasılık dağılımları' ailesinde yer alan dağılımlardan bir
DetaylıÖRNEKLEME TEORİSİ. Prof.Dr.A.KARACABEY Doç.Dr.F.GÖKGÖZ
ÖRNEKLEME TEORİSİ 1 Bir popülasyonu istatistiksel açıdan incelemek ve işlemler yapabilmek için popülasyon içerisinden seçilen örneklemlerden yararlandığımızı söylemiştik. Peki popülasyonun istatistiksel
DetaylıEM302 Yöneylem Araştırması 2 Doğrusal Olmayan Programlamaya Giriş. Dr. Özgür Kabak
EM302 Yöneylem Araştırması 2 Doğrusal Olmayan Programlamaya Giriş Dr. Özgür Kabak Doğrusal Olmayan Programlama Eğer bir Matematiksel Programlama modelinin amaç fonksiyonu ve/veya kısıtları doğrusal değil
Detaylıİş Zekası. Hafta 6 Kestirimci Modelleme Teknikleri. Yrd. Doç. Dr. H. İbrahim CEBECİ
İş Zekası Hafta 6 Kestirimci Modelleme Teknikleri Business Intelligence and Analytics: Systems for Decision Support 10e isimli eserden adapte edilmiştir Bölüm Amaçları Yapay Sinir Ağları (YSA) kavramını
DetaylıMATEMATİK MÜHENDİSLİĞİ PROGRAMI
İSTANBUL TEKNİK ÜNİVERSİTESİ FEN EDEBİYAT FAKÜLTESİ MATEMATİK MÜHENDİSLİĞİ PROGRAMI ÖĞRENCİ HARF NOTLARININ K-MEANS KÜMELEME ALGORİTMASI İLE BELİRLENMESİ BİTİRME ÖDEVİ Ece FIRAT 090070026 Tez Danışmanı:
DetaylıMerkezi eğilim ölçüleri ile bir frekans dağılımının merkezi belirlenirken; yayılma ölçüleri ile değişkenliği veya yayılma düzeyini tespit eder.
Yayılma Ölçütleri Merkezi eğilim ölçüleri ile bir frekans dağılımının merkezi belirlenirken; yayılma ölçüleri ile değişkenliği veya yayılma düzeyini tespit eder. Bir başka ifade ile, bir veri setinin,
DetaylıOLASILIK ve KURAMSAL DAĞILIMLAR
OLASILIK ve KURAMSAL DAĞILIMLAR Kuramsal Dağılımlar İstatistiksel çözümlemelerde; değişkenlerimizin dağılma özellikleri, çözümleme yönteminin seçimi ve sonuçlarının yorumlanmasında önemlidir. Dağılma özelliklerine
DetaylıKLASİK FRAKTALLAR FRAKTAL ÖZELLİKLERİ VE BOYUT
KLASİK FRAKTALLAR FRAKTAL ÖZELLİKLERİ VE BOYUT.. KENDİNE BENZERLİK VE AFİNİTE Fraktal özelliklerinden bir diğeri de kendine benzerlikdir. Geometrik açıdan, aynı şekle sahip olan geometrik şekiller birbirine
DetaylıTemelleri. Doç.Dr.Ali Argun Karacabey
Doğrusal Programlamanın Temelleri Doç.Dr.Ali Argun Karacabey Doğrusal Programlama Nedir? Bir Doğrusal Programlama Modeli doğrusal kısıtlar altında bir doğrusal ğ fonksiyonun değerini ğ maksimize yada minimize
DetaylıDr. Y. İlker TOPCU. Dr. Özgür KABAK web.itu.edu.tr/kabak/
Dr. Y. İlker TOPCU www.ilkertopcu.net www.ilkertopcu.org www.ilkertopcu.info facebook.com/yitopcu twitter.com/yitopcu instagram.com/yitopcu Dr. Özgür KABAK web.itu.edu.tr/kabak/ Dr. Y. İlker Topcu (www.ilkertopcu.net)
DetaylıBÖLÜM 10 PUAN DÖNÜŞÜMLERİ
1 BÖLÜM 10 PUAN DÖNÜŞÜMLERİ Bir gözlem sonucunda elde edilen ve üzerinde herhangi bir düzenleme yapılmamış ölçme sonuçları 'ham veri' ya da 'ham puan' olarak isimlendirilir. Genellikle ham verilerin anlaşılması
DetaylıİÇİNDEKİLER 1. GİRİŞ...
İÇİNDEKİLER 1. GİRİŞ... 1 1.1. Regresyon Analizi... 1 1.2. Uygulama Alanları ve Veri Setleri... 2 1.3. Regresyon Analizinde Adımlar... 3 1.3.1. Problemin İfadesi... 3 1.3.2. Konu ile İlgili Potansiyel
DetaylıKONU 13: GENEL UYGULAMA
KONU : GENEL UYGULAMA Kahve üretimi apan bir şirket anı zamanda cezve ve fincan üretmektedir. Üretilen cezveler ve fincanlar boama kısmında işlem görmekte ve arıca fincanlar kaplanmaktadır. Bir cezve apımı
Detaylı4/4/2013. Ders 8: Verilerin Düzenlenmesi ve Analizi. Betimsel İstatistik Merkezsel Eğilim Ölçüleri Dağılım Ölçüleri Grafiksel Gösterimler
Ders 8: Verileri Düzelemesi ve Aalizi Betimsel İstatistik Merkezsel Eğilim Ölçüleri Dağılım Ölçüleri Grafiksel Gösterimler Bir kitlei tamamıı, ya da kitlede alıa bir öreklemi özetlemekle (betimlemekle)
DetaylıHatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5
Ders Kodu: 0010070021 Kredi: 3 / ECTS: 5 Yrd. Doç. Dr. Serkan DOĞANALP Necmettin Erbakan Üniversitesi Harita Mühendisliği Bölümü Konya 07.01.2015 1 Giriş 2 Giriş Matematiksel istatistiğin konusu yığın
Detaylı