Spatial locality nin getirdigi avantaji kullanmak

Benzer belgeler
BM-311 Bilgisayar Mimarisi

BM 375 Bilgisayar Organizasyonu Dersi Vize Sınavı Cevapları 10 Nisan 2009

PC is updated PS güncellenir

William Stallings Computer Organization and Architecture 9 th Edition

Yrd.Doç.Dr. Celal Murat KANDEMİR

BİLGİSAYAR MİMARİSİNDE YENİ YAKLAŞIMLAR DÖNEM PROJESİ

Lecture 7. Assembler language nedir? Language in 3 seviyesi. Language 3 seviyesi. Nicin onu ogreniriz?

BM-311 Bilgisayar Mimarisi

BİL 423 Bilgisayar Mimarisi 1. Ara Sınavı

BM-311 Bilgisayar Mimarisi

BM-311 Bilgisayar Mimarisi. Hazırlayan: M.Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü

BİLGİSAYAR MİMARİSİ. << Bus Yapısı >> Özer Çelik Matematik-Bilgisayar Bölümü

6 Bellek Organizasyonu (İç / Dış) 6.1 Bellek Hiyerarşisi:

MIPS assembler language de branching

BM-311 Bilgisayar Mimarisi

(Random-Access Memory)

Ders - 1. BİL 221 Bilgisayar Yapısı GİRİŞ. Ders Hakkında. Ders İzlencesi

Bilgisayar Donanımı. Computer Organization Ders 1 - Giriş Kadir Atilla TOKER

Bellek. Hiyerarşisi. Tek işlemcinin saniyedeki ortalama bellek erişimi isteği. Kaynak: Hennesy, Patterson, Computer Architecture, 5/e

MİKROİŞLEMCİ MİMARİLERİ

BİLGİSAYAR MİMARİSİ-II İÇERİK ADRESLEMELİ BELLEK

BM-311 Bilgisayar Mimarisi

6 Bellek Organizasyonu (İç / Dış) 6.1 Bellek Hiyerarşisi:

BM-311 Bilgisayar Mimarisi

Onluk duzende toplama. Lecture 4. Addition and Subtraction. Onluk tabanda toplama

BM-311 Bilgisayar Mimarisi

Bellek. Hiyerarşisi. Statik RAM SRAM (Static RAM):

6.4.1 Önbellek Eşleme Planları

Sanal Bellek (Virtual Memory)

Multiplication/division

Hem lw hem de sw komutlarının ofseti 16-bitlik işaretli tamsayıdır.

Dosya Saklama Ortamları (Devam) Kütük Organizasyonu 1

Bilgisayar Mimarisi. İç Bellek Mimarisi. İşlemci-Bellek Arabağlantısı MAR MBR. komut komut komut. Ön Bellek. veri veri. G/Ç Modül.

CISC Complex Instruction Set Computers

BM-311 Bilgisayar Mimarisi

İşletim Sistemlerine Giriş

İşletim Sistemlerine Giriş

BM-311 Bilgisayar Mimarisi

Mifare Kart Yazıcı/Okuyucu Modül (MFM-200)

D Duplex : Alıcı + Verici Çalışma Debouching : DMA : Direct Memory Access Data-Bus : Data Veri Yolu Data Flow : Veri Akışı Data Processing : Veri

İŞLETİM SİSTEMİ İşletim sistemi kullanıcıyla bilgisayar donanımı arasında iletişim sağlayan programdır.

x86 Ailesi Mikroişlemciler ve Mikrobilgisayarlar

BM-311 Bilgisayar Mimarisi

Dr. Feza BUZLUCA İstanbul Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

İşletim Sistemlerine Giriş

Bölüm Bazı Temel Konseptler

Von Neumann Mimarisi. Mikroişlemciler ve Mikrobilgisayarlar 1

MİKROBİLGİSAYAR SİSTEMLERİ. Teknik Bilimler Meslek Yüksekokulu

İşletim Sistemleri (Operating Systems)

Ozet. Review pointers (in C) Memory Addressing

William Stallings Computer Organization and Architecture 9 th Edition

Logical signals. Active high or asserted logic. Logic threshold, yaklasik 1.4 volts. Read H&P sections B.3, B.4, B.5 Read H&P sections 5.1 and 5.

İşletim Sistemleri. Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü

Önbellek (Cache) Sistemleri

SAYISAL TASARIM. Ege Üniversitesi Ege MYO Mekatronik Programı

Giris {\} /\ Suhap SAHIN

Bilgisayar Donanım 2010 BİLGİSAYAR

Windows Eski Sürümleri Bellek Yapısı

Assembly Language Programming

BIL410 GELİŞMİŞ BİLGİSAYAR MİMARİLERİ. Kayhan İmre

1 I S L U Y G U L A M A L I İ K T İ S A T _ U Y G U L A M A ( 5 ) _ 3 0 K a s ı m

DERS 3 MİKROİŞLEMCİ SİSTEM MİMARİSİ. İçerik

Quiz:8086 Mikroişlemcisi Mimarisi ve Emirleri

Bölüm 8: Ana Bellek. Operating System Concepts with Java 8 th Edition

Spectrum of PCM signal depends on Bit rate: Correlation of PCM data PCM waveform (pulse shape) Line encoding. For no aliasing:

Mikroçita. Mikroçita Rapor 2:

HAFTA 1 KALICI OLMAYAN HAFIZA RAM SRAM DRAM DDRAM KALICI HAFIZA ROM PROM EPROM EEPROM FLASH HARDDISK

Bilgisayarların Gelişimi

BİLGİSAYAR MİMARİSİ. Bilgisayar Bileşenleri Ve Programların Yürütülmesi. Özer Çelik Matematik-Bilgisayar Bölümü

İşletim Sistemleri. Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü

Sequential (SEQ, Ardışıl) Y86 İşlemci Uygulaması (Devamı)

Sıralı Erişimli Dosyalar. Kütük Organizasyonu 1

KOMUT TABLOSU İLE İLGİLİ AÇIKLAMALAR:

Cache-Hızlı Hafıza Birimi. Bilgisayar Sistemi Bilgisayarların Anakart Organizasyonu

Mikroişlemciler ve Assembler Programlama. Teknoloji Fakültesi / Bilgisayar Mühendisliği Öğr.Gör. Günay TEMÜR

Data Communications. Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü. 5. Analog veri iletimi

Background (Arka Plan)

Görüntü Bellek. Ana Bellek. Fiziksel Adres. Belek Uzayı. Bellek hiyerarşisi. Hız Maliyet (+) Ana Bellek. Boyut (+) DISK. Görüntü Adres.

Bilgisayar Programcılığı

Sanal Makineler ve Linux Konteynerlerin Performans Karşılaştırması

8086 nın Bacak Bağlantısı ve İşlevleri. 8086, 16-bit veri yoluna (data bus) 8088 ise 8- bit veri yoluna sahip16-bit mikroişlemcilerdir.

C++ Programming: Program Design Including Data Structures, Third Edition. Bölüm 1: Bilgisayarlar ve Programlama Dillerine Kısa Bakış

Fiziksel Tasarım Konuları. Dosya Organizasyon Teknikleri Kayıt Erişim Yöntemleri Veri Yapıları

Fiziksel Veritabanı Modelleme

T E M E L K AV R A M L A R. Öğr.Gör. Günay TEMÜR / Teknoloji F. / Bilgisayar Müh.

MİKROİŞLEMCİLER 1 Ders 1

: BÖLÜM 1: PLC NİN YAPISI

Bil101 Bilgisayar Yazılımı I. M. Erdem ÇORAPÇIOĞLU Bilgisayar Yüksek Mühendisi

Bilgisayar Mimarisi ve Organizasyonu Giriş

Peripheral Component Interconnect (PCI)

BIL411 - BİLGİSAYAR AĞLARI LABORATUVARI

BELLEK BİRİMLERİ BELLEK BİRİMLERİ

DOĞU AKDENİZ ÜNİVERSİTESİ BAHAR BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ BLGM-324 BİLGİSAYAR MİMARİSİ DENEY #6

BİLGİSAYAR VE PROGRAMLAMAYA GİRİŞ

BTP 205 İŞLETİM SİSTEMLERİ

Kütük Yönetimi. Kütük Yönetim Sisteminin İşlevleri. Hacettepe Üniversitesi Kavramsal Kütük Modeli.

BM-311 Bilgisayar Mimarisi

BELLEKLER. Kelime anlamı olarak RAM Random Access Memory yani Rastgele Erişilebilir Bellek cümlesinin kısaltılması ile oluşmuş bir tanımdır.

Transkript:

Oku H&P section 7.3 Spatial locality nin getirdigi avantaji kullanmak Daha buyuk block (line) kullan Her bir fetch ile gelecekte yakin komsuluktaki erisimler icin data cache bulunacak Daha fazla hit e sebep olur Daha uzun line fetch etmek (ornek 4 words) icin gereken zaman cok katli zaman suresi almaz ( word fetch etmek icin gereken surenin 4 kati) /4/4 Bilgisayar Mimarisi. /4/4 Bilgisayar Mimarisi. Bandwidth succeeds if any block matches Address (showing bit positions) 3 6 5 4 3 6 Byte Tag offset Block offset Bir path deki information akisinin hizi bits/sec veya bytes/sec olarak olculur Bandwith i artirmak Information hizini artirmak veya paralel olarak daha fazla bit akisi temin etmek icin path in genisletilmesiyle olur 6 bits 8 bits V Tag 6 3 3 3 3 4K entries Mux 3 yalnizca word temin eder /4/4 Bilgisayar Mimarisi.3 /4/4 Bilgisayar Mimarisi.4

Eger miss varsa 4word uzunluklu block memory den cache getirilr Address (showing bit positions) 3 6 5 4 3 6 Byte Tag offset Block offset 6 bits 8 bits V Tag 4K entries 6 3 3 3 3 Ardisil instruction fetche leri Instruction cache miss rate yaklasik block size kac katina cikmissa o oranda duser Instruction erisimleri yuksek oranda spatial locality e sahip oldugundan block size ini artirmak mantikli Mux 3 ye yalnizca word getirilir /4/4 Bilgisayar Mimarisi.5 /4/4 Bilgisayar Mimarisi.6 Read 4 words at once into the cache Tag 3 ADD ORI LW LW LW Eger 4 word okumak icin gerekli sure word okumak icin gerekli surenin 4 katindan az ise, her bir memory erisimi cache 4 instruction getirilmesini daha kisa surede gerceklestirir rate in yukselmesini, ortalama fetch zamaninin kisalmasini saglar 4 8 6 4 8 3 36 4 44 ADD ORI LW ADD BLT CMP LUI LW LW /4/4 Bilgisayar Mimarisi.7 Miss Penalty nin ilk parcasina erisim icin gerekli zaman Latency (genelde clock cycle olarak olculur) Miss penalty iki kisimdan olusur Address decode (address cozumu) icin gerekli sure (tipic olarak 5- clock cycle veya 5 nsec) Transfer time: word transferi basina gecen zaman. Yaklasik nsec /4/4 Bilgisayar Mimarisi.8

Miss penalty memory access tarafindan domine edilir access time (address cozumunu icerir) Transfer edilen word sayisindan bagimsizdir Bu yuzden access basina daha cok data transfer et Multiplexor b. Wide memory organization bank bank bank c. Interleaved memory organization bank 3 access, transfer 4 words/ trans time a. One-word-wide memory organization access, transfer word/ transfer time access, transfer 4 words/4 tr times /4/4 Bilgisayar Mimarisi.9 /4/4 Bilgisayar Mimarisi. Ornek 5 clock cycles access time cycle transfer time (bus width = bus genisliginden bagimsiz) Bandwith (in bytes /cycles) = Nbytes/(*access time + N*transfer time) Multiplexor b. Wide memory organization bank bank bank c. Interleaved memory organization BW = 6/(*5 + *) =. bytes/cyc bank 3 a. One-word-wide memory organization BW = 6/(4*5 + 4*) =.5 bytes/cyc BW = 6/(*5 + 4*) =.8 bytes/cyc /4/4 Bilgisayar Mimarisi. /4/4 Bilgisayar Mimarisi.

Miss Penalty memory den bir block transfer etmek icin harcanan sure Genalde cycle cinsinden olculur Block boyunu cok buyuk yapma Eger block boyunu cok buyutursek miss penalty artar Miss penalty nin artmasi sonunda miss rate nin azalmasindan gelen avantaji yok eder /4/4 Bilgisayar Mimarisi.3 /4/4 Bilgisayar Mimarisi.4 4% 35% Don t make block size too big Ccahe kullaniminin sonucu Miss rate 3% 5% % 5% % 5% % 4 6 64 56 Block size (bytes) KB 8 KB 6 KB 64 KB 56 KB /4/4 Bilgisayar Mimarisi.5 Her bir hit, aranilan verinin cycle sonra register larinda bulunmasi anlamina gelir Eger hit rate yuksekse, yuksek hizlimemory e sahip oldugumuz izlenimini verir Miss rate inin dusuk olmasi, miss penalty nin yuksek olmasinin getirdigi dezavantaji dengeler /4/4 Bilgisayar Mimarisi.6

performance access (read veya write) her bir hit icin cyle alir access (read veya miss) her bir miss icin miss penalty zamani alir Penalty suresi boyunca, cache daha dsusuk level daki memory den bir block data okur time = No. of instructions Performance equation Instruction count Average cycles per instruction x CPI Time of clock cycle x Period Performansi etkileyen ana faktorler (bu faktorler Inter-dependent = kendi aralarinda bagimsiz degil) /4/4 Bilgisayar Mimarisi.7 /4/4 Bilgisayar Mimarisi.8 cache performance ornegi Miss penalty: R (read) veya W(write) icin gerekli sure (eger data cache degilse). 5-cycle yaygin Miss rate: miss e sebep olan erisinlerin orani rate: hit le sonuclanan erisimlerin orani Miss rate + rate = Ornek: cache miss penalty cycle, hit rate %95 LW icin CPI normalde 5. Miss oldugunda CPI 5 LW icin ortalama CPI nedir? Ave CPI =.95 * 5 +.5 * 5 =. Eger miss penalty = cycle olsaydi (memory daha yavas) sonuc ne olurdu? Ave CPI =.95 * 5 +.5 * 5 =. Yavas memory nin etkisi az -- miss rate yuksek degil /4/4 Bilgisayar Mimarisi.9 ozeti (simdiye kadar) (SRAM): Daha dusuk seviyedeki memory deki (ornek DRAM) verilerin bir subset ini icerir x - x DRAM den daha hizli Access hit (read veya write) cycle alir. Access miss (R veya W) penalty time kadar sure alir Miss esnasinda daha dusuk seviyen cache block getirilirken stall edilebilir (Her makina icin gecerli degil) /4/4 Bilgisayar Mimarisi.

ozet Miss penalty azaltilamayabilir (DRAM yavas) Daha buyuk block transfer ederek daha az penalty ode performance i artirmanin iki yolu rate i artir Miss penalty azalt /4/4 Bilgisayar Mimarisi. /4/4 Bilgisayar Mimarisi. Associative cache Block larin cache daha esnek yerlestirimi suretiyle hit rate i artirilabilir En son kullanilan data nin daha cogunu ayni buyuklukteki cache tutabiliriz Set-associative cache rate ini artirabilir time inde az bir artisa sebep olur Cost (maliyet): Hardware complexity artar (ayni alana daha kucuk kapasiteli memory sigar) /4/4 Bilgisayar Mimarisi.3 /4/4 Bilgisayar Mimarisi.4

Temel fikir daha dusuk seviyedeki memory den cache getirildiginde, data blogunun nereye yerlestirilecegi konusunda daha esnek ol Son zamanlarda erisilen data yi daima cache tutmaya calis /4/4 Bilgisayar Mimarisi.5 -way set-associative cache den data yi fetch et, cache deki iki locationdan birine yerlestir Tag Tag 7 38 4 3 8 Tag Tag 5 veya 6 9 38 38 4 44 8 99 3 97 36 5 4 44 4 /4/4 Bilgisayar Mimarisi.6 Tipik gorus: data yi least recently used location a yerlestir (LRU teknigi) Reading a -way set-associative cache index iki location i gosterir Tag Tag 7 38 4 3 8 Tag Tag 5 38 6 9 38 4 44 8 99 3 97 36 5 4 44 4 /4/4 Bilgisayar Mimarisi.7 Her iki tag, uretilen address in Tag iyla parallel karsilastirilir Configurations: 8 block set-associative cache All options: Block = word One-way set associative (direct mapped) Tag Block 3 4 5 6 7 Set Two-way set associative Set Tag Tag 3 Four-way set associative Tag Tag Tag Tag Eight-way set associative (fully associative) Tag Tag Tag Tag Tag Tag Tag Tag /4/4 Bilgisayar Mimarisi.8

4-way set-associative cache 3 3 9 8 3 8 Divide 3-bit address this way 53 54 55 V Tag V Tag V Tag V Tag 3 ------------- ----- Tag bits Set index (hangi line) Word ici addressleme Block icinde word address leme Eger blocksize = word ise Bu alan yoktur Blocksize = word 4 data words 56 set (her biri 4 block) 4-to- multiplexor /4/4 Bilgisayar Mimarisi.9 /4/4 Bilgisayar Mimarisi.3 Erisim icin, bir set secilmeli ve bu setteki tum block larin tag lari address den gelen tagla parallel kiyaslanmali Maliyet (Costs): Ekstra hardware, access time inda artis 53 54 55 3 3 9 8 3 8 V Tag V Tag V Tag V Tag 3 time i kisaltmak icin tag kiyaslama lari parallel yap 53 54 55 3 3 9 8 3 8 V Tag V Tag V Tag V Tag 3 4-to- multiplexor 4-to- multiplexor /4/4 Bilgisayar Mimarisi.3 /4/4 Bilgisayar Mimarisi.3

3 3 9 8 3 associativity artikca performance artar 8 5% 53 54 55 V Tag V Tag V Tag V Tag 3 Miss rate % 9% 6% Yalnizca tag i match eden word u ya gonder 4-to- multiplexor /4/4 Bilgisayar Mimarisi.33 3% % One-way Two-way Four-way Eight-way Associativity KB 6 KB KB 3 KB 4 KB 64 KB 8 KB 8 KB /4/4 Bilgisayar Mimarisi.34 5% size (boyu) artikca performance artar Multilevel s Miss rate % 9% 6% 3% chip inde primary SRAM cache ( cycle hit time, cycle miss penalty) main memory ile primary SRAM arasinda Secondary SRAM ( cycle access time, cycle miss penalty ) % One-way Two-way Four-way Eight-way Associativity KB 6 KB KB 3 KB 4 KB 64 KB 8 KB 8 KB /4/4 Bilgisayar Mimarisi.35 /4/4 Bilgisayar Mimarisi.36