Innhold. Oversikt over hukommelseshierakiet. Ulike typer minne. Innledning til cache. Konstruksjon av cache. 26.03.2001 Hukommelseshierarki-1 1



Like dokumenter
Dagens temaer. Dagens emner er hentet fra Englander kapittel 11 (side ) Repetisjon av viktige emner i CPU-design.

Dagens tema. Flere teknikker for å øke hastigheten

IN1020. Minnehierarki

Dagens temaer. Praktisk anvendelse: Satellittkommunikasjon. eksempler på bruk av assembler/c/arkitektur teknikker for å øke hastigheten

INF2270. Minnehierarki

Dagens temaer. eksempler på bruk av assembler/c/arkitektur teknikker for å øke hastigheten. Organisation and Architecture )

Innhold. Virtuelt minne. Paging i mer detalj. Felles rammeverk for hukommelseshierarki Hukommelseshierarki-2 1

Hukommelseshierarki. 16/3 cache /3 virtuell hukommelse in 147, våren 1999 hukommelseshierarki 1

Dagens temaer. Kort repetisjon. Mer om cache (1) Mer om cache (2) Read hit. Read miss. Write hit. Hurtig minne. Cache

Dagens temaer. Mer om cache-hukommelse (kapittel 6.5 i Computer Organisation and Architecture ) RAM ROM. Hukommelsesbusser

Praktisk anvendelse: Satellittkommunikasjon

Dagens temaer. Cache (repetisjon) Cache (repetisjon) Cache (repetisjon)

Dagens temaer. Fra kapittel 4 i Computer Organisation and Architecture. Kort om hurtigminne (RAM) Organisering av CPU: von Neuman-modellen

Cache (repetisjon) Cache (repetisjon) Cache (repetisjon) Dagens temaer. CPU Cache RAM. om cache-hukommelse (kapittel 6.5 i Computer Organisation

bruksområder og oppbygging om cache-hukommelse (kapittel 6.5 i Computer Organisation Dagens temaer and Architecture ) ROM RAM

Oppsummering av digitalteknikkdelen

hvor mye hurtigminne (RAM) CPU en kan nyttiggjøre seg av. mens bit ene betraktet under ett kalles vanligvis et ord.

Dagems temaer. kapittel 4 i Computer Organisation and Architecture. av CPU: von Neuman-modellen. Transfer Language (RTL) om hurtigminne (RAM)

Dagems temaer INF ! Fra kapittel 4 i Computer Organisation and Architecture. ! Kort om hurtigminne (RAM)

! Sentrale begreper er adresserbarhet og adresserom. ! Adresserbarhet: Antall bit som prosessoren kan tak samtidig i én operasjon

! Ytelsen til I/O- systemer avhenger av flere faktorer: ! De to viktigste parametrene for ytelse til I/O er:

Innhold. Introduksjon til parallelle datamaskiner. Ulike typer parallelle arkitekturer. Prinsipper for synkronisering av felles hukommelse

Kapittel 7, Minne RAM DIMM, SIMM ROM, PROM, EPROM, EEPROM FLASH DIM SUM. Cache Virtuelt minne

Internminnet. Håkon Tolsby Håkon Tolsby

Internminnet. Håkon Tolsby Håkon Tolsby

Innhold. Oppgave 1 Oversettelse (vekt 15%)

Dagens tema. Mer om cache-hukommelse Kapittel 6.5 i Computer Organisation and Architecture ) RAM. Typer, bruksområder og oppbygging 2008 ROM

Minnehåndtering i operativsystemer

kan adressere et større område som RAM enn det som faktisk er tilgjengelig. Siden data kan plasseres i RAM og/eller på harddisken brukes begrepet

hukommelse (kapittel 9.9 i læreboken) Dagens temaer Input-Output INF 1070

Martin Olsen, Lars- Petter Ahlsen og Jon- Håkon Rabben

dynamiske data dynamiske data statiske data program dynamiske data statiske data reservert program dynamiske data statiske data reservert program

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Minnehåndtering i operativsystemer

ytelsen til hukommelseshierarkier

Forelesning Hurtigbuffer Kap 4.5

Memory Access) Figure: DMA kommuniserer med disk-controlleren og sørger for at det OS ønsker blir kopiert mellom harddisken og internminnet.

Maskinvaredelen av INF 103: oversikt og innhold (1)

Setup programmet brukes til å endre konfigurasjonen av BIOS og til å vise resultatene fra

Filsystemet fra innsiden

Tildeling av minne til prosesser

UNIVERSITETET I OSLO

Oppsummering digital-teknikk, teknikk, INF2270

Fakultet for informasjonsteknologi, Oppgave 1 Flervalgsspørsmål ( multiple choice ) 15 %

Hovedkort, brikkesett og busser

Innhold. 2 Kompilatorer. 3 Datamaskiner og tallsystemer. 4 Oppsummering. 1 Skjerm (monitor) 2 Hovedkort (motherboard) 3 Prosessor (CPU)

INF2270. Input / Output (I/O)

Phu Pham Laboppgave 29. September 2015

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Datamaskinens oppbygning

Dagens temaer. Virtuell hukommelse (kapittel 9.9 i læreboken) Pentium-arkitekturen i mer detalj INF 1070

Dagens temaer. Virtuell hukommelse. Sidetabell. Virtuell hukommelse (forts.)

Del 2. Bak skallet. Avsette minne til et spesifikt OS Teste harddisk under oppstart Sette opp system logger

Generelt om permanent lagring og filsystemer

Lab oppgave gruppe 2 IT-ledelse (Jonas F, Robin PN, Aksel S, Magnus M, Erik I)

Innhold. Innledning til Input/Output. Ulike typer Input/Output. Input/Output internt i datamaskinen. Input/Output mellom datamaskiner

Singletasking OS. Device minne Skjerm minne. Brukerprogram. Brukerdata/heap. Stack. Basis for flerprosess-systemer.

Datamaskinens oppbygning og virkemåte

En harddisk består av et lite antall plater av et magnetisk materiale.

Del1: Setup: BIOS. 2. Hvor mye Internminne har den? 3GB DDR2

Dagens tema. Mer MIPS maskinkode. Maske-operasjoner Skift-operasjoner Lesing og skriving Pseudo-instruksjoner Mer om funksjonskall Registeroversikt

Filsystemet fra innsiden

Operativsystemer og nettverk Løsningsforslag til eksamen Oppgave 1. a) Linux-kommando: java Beregn & b) Shellprogram:

P1 P2 P3 P1 P2 P3 P1 P2. OS gjør Contex Switch fra P1 til P2

Oppgave 2 Maskinkode (vekt 12%)

Superbruker Prosjekt

Håndtering av minne i et OS

Hvorfor lære om maskinvare*?

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Oppgave 8.1 fra COD2e

Clock speed 3.20GHz Bus Speed 800MHz L2 Cache 4MB 2 Cores Ikke Hyperthreading 64 BIT

Intel Core i7. Omid Mirmotahari 4

Seksjon 1. INF2270-V16 Forside. Eksamen INF2270. Dato 1. juni 2016 Tid Alle trykte og skrevne hjelpemidler, og en kalkulator, er tillatt.

2. Hvor mye Internminne har den? Svar: 2GB

INF2270. Datamaskin Arkitektur

Tildeling av minne til prosesser

INF2270. Input / Output (I/O)

UNIVERSITETET I OSLO

Del 1 Setup - BIOS Oppgaver: 1. Hva slags CPU har maskinen? Beskriv de tekniske egenskapene ved CPU en.

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

LabOppgave. 1. Hva slags CPU har maskinen? Beskriv de tekniske egenskapene ved CPU en.

Oppgave 1 JK-flip-flop (Total vekt 20%)

EKSAMEN I TDT4160 DATAMASKINER GRUNNKURS

DEL 1 Setup BIOS Stian A. Johansen Terje Bratlie Espen Torås

Eksamensoppgave i TDT4225 Lagring og behandling av store datamengder Kontinuasjonseksamen

IN1020. Datamaskinarkitektur

Intel Core i7. Omid Mirmotahari 4

Dagens temaer. Intern hukommelse (1) Maskinvaredelen av INF 103: oversikt og innhold (2) Maskinvaredelen av INF 103: oversikt og innhold (1)

Filer i Linux og Bourne-again shell

Oppgave 1 & 2: Først gå inn på «Min Datamaskin/ Computer» Høyreklikk på vinduet uten å være nær noen dokumenter o.l.

Vi anbefaler at du setter deg litt inn i maskinen på forhånd. Det er en DELL Optiplex 620.

4/5 store parallelle maskiner /4 felles hukommelse in 147, våren 1999 parallelle datamaskiner 1. når tema pensum.

Tonje Thøgersen, Daniel Svensen Sundell, Henrik Smedstuen

INF2270. Datamaskin Arkitektur

Generell informasjon

Laboppgave. Sondre Gulichsen, Li Lisan Linder. 1. Hva slags CPU har maskinen? Beskriv de tekniske egenskapene ved CPU en.

D: Ingen trykte eller håndskrevne hjelpemiddel tillatt. Bestemt, enkel kalkulator tillatt.

Lars Vidar Magnusson

Oppgave lab. 2. Hvor mye Internminne har den? - Maskinen har 2GB internminne.

Optimalisering av flyttallsintensive programmer. Bjørn Lande

Transkript:

Innhold Oversikt over hukommelseshierakiet Ulike typer minne Innledning til cache Konstruksjon av cache 26.03.2001 Hukommelseshierarki-1 1

Hukommelseshierarki Ønsker ubegrenset mye minne som er like raskt som CPU en. I praksis må man velge ut fra flere hensyn. Størrelse Pris per byte Regi stre Cache Hovedminne Magnetisk disk Magnetisk tape Optisk disk Hastighet Tre parametre klassifiserer minnetyper: Antall byte tilgjegelig per enhet Pris per byte Aksesshastighet 26.03.2001 Hukommelseshierarki-1 2

Bruksområder Registre: Intern kladdeblokk for CPU en med rask aksess til innholdet. Cache: Hurtig mellomlager for både instruksjoner og data for jevne ut hastighetsforskjellen mellom CPU en og hurtigminnet. Hurtigminne (RAM): Buffer mellom eksternt lagringsmedium og CPU en med rask både lese- og skrive-aksess. Magnetisk disk: Høy-kapasitets minne for lesing/skriving av program/data. Magnetisk tape: Høykapasitetsmedium for sikkerhetskopiering. CD-ROM og DVD: Lagringsmedium for mindre mengder sikkerhetskopiering og distribusjon av programkode etc. 26.03.2001 Hukommelseshierarki-1 3

Lagringskapasitet Registre: Integrert på CPU en, relativt få (32-64 stykker). Cache: Mellomlager internt (L1) eller i nærheten av (L2) CPU en, typisk kapasitet fra 8 KiloByte(L1) til 512 (L2) KiloByte, og etpar MegaByte (L3). Hovedminne: Internt på hovedkortet i nærheten av CPU en, størrelse opptil etpar GigaByte. Magnetisk disk: Ekstern eller intern lagringsenhet i maskinen, med kapasitet opptil TeraByte. Magnetisk tape: Sekvensielt medium med opptil 10- talls sekunders aksesstid. Optisk disk: (CD-ROM, CD-RW og DVD). Billig eksternt lagringsmedium med kapasitet opptil flere GigaByte (DVD). 26.03.2001 Hukommelseshierarki-1 4

Aksesstider Registre: En klokkesykel, dvs samme hastighet som prosessoren (nano-sekunder). Cache: Samme størrelsesorden som interne registre. Hovedminne: Flere titalls nano-sekunder. Magnetisk disk: 5-6 størrelsesordener langsommere, dvs millisekunder. Magnetisk tape: Sekvensielt medium med opptil flere titalls sekunders aksesstid. Optisk disk: (CD-ROM, CD-RW og DVD): Opptil flere sekunders aksesstid. 26.03.2001 Hukommelseshierarki-1 5

Cache Cache n inneholder en kopi av et subsett av hurtigminnet. CPU en henter data og/eller instruksjoner fra cache istedenfor RAM. Siden cache er mindre enn RAM, må det bestemmes hvilke data/instruksjoner som skal ligge i cache. Cache baserer seg på at instruksjoner/data akesseres Nær hverandre i tid Nær hverandre i rom 26.03.2001 Hukommelseshierarki-1 6

Hvis data/instruksjon CPU en trenger ligger i cache, kalles det for cache hit. Hvis data/instruksjon CPU en trenger ikke ligger i cache, kalles det for cache miss. Ved cache miss må data/instruksjon først kopieres fra hurtigminnet over i cache før CPU en kan bruke det. Cache fylles fra hurtigminnet første gangen en bestemt lokasjon blir referert: X4 X1 Xn 2 X4 X1 Xn 2 Xn 1 X2 Xn 1 X2 Xn X3 Før referanse til Xn X3 Etter referanse tilxn 26.03.2001 Hukommelseshierarki-1 7

Direkte-mapped cache Trenger en logisk kobling mellom lokasjoner i cache og lokasjoner i hurtigminne Den enkleste formen for en slik kobling er direkteavbildet (direct-mapped): 000 001 010 011 100 101 110 111 Cache Hurtigminne 00001 00101 01001 01101 10001 10101 11001 11101 De tre nederste bit ene angir adressen i cache n. Flere lokasjoner i hurtigminnet deler samme lokasjon i cache n. 26.03.2001 Hukommelseshierarki-1 8

Trenger mer informasjon for å identifisere koblingen mellom hurtigminne og cache: Index inneholder nedre del av adressen og peker til rett ord i cache n Tag inneholder øvre del av adressen Valid indikerer om cache-ordet inneholder gyldig data eller ikke Address (showing bit positions) 31 30 13 12 11 2 1 0 Byte offset Hit Tag 20 10 Data Index Index 0 1 2 Valid Tag Data 1021 1022 1023 20 32 Figur 7.7 side 549 26.03.2001 Hukommelseshierarki-1 9

Hvis riktig ord ikke finnes i cache (dvs. cache miss) skjer følgende: 1) Sett PC til PC-4 og skriv verdien tilbake til minnet 2) Sett i gang lesing fra hovedminnet og vent til data er klar 3) Skriv det riktige innholdet til cache og oppdater tag og valid 4) Start opp igjen eksekveringen av neste instruksjon Ved skriving til cache må, det også skrives til hurtigminnet, slik at innholdet blir identisk. Enkleste er alltid å skrive til både cache og hurtigminne (forutsatt at ordet finnes begge steder) (write-though). 26.03.2001 Hukommelseshierarki-1 10

Write-through er ineffektivt, fordi skriving alltid medfører write-miss med påfølgende stopp av prosessoren. Et skrivebuffer kan brukes til å mellomlagre slik at prosessoren ikke må stoppe opp. write-back skriver først til cache, og til hurtigminne når innholdet i blokken skal oppdateres. Effektiviteten kan økes ved å øke blokkstørrelsen (dvs antall ord som kopieres fra hurtigminne over i cache). 26.03.2001 Hukommelseshierarki-1 11

Tag og valid-feltene gjelder for hele blokken Write-miss blir mer komplisert, fordi tag/valid bit gjelder for hele blokken, og ikke bare det ene ordet som ga write-miss Løsning: Les hele tilsvarende blokk fra minnet og oppdater etterpå Ad dress (sho w ing b it po sition s) 31 16 1 5 4 3 2 1 0 H it Tag 16 1 2 2 B yte offset D ata Index Block offset 1 6 bits 12 8 bits V Tag D ata 4K entrie s 16 32 3 2 3 2 32 M ux 32 Figur 7.10 side 557 26.03.2001 Hukommelseshierarki-1 12

Båndbredden mellom cache og hurtigminnet bestemmer effektiviteten. Tre mulige organiseringer av grensesnittet mellom cache og hurtigminne: C P U C PU C PU C a ch e M ultip le xo r C a ch e C a che B us B us B u s M em ory M e m o ry ba n k 0 M em o ry b an k 1 M e m o ry ba n k 2 M em o ry b an k 3 M e m o ry b. W id e m e m o ry o rga nizatio n c. In te rle av e d m e m o ry orga niza tio n Figur 7.13 side 561 a. O n e - w ord -w ide m e m ory o rga nization 26.03.2001 Hukommelseshierarki-1 13

Direkte-mappet cache er ikke den mest fleksible måten å plassere blokker i cache på. Det mest ekstreme andre alternativet er å plassere blokken hvorsomhelst: Full assosiativ cache. En tredje mulighet er set assosiativ (kombinasjon) D ir e c t m a p p e d S e t a s s o c ia tiv e F u lly a s s o c ia ti v e B l o c k # 0 1 2 3 4 5 6 7 S e t # 0 1 2 3 D a ta D a t a D a t a T a g 1 2 T a g 1 2 T a g 1 2 S e a rc h S e a rc h S e a rc h 26.03.2001 Hukommelseshierarki-1 14

Sammenliging mellom direkte-mapped, setassosiativ og fullt assosiativ cache: One-way set associative (direct mapped) Block 0 1 2 3 4 5 6 7 Tag Data Two-way set associative Set 0 1 2 3 Tag Data Tag Data Set 0 1 Four-way set associative Tag Data Tag Data Tag Data Tag Data Eight-way set associative (fully associative) Tag Data Tag Data Tag Data Tag Data Tag Data Tag Data Tag Data Tag Data 26.03.2001 Hukommelseshierarki-1 15

Hvordan finne en blokk i set -assosiativ cache: Hvilken blokk skal kastes ut? Address 31 30 12 11 10 9 8 3 2 1 0 22 8 Index V Tag Data V Tag Data V Tag Data V Tag Data 0 1 2 253 254 255 22 32 4-to-1 m ultiplexo r Hit Data 26.03.2001 Hukommelseshierarki-1 16