Fortsetelse Microarchitecture level



Like dokumenter
TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Fortsetelse Microarchitecture level

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Kapittel 4: Microarchitecture level

Forelesning Optimalisering av μark Kap 4.4

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Kapittel 3: Digital logic level

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

TDT DESEMBER, 2011, 09:00 13:00

Dagens temaer. Fra kapittel 4 i Computer Organisation and Architecture. Kort om hurtigminne (RAM) Organisering av CPU: von Neuman-modellen

Fortsetelse Microarchitecture level

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Intel Core i7. Omid Mirmotahari 4

Forelesning Mikroprogram for IJVM Kap 4.3

IN1020. Datamaskinarkitektur

TDT4160 DATAMASKINER GRUNNKURS EKSAMEN

TDT4160 DATAMASKINER GRUNNKURS EKSAMEN

Forelesning ISA: IJVM Kap 4.2

EKSAMENSOPPGAVE I FAG TDT4160 DATAMASKINER GRUNNKURS. D: Ingen trykte eller håndskrevne hjelpemiddel tillatt. Bestemt, enkel kalkulator tillatt.

TDT DESEMBER, 2013, 09:00 13:00. Norwegian University of Science and Technology Engineering The Department of Computer and Information Science

EKSAMEN I TDT4160 DATAMASKINER GRUNNKURS

Bussar. Tilgong til buss (Three state buffer) Synkron / Asynkron Serielle bussar Parallelle bussar Arbitrering: Kven kontrollerar bussen

AVSLUTTENDE EKSAMEN I. TDT4160 Datamaskiner Grunnkurs Løsningsforslag. Torsdag 29. November 2007 Kl

TDT4160 OG IT2201 DATAMASKINER GRUNNKURS EKSAMEN

Intel Core i7. Omid Mirmotahari 4

Dagems temaer. kapittel 4 i Computer Organisation and Architecture. av CPU: von Neuman-modellen. Transfer Language (RTL) om hurtigminne (RAM)

TDT4160 DATAMASKINER GRUNNKURS EKSAMEN

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

INF2270. Datamaskin Arkitektur

TDT DESEMBER, 2009, 09:00 13:00

TDT4160 AUGUST, 2008, 09:00 13:00

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

1 TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

TDT DESEMBER, 2014, 09:00 13:00. Norwegian University of Science and Technology Engineering The Department of Computer and Information Science

INF2270. Datamaskin Arkitektur

TDT DESEMBER, 2008, 09:00 13:00

TDT AUGUST, 2009, 09:00 13:00

Forelesning Forgreningspredikering Kap 4.5 Superskalaritet Kap 4.5 Spekulativ utføring Kap 4.5

ANSWER KEY FOR THE EXAM

hvor mye hurtigminne (RAM) CPU en kan nyttiggjøre seg av. mens bit ene betraktet under ett kalles vanligvis et ord.

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

TDT AUGUST, 2011, 09:00 13:00

EKSAMEN I TDT4160 DATAMASKINER GRUNNKURS

TDT4160 Datamaskiner Grunnkurs 2011

Digital logic level: Oppsummering

AVSLUTTENDE EKSAMEN I. TDT4160 Datamaskiner Grunnkurs. Torsdag 29. November 2007 Kl

ANSWER KEY FOR THE EXAM

Dagems temaer INF ! Fra kapittel 4 i Computer Organisation and Architecture. ! Kort om hurtigminne (RAM)

Løsningsforslag eksamen TDT4160 høsten 2005

befinner seg. Deretter leses instruksjonen fra i registerfilen ved ny stigende klokkepuls.

POLITISKE SAKSDOKUMENT:

Forelesning 5. Diverse komponenter/større system

TDT AUGUST, 2013, 09:00 13:00. Norwegian University of Science and Technology Engineering The Department of Computer and Information Science

INF1400 Kap4rest Kombinatorisk Logikk

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

TDT DESEMBER, 2012, 09:00 13:00. Norwegian University of Science and Technology Engineering The Department of Computer and Information Science

TDT DESEMBER, 2009, 09:00 13:00

Maskinvaredelen av INF 103: oversikt og innhold (1)

Dagens tema. Dagens tema er hentet fra kapittel 4.3 og 4.4. Mer om pipelining Ytelse Hasarder. Pipelining i Pentium-arkitekturen

TDT4160 DATAMASKINER GRUNNKURS EKSAMEN

Eksamensoppgåve i TDT4160 datamaskiner og digitalteknikk

TDT DESEMBER, 2014, 09:00 13:00. Norwegian University of Science and Technology Engineering The Department of Computer and Information Science

Fakultet for informasjonsteknologi, Oppgave 1 Flervalgsspørsmål ( multiple choice ) 15 %

Overordnet maskinarkitektur. Maskinarkitektur zoomet inn. I CPU: Kontrollenheten (CU) IT1101 Informatikk basisfag, dobbeltime 11/9

SIE 4005, 9/10 (4. Forelesn.)

! Sentrale begreper er adresserbarhet og adresserom. ! Adresserbarhet: Antall bit som prosessoren kan tak samtidig i én operasjon

Innhold. 2 Kompilatorer. 3 Datamaskiner og tallsystemer. 4 Oppsummering. 1 Skjerm (monitor) 2 Hovedkort (motherboard) 3 Prosessor (CPU)

Dagens temaer. temaer hentes fra kapittel 3 i Computer Organisation. av sekvensielle kretser. and Architecture. Tilstandsdiagram.

TDT4160 DATAMASKINER GRUNNKURS EKSAMEN

Forelesning Hurtigbuffer Kap 4.5

tema er hentet fra kapittel 4.3 og 4.4 om pipelining Mikroprogrammert Dagens temaer Hard-wired Mikrokode Hasarder Ytelse

Vi har ikkje behandla bustøttesøknaden fordi det manglar samtykke frå ein eller fleire i husstanden

Oppgave 1 Flervalgsspørsmål ( multiple choice ) 15 %

INF1400. Digital teknologi. Joakim Myrvoll 2014

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

ITPE/DATS 2400: Datamaskinarkitektur og Nettverk

I dag. Minne typar Minne mot bussar (fysisk grensesnitt generelt) Meir buss

Dagens temaer. Mer om adresseringsmodi. Indeksert adressering med offset og auto-inkrement eller dekrement. Register-indirekte adressering

Kapittel 6. Høynivå møter lavnivå Fra C til assembly Fra assembly til maskinkode Linking og lasting

1 TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Undersøking. Berre spør! Få svar. I behandling På sjukehuset. Ved utskriving

En mengde andre typer som DVD, CD, FPGA, Flash, (E)PROM etc. (Kommer. Hukommelse finnes i mange varianter avhengig av hva de skal brukes til:

Dagens tema. Dagens tema hentes fra kapittel 3 i Computer Organisation and Architecture. Sekvensiell logikk. Flip-flop er. Tellere og registre

«VURDERING FOR LÆRING» Retningsliner for skulane i Lindås

Datamaskinens virkemåte

Søknad om godkjenning frå fylkesmannen til å gi gaver eller arveforskot frå midlane til ein person med verje

Forelesning Datatyper Kap 5.2 Instruksjonsformat Kap 5.3 Flyttall App B

TDT AUGUST, 2015, 09:00 13:00. Norwegian University of Science and Technology Engineering The Department of Computer and Information Science

Du kan skrive inn data på same måte som i figuren under :

Dagens temaer. Architecture INF ! Dagens temaer hentes fra kapittel 3 i Computer Organisation and

Dagens temaer. Dagens temaer er hentet fra Englander kapittel 12 side (2. utgave), side (3. utgave)

Dagens temaer. Dagens temaer hentes fra kapittel 3 i Computer Organisation and Architecture. Sekvensiell logikk. Flip-flop er

Transkript:

1 Fortsetelse Microarchitecture level

IJVM 2 Implementasjon Detaljar for å utføre instruksjonssettet Ein gitt implementasjon har ein gitt yting Endre ytinga Teknologi (prosess) Transistor implementasjon Digital design av komponentar Auke mengda logikk Endring Av arkitektur Kva kan gjerast for å auke ytinga Auke mengda logikk og endring av arkitektur Intel P4

IJVM 3 som eksempel Kva kan gjerast for å auke ytinga Auke mengda logikk og endring av arkitektur Instruction Fetch Unit Samleband Instruksjonskø Hurtigbuffer Intel P4

4 Flytte funksjonalitet til maskinvare: 1 ILOAD 2 PC = PC + 1 3 IADD 4 PC = PC + 1 5 ISTORE 6 PC = PC + 1 7 ILOAD 8 PC = PC + 1 9 BIPUSH 10 PC = PC + 1 11 IF_ICMPEQ (betinga hopp) L1 12 PC = Opdater PC 13 ILOAD 14 PC = PC + 1 15 BIPUSH 16 PC = PC + 1 17 ISUB 18 PC = PC + 1 19 ISTORE 20 PC = PC + 1 21 GOTO L2 22 PC = L2 23 BIPUSH L1 24 PC = PC + 1 25 ISORE 26 PC = PC + 1 27 XXXXX L2 PC = PC +1 ALU B-Buss C-Buss Okuperar ressursar Legg til logikk PC = PC + 1 PC = PC +1 Hopp

5 Flytte funksjonalitet til maskinvare: 1 ILOAD 2 IADD 3 ISTORE 4 ILOAD 5 BIPUSH 6 IF_ICMPEQ (betinga hopp) L1 7 PC = Opdater PC 8 ILOAD 9 BIPUSH 10 ISUB 11 ISTORE 12 GOTO L2 13 PC = L2 14 BIPUSH L1 15 ISORE 16 XXXXX L2 PC = PC +1 ALU B-Buss C-Buss Okuperar ressursar Legg til logikk PC = PC + 1 Redusert med 11 gonger bruk av ALU B-Buss C-Buss PC = PC +1 Hopp

Instruction 6 Fetch Unit Instruksjon 8 bit (1 byte) Minne grensesnitt 32 bit (4 Byte) Brukar 32 bit buss Hentar 8 bit 24 bit ubrukt

Instruction 7 Fetch Unit (IFU) For kvar instruksjon PC increment (ALU) PC peikar på neste instruksjon Operandar lest frå minne Operandar skrives til minne ALU operasjon, resultat lagra (ein eller anna plass Viss: Instruksjonar med ekstra operandar Kvar operand må hentast (1 Byte viss i programminne) Brukar PC dvs ALU

Instruction 8 Fetch Unit (IFU) To moglege alternativ: 1: IFU tolkar opcode IFU avgjer antal ekstra operandar (ut frå opcode) Hentar operandar (fetch) Skriv operandar til register PC peikar på neste instruksjon Operandar lest frå minne Operandar skrives til minne ALU operasjon, resultat lagra (ein eller anna plass 2: Gjere instruksjonar kontinuerleg tilgjengelege for styreeining Kø med instruksjonar som skal utførast (8 og 16 bit)

Instruction 9 Fetch Unit 2: Gjere instruksjonar kontinuerleg tilgjengelege for styreeining Kø med instruksjonar som skal utførast (8 og 16 bit)

Instruction 10 Fetch Unit Innfører MBR2 MBR1: 8 bit MBR2: 16 bit

Instruction 11 Fetch Unit

Instruction 12 Fetch Unit Innfører MBR2 MBR1: 8 bit MBR2: 16 bit

Instruction 13 Fetch Unit Shift register Kø av instruksjonar MBR1: 1 byte (først lest) Når MBR1 lest, last MBR1 med neste instruksjon MBR2: 2 byte (først leste) Neste to instruksjonar (operandar)

Instruction 14 Fetch Unit Shift register Kø av instruksjonar MBR1: 1 byte (først lest) Når MBR1 lest, last MBR1 med neste instruksjon MBR2: 2 byte (først leste) Neste to instruksjonar (operandar) Sign extention (16 bit verdiar) Legge innhald i reg ut på B-buss (MSD eller LSD)

Instruction 15 Fetch Unit Shift register Kø av instruksjonar MBR1: 1 byte (først lest) Når MBR1 lest, last MBR1 med neste instruksjon MBR2: 2 byte (først leste) Neste to instruksjonar (operandar) Sign extention (16 bit verdiar) Legge innhald i reg ut på B-buss (MSD eller LSD)

Instruction 16 Fetch Unit IMAR Innført eige register for adressering av programminne MAR ikkje okkupert til adressering av instruksjonar Har lokal increment for sekvensiell utførelse Lastast frå C-buss ved hopp Kopi av PC

Instruction 17 Fetch Unit FSM MBR1: når MBR1 er lest MBR2 når MBR2 er lest Word fetched når 4 byte er lest frå minne til shift registeret Tilstand namn gir antal byte i shift registeret

18

Instruction 19 Fetch Unit (IFU) PC = PC + 1 i maskinvare IFU gjer PC increment To Byte operandar tilgjengeleg IMAR register mot minne

20 Kva kan gjerast for å auke ytinga Auke mengda logikk og endring av arkitektur Instruction Fetch Unit Samleband Instruksjonskø Hurtigbuffer Intel P4

Utdrag 21 Gunnars Uopdaterte plan 19/11 Spørje/lure på, der studentane (dykk) må finne ut om det er noko som er uklart. Eg må ha melding om kva fredag 14/11 20/11 Oppsummering

IJVM 22 som eksempel Kva kan gjerast for å auke ytinga Auke mengda logikk og endring av arkitektur Instruction Fetch Unit Samleband Instruksjonskø Hurtigbuffer

IJVM 23 Innfører A-buss Endrar data path Samankopling av komponentar

IJVM 24 Innfører A-buss Endrar data path Samankopling av komponentar ALU operasjonar: To tlifeldige register Sparar ein microinstruksjon H-reg som mellomlagring

IJVM 25 som eksempel Kva kan gjerast for å auke ytinga Auke mengda logikk og endring av arkitektur Instruction Fetch Unit Samleband Instruksjonskø Hurtigbuffer

26 Parallellitet Essensielt for å øke ytelse To typer: 1) Instruksjonsnivåparallellitet Fleire instruksjonar utføres samtidig (1 prosessor) Samleband Eks: Unødvendig at ALU er ledig mens CPU leser instruksjon Superskalaritet: Duplisering av CPU-komponenter 2) Prosessornivåparallellitet Ein prosessor er bra, fleire er betre?

27 Samleband (Pipelining)

28 Samleband (Pipelining) Fetch Decode Execute Dei tre prinsipielle stega i instruksjonutføring Lagar oss ein tretrinns styreeining 1: Fetch 2: Decode 3: Execute Kan startast uavhengig av kvarandre Raskare Enkle trinn Kortare tid

29 Samleband (Pipelining)

30 Samleband (Pipelining)

31 Samleband

32 Samleband

33

34 Samleband A-B-C-register Sluse mellom utføringssteg Lastast i slutten av clk-syklus To Instruksjonar skriv ikkje over data for kvarandre Her 4 klokkeperiodar instruksjon Klokkeperiode kortare Kortare tid på å utføre 4 enn 1

IJVM 35 som eksempel Kva kan gjerast for å auke ytinga Auke mengda logikk og endring av arkitektur Instruction Fetch Unit Samleband Instruksjonskø Hurtigbuffer Intel P4

36 Samleband Hopp og prefetch

37 Samleband 7 steg

38 Samleband dekoding instr. kø

39 Samleband 7 steg

40

IJVM 41 som eksempel Kva kan gjerast for å auke ytinga Auke mengda logikk og endring av arkitektur Instruction Fetch Unit Samleband Instruksjonskø Hurtigbuffer Intel P4