TDT4160 OG IT2201 DATAMASKINER GRUNNKURS EKSAMEN



Like dokumenter
TDT4160 DATAMASKINER GRUNNKURS EKSAMEN

TDT4160 AUGUST, 2008, 09:00 13:00

TDT4160 DATAMASKINER GRUNNKURS EKSAMEN

TDT DESEMBER, 2009, 09:00 13:00

TDT4160 DATAMASKINER GRUNNKURS EKSAMEN

TDT DESEMBER, 2008, 09:00 13:00

TDT AUGUST, 2009, 09:00 13:00

TDT AUGUST, 2011, 09:00 13:00

TDT DESEMBER, 2012, 09:00 13:00. Norwegian University of Science and Technology Engineering The Department of Computer and Information Science

EKSAMEN I TDT4160 DATAMASKINER GRUNNKURS

TDT DESEMBER, 2014, 09:00 13:00. Norwegian University of Science and Technology Engineering The Department of Computer and Information Science

TDT DESEMBER, 2011, 09:00 13:00

TDT DESEMBER, 2009, 09:00 13:00

ANSWER KEY FOR THE EXAM

ANSWER KEY FOR THE EXAM

TDT DESEMBER, 2013, 09:00 13:00. Norwegian University of Science and Technology Engineering The Department of Computer and Information Science

AVSLUTTENDE EKSAMEN I. TDT4160 Datamaskiner Grunnkurs. Torsdag 29. November 2007 Kl

AVSLUTTENDE EKSAMEN I. TDT4160 Datamaskiner Grunnkurs Løsningsforslag. Torsdag 29. November 2007 Kl

TDT AUGUST, 2013, 09:00 13:00. Norwegian University of Science and Technology Engineering The Department of Computer and Information Science

TDT DESEMBER, 2014, 09:00 13:00. Norwegian University of Science and Technology Engineering The Department of Computer and Information Science

TDT4160 DATAMASKINER GRUNNKURS EKSAMEN

EKSAMEN I TDT4160 DATAMASKINER GRUNNKURS

Forelesning Forgreningspredikering Kap 4.5 Superskalaritet Kap 4.5 Spekulativ utføring Kap 4.5

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

TDT4160 DATAMASKINER GRUNNKURS EKSAMEN

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

NORGES TEKNISK-NATURVITENSKAPELIGE UNIVERSITET INSTITUTT FOR DATATEKNIKK OG INFORMASJONSVITENSKAP

Eksamensoppgave i TDT4258 Energieffektive Datamaskinsystemer

Fortsetelse Microarchitecture level

EKSAMEN I TDT4160 DATAMASKINER GRUNNKURS

TDT AUGUST, 2015, 09:00 13:00. Norwegian University of Science and Technology Engineering The Department of Computer and Information Science

Kapittel 4: Microarchitecture level

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Seksjon 1. INF2270-V16 Forside. Eksamen INF2270. Dato 1. juni 2016 Tid Alle trykte og skrevne hjelpemidler, og en kalkulator, er tillatt.

Eksamensoppgave i TDT4258 Energieffektive Datamaskinsystemer

EKSAMENSOPPGAVE I FAG TDT4160 DATAMASKINER GRUNNKURS. D: Ingen trykte eller håndskrevne hjelpemiddel tillatt. Bestemt, enkel kalkulator tillatt.

Fortsetelse Microarchitecture level

Eksamensoppgave i TDT4258 Energieffektive datamaskinsystemer

Forelesning Optimalisering av μark Kap 4.4

Dagens temaer. Fra kapittel 4 i Computer Organisation and Architecture. Kort om hurtigminne (RAM) Organisering av CPU: von Neuman-modellen

Datamaskinens oppbygning

Fortsetelse Microarchitecture level

Fakultet for informasjonsteknologi, Oppgave 1 Flervalgsspørsmål ( multiple choice ) 15 %

INF2270. Datamaskin Arkitektur

Dagens tema. Datamaskinenes historie. De første moderne datamaskiner. Løsning. Menneskene har alltid prøvd å lage maskiner for å løse sine problemer.

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

INF2270. Datamaskin Arkitektur

Forelesning 5. Diverse komponenter/større system

Dagems temaer. kapittel 4 i Computer Organisation and Architecture. av CPU: von Neuman-modellen. Transfer Language (RTL) om hurtigminne (RAM)

Kapittel 3: Digital logic level

Dagens tema. Rask-maskinen. Rasko-kode Raskas-kode. Litt datamaskinhistorie Registre og lagre Instruksjoner

En overikt. Dagens tema. Datamaskinenes historie. Rask-maskinen Litt datamaskinhistorie Registre og lagre Instruksjoner. Rasko-kode.

TDT4258 Eksamen vår 2013

Digital logic level: Oppsummering

hvor mye hurtigminne (RAM) CPU en kan nyttiggjøre seg av. mens bit ene betraktet under ett kalles vanligvis et ord.

IN1020. Datamaskinarkitektur

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Oppgave 2 Maskinkode (vekt 12%)

Innhold. 2 Kompilatorer. 3 Datamaskiner og tallsystemer. 4 Oppsummering. 1 Skjerm (monitor) 2 Hovedkort (motherboard) 3 Prosessor (CPU)

Intel Core i7. Omid Mirmotahari 4

EKSAMENSOPPGAVE, INF-2200

Overordnet maskinarkitektur. Maskinarkitektur zoomet inn. I CPU: Kontrollenheten (CU) IT1101 Informatikk basisfag, dobbeltime 11/9

Fakultet for informasjonsteknologi, Oppgave 1 Flervalgsspørsmål ( multiple choice ) 15 %

INF1400 Kap4rest Kombinatorisk Logikk

Dagems temaer INF ! Fra kapittel 4 i Computer Organisation and Architecture. ! Kort om hurtigminne (RAM)

Dagens temaer. Architecture INF ! Dagens temaer hentes fra kapittel 3 i Computer Organisation and

Øving 1: Busser, adressemodi, multiplekser og styreord

Løsningsforslag eksamen TDT4160 høsten 2005

Eksamensoppgåve i TDT4160 datamaskiner og digitalteknikk

Forelesning ISA-nivået Kap 5.1

NORGES TEKNISK- NATURVITENSKAPELIGE UNIVERSITET INSTITUTT FOR DATATEKNIKK OG INFORMASJONSVITENSKAP

Hvorfor lære om maskinvare*?

NORGES TEKNISK- NATURVITENSKAPELIGE UNIVERSITET INSTITUTT FOR DATATEKNIKK OG INFORMASJONSVITENSKAP

Singletasking OS. Device minne Skjerm minne. Brukerprogram. Brukerdata/heap. Stack. Basis for flerprosess-systemer.

Internminnet. Håkon Tolsby Håkon Tolsby

UNIVERSITETET I OSLO

P1 P2 P3 P1 P2 P3 P1 P2. OS gjør Contex Switch fra P1 til P2

! Sentrale begreper er adresserbarhet og adresserom. ! Adresserbarhet: Antall bit som prosessoren kan tak samtidig i én operasjon

Internminnet. Håkon Tolsby Håkon Tolsby

INF-103. Velkommen til. Første time. Fra brukergrensesnitt til maskinvare. eller Datamaskinen på tvers. Andre time

INF-103 Fra brukergrensesnitt til maskinvare

INF2100. Dagens tema: Flink-maskinen Litt datamaskinhistorie. Registre og lagre. Instruksjoner. Flass-koden

Prosessoren. Bakgrunnen Innhold LMC. Assemblerkode Oppsummering instruksjonene [Englander kap 6] Hva inneholder den? Hvordan utføres instruksjonene?

Oppsummering av digitalteknikkdelen

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

4/5 store parallelle maskiner /4 felles hukommelse in 147, våren 1999 parallelle datamaskiner 1. når tema pensum.

Dagens temaer. Mer om adresseringsmodi. Indeksert adressering med offset og auto-inkrement eller dekrement. Register-indirekte adressering

Intel Core i7. Omid Mirmotahari 4

Dagens tema. Mer MIPS maskinkode. Maske-operasjoner Skift-operasjoner Lesing og skriving Pseudo-instruksjoner Mer om funksjonskall Registeroversikt

Datamaskinarkitektur våren 2009

I dag. Minne typar Minne mot bussar (fysisk grensesnitt generelt) Meir buss

SIE 4005, 9/10 (4. Forelesn.)

Dataveier og optimalisering. Kapittel 9

ITPE/DATS 2400: Datamaskinarkitektur og Nettverk

MID-TERM EXAM TDT4258 MICROCONTROLLER SYSTEM DESIGN. Wednesday 3 th Mars Time:

Transkript:

Norwegian University of Science and Technology Faculty of Information Technology, Mathematics and Electrical Engineering The Department of Computer and Information Science TDT4160 OG IT2201 DATAMASKINER GRUNNKURS EKSAMEN 20. DESEMBER, 2006, 09:00 13:00 Kontakt under eksamen: Gunnar Tufte 73590356 Tillatte hjelpemidler: D. Ingen trykte eller håndskrevne hjelpemidler tillatt. Bestemt, enkel kalkulator tillatt. Målform: Bokmål Page 1 of 14

OPPGAVE 1: BUSS OG ADRESSEDEKODING (20%) a. I Figur 1 er EPROM, RAM og PIO koblet til en felles buss. Finn adresseområde for EPROM, RAM og PIO. Alle enhetene har aktivt lavt (logisk 0 ) CS (Chip Select) signal. A0 A15 CS 2K EPROM CS 2K RAM CS PIO Figur 1: Adressedekoding. b. Anta at PIO-kretsen kun har mulighet til å adressere fire enheter. Hvordan kan adressedekodingen endres for å gi maksimal utvidelsesmulighet for RAM-området? OPPGAVE 2: MIKROARKITEKTUR OG MIKROINSTRUKSJO- NER (20% (5% PÅAOGB; 10% PÅ C)) Bruk vedlagte diagram og tabeller for IJVM til å løse oppgavene. a. Forklar funksjonen til registeret PC. b. Lag mikroinstruksjon(er) for følgende IJVM-operasjon: last register H med innholdet i register TOS. Page 2 of 14

Se bort fra Addr- og J-feltene i mikroinstruksjonsformatet. Angi korrekte bit for ALU, C, Mem og B gitt i Figur 4. c. Lag mikroinstruksjon(er) for følgende IJVM-operasjon: TOS = TOS + OPC. Se bort fra Addr- og J-feltene i mikroinstruksjonsformatet. Angi korrekte bit for ALU, C, Mem og B gitt i Figur 4. OPPGAVE 3: FORBEDRE YTELSEN (20%) a. Hvilken av disse alternativene er ikke en grunn til at man har begynt å utvikle en-brikke mulitiprosessorer (CMP)? 1 Tilgjengelig ILP (Instruction Level Parallelism) i instruksjonsstrømmen er begrenset 2 En-kjerneprosessorer har ofte høyt effektforbruk. 3 Store cacher på brikken gjør at vi ikke har plass til større kjerner. 4 En moderne en-kjerneprosessor er svært kompleks og derfor kostbar å utvikle. b. Anta at en prosessor har et samlebånd. Samlebåndet bruker tiden t på å utføre en instruksjon. Hvert trinn har en forsinkelse på t. Samlebåndet med tre trinn er illustrert i Figur 2(a). For å få høyere ytelse erstattes samlebåndet med et femtrinns samlebånd, vist i Figur 2(b). Hva skjer typisk med t og t dersom tretrinns samlebåndet erstattes med et samlebånd med fem trinn som kan øke ytelsen til prosessoren? Begrunn svaret. t t t t t t t t t t Stage 1 Stage 2 Stage 3 Stage 1 Stage 2 Stage 3 Stage 4 Stage 5 (a) Tretrinns samlebånd. (b) Femtrinns samlebånd Figur 2: Samlebånd med angitt tidsforsinkelse. Page 3 of 14

OPPGAVE 4: SUPERSKALARE PROSESSORER -SCOREBOARD (20%) Et program som utfører fire operasjonar: 1 R1=R2+R3 2 R4=R1*R1 3 R1=R5*R6 4 R7=R0+R0 a. Marker følgende typer dataavhengigheter i programmet ovenfor: Sanne dataavhengigheter (RAW-avhengighet). Utavhengigheter (WAW-avhengighet). Antiavhengigheter (WAR-avhengighet). b. Anta at programmet ovenfor skal utføres på en superskalar prosessor med åtte synlige registre hvor instruksjoner startes og avsluttes i rekkefølge og maksimalt to instruksjoner kan startes per klokkesykel. Anta at for instruksjoner som dekodes i sykel n, så startes utførselen i sykel n+1. Anta at for addisjonsoperasjoner (+) som startes i sykel n, skrives resultatet tilbake til registeret i slutten av sykel n+2, og for multiplikasjonsinstruksjoner (*) som startes i sykel n, skrives resultatet tilbake til registeret i slutten av sykel n+3. Fullfør det påbegynte scoreboardet i Tabell 1 for alle fire instruksjoner i programmet ovenfor. Tabell 1: Scoreboard. Cy # Decoded Iss Ret Reg. being read Reg. being written 01234567 01234567 1 1 R1=R2+R3 1 2 R4=R1*R1 - Page 4 of 14

OPPGAVE 5: DIVERSE (20%) Ta stilling til om påstandene er korrekte eller ikke. Korrekt svar gir 2% uttelling, feil svar gir tilsvarende straff og vet ikke (ikke svar) gir ingen uttelling. a. Moore sin lov er oppkalt etter Gordon Moore. Dette er en lov som sier noe om fysiske egenskaper i halvledermaterialet. b. hex(0ff0) i Big endian representerar et større tall enn hex(0ff0) i Little endian. c. RISC-prosessorer er raske fordi de har få kompliserte instruksjoner. d. Cache (hurtigbuffer) er oftest implementert med SRAM-celler. e. IJVM er en typisk RISC-arkitektur. f. Aritmetiske uttrykk på omvent polsk notasjon (Reverse Polish Notation) er enkelt å utføre på stakkmaskiner. g. IJVM-arkitekturen kan maksimalt ha et instruksjonsett bestående av 256 forskjellige instruksjoner.. h. Throughput er et ytelsesmål der man måler hvor mye arbeid man får gjort per tidsenhet. i. Throughput er et ytelsesmål som måler hvor mange instruksjoner en prosessor gjør ferdig per klokkesykel. j. DRAM er raskere enn SRAM (kortere aksesstid). Page 5 of 14

IJVM vedlegg Page 6 of 14

Figur 3: Blokkdiagram (IJVM). Page 7 of 14

Figur 4: Mikroinstruksjonsformat (IJVM). Page 8 of 14

ANSWER KEY FOR THE EXAM Page 1 of 14

OPPGAVE 1: BUSS OG ADRESSEDEKODING (20%) a. I Figur 1 er EPROM, RAM og PIO koblet til en felles buss. Finn adresseområde for EPROM, RAM og PIO. Alle enhetene har aktivt lavt (logisk 0 ) CS (Chip Select) signal. Answer: EPROM: hex(0000) - hex(07ff) RAM: hex(8000) - hex (87FF) PIO: hex(c000) - hex(ffff) b. Anta at PIO-kretsen kun har mulighet til å adressere fire enheter. Hvordan kan adressedekodingen endres for å gi maksimal utvidelsesmulighet for RAM-området? Answer: Endre adressedekodingen til PIO til kunn adressere området hex(fffc) - hex(ffff). OPPGAVE 2: MIKROARKITEKTUR OG MIKROINSTRUKSJO- NER (20% (5% PÅAOGB; 10% PÅ C)) Bruk vedlagte diagram og tabeller for IJVM til å løse oppgavene. a. Forklar funksjonen til registeret PC. Answer: PC Program Counter inneheld minne adressa til instruksjon som skal utførast. b. Lag mikroinstruksjon(er) for følgende IJVM-operasjon: last register H med innholdet i register TOS. Se bort fra Addr- og J-feltene i mikroinstruksjonsformatet. Angi korrekte bit for ALU, C, Mem og B gitt i Figur 4. Answer: ALU: 010100 (B) C: 100000000 (H) Mem: 000 (ingen mem opprasjon) B: 0111 (7 TOS) c. Lag mikroinstruksjon(er) for følgende IJVM-operasjon: TOS = TOS + OPC. Se bort fra Addr- og J-feltene i mikroinstruksjonsformatet. Angi korrekte bit for ALU, C, Mem og B gitt i Figur 4. Answer: Må ha to mikroinstruksjonar for å klare å utføre TOS = TOS + OPC. 1: Laste TOS inn i H ALU: 010100 (B) C: 100000000 (H) Mem: 000 (ingen mem opprasjon) B: 0111 (7 TOS) Page 2 of 14

2 addere H + OPC skriv til TOS ALU: 111100 (A+B) C: 001000000 (TOS) Mem: 000 (ingen mem opprasjon) B: 1000 (8 OPC) eller OPC kan lastast H i fyrste opperasjon og TOS + H i andre operasjon. OPPGAVE 3: FORBEDRE YTELSEN (20%) a. Hvilken av disse alternativene er ikke en grunn til at man har begynt å utvikle en-brikke mulitiprosessorer (CMP)? 1 Tilgjengelig ILP (Instruction Level Parallelism) i instruksjonsstrømmen er begrenset 2 En-kjerneprosessorer har ofte høyt effektforbruk. 3 Store cacher på brikken gjør at vi ikke har plass til større kjerner. 4 En moderne en-kjerneprosessor er svært kompleks og derfor kostbar å utvikle. Answer: 3 b. Anta at en prosessor har et samlebånd. Samlebåndet bruker tiden t på å utføre en instruksjon. Hvert trinn har en forsinkelse på t. Samlebåndet med tre trinn er illustrert i Figur 2(a). For å få høyere ytelse erstattes samlebåndet med et femtrinns samlebånd, vist i Figur 2(b). Hva skjer typisk med t og t dersom tretrinns samlebåndet erstattes med et samlebånd med fem trinn som kan øke ytelsen til prosessoren? Begrunn svaret. Answer: t minkar sidan kvart trinn kan vere enklare (mindre tidsforsinkelse). Total tidsforbruk t samla for trinna må ikkje vere mindre slik. Klokkefrekvensen for prosessoren kan aukast. Page 3 of 14

OPPGAVE 4: SUPERSKALARE PROSESSORER -SCOREBOARD (20%) Et program som utfører fire operasjonar: 1 R1=R2+R3 2 R4=R1*R1 3 R1=R5*R6 4 R7=R0+R0 a. Marker følgende typer dataavhengigheter i programmet ovenfor: Sanne dataavhengigheter (RAW-avhengighet). Utavhengigheter (WAW-avhengighet). Antiavhengigheter (WAR-avhengighet). Answer: Avhengighet: RAW: I2 leser R1, I1 skriver R1 WAR: I2 leser R1, I3 skriver R1 WAW: I1 og I3 skriver R1 b. Anta at programmet ovenfor skal utføres på en superskalar prosessor med åtte synlige registre hvor instruksjoner startes og avsluttes i rekkefølge og maksimalt to instruksjoner kan startes per klokkesykel. Anta at for instruksjoner som dekodes i sykel n, så startes utførselen i sykel n+1. Anta at for addisjonsoperasjoner (+) som startes i sykel n, skrives resultatet tilbake til registeret i slutten av sykel n+2, og for multiplikasjonsinstruksjoner (*) som startes i sykel n, skrives resultatet tilbake til registeret i slutten av sykel n+3. Fullfør det påbegynte scoreboardet i Tabell 1 for alle fire instruksjoner i programmet ovenfor. Tabell 2: Scoreboard. Cy # Decoded Iss Ret Reg. being read Reg. being written 01234567 01234567 1 1 R1=R2+R3 1 2 R4=R1*R1 - Answer: Instr. (4) kan ikke avsluttes før i syklus 11 pga. kravet om i-rekkefølge-avslutning (eng. in-order-completion). Page 4 of 14

Tabell 3: Scoreboard. Cy # Decoded Iss Ret Reg. being read Reg. being written 01234567 01234567 1 1 R1=R2+R3 1 XX11XXXX X1XXXXXX 2 R4=R1*R1 - XX11XXXX X1XXXXXX 2 XX11XXXX X1XXXXXX 3 1 XXXXXXXX XXXXXXXX 4 2 X1XXXXXX XXXX1XXX 3 R1=R5*R6 - X1XXXXXX XXXX1XXX 5 X1XXXXXX XXXX1XXX 6 X1XXXXXX XXXX1XXX 7 2 XXXXXXXX XXXXXXXX 8 3 XXXXX11X X1XXXXXX 4 R7=R5+R0 4 1XXXX21X X1XXXXX1 9 1XXXX21X X1XXXXX1 10 1XXXX21X X1XXXXX1 11 3 1XXXX1XX XXXXXXX1 4 XXXXXXXX XXXXXXXX OPPGAVE 5: DIVERSE (20%) Ta stilling til om påstandene er korrekte eller ikke. Korrekt svar gir 2% uttelling, feil svar gir tilsvarende straff og vet ikke (ikke svar) gir ingen uttelling. a. Moore sin lov er oppkalt etter Gordon Moore. Dette er en lov som sier noe om fysiske egenskaper i halvledermaterialet. Answer: Nei b. hex(0ff0) i Big endian representerar et større tall enn hex(0ff0) i Little endian. Answer: Nei c. RISC-prosessorer er raske fordi de har få kompliserte instruksjoner. Answer: Nei d. Cache (hurtigbuffer) er oftest implementert med SRAM-celler. Answer: Ja e. IJVM er en typisk RISC-arkitektur. Answer: Nei Page 5 of 14

f. Aritmetiske uttrykk på omvent polsk notasjon (Reverse Polish Notation) er enkelt å utføre på stakkmaskiner. Answer: Ja g. IJVM-arkitekturen kan maksimalt ha et instruksjonsett bestående av 256 forskjellige instruksjoner.. Answer: Ja h. Throughput er et ytelsesmål der man måler hvor mye arbeid man får gjort per tidsenhet. Answer: Ja i. Throughput er et ytelsesmål som måler hvor mange instruksjoner en prosessor gjør ferdig per klokkesykel. Answer: Nei j. DRAM er raskere enn SRAM (kortere aksesstid). Answer: Nei Page 6 of 14

IJVM vedlegg Page 7 of 14

SLR1 SLL8 Function 0 0 No shift 0 1 Shift 8 bit left 1 0 Shift 1 bit right Figur 5: Funksjonstabell for ALU (IJVM). Page 8 of 14

Figur 6: Timingdiagram (IJVM). Page 9 of 14

A0 A15 CS 2K EPROM CS 2K RAM CS PIO Figur 7: Adressedekoding. t t t t t t t t t t Stage 1 Stage 2 Stage 3 Stage 1 Stage 2 Stage 3 Stage 4 Stage 5 (a) Tretrinns samlebånd. (b) Femtrinns samlebånd Figur 8: Samlebånd med angitt tidsforsinkelse. Page 10 of 14

Figur 9: Blokkdiagram (IJVM). Page 11 of 14

Figur 10: Mikroinstruksjonsformat (IJVM). Page 12 of 14

SLR1 SLL8 Function 0 0 No shift 0 1 Shift 8 bit left 1 0 Shift 1 bit right Figur 11: Funksjonstabell for ALU (IJVM). Page 13 of 14

Figur 12: Timingdiagram (IJVM). Page 14 of 14