Praktisk anvendelse: Satellittkommunikasjon

Like dokumenter
Dagens temaer. Praktisk anvendelse: Satellittkommunikasjon. eksempler på bruk av assembler/c/arkitektur teknikker for å øke hastigheten

Dagens temaer. eksempler på bruk av assembler/c/arkitektur teknikker for å øke hastigheten. Organisation and Architecture )

Dagens tema. Flere teknikker for å øke hastigheten

Dagens temaer. Dagens emner er hentet fra Englander kapittel 11 (side ) Repetisjon av viktige emner i CPU-design.

IN1020. Minnehierarki

Dagens temaer. Cache (repetisjon) Cache (repetisjon) Cache (repetisjon)

Dagens temaer. Mer om cache-hukommelse (kapittel 6.5 i Computer Organisation and Architecture ) RAM ROM. Hukommelsesbusser

INF2270. Minnehierarki

Innhold. Oversikt over hukommelseshierakiet. Ulike typer minne. Innledning til cache. Konstruksjon av cache Hukommelseshierarki-1 1

Cache (repetisjon) Cache (repetisjon) Cache (repetisjon) Dagens temaer. CPU Cache RAM. om cache-hukommelse (kapittel 6.5 i Computer Organisation

bruksområder og oppbygging om cache-hukommelse (kapittel 6.5 i Computer Organisation Dagens temaer and Architecture ) ROM RAM

Oppsummering av digitalteknikkdelen

Dagens temaer. Fra kapittel 4 i Computer Organisation and Architecture. Kort om hurtigminne (RAM) Organisering av CPU: von Neuman-modellen

Dagens temaer. Kort repetisjon. Mer om cache (1) Mer om cache (2) Read hit. Read miss. Write hit. Hurtig minne. Cache

Oppsummering digital-teknikk, teknikk, INF2270

Innhold. Virtuelt minne. Paging i mer detalj. Felles rammeverk for hukommelseshierarki Hukommelseshierarki-2 1

Dagems temaer. kapittel 4 i Computer Organisation and Architecture. av CPU: von Neuman-modellen. Transfer Language (RTL) om hurtigminne (RAM)

Dagems temaer INF ! Fra kapittel 4 i Computer Organisation and Architecture. ! Kort om hurtigminne (RAM)

hvor mye hurtigminne (RAM) CPU en kan nyttiggjøre seg av. mens bit ene betraktet under ett kalles vanligvis et ord.

Internminnet. Håkon Tolsby Håkon Tolsby

Internminnet. Håkon Tolsby Håkon Tolsby

! Sentrale begreper er adresserbarhet og adresserom. ! Adresserbarhet: Antall bit som prosessoren kan tak samtidig i én operasjon

Hukommelseshierarki. 16/3 cache /3 virtuell hukommelse in 147, våren 1999 hukommelseshierarki 1

Memory Access) Figure: DMA kommuniserer med disk-controlleren og sørger for at det OS ønsker blir kopiert mellom harddisken og internminnet.

Dagens tema. Dagens tema hentes fra kapittel 3 i Computer Organisation and Architecture. Sekvensiell logikk. Flip-flop er. Tellere og registre

Innhold. Introduksjon til parallelle datamaskiner. Ulike typer parallelle arkitekturer. Prinsipper for synkronisering av felles hukommelse

Oppgave 8.1 fra COD2e

Intel Core i7. Omid Mirmotahari 4

Tildeling av minne til prosesser

IN1020. Datamaskinarkitektur

Intel Core i7. Omid Mirmotahari 4

Hvorfor lære om maskinvaren*?

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Dagens tema. Mer om cache-hukommelse Kapittel 6.5 i Computer Organisation and Architecture ) RAM. Typer, bruksområder og oppbygging 2008 ROM

! Ytelsen til I/O- systemer avhenger av flere faktorer: ! De to viktigste parametrene for ytelse til I/O er:

Datamaskinens oppbygning og virkemåte

Operativsystemer og nettverk Løsningsforslag til eksamen Oppgave 1. a) Linux-kommando: java Beregn & b) Shellprogram:

Tildeling av minne til prosesser

Datamaskinens oppbygning

Singletasking OS. Device minne Skjerm minne. Brukerprogram. Brukerdata/heap. Stack. Basis for flerprosess-systemer.

P1 P2 P3 P1 P2 P3 P1 P2. OS gjør Contex Switch fra P1 til P2

Hvorfor lære om maskinvare*?

Vi anbefaler at du setter deg litt inn i maskinen på forhånd. Det er en DELL Optiplex 620.

Fakultet for informasjonsteknologi, Oppgave 1 Flervalgsspørsmål ( multiple choice ) 15 %

En harddisk består av et lite antall plater av et magnetisk materiale.

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Forelesning Hurtigbuffer Kap 4.5

Innhold. Oppgave 1 Oversettelse (vekt 15%)

Martin Olsen, Lars- Petter Ahlsen og Jon- Håkon Rabben

4/5 store parallelle maskiner /4 felles hukommelse in 147, våren 1999 parallelle datamaskiner 1. når tema pensum.

Maskinvaredelen av INF 103: oversikt og innhold (1)

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Innhold. 2 Kompilatorer. 3 Datamaskiner og tallsystemer. 4 Oppsummering. 1 Skjerm (monitor) 2 Hovedkort (motherboard) 3 Prosessor (CPU)

Setup programmet brukes til å endre konfigurasjonen av BIOS og til å vise resultatene fra

Forstørrelse og skjermforsterkning programvare for øye trykk/press lettelse. Hurtigveiledning

Phu Pham Laboppgave 29. September 2015

Oppgave lab. 2. Hvor mye Internminne har den? - Maskinen har 2GB internminne.

kan adressere et større område som RAM enn det som faktisk er tilgjengelig. Siden data kan plasseres i RAM og/eller på harddisken brukes begrepet

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

Dagens temaer. Virtuell hukommelse. Sidetabell. Virtuell hukommelse (forts.)

Hovedkort, brikkesett og busser

Dagens temaer. Virtuell hukommelse (kapittel 9.9 i læreboken) Pentium-arkitekturen i mer detalj INF 1070

Del1: Setup: BIOS. 2. Hvor mye Internminne har den? 3GB DDR2

Generelt om operativsystemer

Lab oppgave gruppe 2 IT-ledelse (Jonas F, Robin PN, Aksel S, Magnus M, Erik I)

Oppgave 1 Flervalgsspørsmål ( multiple choice ) 15 %

Minnehåndtering i operativsystemer

MAT1030 Forelesning 30

Grafisk kryptografi (hemmelig koding av bilder)

Generelt om permanent lagring og filsystemer

Del 1 Setup - BIOS Oppgaver: 1. Hva slags CPU har maskinen? Beskriv de tekniske egenskapene ved CPU en.

Dagens temaer. Architecture INF ! Dagens temaer hentes fra kapittel 3 i Computer Organisation and

Håndtering av minne i et OS

Forelesning Instruksjonstyper Kap 5.5

Kjenn din PC (Windows7)

UNIVERSITETET I OSLO

hukommelse (kapittel 9.9 i læreboken) Dagens temaer Input-Output INF 1070

Seksjon 1. INF2270-V16 Forside. Eksamen INF2270. Dato 1. juni 2016 Tid Alle trykte og skrevne hjelpemidler, og en kalkulator, er tillatt.

UNIVERSITETET I OSLO

Funksjonalitet og oppbygning av et OS (og litt mer om Linux)

Dagens temaer. Dagens emner er hentet fra Englander kapittel 10 (side ) Mer om adresseringsmodi. RISC og CISC-prosessorer.

Oppgave 2 Maskinkode (vekt 12%)

Minnehåndtering i operativsystemer

Scheduling og prosesshåndtering

Flerveis søketrær og B-trær

1.8 Binære tall EKSEMPEL

TDT4160 AUGUST, 2008, 09:00 13:00

a) Ved avlesning på graf får man. Dermed er hastighet ved tid sekund lik.

S1 Eksamen våren 2009 Løsning

Dagens temaer. Mer om adresseringsmodi. Indeksert adressering med offset og auto-inkrement eller dekrement. Register-indirekte adressering

Spinning - FSC / Terningen Arena

UNIVERSITETET I OSLO

Dagens temaer. temaer hentes fra kapittel 3 i Computer Organisation. av sekvensielle kretser. and Architecture. Tilstandsdiagram.

Bits&Bytes Om datamaskinens oppbygging og virkemåte. TOS - IKT Tirsdag 4. desember 2012 Seksjon for digital kompetanse

Superbruker Prosjekt

NORGES TEKNISK- NATURVITENSKAPELIGE UNIVERSITET INSTITUTT FOR DATATEKNIKK OG INFORMASJONSVITENSKAP

Lars Vidar Magnusson

2. Hvor mye Internminne har den? Svar: 2GB

Steg for steg. Sånn tar du backup av Macen din

Transkript:

Dagens temaer Praktiske Flere Cache-hukommelse eksempler på bruk av assembler/c/arkitektur teknikker for å øke hastigheten del (fra kapittel 6.5 i Computer Organisation and Architecture ) cache virkemåte cache Hvorfor Grunnleggende Direkte-avbildet Praktisk anvendelse: Satellittkommunikasjon Satellitt brukt til kommunikasjon gjør at man har trådløs adgang til telefoni og Internet hvor som helst i verden (nesten). Mye brukt av handelsflåte, forsvar, FN og etterhvert også som eneste bredbåndsalternativ i grisgrendte strøk Satellitter befinner seg i varierende høyde, fra ca 65 km til 6 km over jorden Den største forskjellen mellom trådbasert og satellittbaserte systemer er den lange tidsforsinkelsen (ca 5 ms én vei for geostasjonære satellitter) En satellitt koster ofte flere milliarder kroner, og satellittkommunikasjon er som regel mye dyrere enn bakkebasert utstyr Et system for satellittkommunikasjon består av tre deler: Forward Link Interface Forward Modem Return T Link Interface Return Modem t Forward Link Interface Radiolinken Før opp til satellitten har endel parametre som må settes (frekvens) (antall ekstra bit som må brukes for å overføre et nytte-bit ) (sendeeffekt som skal brukes ved overføring av bit ene) en IP-pakke kan sendes inn på modemet i forover-retningen, må innholdet re-formatteres, og del tilleggsinformasjon må beregnes for at pakken skal kunne sendes korrekt: 4 i tidluken(e) koding og forsterkning (MKF) Lengden av superramme = ms = 56 slots Slot slot = 496 symboler Mellom og 5 symboler brukes for å overføre byte Tidluke Modulasjon Koding Forsterking Plass Modulasjon,

5 En Man Variasjon Hvis sluttbrukerhar typisk kjøpt en viss båndbredde (eks 4 forover, 56 i retur) kjøper også en bestemt Service Level Agreement (SLA) for å få en bestemt QoS, f.eks for (må ha lav forsinkelse, liten/ingen variasjon i forsinkelse og konstant båndbredde) (tåler forsinkelse, men uten variasjon, og høy båndbredde) (tåler både forsinkelse, variasjon i forsinkelse, og variasjon i båndbredde) i atmosfæriske forhold gjør at man må bruke mer robust koding mange brukere er på systemet, konkurrerer man om satellittkapasiteten VoIP Streaming Filoverføring For Ved Hovedoppgave 6 eiere og brukere av systemet er det viktig at satellitten brukes så optimalt som mulig tjener mer penger, og kan senke prisene til som forventer å få en bestent tjeneste til en gitt pris dårlig resursshåndtering vil satellitten utnyttes dårlig, samtidig som tjenesten blir dyr og kvaliteten mindre god. for Forward Link Interface hver innkommende IP-pakke beregne hvilke(n) slot og superramme pakken skal plasseres i, og med hvilke MKF verdier så mange IP-pakker som mulig innenfor en superramme slik at alle SLA er overholdes to foregående jobbene må beregnes innen millisekunder: Svært tidskritisk, og noen deler må skrives i assembler må også skrives i assembler Eierne Sluttbrukere For Plassere De Spesialdrivere 8 Arkitektur på Forward Link Prosessor Består av (kalt FLP og TI) stykker 9 industri-pc er med Dual Pentium.4 GHz Xeon prosessorer. Kommunikasjon mellom FLP og TI er gigabit Ethernet, og mellom TI og modem er det SPI (standard for video-overføring) Core Router FLP-Server TI-Server By TOLL By TCP By UT By LCID SPI Frame C&C 7 C&C CBR BST-CC VBR (-) VBR (-) C&C CBR VBR SPI BST FDS GRAC Frame Map Cache Pipelining Andre er viktig for å øke antall instruksjoner som utføres pr sekund. teknikker som øker hastigheten ytterligere er Flere CPUer i en maskin (multiprosessor) Økt klokkehastighet Stor ordlengde på instruksjoner og i datapath Raskere disker Noen Hurtigere og større RAM teknikker er ren forbedring i teknologi, andre er forbedring av selve arkitekturen.

9 Multiprosessorer (parallellprosessorer) Ide: Istedenfor å la én CPU utføre instruksjoner, lar man flere CPUer samarbeide om den samme jobben. Gir en teoretisk hastighetsøkning direkte proporsjonal med antall ekstra CPUer: det går n ganger raskere med n CPUer enn med én CPU. I praksis ikke mulig av flere årsaker: Ikke alltid mulig å dele opp et problem i like store deler som kan løses uavhengig av hverandre. Det kreves administrasjon og koordinering av programeksekveringen før, under og etter at jobben er fordelt på de ulike CPUene, dvs ekstra overhead Endel applikasjoner egner seg for lastdeling, f.eks server-applikasjoner, dvs enkelt å parallellisere oppgavene Økt klokkehastighet og større ordlengde Økt klokkehastighet reduserer tiden hver enkelt instruksjon tar (Resultatet av teknologisk utvikling.) Hastigheten til alle deler av en datamaskin øker ikke like raskt: Interne data/adressebusser Nettverk Klokkehastigheten til en CPU øker mye raskere enn lese/skrivehastigheten til hukommelsen, mao: Effektive hastighets-forbedring blir langt mindre. Bredere datapath og ordlengde gjør det mulig å behandle større tall i en operasjon og å lese/skrive mer data fra hukommelsen i én operasjon. Det er en øvre grense for hvor mange bit som kan behandles i en operasjon (typisk i dag er 64 eller 8 bit). Raskere disker Programmer trenger å aksessere disker av og til ved f.eks innlesning og skriving av data, ved oppstart og virtuell hukommelse En harddisk ca ganger langsommere enn en CPU, dvs at en CPU kan gjøre instruksjoner mens en harddsik gjør én lese/skriveoperasjon. Teknikker finnes for å lese store blokker av data ad gangen, prøve å gjette hvilke data som skal leses neste gang og lagre disse i hurtigminne, etc Harddisker blir både raskere og får mer kapasitet, men allikevel vil hyppig diskaksess være et betydelig problem hvis hastighet er viktig. Større og raskere hurtigminne Det optimale ville være ubegrenset tilgang på billig hurtigminne like raskt som prosessoren selv. Henting av instruksjoner, og lesing/skriving av data ville gå like raskt som registeraksess. I praksis må man velge hva som er viktigst av pris, hastighet og kapasitet - + Regi stre Cache - Kapasitet Pris per bit RAM Aksesstid Magnetisk disk + - + Magnetisk tape Optisk disk

4 Bruksområder for de ulike hukommelsestyper Registre: Integrert på CPU en, relativt få (-64 stykker) med like mange bit i hver som maskinens ordbredde Cache: Mellomlager som ligger inne på (L) eller i nærheten av (L, L) CPU en, typisk kapasitet fra 8 KiloByte (L) til 5 (L) KiloByte, og noen MegaByte (L). RAM: Internt på hovedkortet i nærheten av CPUen, størrelse opptil mange GigaByte. Magnetisk disk: Ekstern eller intern lagringsenhet i maskinen, med kapasitet opptil TeraByte. Magnetisk tape: Sekvensielt medium med opptil -talls sekunders aksesstid. Optisk disk: (CD-ROM, CD-RW og DVD). Billig eksternt lagringsmedium med kapasitet opptil flere GigaByte (DVD). Aksesstider Registre: En klokkesykel, dvs like raskt som resten av prosessoren (nanosekunder). Cache: Samme størrelsesorden som interne registre, men allikevel noe langsommere (avhengig av L eller L/L). Hovedminne: Flere titalls nano-sekunder. Magnetisk disk: til ganger langsommere aksesstid, dvs flere millisekunder. For å finne data må disken rotere til riktig posisjon Magnetisk tape: Sekvensielt medium med opptil flere titalls sekunders aksesstid (man må i verste fall spole gjennom hele tapen før man finner det man leter etter. Optisk disk: (CD-ROM, CD-RW og DVD): Opptil flere sekunders aksesstid. For å finne data må platen rotere til riktig posisjon. Cache Ønsker så mye og rask hukommelse som mulig tilgjengelig for et program under eksekvering, både for instruksjoner og data 5 Cache-minnet er logisk sett plassert mellom CPUen og RAM slik det er vist i figuren under: Innholdet i cache vil alltid være et subsett av innholdet i RAM Fysisk er cache enten integrert på CPU en eller plassert rett ved siden av (eller begge deler) CPU Cache RAM Cache (forts.) Kapasiteten til cache ligger i mellom det interne i CPUen og RAM. Typiske verdier er fra 8 KB til MB (Finnes i flere nivåer kalt L, L og L) Siden cache n er nesten like rask som CPUen, trenger ikke CPU en å stoppe opp og vente i mange klokkesykler på at RAM skal levere data. 6 CPU en har ingen bevissthet om at det finnes cache og ser ikke forskjell på om data eller instruksjoner ligger i cache eller i RAM CPUen får beskjed utefra (buss- eller cache-kontroller) når data er klare. Om CPUen venter eller klokkesykler spiller ingen rolle annet enn for hastigheten.

8 Cache (forts.) 7 Siden cache n er mindre enn hurtigminnet (RAM) består mesteparten av administrasjonen av cache i å velge ut hvilken del av programmet og hvilke data som skal ligge i cache, og hvilke som må ligge i RAM. Cache benytter seg av lokalitetsprinsippet: Instruksjoner/data aksesseres som regel sekvensielt, dvs fra samme område i hukommelsen Som en konsekvens vil de samme instruksjonene/data også aksesseres nær hverandre i tid Cache kopierer derfor hele blokker (størrelse fra 4 byte opp til noen kilobyte) Slot-nummer Tag-felt Blokk 64 88 64 Startadresse i blokken Tag+Slot =adresse 64 64 64 64 88 88 88 88 64 65 66 67 Tilsvarer adresse i RAM 9 CPU ) Cachekontroller Når en prosessor skal hente en instruksjon eller lese/skrive data, vet den ikke om den skal hente fra RAM eller cache. Hvis det prosessoren ber om ligger i cache, kalles det for cache hit: Figur til høyre: CPUen ber om å få innholdet i lokasjon 88 ) Tag-felt Slot Blokk 64 88 64 ) 5) Hvis data ikke ligger i cache, får man en cache miss Figur til høyre: CPU en ber om lokasjon 987 Cachekontrolleren finner ut at denne ikke finnes i cachen Blokken som starter på 987 leses inn fra RAM Blokken som starter på 64 overskrives for å gi plass til 987 ) CPU ) Cachekontroller Tag-felt Blokk 64 987 88 64 RAM 4) )

Read/write hit/miss Cache-kontrolleren må håndetere 4 tilstander av aksess av cache Read hit Det skal leses fra hukommelsen og blokken med ordet befinner seg i cache Data leveres med en gang fra cache n til CPU en Read miss Det skal leses fra hukommelsen, men blokken det skal leses fra er ikke i cache Cache-kontrolleren må bestemme Hvilken blokk i cache som kan/skal overskrives Kopiere inn riktig blokk fra RAM til cache Levere ordet til CPU en Ved begge read-operasjoner vil innholdet i RAM og innholdet i kopien av blokkene i cache være identiske -> OK Read/write hit/miss (forts) Write hit Det skal skrives til hukommelsen og blokken med lokasjonen det skal skrives til ligger i cache Data skrives til riktig lokasjon i blokken i cache Write miss Det skal skrives til hukommelsen og blokken med lokasjonen det skal skrives til ligger ikke i cache Cache-kontrolleren må bestemme blokk i cache som kan/skal overskrives inn riktig blokk fra RAM til cache skriving til riktig lokasjon i cache Ved begge write-operasjoner vil innholdet ikke innholdet i RAM og innholdet i kopien av blokkene i cache være identiske -> ikke OK Hvilken Kopiere Besørge Mer om write hit/miss Hvis det bare skrives til cache og ikke RAM, vil ikke RAM inneholde gyldige data Hvis en blokk det er skrevet til kastes ut fordi cache er full, mister man data To strategier benyttes for å håndtere write-operasjonen korrekt: Write-through: Etter hver gang det skrives til en blokk, skrives innholdet i blokken også tilbake til RAM Fordel: Enkelt å implementere i cache-kontrolleren Ulempe: Hvis det skal skrives flere ganger rett etterhverandre til samme blokk må prosessoren vente mellom hver gang Mer om write hit/miss (forts.) Write-back Innholdet i en blokk i cache kopieres kun tilbake til RAM hvis blokken skal overskrives i cache og det har blitt skrevet til den i cache For raskt å detektere om en blokk har blitt skrevet til benyttes et kontroll-bit i cache (kalles dirty-bit et) 4 Fordel: Gir ingen hastighetsreduksjon ved flere påfølgende write-operasjoner til samme blokk siden CPU en ikke trenger vente mellom hver skriving Ulempe: Hvis det skal skrives flere ganger rett etterhverandre til samme blokk må prosessoren vente mellom hver gang. Hvis arkitekturen støtter direkte lesing/skriving mellom RAM og Input/Output-enheter uten å gå via CPU en (kalt Direct memory Access eller DMA), risikerer man inkonsistente data hvis ikke DMA-kontrolleren kommuniserer med cache-kontrolleren