Dagens tema: 12 gode råd for en kompilatorskriver. Prosjektet. Modifikasjon av grammatikken. Utifra dette RusC programmet:

Like dokumenter
Dagens tema: 12 gode råd for en kompilatorskriver. Prosjektet. Koblingen mellom grammatikken og klasser. Utifra dette RusC-programmet:

Dagens tema: Resten av det dere trenger til del 1

Dagens tema: Resten av det dere trenger til del 1

Dagens tema: 12 gode råd for en kompilatorskriver

Dagens tema: 12 gode råd for en kompilatorskriver. Sjekking av navn. Lagring av navn. Hvordan finne et navn?

Råd nr 1: Start nå! Det tar typisk timer å programmere Del 1 om man ikke har gjort slikt før. Dagens tema:

Dagens tema: Mer av det dere trenger til del 1

Dagens tema. Hva er kompilering? Anta at vi lager dette lille programmet (kalt kildekoden): Hva er kompilering?

Dagens tema. Hva er kompilering? Anta at vi lager dette lille programmet doble.rusc (kalt kildekoden): Hva er kompilering?

Dagens tema: INF2100. Syntaksanalyse. Hva annet gjør en kompilator? Sjekking av navnebruk. Testutskrifter

Syntaksanalyse. Dagens tema: Språkdiagrammene Jernbanediagrammene er et ypperlig utgangspunkt for å analysere et program: INF2100 INF2100 INF2100

Kompilering Statiske Syntaksanalyse Feilsjekking Eksempel Oppsummering

Oversikt Kompilering Syntaksanalyse Java Feilsjekking Oppsummering

Dagens tema: Resten av det dere trenger til del 1

Dagens tema: Resten av det dere trenger til del 1

Dagens tema: Resten av det dere trenger til del 1

Kompilering Statiske Syntaksanalyse Feilsjekking Eksempel Oppsummering

INF2100. Oppgaver 23. og 24. september 2010

INF2100. Oppgaver uke 40 og

INF2100. Oppgaver 9. oktober 2012 C 100 X 10

INF2100. Oppgaver 6. og 11. oktober 2011 C 100 X 10

Dagens tema: Formålet. Kodegenerering NB! Introduksjon Modulen Code. Enkle variable Noen enkle setninger Uttrykk

UNIVERSITETET I OSLO

Dagens tema: Formålet. Kodegenerering NB! Introduksjon Modulen Code. Enkle variable Noen enkle setninger Uttrykk

INF1000 (Uke 5) Mer om løkker, arrayer og metoder

Hva er kompilering? Dagens tema. En kompilator En kompilator leser Minila koden og lager Flok koden.

INF2100. Oppgaver 26. september til 1. oktober 2007

INF2100. Oppgave 1. Oppgave 2 4. Løsningsforslag til oppgaver uke 40 og Se figur 1 på neste side.

Dagens tema: Sjekking

2 Om statiske variable/konstanter og statiske metoder.

Oversikt Kodegenerering Variable Setninger Uttrykk While-setningen Oppsummering

Oversikt Kodegenerering Variable Setninger Uttrykk While-setningen

LITT OM OPPLEGGET. INF1000 EKSTRATILBUD Stoff fra uke September 2012 Siri Moe Jensen EKSEMPLER

UNIVERSITETET I OSLO

INF Repetisjon: Hvordan bygge treet og analysere? 8. september Typisk situasjon. De problematiske syntaks-diagrammene

Del 3: Evaluere uttrykk

Dagens tema: Mer av det dere trenger til del 1

Løsningsforslag ukeoppg. 6: 28. sep - 4. okt (INF Høst 2011)

INF 1010, vår 2005 Løsningsforslag uke 11

Dagens tema: Kompilatorens struktur. De ulike modulene Prosjektet. Oppbyggingen Pakker i Java Avbrudd («exceptions») Enum-klasser i Java

INF2100. Oppgave 1, 2 og 3. Løsningsforslag til oppgaver 23. og 24. september Her er det mange mulige løsninger her er én: import java.io.

Oversikt Oversettelse Logging Implementasjon Oppsummering

Dagens tema: Generelt om variable. Kodegenerering. Deklarasjon av array er. Versjonskontroll. Oppslag i array er

OPPGAVE 1 OBLIGATORISKE OPPGAVER (OBLIG 1) (1) Uten å selv implementere og kjøre koden under, hva skriver koden ut til konsollen?

INF1000 EKSTRATILBUD. Stoff fra uke 1-5 (6) 3. oktober 2012 Siri Moe Jensen

Velkommen til INF2100

Velkommen til INF2100

Innhold uke 4. INF 1000 høsten 2011 Uke 4: 13. september. Deklarasjon av peker og opprettelse av arrayobjektet. Representasjon av array i Java

IN1010 våren januar. Objektorientering i Java

Jentetreff INF1000 Debugging i Java

Forelesning inf Java 4

Bakgrunnen for INF2100. Velkommen til INF2100. Prosjektet. Hva gjør en kompilator?

Hva er verdien til variabelen j etter at følgende kode er utført? int i, j; i = 5; j = 10; while ( i < j ) { i = i + 2; j = j - 1; }

GJØVIK INGENIØRHØGSKOLE

i=0 Repetisjon: arrayer Forelesning inf Java 4 Repetisjon: nesting av løkker Repetisjon: nesting av løkker 0*0 0*2 0*3 0*1 0*4

UNIVERSITETET I OSLO

2 Om statiske variable/konstanter og statiske metoder.

INF1000 : Forelesning 4

Tre måter å lese fra terminal. Java 4. Eksempel. Formatert utskrift til skjerm

Velkommen til INF2100

INF1000 (Uke 15) Eksamen V 04

INF1000 (Uke 15) Eksamen V 04

Velkommen til INF2100

i=0 i=1 Repetisjon: nesting av løkker INF1000 : Forelesning 4 Repetisjon: nesting av løkker Repetisjon: nesting av løkker j=0 j=1 j=2 j=3 j=4

Programmering Høst 2017

Oversikt Kodegenerering Variabler Setninger Uttrykk While-setningen

TDT4100 Objektorientert programmering

Hvis en person har inntekt < , så betaler han 10% skatt på alt, og ellers betaler han 10% skatt på de første og 30% på resten.

Hvis en person har inntekt < , så betaler han 10% skatt på alt, og ellers betaler han 10% skatt på de første og 30% på resten.

Dagens tema: Kompilatorens struktur. De ulike modulene Prosjektet. Oppbyggingen Pakker i Java Avbrudd («exceptions») Enum-klasser i Java

Dagens tema: Mer av det dere trenger til del 2

Hvordan skrive Flok og Flass kode? I mange tilfelle er det svært enkelt:

UNIVERSITETET I OSLO

Introduksjon til objektorientert. programmering. Hva skjedde ~1967? Lokale (og globale) helter. Grunnkurs i objektorientert.

Programmeringsspråket C

INF 1000 høsten 2011 Uke september

Kapittel 5: Objektkommunikasjon

Dagens tema: Resten av det dere trenger til del 2

Praktisk informasjon. Repetisjon: While-løkker. I dag. INF1000 (Uke 5) Mer om løkker, arrayer og metoder. Oblig 2 er lagt ut

Fra Python til Java, del 2

Oversikt Kodegenerering Variable Setninger Uttrykk While-setningen

UNIVERSITETET I OSLO

Oppgave 1. Oppgave 2. Oppgave 3. Prøveeksamen i INF1000. Ole Christian og Arne. 23. november 2004

INF1000 undervisningen INF 1000 høsten 2011 Uke september

Hovedansvarlig. Symbolgenerator. Tregenerator. Litt mer kompliserte setninger med betingelser

Praktisk informasjon. I dag. Repetisjon: While-løkker. INF1000 (Uke 5) Mer om løkker, arrayer og metoder

INF Uke 10. Ukesoppgaver oktober 2012

Beskrivelse av programmeringsspråket Compila15 INF Kompilatorteknikk Våren 2015

Prøveeksamen i INF1000. Ole Christian og Arne. 23. november 2004

Velkommen til INF2100. Bakgrunnen for INF2100. Hva gjør en kompilator? Prosjektet. Jeg er Dag Langmyhr

INF1000 : Forelesning 3

INF1010 våren januar. Objektorientering i Java

Oppgave 1. INF1000 Uke 13. Oppgave 2. Oppgave 3. Er dette lovlige deklarasjoner (når de foretas inni en metode)? JA NEI

Body Mass Index (BMI) INF1000 : Forelesning 3. Ferdig program (forts.) Ferdig program

INF1000 oppgaver til uke 38 (17 sep 23 sep)

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Oversikt. Introduksjon Kildekode Kompilering Hello world Hello world med argumenter. 1 C programmering. 2 Funksjoner. 3 Datatyper. 4 Pekere og arrays

UNIVERSITETET I OSLO

Repetisjon. INF gruppe 13

Transkript:

Dagens tema Dagens tema: 12 gode råd for en kompilatorskriver Hvordan sjekke navn? Testutskrifter Programmeringsstil 12 gode råd Dagens tema Prosjektet Utifra dette RusC programmet: func pot2 (int x) int p2; p2 = 1; while (2*p2 <= x) p2 = 2*p2; return p2; int x; func main () int v; v = getint(); x = pot2(v); putint(x); putchar(10); Dagens tema Dagens tema... skal vi bygge opp dette treet (som her er klippet): ProgramUnit Modifikasjon av grammatikken FuncDeclUnit FuncDeclUnit Grammatikken er gitt, men vi har lov å endre den så lenge selve språket er det samme. Nye symboler declaration og decl list er nyttig. FuncBodyUnit FuncBodyUnit Vi kan slå sammen func decl og func body om vi ønsker det. StatmListUnit StatmListUnit

Hva skal gjøres med navn? Sjekking av navn Lagring av navn Lagring av navn Enkeltnavnene bør lagres i deklarasjonsobjektet: En kompilator må også sjekke riktig navnebruk: Det må ikke forekomme dobbeltdeklarasjoner. Alle navn må være deklarert. Navnet må brukes riktig (enkel variabel kontra array kontra prosedyre). abstract class DeclarationUnit extends SyntaxUnit protected String name = null; protected DeclarationUnit nextdecl = null; public abstract void checkwhetherarray(); public abstract void checkwhetherfunction(int nparamsused); public abstract void checkwhethersimplevar(); class FuncDeclUnit extends DeclarationUnit... public static FuncDeclUnit parse(...)... public void checkwhetherarray()... public void checkwhetherfunction(int nparamsused)... public void checkwhethersimplevar()... Lagring av navn Hvordan finne et navn? Det er nyttig med en egen klasse for en deklarasjonsliste: class extends SyntaxUnit DeclarationUnit firstdecl; outerlist; ( outer)... void adddecl(declarationunit d)... I RusC programmet kan vi ha følgende setning: x = a[4] + 1; DeclarationUnit finddecl(string n)... Hvilken x er det snakk om, og hvilken a?

Lokale variable Globale navn Det enkleste er å sjekke om variabelen er en lokal variabel: func f () int c; c = getchar() + 32; putchar(c); La parse få med en parameter som peker til den lokale deklarasjonslisten: public static WhileUnit parse( decls). Navn kan imidlertid være deklarert «lenger ute». I Rusc kan vi ha opptil fire nivåer: int a; func f (int b) int c;... c... b... a... getint... Globale navn exit getchar getint putchar putint Navn kan imidlertid være deklarert «lenger ute». I Rusc kan vi ha opptil fire nivåer: int a; ProgramUnit func f (int b) int c; FuncDeclUnit... c... b... a... getint... FuncBodyUnit Hvordan finner globale navn? StatmListUnit Det enkleste er å la hvert objekt ha en peker til sin nærmeste omliggende deklarasjonsliste.

Skjuling av navn Deklarasjonsrekkefølgen Som i de fleste språk vil en indre deklarasjon skjule en ytre. int a; func f (int a) int a;... a... Husk at navn i RusC først er kjent etter at de er deklarert. func f1 () outint(v); int v; :... så dette programmet skal gi feilmelding. Dette håndteres automatisk av vårt opplegg. Noen ganger er dette ganske viktig: func f1 (int a) putint(a); exit getchar getint putchar putint ProgramUnit func putint (int a) putchar(a); FuncDeclUnit FuncDeclUnit func f2 (int a) putint(a); FuncBodyUnit StatmListUnit FuncBodyUnit StatmListUnit Dette håndteres også automatisk når vi gjør det samtidig med parseringen.

Oversikt Testutskrifter Det er lett å gjøre feil når man programmerer noe såpass komplisert som en kompilator. Det lureste er å godta dette og heller finne teknikker for å oppdage feilen. logp avslører om man gjør riktige valg i jernbanediagrammene. La hver parse gi lyd fra seg. logt sjekker om analysetreet ble riktig ved å skrive det ut etterpå. logp Vårt testprogram func pot2 (int x) int p2; p2 = 1; while (2*p2 <= x) p2 = 2*p2; return p2; int x; func main () int v; v = getint(); x = pot2(v); putint(x); putchar(10); logp logp 1: func pot2 (int x) <program> <func decl> <func params> 2: 3: int p2; p2 = 1; <func params> <func body> <var decl> <var decl> <statm list> <statement> <assignment> <variable> <variable> <expression> <number> 4: while (2*p2 <= x) p2 = 2*p2; <number> <expression> <assignment> <statement> <statement> <while statm> <expression> <number> <number> <variable> <variable> <variable> <variable> <expression> <statm list> <statement> <assignment> <variable> <variable> <expression> <number> <number> Implementasjon Alle parse metoder må kalle Log.enterParser("<while statm>"); (eller tilsvarende) ved oppstart og Log.leaveParser("<while statm>"); ved avslutning. Innrykk må håndteres automatisk.

logt logt Korrekt parsering av treet sjekkes enkelt ved å regenerere det (såkalt «pretty printing»): Tree: func pot2 (int x) Tree: Tree: int p2; Tree: Tree: p2 = 1; Tree: while (2 * p2 <= x) Tree: p2 = 2 * p2; Tree: Tree: return p2; Tree: Tree: Tree: int x; Tree: Tree: func main () Tree: Tree: int v; Tree: Tree: v = getint(); Tree: x = pot2(v); Tree: putint(x); Tree: putchar(10); Tree: Et eksempel class WhileUnit extends StatementUnit ExpressionUnit test; StatmListUnit body; public static WhileUnit parse( decls) Log.enterParser("<while statm>"); WhileUnit w = new WhileUnit(); Scanner.readNext(); Scanner.skip(Token.leftParToken); w.test = ExpressionUnit.parse(decls); Scanner.skip(Token.rightParToken); w.body = StatmListUnit.parse(decls,true); Log.leaveParser("<while statm>"); return w; public void printtree() Log.wTree("while ("); test.printtree(); Log.wTreeLn(") "); Log.indentTree(); body.printtree(); Log.outdentTree(); Log.wTreeLn(""); Programmeringsstil Alle har sin programmeringsstil, men noen ganger kan det være lurt å følge en standard: Ved samarbeide Når man produserer kommersiell kode. Sun har definert et forslag til standard: http://java.sun.com/docs/codeconv/codeconventions.pdf. Klasser Hver klasse bør ligge i sin egen kildefil. Klasse filer bør inneholde følgende (i denne rekkefølgen): 1. De aller viktigste opplysningene om filen: /* * Klassens navn * * Versjonsinformasjon * * Copyrightangivelse */ 2. Alle import spesifikasjonene. 3. JavaDoc kommentar for klassen. 4. Selve klassen.

Variable Variable bør deklareres én og én på hver linje: (Uenig!) int level; int size; De bør komme først i blokken (dvs ikke etter noen setninger). (Uenig!) Lokale for indekser er helt OK: for (int i = 1; i <= 10; ++i)... Om man kan initialisere variablene samtidig med deklarasjonen, er det er fordel. Setninger Enkle setninger bør stå én og én på hver linje: (Uenig!) i = 1; j = 2; Sammensatte setninger: do while (uttrykk); if (uttrykk) if (uttykk) else if (uttrykk) else if (uttrykk) for (init; betingelse; oppdatering) return uttrykk; switch (uttrykk) case xxx: break; case xxx: break; while (uttrykk) try catch (ExceptionClass e) default: break; Sammensatte setninger skal alltid har rundt innmaten. (Uenig!) Innmaten skal indenteres 4 posisjoner.

Navn Navn bør velges slik: Type navn Kapitalisering Hva slags ord Eksempel Klasser XxxxXxxx Substantiv som beskriver objektene Metoder xxxxxxxx Verb som angir hva metoden gjør Variable xxxxxxxx Korte substantiver; «bruk og kastvariable» kan være på én bokstav IfStatement readtoken curtoken Konstanter XXXX_XX Substantiv MAX_MEMORY Utseende Linjer maks 80 tegn. For lange linjer bør deles etter et komma eller før en operator (som + eller &&). Blanke linjer Sett inn doble blanke linjer mellom klasser. Sett inn enkle blanke linjer mellom metoder, mellom variabeldeklarasjonene og første setning i metoder eller mellom ulike deler av en metode. Start nå! Råd nr 1: Start nå! Forstå hva du skal gjøre! Råd nr 2: Forstå problemet! Det tar typisk 20 100 timer å programmere Del 1 om man ikke har gjort slikt før. Påtrengende spørsmål Det er 21 arbeidsdager til 7. november. Hvor mange timer per dag blir det? Forstå hva du skal gjøre før du begynner å programmere. NB! Skriv noen korte kodesnutter i RusC. Tegn syntakstrærne deres. Studér eksemplet med kalkulatoren i øvelsesoppgavene. På dette stadium kan man samarbeide så mye man ønsker!

Start enkelt! Råd nr 3: Start med noe enkelt! Bruk aktiv feilsøking! Råd nr 4: Ikke sitt og stirr på koden! Ingen bør forvente at de kan skrive all koden og så bare virker den. Start med et enkelt programmeringsspråk program int decl int decl int name ; og få det til å virke først. Utvid etter hvert. Sjekk hver utvidelse før du går videre. Når programmet ikke virker: 1. Se på siste versjon av programkoden. 2. Siden du arbeider i små steg er feilen sannsynligvis i de siste linjene du endret. 3. Hvis du ikke har funnet feilen i løpet av fem minutter, gå over til aktiv feilsøking. Husk testutskriftene! Husk testutskriftene! Råd nr 5: Les testutskriftene! P utskriftene forteller hvilke parse metoder som kalles. Anta at vi har programmet func pot2 (int x) int p2; p2 = 1;. Svaret kan vi finne i P utskriften: 1: func pot2 (int x) <program> <func decl> 2: 3: int p2; p2 = 1; <func body> Programmet gir en feilmelding i linje 1: Expected a leftcurltoken but found a leftpartoken! Hva er galt?

Husk testutskriftene! Svaret kan vi finne i P utskriften: 1: func pot2 (int x) <program> <func decl> 2: 3: int p2; p2 = 1; <func body> Utskriften skulle ha startet 1: func pot2 (int x) <program> <func decl> <func params> 2: 3: int p2; p2 = 1; <func params> <func body> Husk testutskriftene! T utskriften viser en utskrift av det genererte treet. Anta at vi har det samme testprogrammet func pot2 (int x) int p2; p2 = 1;. Hvis T utskriften er func pot2 (int x) p2 = 1;. så vet vi at lokale deklarasjoner i funksjoner ikke settes opp riktig (eller at det er feil i T utskriften : ). Lag egne testutskrifter Lag egne testutskrifter Råd nr 6: Lag egne testutskrifter Her er litt (muligens feilaktig) kode fra StatmListUnit.parse: class StatmListUnit extends SyntaxUnit StatementUnit firststatement = null; public static StatmListUnit parse( decls) Log.enterParser("<statm list>"); StatmListUnit sl = new StatmListUnit(); StatementUnit laststatement = null; Scanner.skip(Token.leftCurlToken); while (Scanner.curToken!= Token.rightCurlToken) StatementUnit sx = StatementUnit.parse(decls); if (laststatement!= null) sl.firststatement = sx; else laststatement.nextstatement = sx; laststatement = sx; Scanner.readNext(); Anta at vi får melding om null peker i linjen med laststatement.nextstatement = sx;. Slikt skal ikke skje. Mitt råd er å legge inn noe à la while (...) System.out.println("StatmListUnit.parse: " + "laststatement er " + (laststatement==null? "null" : "ikke null")); Log.leaveParser("<statm list>"); return sl;

Lag egne testutskrifter Slik skal koden være: class StatmListUnit extends SyntaxUnit StatementUnit firststatement = null; public static StatmListUnit parse( decls) Log.enterParser("<statm list>"); StatmListUnit sl = new StatmListUnit(); StatementUnit laststatement = null; Scanner.skip(Token.leftCurlToken); while (Scanner.curToken!= Token.rightCurlToken) StatementUnit sx = StatementUnit.parse(decls); if (laststatement == null) sl.firststatement = sx; else laststatement.nextstatement = sx; laststatement = sx; Scanner.readNext(); Log.leaveParser("<statm list>"); return sl; Behold testutskriftene! Råd nr 7: Behold testutskriftene! Når feilen er funnet, bør man la testutskriften forbli i koden. Man kan få bruk for den igjen. Derimot bør man kunne slå den av eller på: Det mest avanserte er å bruke opsjoner på kommandolinjen: java Rusc debugss.a testprog.rusc Det fungerer også godt å benytte statusvariable: static boolean debugss_a = true;. if (debugss_a) System.out.println("..."); Stol ikke på det du har skrevet! Råd nr 8: Mistro din egen kode! Stol ikke på det du har skrevet! NB! Det er altfor lett å stole på at ens egen kode andre steder er korrekt. Løsningen er å legge inn assertions som bare sjekker at alt er som det skal være (som vist her i WhileUnit.parse): class WhileUnit extends StatementUnit ExpressionUnit test; StatmListUnit body; public static WhileUnit parse( decls) Log.enterParser("<while statm>"); WhileUnit w = new WhileUnit(); assert Scanner.curToken==Token.whileToken: "While setning starter ikke med while!"; Scanner.readNext(); Scanner.skip(Token.leftParToken); w.test = ExpressionUnit.parse(decls); Scanner.skip(Token.rightParToken); w.body = StatmListUnit.parse(decls,true); Log.leaveParser("<while statm>"); return w; Husk å kjøre med java ea Rusc for å slå på mekanismen.

Synkronisér med symbolgeneratoren! Råd nr 9: Sjekk spesielt på Scanner.readNext! Ta sikkerhetskopier! Råd nr 10: Ta kopier daglig eller oftere! Det er lett å kalle readnext for ofte eller for sjelden. Her er reglene som parse metodene må følge: 1. Når man kaller parse, skal første symbol være lest inn. 2. Når man returnerer fra en parse, skal første symbol etter konstruksjonen være lest. Vær spesielt oppmerksom på if tester og løkker. Programmering er mye prøving og feiling. Noen ganger må man bare glemme alt man gjorde den siste timen. Det finnes systemer for versjonskontroll som man bør lære seg før eller siden. I mellomtiden kan man ha nytte av 1. Ta en kopi av Java filen hver gang du starter med å legge inn ny kode. 2. Ta uansett en kopi hver dag (om noe som helst er endret). Hele folket i arbeid! Råd nr 11: Fordel arbeidet! Dere er to om jobben. Selv om begge må kjenne til hovedstrukturen, kan man fordele programmeringen. Forslag 1. Én tar det som har med deklarasjoner. 2. Én tar det som har med setninger. Men... Snakk ofte sammen. Planlegg hvordan dere bruker filene så ikke den ene ødelegger det den andre har gjort. Søk profesjonell hjelp! Råd nr 12: Bruk hjelpemidlene Spør gruppelærerne! De er tilgjengelige under gruppetimene og svarer på e post til andre tider. Orakel Siste uken før oblig fristene vil de sitte på terminalstuen i Abel for å svare på spørsmål. Les kompendiet Stoffet er forklart med flere detaljer enn det er mulig på forelesningene.

Vi har snakket om Navn lagres i deklarasjonsobjektet. parse får med peker til lokale deklarasjonsliste. Hver deklarasjonsliste peker på listen utenfor. Testutskriftene er svært nyttige. God programmeringsstil er også en hjelp. 12 gode råd.