Avdeling for journalistikk, bibliotek- og informasjonsfag Master bibliotek. Webteknologier

Størrelse: px
Begynne med side:

Download "Avdeling for journalistikk, bibliotek- og informasjonsfag Master bibliotek. Webteknologier"

Transkript

1 Avdeling for journalistikk, bibliotek- og informasjonsfag Master bibliotek Webteknologier Dato: Tirsdag 7. juni 2011 Tid: 6 timer / Antall sider inklusive forside: 14 Antall oppgaver: 2 Tillatte hjelpemidler: Alle + PC uten nettverkstilkobling Merknad: Begynn på nytt ark for hver oppgave. Kandidaten må selv kontrollere at oppgavesettet er fullstendig. Navn må ikke skrives på eksamensbesvarelsen. Innføring med blå eller sort penn. Emnekode: LM-WEBTEKNO1 Side 1

2 BOKMÅL Nynorsk, se side 4 4 vedlegg HØGSKOLEN I OSLO Avdeling for journalistikk, bibliotek- og informasjonsfag Bibliotek- og informasjonsstudiene Eksamen Webteknologier Tirsdag 7. juni 2011, kl Alle hjelpemidler tillatt OPPGAVE 1 (Teller 2/3) Discogs er et nettsted som samler diskografier og artistbiografier. Hver plateutgivelse beskrives detaljert, og diskografiene kan listes per artist og plateselskap. Discogs er et sosialt nettsted, der registrerte brukere legger inn all informasjon. Discogs tilbyr sine data via en REST-orientert web service. Vedlegg 1 viser XML-dokumentet som er responsen på en forespørsel etter diskografiske opplysninger om plateselskapet Obscure (UK). a) Lag et XML Schema-dokument for XML-formatet for diskografiske opplysninger basert på dokumentinstansen i Vedlegg 1. b) Lag et XSLT-dokument som transformerer XML-dokumentet til et XHTML-dokument som presenterer utgivelsesdataene på en litt mer leservennlig måte. XHTML-dokumentet skal presentere informasjonen på følgende måte: Tittel og overskrift skal være plateselskapets navn, hentet fra XML-dokumentet. I et avsnitt skal plateselskapets logo vises sammen med en beskrivelse. Adressen til bildet hentes fra uri-attributtet til image-elementet i XML-dokumentet (kildedokumentet). Alternativ tekst er plateselsapets navn etterfulgt av teksten «logo». Beskrivelsen hentes fra profile-elementet i kildedokumentet. artist- og label-elementene skal transformeres til hyperlenker i XHTML. Her, som i alle andre lenker, er basis-url til artister mens den for plateselskap er Den fullstendige URL-en blir basis-url etterfulgt av artist- eller plateselskap-navn. Alle ordskillere i navnet blir erstattet med +-tegn. Eksempel: Discogs-URL-en til Brian Eno blir Tips: For å erstatte ordskillere med +, kan du bruke XPath 2.0-funksjonen replace, som er dokumentert i Vedlegg 4. Ignorer navneromprefikset fn. Side 2

3 Det etterfølgende avsnittet skal liste andre nettsteder som har opplysninger om plateseksapet (sites-elementet i kildedokumentet), med komma mellom. Alle utgivelser skal listes i en tabell med fire kolonner: Katalognummer, Artist, Tittel og År. Utgivelsene skal listes sortert stigende på år og katalognummer. Verdiene for katalognummer og år hentes direkte fra kildedokumentet. I kolonnen for artist skal artistene lenkes til sine respektive sider på Discogs etter samme regler som beskrevet over. På en del utgivelser samarbeider flere artister. Artistene skilles da i kildedokumentet med tegnet /. Slik skal de også skrives ut, men med lenke til hver enkelt artist. I tittelkolonnen skal tittelen på utgivelsen lenkes til mer informasjon på Discogs, mens utgivelsens format skal skrives i parentes bak. Tittellenken lages ved å sette sammen basis-url-en med verdien for idattributtet i release-elementet i kildedkokumentet. Vedlegg 2 viser resultatdokumentet i nettleseren, mens Vedlegg 3 viser kildekoden. c) Lag et XSLT-dokument som transformerer XHTML-dokumentet tilbake til det opprinnelige XML-dokumentet i Vedlegg 1 så godt det lar seg gjøre. OPPGAVE 2 (Teller 1/3) SRU og OAI-PMH er eksempler på protokoller som bygger på arkitekturen til REST-orienterte web services, og som typisk brukes innenfor ABM-domenet. Andre innholdsleverandører, slik som Amazon, Last.fm og Discogs, leverer data via egenutviklede web services eller API-er. Sammenlikne disse tilnærmingsmåtene og diskuter fordeler og ulemper ved dem. Side 3

4 NYNORSK Bokmål, sjå side 2 4 vedlegg HØGSKOLEN I OSLO Avdeling for journalistikk, bibliotek- og informasjonsfag Bibliotek- og informasjonsstudia Eksamen Webteknologiar Tysdag 7. juni 2011, kl Alle hjelpemiddel tillatne OPPGÅVE 1 (Tel 2/3) Discogs er ein nettstad som samlar diskografiar og artistbiografiar. Kvar plateutgjeving vert beskriven i detalj, og diskografiane kan listast per artist og plateselskap. Discogs er ein sosial nettstad, der registrerte brukarar legg inn all informasjonen. Discogs tilbyr sine data via ein REST-orientert web service. Vedlegg 1 viser XML-dokumentet som er responsen på ein førespurnad etter diskografiske opplysningar om plateselskapet Obscure (UK). a) Lag eit XML Schema-dokument for XML-formatet for diskografiske opplysningar basert på dokumentinstansen i Vedlegg 1. b) Lag eit XSLT-dokument som transformerar XML-dokumentet til eit XHTML-dokument som presenterer data om plateselskapet på ein litt meir lesarvenleg måte. XHTML-dokumentet skal presentere informasjonen på følgjande måte: Tittel og overskrift skal vere namnet på plateselskapet, henta frå XML-dokumentet. I eit avsnitt skal logoen til plateselskapet visast saman med ei beskriving. Adressa til bildet finn du i uri-attributtet til image-elementet i XML-dokumentet (kjeldedokumentet). Alternativ tekst er namnet på plateselskapet etterfølgd av teksten «logo». Beskrivinga er profile-elementet i kjelldedokumentet. artist- og label-elementa skal transformerast til hyperlenkjer i XHTML. Her, som i alle andre lenkjer, er basis-url-en til artistar mens for plateselskap er han Den fullstendige URL-en vert basis-url-en etterfølgd av namnet til artisten eller plateselskapet. Alle ordskiljar-teikna i namnet vert erstatta med +-teiknet. Eksempel: Discogs-URL-en til Brian Eno vert Tips: For å erstatte ordskiljar-teikna med +, kan du bruke XPath 2.0-funksjonen replace, som er dokumentert i Vedlegg 4. Ignorer namneromprefikset fn. Side 4

5 Det etterfølgjande avsnittet skal liste andre nettstader som har opplysningar om plateseksapet (sites-elementet i kjeldedokumentet), med komma mellom. Alle utgjevingar skal listast i ein tabell med fire kolonnar: Katalognummer, Artist, Tittel og År. Utgjevingane skal sorterast stigande på år og katalognummer. Verdiane for katalognummer og år hentast direkte frå kjeldedokumentet. I kolonnen for artist skal namna ha lenkjer til sine respektive sider på Discogs etter dei same reglane som skildra over. På ein del utgjevingar samarbeider fleire artistar. Artistane vert då skilde frå kvarandre i kjeldedokumentet med teiknet /. Slik skal dei også skrivast ut, men med ei lenkje til kvar einskild artist. I tittelkolonnen skal tittelen på utgjevinga ha ei lenkje til meir informasjon på Discogs, mens format på utgjevinga skal skrivast i parentes bak. Tittellenkja lagar du ved å sette saman basis-url-en med verdien for idattributtet i release-elementet i kjeldedkokumentet. Vedlegg 2 viser resultatdokumentet i nettlesaren, mens Vedlegg 3 viser kjeldekoden. c) Lag eit XSLT-dokument som transformerer XHTML-dokumentet tilbake til XML-dokumentet i Vedlegg 1 så godt det lar seg gjere. OPPGÅVE 2 (Tel 1/3) SRU og OAI-PMH er døme på protokollar som byggjer på arkitekturen til REST-orienterte web services, og som typisk vert nytta innanfor ABM-domenet. Andre innhaldsleverandørar, slik som Amazon, Last.fm og Discogs, leverer data via eigenutvikla web services eller API-ar. Samanlikne desse tilnærmingsmåtane og diskuter fordelar og ulemper ved dei. Side 5

6 VEDLEGG 1 <?xml version="1.0" encoding="utf-8"?> <resp stat="ok" version="1.0" requests="4"> <label> <images> <image height="76" type="primary" uri="http://s.dsimg.com/image/l jpeg" uri150="http://s.dsimg.com/image/l jpeg" width="244"/> </images> <name>obscure (UK)</name> <profile>mid 1970s conceptual label run by <artist>brian Eno</artist>, which was initially marketed through <label>island Records</label>. During the Island period all the catalogue numbers had the prefix OBSCURE NO. When the catalogue was bought by Polydor in the late 1970s the catalogue prefix changed to OBS. All releases were later reissued by <label>editions EG</label> (EGED 21-30).</profile> <sites> <site> <name>wikipedia</name> <url>http://en.wikipedia.org/wiki/obscure_records</url> </site> <site> <name>musicbrainz</name> <url>http://musicbrainz.org/label/f43826db-ebbe b53-2de21374d537</url> </site> </sites> <releases> <release id=" " status="accepted"> <catno>obs 1</catno> <artist>gavin Bryars</artist> <title>the Sinking Of The Titanic</title> <format>lp, Album</format> <year>1975</year> <release id=" " status="accepted"> <catno>obs 10</catno> <artist>harold Budd</artist> <title>the Pavilion Of Dreams</title> <format>lp, Album</format> <year>1978</year> <release id="980558" status="accepted"> <catno>obs 7</catno> <artist>simon Jeffes</artist> <title>music From The Penguin Café - Performed By Members Of The Penguin Café Orchestra</title> <format>lp, RP</format> <year>1976</year> <release id=" " status="accepted"> <catno>obscure 4</catno> <artist>david Toop / Max Eastley</artist> <title>new And Rediscovered Musical Instruments</title> <year>1975</year> <release id=" " status="accepted"> <catno>obscure No. 1</catno> <artist>gavin Bryars</artist> Side 6

7 <title>the Sinking Of The Titanic</title> <year>1975</year> <release id="316751" status="accepted"> <catno>obscure No. 2</catno> <artist>christopher Hobbs / John Adams / Gavin Bryars</artist> <title>ensemble Pieces</title> <year>1975</year> <release id="187339" status="accepted"> <catno>obscure No. 3</catno> <artist>brian Eno</artist> <title>discreet Music</title> <year>1975</year> <release id="80037" status="accepted"> <catno>obscure No. 4</catno> <artist>david Toop / Max Eastley</artist> <title>new And Rediscovered Musical Instruments</title> <year>1975</year> <release id="349087" status="accepted"> <catno>obscure No. 5</catno> <artist>jan Steele / John Cage</artist> <title>voices And Instruments</title> <year>1976</year> <release id=" " status="accepted"> <catno>obscure No. 6</catno> <artist>michael Nyman</artist> <title>decay Music</title> <year>1976</year> <release id=" " status="accepted"> <catno>obscure No. 7</catno> <artist>penguin Café Orchestra</artist> <title>music From The Penguin Café</title> <year>1976</year> <release id=" " status="accepted"> <catno>special OBS 3</catno> <artist>brian Eno</artist> <title>discreet Music</title> <format>lp, Album, RE</format> <year>1987</year> <release id="963461" status="accepted"> <catno>special OBS 8</catno> <artist>john White / Gavin Bryars</artist> <title>machine Music</title> <format>lp, Album</format> <year>1978</year> <release id="746213" status="accepted"> Side 7

8 <catno>special OBS 9</catno> <artist>tom Phillips (3) / Gavin Bryars / Fred Orton</artist> <title>irma</title> <year>1978</year> </releases> </label> </resp> Side 8

9 VEDLEGG 2 Side 9

10 VEDLEGG 3 <?xml version="1.0" encoding="utf-8"?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/tr/xhtml1/dtd/xhtml1-strict.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="content-type" content="text/html; charset=utf-8" /> <link rel="stylesheet" href="obscure+(uk).css" type="text/css" /> <title>obscure (UK)</title> </head> <body> <h1>obscure (UK)</h1> <p><img src="http://s.dsimg.com/image/l jpeg" alt="obscure (UK) logo" />Mid 1970s conceptual label run by <a href="http://www.discogs.com/artist/brian+eno">brian Eno</a>, which was initially marketed through <a href="http://www.discogs.com/label/island+records">island Records</a>. During the Island period all the catalogue numbers had the prefix OBSCURE NO. When the catalogue was bought by Polydor in the late 1970s the catalogue prefix changed to OBS. All releases were later reissued by <a href="http://www.discogs.com/label/editions+eg">editions EG</a> (EGED 21-30).</p> <p><strong>sites:</strong> <a href="http://en.wikipedia.org/wiki/obscure_records">wikipedia</a>, <a href="http://musicbrainz.org/label/f43826db-ebbe b53-2de21374d537">musicbrainz</a></p> <h2>releases</h2> <table> <th>cat. no.</th> <th>artist</th> <th>title</th> <th>year</th> OBS 1 <a href="http://www.discogs.com/artist/gavin+bryars">gavin Bryars</a> <a href="http://www.discogs.com/release/ ">the Sinking Of The Titanic</a> (LP, Album) 1975 Obscure 4 <a href="http://www.discogs.com/artist/david+toop">david Toop</a> / <a href="http://www.discogs.com/artist/max+eastley">max Eastley</a> <a href="http://www.discogs.com/release/ ">new And Rediscovered Musical Instruments</a> (LP) 1975 Obscure No. 1 <a href="http://www.discogs.com/artist/gavin+bryars">gavin Bryars</a> <a href="http://www.discogs.com/release/ ">the Sinking Of The Titanic</a> (LP) Side 10

11 1975 Obscure No. 2 <a href="http://www.discogs.com/artist/christopher+hobbs">christopher Hobbs</a> / <a href="http://www.discogs.com/artist/john+adams">joh Adams</a> / <a href="http://www.discogs.com/artist/gavin+bryars">gavin Bryars</a> <a href="http://www.discogs.com/release/316751">ensemble Pieces</a> (LP) 1975 Obscure No. 3 <a href="http://www.discogs.com/artist/brian+eno">brian Eno</a> <a href="http://www.discogs.com/release/187339">discreet Music</a> (LP) 1975 Obscure No. 4 <a href="http://www.discogs.com/artist/david+toop">david Toop</a> / <a href="http://www.discogs.com/artist/max+eastley">max Eastley</a> <a href="http://www.discogs.com/release/80037">new And Rediscovered Musical Instruments</a> (LP) 1975 OBS 7 <a href="http://www.discogs.com/artist/simon+jeffes">simon Jeffes</a> <a href="http://www.discogs.com/release/980558">music From The Penguin Café - Performed By Members Of The Penguin Café Orchestra</a> (LP, RP) 1976 Obscure No. 5 <a href="http://www.discogs.com/artist/jan+steele">jan Steele</a> / <a href="http://www.discogs.com/artist/john+cage">john Cage</a> <a href="http://www.discogs.com/release/349087">voices And Instruments</a> (LP) 1976 Obscure No. 6 <a href="http://www.discogs.com/artist/michael+nyman">michael Nyman</a> <a href="http://www.discogs.com/release/ ">decay Music</a> (LP) 1976 Side 11

12 Obscure No. 7 <a href="http://www.discogs.com/artist/penguin+café+orchestra">penguin Café Orchestra</a> <a href="http://www.discogs.com/release/ ">music From The Penguin Café</a> (LP) 1976 OBS 10 <a href="http://www.discogs.com/artist/harold+budd">harold Budd</a> <a href="http://www.discogs.com/release/ ">the Pavilion Of Dreams</a> (LP, Album) 1978 Special OBS 8 <a href="http://www.discogs.com/artist/john+white">john White</a> / <a href="http://www.discogs.com/artist/gavin+bryars">gavin Bryars</a> <a href="http://www.discogs.com/release/963461">machine Music</a> (LP, Album) 1978 Special OBS 9 <a href="http://www.discogs.com/artist/tom+phillips+(3)">tom Phillips (3)</a> / <a href="http://www.discogs.com/artist/gavin+bryars">gavin Bryars</a> / <a href="http://www.discogs.com/artist/fred+orton">fred Orton</a> <a href="http://www.discogs.com/release/746213">irma</a> (LP) 1978 special OBS 3 <a href="http://www.discogs.com/artist/brian+eno">brian Eno</a> <a href="http://www.discogs.com/release/ ">discreet Music</a> (LP, Album, RE) 1987 </table> </body> </html> Side 12

13 VEDLEGG fn:replace fn:replace($input as xs:string?, $pattern as xs:string, $replacement as xs:string) as xs:string fn:replace($input as xs:string?, $pattern as xs:string, $replacement as xs:string, $flags as xs:string) as xs:string Summary: The function returns the xs:string that is obtained by replacing each non-overlapping substring of $input that matches the given $pattern with an occurrence of the $replacement string. The effect of calling the first version of this function (omitting the argument $flags) is the same as the effect of calling the second version with the $flags argument set to a zero-length string. Flags are defined in Flags. The $flags argument is interpreted in the same manner as for the fn:matches() function. If $input is the empty sequence, it is interpreted as the zero-length string. If two overlapping substrings of $input both match the $pattern, then only the first one (that is, the one whose first character comes first in the $input string) is replaced. Within the $replacement string, a variable $N may be used to refer to the substring captured by the Nth parenthesized sub-expression in the regular expression. For each match of the pattern, these variables are assigned the value of the content matched by the relevant sub-expression, and the modified replacement string is then substituted for the characters in $input that matched the pattern. $0 refers to the substring captured by the regular expression as a whole. More specifically, the rules are as follows, where S is the number of parenthesized sub-expressions in the regular expression, and N is the decimal number formed by taking all the digits that consecutively follow the $ character: 1. If N=0, then the variable is replaced by the substring matched by the regular expression as a whole. 2. If 1<=N<=S, then the variable is replaced by the substring captured by the Nth parenthesized sub-expression. If the Nth parenthesized sub-expression was not matched, then the variable is replaced by the zero-length string. 3. If S<N<=9, then the variable is replaced by the zero-length string. 4. Otherwise (if N>S and N>9), the last digit of N is taken to be a literal character to be included "as is" in the replacement string, and the rules are reapplied using the number N formed by stripping off this last digit. For example, if the replacement string is "$23" and there are 5 substrings, the result contains the value Side 13

14 of the substring that matches the second sub-expression, followed by the digit "3". A literal "$" symbol must be written as "\$". A literal "\" symbol must be written as "\\". If two alternatives within the pattern both match at the same position in the $input, then the match that is chosen is the one matched by the first alternative. For example: fn:replace("abcd", "(ab) (a)", "[1=$1][2=$2]") returns "[1=ab][2=]cd" An error is raised [err:forx0002] if the value of $pattern is invalid according to the rules described in section Regular Expression Syntax. An error is raised [err:forx0001] if the value of $flags is invalid according to the rules described in section Regular Expression Syntax. An error is raised [err:forx0003] if the pattern matches a zero-length string, that is, if the expression fn:matches("", $pattern, $flags) returns true. It is not an error, however, if a captured substring is zero-length. An error is raised [err:forx0004] if the value of $replacement contains a "$" character that is not immediately followed by a digit 0-9 and not immediately preceded by a "\". An error is raised [err:forx0004] if the value of $replacement contains a "\" character that is not part of a "\\" pair, unless it is immediately followed by a "$" character Examples replace("abracadabra", "bra", "*") returns "a*cada*" replace("abracadabra", "a.*a", "*") returns "*" replace("abracadabra", "a.*?a", "*") returns "*c*bra" replace("abracadabra", "a", "") returns "brcdbr" replace("abracadabra", "a(.)", "a$1$1") returns "abbraccaddabbra" replace("abracadabra", ".*?", "$1") raises an error, because the pattern matches the zero-length string replace("aaaa", "A+", "b") returns "b" replace("aaaa", "A+?", "b") returns "bbbb" replace("darted", "^(.*?)d(.*)$", "$1c$2") returns "carted". The first d is replaced. Side 14