E-bøker Workshop: Bibliotek- og informasjonsvitenskap, HIOA, januar-februar 2015 1. økt: om Bokselskap og tekstkoding Ellen Wiger, bokselskap.no
bokselskap.no bokselskap = ebokportal, et paraplynettsted for norske tekstutgivere Ikke-kommersiell og gratis Hovedsakelig verker som har falt i det fri Utviklet og driftet av Det norske språk- og litteraturselskap (NSL) Samarbeidspartnere: Nasjonalbiblioteket, Universitet i Oslo, Henrik Ibsens skrifter, Ludvig Holbergs skrifter, Høgskolen i Oslo og Akershus, Store norske leksikon Har mottatt støtte fra Norsk kulturråd, Fritt Ord og Anders Jahres Humanitære Stiftelse Nasjonalbiblioteket sponser redaktørstillingen (2013-2015) Pr. 1. januar 2015: 243 bøker av 53 forfattere Tilbyr lesetekster på nett og nedlastningsfiler i fire formater: epub, mobi, pdf, html
bokselskap.no: gangen i arbeidet 1. Tekst fra NB, UiO e.l. 2. Tekstkoding: TEI P5 XML 3. Transformering: XML -> visningsfil (XHTML) 4. Korrektur mot originalbok/faksimiler 5. Innføring av korrekturrettelser i XML-fil 6. Validering og kodekontroll av XML-fil 7. Transformering: XML -> XHTML-filer = utgangspunkt for nedlastningsfilene og WordPress 8. Lage EPUB- og MOBI(Kindle)-filer vha ecub, Sigil og Calibre
Tekstkoding Eksempel bokselskaps xml-koding
Tekstkoding = å sette merkelapper på tekstbolker og tekstbiter: store bolker: diktsamling eller roman mellomstore bolker: dikt, kapittel, brev små bolker: overskrift, avsnitt, datolinje tekstbiter: navn, dato, uthevet ord Tekstanalyse = utgangspunkt for tekstkoding
Eksempel 1 Haabet er lysegrønt «Du støver» raabte Fætter Hans. Ole hørte ikke. «Han er lige saa døv som Tante Maren,» tænkte Hans; «du støver, Ole!» raabte han høiere. «Aa om Forladelse!» sagde Fætter Ole og løftede Benene høit iveiret for hvert Skridt. Ikke for alt i Verden vilde han genere sin Broder; han havde allerede nok paa Samvittigheden.
<overskrift>haabet er lysegrønt</overskrift> <prosaavsnitt>«du støver» raabte Fætter Hans. Ole hørte ikke. «Han er lige saa døv som Tante Maren,» tænkte Hans; «du støver, Ole!» raabte han høiere.</prosaavsnitt> <prosaavsnitt>«aa om Forladelse!» sagde Fætter Ole og løftede Benene høit iveiret for hvert Skridt. Ikke for alt i Verden vilde han genere sin Broder; han havde allerede nok paa Samvittigheden.</prosaavsnitt>
Eksempel 2 Og medens han tænkte paa hende i den lysegrønne Kjole i det vaarfriske, sommerfugllette Gevandt, som han kaldte det, faldt der ham en gammel Visestump i Munden, som han sang med stort Velbehag: Haabet er lysegrønt Trommelommelom, trommelommelom, Stedse og altid skjønt Trommelommelom, trommelommelom.
<prosaavsnitt>og medens han tænkte paa hende i den lysegrønne Kjole i det vaarfriske, sommerfugllette Gevandt, som han kaldte det, faldt der ham en gammel Visestump i Munden, som han sang med stort Velbehag:</prosaavsnitt> <strofe> <verslinje>haabet er lysegrønt </verslinje> <verslinje> Trommelommelom, trommelommelom, </verslinje> <verslinje> Stedse og altid skjønt </verslinje> <verslinje> Trommelommelom, trommelommelom. </verslinje> </strofe>
Kodespråk Kodespråk el. markeringsspråk ( markup language på engelsk) = sett med koder og koderegler, gjør deling og gjenfinning på tvers av systemer mulig Kjente kodespråk: Hypertext Markup Language (HTML) Extensible Markup Language (XML)
XML Spesifiseres av World Wide Web Consortium (W3C) -> et metaspråk andre språk kan defineres ut i fra Kjente språk som bygger på XML: XHTML, RSS, MathML
XML Noen fordeler: kan leses av både mennesker og maskiner hierarkisk struktur plattformuavhengig støttes av en stor mengde programvare Noen ulemper: vanskelig å kode overlappende (ikke-hierarkiske) strukturer krever vanligvis parsing for å hente ut verdier
TEI Text Encoding Initiative (http://www.teic.org/index.xml): et konsortium bestående av institusjoner (f.eks. universiteter), prosjekter og enkeltpersoner -> spesifiserer standarder for tekstkoding Standarden TEI P5 brukes av digitale tekstutgivere over hele verden -> svært omfattende, men man velger selv hvilke deler man vil bruke og hvor detaljert man vil kode TEI P5 Guidelines: http://www.tei-c.org/release/doc/tei-p5- doc/en/html/index.html bokselskaps kodebok: http://www.bokselskap.no/tekstkoding/kodebok_bokselskap.html
Mest brukte koder i bokselskapfiler <div>: kapittel el. <head>: overskrift <p>: avsnitt <lg> + <l>: strofe med verslinjer <hi rend="italics">: uthevet tekst <list> + <item>: lister <table> + <row> + <cell>: tabeller
Grunnlagsfil
XML-fil
HTML-visning
Visning i Wordpress
www.bokselskap.no kontakt@bokselskap.no Ellen.Wiger@nb.no (Følg oss gjerne på Facebook og Twitter!)