Et kort historisk overblikk



Like dokumenter
DRI1002 Våren 2007 Seminar 30.1 Databaser og søkeverktøy

DRI2010 Databaser, arkiver og fritekst-systemer

DRI : Kildekritikk. Mer om Internetts arkitektur

DRI : Søkestrategier og evaluering av informasjon

ÅRSRAPPORT NETTSIDENE FOR Innhald Kva har vi gjort i læringsnettverket... 2

Du kan skrive inn data på same måte som i figuren under :

HUIN100 Essay nr. 3. Søket. Antall ord: 991

Bachelor i bibliotek- og informasjonsvitenskap

Romlig datamanipulering

Datasystemer og informasjonssystemer

DRI1002 IKT og Informasjonssøking Våren forelesning 16. Januar Arild Jansen, Avd. for forvaltningsinformatikk, UiO

DRI 1002 "IKT og informasjonssøking"

Kontekst basisbok Gyldendal forlag. Læreverket har to tekstsamlinger. Tekster 2 er en av disse.

Kronikken i ComputerWorld, 19. nov. 2010:

DRI1002-V05 1. forelesning Arild Jansen, AFIN

Rapport frå Samhandlingsseminar mellom kommunane i Sunnhordaland og Stord sjukehus, Helse Fonna Dato: 04.des.2014

Steg for steg. Sånn tar du backup av Macen din

Matematisk samtale og undersøkingslandskap

INF oktober Dagens tema: Uavgjørbarhet. Neste uke: NP-kompletthet

Del 1: Overgang fra gammel hjemmeside til ny hjemmeside

Vegvisar til vilbli.no

Noe av innholdet. Bli funnet på nett uten juks! Gunnar Bråthen Søkemotorkrigen. Søkemotorkrigen

1. SQL server. Beskrivelse og forberedelse til installasjon

Avansert Søk Må Dø. Laura Arlov

OM DATABASER DATABASESYSTEMER

POLITISKE SAKSDOKUMENT:

Beslutningstøttesystem for effektiv drift av bygninger. Teknisk vinteruke Storefjell Resort Hotel, Gol

Datasystemer og informasjonssystemer

Datasystemer og informasjonssystemer

1: Kva er ein teikneserie? Teikneserie som samansett tekst. 2: Arbeid med teikneseriar i norskfaget. Døme frå praksis

Min digitale infrastruktur

Notater. Olaf Espeland Hanssen, Sigrid Holm og Øyvind Sivertstøl. FD - Trygd Dokumentasjonsrapport Avslag på uførepensjon, /17.

Los - vegvisar til offentlege tenester

DRI 1001 Forelesning tirsdag Er teknologien styrbar?

TDT4160 Datamaskiner Grunnkurs Gunnar Tufte

DRI 1001 Bruk av IKT I offentlig sektor Offentlig databehandling

Ny på nett Internett. Bruk av nettleser.

Import av referanser til EndNote

Informasjonsorganisering. Information Architecture Peter Morville & Jorge Arango Kapittel 4, 5 & 6

Metodisk arbeid. Strukturert arbeidsmåte for å nå et bestemt mål

EN INNFØRING I SØK - EN INNFØRING I SØK BRANSJENYTT FAG OG VERKTØY BRANSJEKALENDER JOBB OG KARRIERE LEVERANDØRGUIDE OM INMA

Digidel-arena Nord-Norge

Eksamen MAT1008 Matematikk 2T. Nynorsk/Bokmål

DRI 1001 Er teknologien styrbar og hvordan kan vi styre?

Vegvisar til vilbli.no for rådgivarar

Noe av innholdet. Bli funnet på nett uten juks! Gunnar Bråthen Søkemotorkrigen. Søkemotorkrigen

DRI2001 forelesning

FINF Forvaltningsinformatikk Onsdag 10. desember 2003, klokken

DRI 1001 Er teknologien styrbar og hvordan kan vi styre?

Ofte stilte spørsmål (OSS)

Søk og universell utforming. Audun Rundberg 26. februar 2013

my good friends uke

Installasjon og Oppsett av Weather Display Denne artikkelen er ment å være en hjelp til å laste ned, installere og sette opp Weather Display.

Veiledning for innlevering av Årsrapport

Intro til WWW, HTML5 og CSS

Forelesingar og oppgåveløysing

Hotellstatistikk April 2016 Norske storbyer. Oslo, 24. mai 2016

BRUKARRETTLEIING FOR ELEKTRONISK SKJEMA SØKNAD OM STATSTILSKOT TIL POLITISKE PARTI... 2 GENERELLE OPPLYSNINGAR LES DETTE FØRST...

Spørsmål frå leiar i tenesteutvalet:

Søk regionale miljøtilskudd elektronisk

Brukermanual for statistikk på Asset on web: Statistikk salg pr dag, uke eller måned fordelt på alle avdelinger:

Digital tilstand i høyere utdanning

INF130 Databehandling og analyse

2. Privat forbruk. Årleg forbruk til kultur og fritid tredje størst. 20 Statistisk sentralbyrå

Det digitale Nasjonalbiblioteket Digitalisering i NB

DRI Datasystemer og informasjonssystemer

Nissedal kommune. Formannskapet. Møteinnkalling. Utval: Møtestad: Kommunehuset Dato: Tidspunkt: 13:00

versjon 1.1 Brukermanual

Hvordan avslører vi svindel?

Beslutningstøttesystem for effektiv drift av bygninger. Teknisk vinteruke Storefjell Resort Hotel, Gol

Kom i gang med nye HRessurs Reise og Utlegg

KILDEKRITIKKURS PÅ 8. TRINN

Oversikt over besøkende

Oversikt over besøkende

Tabeller og enkle spørringer

BRUKARUNDERSØKING MOTTAK AV FLYKTNINGAR MOTTAK AV FLYKTNINGAR

Etter suksessen under vinterlekene, laget Oslonett en egen side for resultatet av EU avstemningen i november 1994.

DRI 2001 Systemutviklingsarbeidet et overblikk Forelesning

egevinst Bakgrunn: Dei har kalla tilnærminga egevinst

LEGO MINDSTORMS Education EV3

I denne oppgaven blir du introdusert for programmeringsspråket JavaScript. Du skal gjøre den klassiske oppgaven Hei verden, med en katt.

SENTRALT GITT SKRIFTLEG EKSAMEN FOR ELEVAR VÅREN 2003 OVERSIKT OVER TILLATNE HJELPEMIDDEL I VIDAREGÅANDE OPPLÆRING OG TEKNISK FAGSKOLE

vet vi hvilke fartsgrenser som gjelder der vi er???

TEOLOGI FORDYPNING BIBLIOTEKRESSURSER & LITTERATURSØKING. Svein Helge Birkeflet februar-16

Tilsynsrapport. Tilsyn etter Lov om elektronisk kommunikasjon. 2-7 b. Bruk av informasjonskapsler/cookies

Shellscripting I. Innhold

Molde Domkirke Konfirmasjonspreike

Skatteetatens bidrag til å øke bruken av digitale tjenester. Roar Lyby Seniorrådgiver Veiledning Skatt øst

Løysingsforslag til eksamen i MA1301-Talteori, 30/

Brukerveiledning for å legge inn Støtteordning, Rammer, Forenklet tilsagn, Endringer på tilsagn, Årsrapportering

Kari Saanum. Roman. Omnipax, Oslo 2015

ÅRSPLAN 2013/2014 FAG: Samfunnsfag TRINN: 10.trinn

Veiledning for bruk av Europass språkpass

INF109 - Uke 1b

Arkiv skal ikkje førast ut or landet

STRATEGI FOR BYGNINGSDELEN I MATRIKKELEN FORMÅL/HENSIKT/RAMMER

Å SØKE INFORMASJON. Kompetansemål etter 10. trinn: Læringsmål:

Informasjon og brukarrettleiing

Kort norsk manual Hvordan komme i gang:

Transkript:

DRI1002 - IKT og informasjonssøking 3. Seminar uke 6: Søkeverktøy og søkestrategier Hovedpunkter for forelesningen Databaser og fritekstsystemer et overblikk Hypertekst og WWW Søkemotorer søkestrategier Om arkiver og postjournaler som kilde og verktøy for å søke informasjon Diskusjon Øvelser i informasjonssøking Et kort historisk overblikk Datamaskinen en regnemaskin (compute (r) ) Digitaliseringen : Alt representeres ved 0 og 1 (tall, tekst, lyd, bilder, film,..) Formalisering: Handlingsregler uttrykkes på presis form (matematiske/logiske algoritmer) Strukturering : Organisering av data i bestemte, (veldefinerte) mønstre Eksempler på tidligere programmeringsspråk: Fortran : Formula translator, Algol : Algoritmic language Som begge er utformet for å kunne uttrykke og utføre matematiske og logiske operasjoner Behandling av strukturerte data databaser Det vokste raskt fram et behov for å beskrive data på en strukturert form De første eksempler på EDB-baserte databaser på 50-tallet : Folketellingsdata Skatt- og ligningsdata Bankenes og forsikringsselskapers kundekonti Medlemsarkiver Regnskaps- og lønnssystemer 1

Hva er en database? Samling med data som er organisert for å tjene et bruksområde. Organiseringen av data er gjort i henhold til en tenkt struktur som beskriver dataenes karakteristikker og sammenhengen mellom dem: Et databasehåndteringssystem (DBMS data base management system) er et programsystem som laget for opprette og vedlikeholde databaser Den mest vanlige formen for databaser er tabellformen eller relasjonsdatabaser Manuelle databaser eksempler Kirkebøker Leksikon, ordbøker Kataloger Kartoteker, Offentlige og private arkiver Medlemsregistre. Eksempel på relasjonsdatabase Arild Johan Jansen, Hofstadgate, 1384 Asker Dag Wiese Schartum, Harald Løvenskiolds v, 0760 Oslo Felter Personnr E_navn For- og m.navn Gate/veinavn Postnr Poststed 1234567 8987 Jansen Arild Johan Hofstadgate 1384 Asker Post er 9876543 2112 Schartum Dag Wiese H. Løvenskiold vei 0760 Oslo... 2

Noen sentrale begreper knyttet til databaser Poster (record) : En linje i tabellen som inneholder verdier i de enkelte feltene Primærnøkkel : et felt som gir entydig identifikasjon for alle poster (f eks. personnr.) Vanlige operasjoner Opprette en database : definere strukturen Vedlikeholde en database : legge inn/rette data Spørring og rapporter: Hente ut data fra en database, enkeltvis ellers oversikter Noen eksempler på databaser Samordna opptak : http://www.samordnaopptak.no/sokerinformasjon_20 05/laresteder_studier.html Visveg http://www.visveg.no/visveg/default.jsp Studentveb http://www.uio.no/studier/tilbud/ Statistisk sentralbyrå, f eks. http://www.ssb.no/navn/ Datamaskinen ble også en tekstbehandler Fritekstsystemer : Med fritekst mener vi en vanlig prosatekst inndelt i kapitler, avsnitt og setninger - i utgangspunktet uten spesielle skilletegn og markører. Fritekstsystemer har i Norge blitt brukt til databaser over arkeologisk gjenstandsmateriale, utdrag fra middelalderdiplomer og tingbøker innenfor historiefaget. Rettslig materiale er kanskje det felt hvor tekstsøking har blitt mest anvendt i Norge, jf de juridiske databasene hos stiftelsen Lovdata. (hentet fra Heimen 2/1996 Av: Gunnar Thorvaldsen, se http://www.rhd.uit.no/art/heim96-2.html 3

Informasjonssøking Computer-aided information search and retrieval historie om lag like gammel som datamaskinene første skikkelege gjennombrot på 50-talet i samband med søk og erstatt av uttrykk i lovtekst IR = Information Retrieval Før WWW har informasjonssøk særleg vært knyttet til databaser og slik sett databasesøk, men også enkle fritekstsøkesystemer Internett/WWW har endra dette ved søk i store, ustrukturerte datamengder Internett-søk i et historisk lynglimt I begynnelsen var... Archie utvikla i 1990 av Alan Emtage, pre-web søkemotor (ftp) The World Wide Web Wanderer (Wandex) den første søkeroboten på web en Galaxy (1994), den første internett-katalogen Excite (1993) WebCrawler (1994) første fulltekstindeksering av web Yahoo! (1994) 10 år med internett-søk har vist at det skjer raske endringer og mange søketjenester har relativt kort levetid. Yahoo! er en av få tjenester som har vært med heile tida AltaVista var ei viktig tjeneste fram til slutten av 90-talet. På berre ca. et halvt år forsvant den nesten helt då Google tok over. Ulike typer søketjenester Katalog menneskeskapt hierarkisk database over nettressursar (Yahoo, Open Directory, LookSmart, Kvasir) Søkemotor robot, database, brukargrensesnitt mot database (Google, AltaVista, Teoma, Kvasir...) samme søkemotor kan være motor i ulike tjenester (Google blir brukt i Yahoo, AOL, Kvasir...) outsourcing av søk! Metasøkemotor søkemotor som bruker andre søkemotorer som kilde, parallellsøk i mange underliggende baser HotBot, Queryster, DogPile, Excite, MetaCrawler, mamma I praksis er i dag de fleste søketjenester en kombinasjon av kataloger og søkemotorer 4

Hva er en søkemotor? I Søkerobot (crawler, bot, spider, vevkjerring) program som følger lenker på veven og kopierer informasjon (tekst) inn i den sentrale databasen II Database informasjonen samla av roboten blir lagra i en data-base med en del tilleggsinfo indekseringa i etterkant av informasjonsinnhenting inneber m.a. statistikk over ord, plassering av ord i teksten, analyse av lenker m.m. III Søkegrensesnitt brukeren sin interaksjon med søkemotoren enkelt søkefelt eller grensesnitt for avansert søk Søkemotor: Søkerobot Søkerobot ikke en, men mange roboter (program) som traverserer nettet og henter inn informasjon en tjeneste som Google vil vanligvis indeksere en vevtjeneste en gang i månaden søkeroboten leser vevsider som en primitiv tekstbasert nettleser Analyse av resultat-treff, Google 2. Tekst henta frå sida, 1. URL til treffside, nær søkeordet/-uttrykket presentert med innhaldet i HTML-elementet <title> 4. Kategoriseringa i emnekatalog, dersom det finst ei oppføring 5. URL, størrelse på side 6. Googles kopi av sida og sist indeksert sist den vart indeksert 3. Tekst henta frå HTMLelementet 'Description', dersom utfylt 7. Liknande sider (forslag frå Google) 5

Søkemotor: Søkegrensesnitt Søkegrensesnitt Søkeboks for enkle søk Avansert søk med hjelp til avgrensing Problem: Ingen standard for søk i søkemotorar korleis fungerer søket epler pærer i Google? (finsk undersøking viste at > 60% av brukerene tok feil) Variabel støtte for Boolsk logikk (AND, OR, NOT) For mer informasjon om oppbygging av en søkemotor, les The Anatomy of a Large-Scale Hypertextual Web Search Engine av Larry Page og Sergey Brink (grunnleggjarane av Google) Mest brukte søkemotorar (januar 2004) GG = Google YH = Yahoo MSN = Microsoft AOL = America Online AJ = Ask Jeeves Panel på meir enn 60 000 brukarar i USA Finst det andre søkemotorar enn Google? Fort å se seg blind på en dominerende aktør som Google bør stadig prøve ut andre søkemotorer nisjesøk dersom du søker etter offentlig informasjon i Norge, bør norge.no vera en betre søkemotor enn Google (men ikke heilt sikker på at den er det...) Kvasir er avgrensa til.no-domenet og bør slik sett kunna gi betre resultat enn ei meir omfattande tjeneste (i realiteten er det Google som leverer søkeresultat til Kvasir; skilnaden blir emnekatalogen Kvasir har bygd opp) Startsiden.no tilbyr søk i Google, Kvasir, AltaVista, Yahoo! og Alltheweb (som nå er en del av Yahoo!) Google har i dag en for dominerande rolle siden den også blir brukt som motor for mange andre konkurrenter Meir informasjon: Search Engines and controversy: http://www.firstmonday.dk/issues/issue9_1/gerhart/ 6

Hvilken søkemotor skal jeg bruke Same søkemotoren kan være brukt på mange søketjenester: Google er også søkemotor for tjenester som Yahoo! (heilt fram til årsskiftet) AOL (America Online) Kvasir (Scandinavia Online SOL) Yahoo! har gjennom oppkjøp følgjande søkemotorar: Inktomi AltaVista AlltheWeb (FAST) gjennom Inktomi gir dei søkeresultat for MSN (Microsoft) Synlege vevtenester For sluttbruker er søkegrensesnittet den synlige delen av søkemotoren For tjenestetilbydar er søkeroboten den viktigste delen søkerobotar les vevsider som primitive nettlesarar http://www.delorie.com/web/lynxview.html for å sjå korleis søkemotoren les sidene Den usynlige (skjulte) vev http://www.hib.no/biblioteket/kildekritikk.asp#aapen eksempel på usynleg side: www.kjornes.no/start.htm Øvelser i søking 7.2 1. Går inn i Lovdata. Søk etter lover mm som omtaler hvilke rettigheter og plikter dere har som studenter Hva fant dere? Hva slag type søking tror dere ble utført (databasesøk, fritekst, )? 2. Bruk minst to åpne søkemotorer og gjør tilsvarende søk, både enkle og mer avanserte Hva fant dere? Sammenlign ulike resultater fra ulike søkemotorene Forklar hvorfor ble dette forskjellig for ulike søkemotorene. Drøft resultatet. 7