DRI1002 - IKT og informasjonssøking Uke 9: Kan vi stole på Internett? Hovedpunkter for forelesningen Informasjonssøking og kildekritikk Hva er kildekritikk og hvorfor Evaluering av informasjon på Internett Litt mer om Internett Om tekniske egenskaper, Litt om organisering og styring Diskusjon Pensum Hannemyr, kap. 2-4, Bertnes, kap. 4-5 (se også forelesningene til Bråthen og Hannemyr) Ulike typer søketjenester Katalog menneskeskapt hierarkisk database over nettressurser (Yahoo, Open Directory, LookSmart, Kvasir) Portal En samling av informasjonstjenester på nettet, som oftest knyttet til et bruksområde eller lignede Søketjenester/søkemotor Robot + database + brukargrensesnitt mot database (Google, AltaVista, Teoma, Kvasir...) samme søkemotor kan være motor i ulike tjenester (Google blir brukt i Yahoo, AOL, Kvasir...) outsourcing av søk! Metasøkemotor søkemotor som bruker andre søkemotorer som kilde, parallellsøk i mange underliggende baser eks. HotBot, Queryster, DogPile, Excite, MetaCrawler, mamma I praksis er i dag de fleste søketjenester en kombinasjon av kataloger og søkemotorer Hva er en søketjeneste (søkemotor)? Hovedkomponentene: Søkerobot ( speider ) (eng: crawler, bot, spider, vevkjerring) program (mer) som følger lenker på veven og kopierer informasjon (tekst) inn i den sentrale databasen en tjeneste som Google vil gjennomsnittlig indeksere en vevtjeneste en gang i måneden (men søkeroboten leser vevsider som en primitiv tekstbasert nettleser Database informasjonen som er samla av roboten blir lagra i en (strukturert) database med mye tilleggsinformasjon (metainformasjon) indekseringa i etterkant av informasjonsinnhenting innebærer m.a. statistikk over ord, plassering av ord i teksten, analyse av lenker m.m. Søkegrensesnitt brukeren sin interaksjon med søkemotoren enkelt søkefelt eller grensesnitt for avansert søk For sluttbruker er søkegrensesnittet den synlige delen av søkemotoren For tjenestetilbyderen er søkeroboten den viktigste delen Faktorer som hindrer synbarhet for søketjenstene Informasjon som er skjult for søkemotorene Frames (rammer) Multimedia (flash, shockwave, streaming,..) Image maps Java aplets Lukkete områder, f eks sider som krever passord, cookies eller registrering Den skulte veven (sider som ikke er synlige) : Databaser Dypere lag i en nettside Ikke alle områder blir indeksert, f eks. lukkede områder 1
Trenger vi bibliotekene når vi har Internett? Bibliotekene har lang tradisjon i søking, systematisering og vurdering av informasjon Hvordan finne fram viktige faglige kilder? BIBSYS Katalog og administrasjonssystem for bibliotekene i Norge (bøker og tidsskrifter ) Startet på midten av 70-tallet ved NTH, etter hvert kom UB Tromsø og UB Bergen med i 1986 kom UB Oslo med seinere bibliotekene ved de fleste videregående utdanninger (høgskolene) Hvordan vurdere informasjon Hva er kvalitetskrav Biblioteksportaler UB- fellessiden: http://www.ub.uio.no/ Jus: http://www.ub.uio.no/ujur/ IRI: http://www.ub.uio.no/ujur/instbibl/iri/ Juridisk veiviser: http://juridisk.net/ Lovdata: http://www.lovdata.no/ Informatikk-biblioteket : http://www.ub.uio.no/umn/inf/ ISI Web of science (Science citation index) Siteringsdatabase, Dekker sentrale tidsskrifter innen matematikk, informatikk og naturvitenskapene http://portal.isiknowledge.com/portal.cgi? Juridiske kilder Juridisk metode - Juridiske kilder : kvalitetssikring Relevante kilder- Mye finnes elektronisk tilgjengelig Lover/forskrifter Lovdata Forarbeider Odin, Lovdata Avgjørelser Lovdata Andre myndigheter praksis Artikler noe her og der elektronisk tilgjengelig, eks. Lovdata Bøker lite elektronisk tilgjengelig, se Lovdata Kvalitetssikrede lenker til gratis juridiske kilder på Internett http://juridisk.net/ Wikipedia.org Dugnadsleksikon på Internett flerspråklig startet i januar 2001 Åpen /gratis for alle både som leverandør og brukere Utstrakt bruk av hypertekst Oppslag etter ulike kategorisystemer 171 000 artikler Søketeknikk (Google-søk i øyeblikket) Mange lenker mellom artiklene http://en.wikipedia.org/ 2
Tradisjonell kildekritikk Primærkilder: Der vi finner det vi søker etter : bøker, tidskrifter, Sekundærkilder Der vi finner informasjon om det vi søker etter: biblioteker, databaser, søkemotorer, portaler, Viktige kriterier Ekthet Uavhengig og upåvirket Tidssammenheng ajourført og fortsatt relevant Tendensfri Vær alltid omhyggelig med å oppgi kildene du bruker, slik at andre kan vurdere det du skriver Kildekritikk på Internett: Hvorfor og hvordan? Kan ikke stole på alt som utgis Svært mye av det som utgis har ikke god nok kvalitet Utgiverne har forskjellige motiv Internettøkonomi hvordan tjene penger på nett Vurderinger Er kildematerialet relevant? Er alle relevante kilder funnet? Skjult/åpen web Kan kildematerialet brukes? Viktig å finne ut i hvilken sammenheng sidene er publisert og hvem som står bak Vurderingspunkter Er informasjonen troverdig og uten feil? Kvalitetskriterier : Riktig, nøyaktig, relevant, fullstendig, oppdatert Motiv- hvorfor presenteres informasjon Objektivitet uavhengighet Autoritet : faglig, myndighet, Fagområde Hvordan innholdet er presentert: oversikt Oppdatert ajourhold Utseende Brukervennlighet.. Hvem står bak Kommersielt foretak Enkeltperson Privat organisasjon Offentlig myndighet Universitet/høgskole/annen utdanningsinstitusjon Bibliotek Nyhetsmedium 3
Internettadressen Se på URL-en:.com/.co.uk - kommersielle foretak.org -organisasjoner.gov - amerikanske myndigheter.edu/.ac.uk - utdanningsinstitusjoner.dep.no norske departementer Skrelle adressen Evaluering av informasjon på Internett Kildebruk og kritikk http://www.gatt.org/ http://www.wto.org Kan vi stole på disse Aleneforeldreforeningen Foreningen 2 foreldre Dadwatch Er denne troverdige? http://jusstorget.no/ Eksempler Norske juridiske nettsteder http://www.jusstorget.no/ http://www.jussnettavis.no Store rettskildedatabaser i utlandet Westlaw Oversatte lover http://www.ub.uio.no/ujur/ulov/ Convention on the Rights of the Child http://www1.umn.edu/humanrts/instree/k2crc.htm http://www.unhchr.ch/html/menu3/b/k2crc.htm Informasjonssøking og kildekritikk et enkelt bilde? Informasjonssøkere Privatperson Organisasjoner Bedrifter Andre søkestrategi Søkeresultat Kriterier for kildekritikk: Informasjonstjenester Informasjonsmegling Bibliotekene Offentlige inf. tjenester Kommersielle informasjonstjenester. tjenester Andre aktører;.. Informasjonsprodusenter (primærkilder) Offentlig informasjon Akademia Næringslivet kommersielt Interesseorg. Org-, private etc.. Henter data og metadata Strategi for synlighet gjennom søkemotoroptimalisering Interessefelleskap eller interessekonflikter? 4
Informasjonssøker (e) Et spesifikt formål -bruksområde En gitt kontekst (sammenheng) Egne kunnskaper og kompetanse Økonomiske og andre ressurser (f eks. tid) Krav til Kvalitet (korrekt, presist, relevant, oppdatert, ) Tilgjengelighet Lesbarhet, Vurderingskriterier Ekthet Objektivitet uavhengighet,. Informasjonsprodusenter Primærkilder Hovedgrupper Offentlig informasjon Statlige etater, kommuner og fylkeskommuner Akademia U&H-sektoren, tidsskrifter, fagdatabaser, fagbokforlag,,.. Næringslivet kommersielle virksomheter Både reklame og faktainformasjon Ikke-kommersielle organisasjoner, privatpersoner etc. Ulike typer målgrupper Generelt ønske om synlighet Men ulike strategier for å publisere informasjon Informasjonsformidlere (meglere) 1 Generelle kataloger og portaler Bibliotekskataloger og portaler (http://www.ub.uio.no/, BIBSYS,.. Offentlige portaler (Odin, Norge.no, Fag-kataloger og portaler F eks. innen jus (Juridisk veiveiser, Lovdata), realfag, humanoria, Omfatter også generelle søketjenester Karakteristiske trekk: Primære formål å formidle kvalitet Høy faglig integritet bases på egen kompetanse Generelle innenfor sitt fag/emneområde Ikke knyttet til en bestemt kontekst Ikke-diskriminerende (et ideal, men ikke alltid i praksis) Høy tilgjengelighet Men uavhengige av kontekst eller formål Informasjonsformidlere (meglere) 2 Kommersielle kataloger og portaler F eks. Startsiden, gule side http://www.startsiden.no/, http://www.gulesider.no/gsi/index.jsp, Kommersielle søkemotorer /søketjenester Google, AllTheweb, AltaVista, Yahoo! Styrke Generelle, meget stort informasjonstilfang, effektive, lett tilgjengelige,.. Ulemper (fra et forbrukerperspektiv) Nødvendigvis ingen faglig kompetanse Kommersielle interesser Skulte kriterier for utvelgelse og rangering 5
PAUSE En kort video om IP/TCP mm Nytt Tema : Mer om Internett Ende-til - ende prinsippet Bruker-orienterte anvendelser (applikasjoner) Nett-tjenester som navnetjenester, URL, epost, WWW, Sikkerhet. TCP : Ende-til-ende utveksling av data, feilkontroll IP: Adressering og ruting Her foregår det meste : Pakking og utpakking av data Formatering og redigering Beregninger og Sikkerhet, Brannmurer De fysiske nettverkene: lokalnett : kabler/trådløst, telenettet, kabelnett, satellitt 6
Litt mer prinsippene for Internett-arkitekturen Utgangspunktet var en ønsket om en enkel, distribuert og robust løsning: TCP/IP-løsningen Utgangspunkt i behovet for å knytte sammen ulike nett Basert på lagdeling og horisontal integrasjon Minimumsfunksjonalitet på nett-laget og lavere lag Balansere standarder og fleksibilitet Åpenhet Dubleringer og konvertere (gateways- oversettere ) Minimale standarder Foreløpige løsninger, etter hvert gradvis forbedringer Hva innebærer ende-til-ende prinsippet Nettet har minimal funksjonalitet: + +Brukerne kan gjøre nesten hva som helst Men - -Bruk av nettet er svært usikkert (en risikosport?) - Overlater derfor nesten alt ansvar til brukerne! Internet har gradvis fått gjennomslag og vokst gjennom sjølforsterkende effekter: Viser fordelene ved nettverket som organisasjonsform Ideene bak WWW Et desentralisert og distribuert nett (vev) av informasjonsressurser, Strukturering av informasjon basert på hypertekst Felles, standardisert grensesnitt mot alle typer informasjon (tall, tekst, lyd, bilde, video..) Standardisert måte å lagre informasjon på Både enkelt å legge ut informasjon og å hente ut informasjon World Wide Web (W3C) 1994 437 medlemsorganisasjoner W3C Team 73 personer. Ledes av Tim Berners-Lee Mål og prinsipper 1. Universell tilgjengelighet 2. Semantisk vev 3. Tillit 4. Interoperabilitet: Kan operere på tvers av ulikt utstyr og programvarer 5. Hele tiden under utvikling 6. Desentralisering 7. Stadig bedre ( kulere multimedia) 7
WWW- arkitekturen (her).. (NB: Detaljer her ikke pensum). Hvordan gjøre WWW tilgjengelig for alle Universell tilgjengelighet : Web Accessibility Initiative (WAI) For alle brukere uansett funksjonshemming mm På alle typer teknisk plattform På alle typer utstyr Tilgjengelighet for alle : Funksjonshemning er ikke en sykdom, men en del av livet! Noen eksempler på Internettbrukere som har ulike funksjonshemming Fargeblind butikk-kunde Elev med dysleksi Blind arbeidstaker Pensjonist som bankkunde Døv student Bruker med gammelt utstyr og programvare Teknisk styring av Internett (Internett Governance) Internet Engineering Task Force (IETF 1986) Ser på tekniske spørsmål og problemer Portokoller for kortsiktige løsninger Åpent samfunn alle kan delta I 2205 ledet av en nordmann (Harald Tveit Alvestrand) ICANN : Internet Corporation for Assigned Names and Numbers: Fra 1988, sete i USA (I Norge Norid) Andre organisasjoner er IEST, ISOC, IAB, WWW Consortium : W3C (1995) Styring av Internett (Internet Governance) Fysisk teknisk utstrekning: En (ubegrenset) samling av datanettverk som er knyttet sammen og kan kommunisere med hverandre Logisk arkitektur Basert på et sett av felles prosedyrer og formater for kommunikasjon (protokoller), inkludert lagdeling, adressering mm. Organisatorisk : Internasjonale, nasjonale og lokale organisasjoner som har ansvar for utvikling og drift/administrasjon. Politisk [og juridisk perspektiv] Styring og regulering av Internet, hvilke internasjonale og nasjonale lover og overenskomster regulerer nettet Sosialt og kulturelt perspektiv Hvilke verdier, normer, atferdsmønstre og symboler preget utvikling og bruk av nettet http://www.abmutvikling.no/kursogkonferanser/program/2005/wsis_web.pdf 8