og oss på p godt og vondt Foredrag BIBSYS brukermøte Rica Nidelven Hotell, Trondheim 22. 23. mars 2011 Roar Storleer NTNU UB 1
NTNU UB - INFOSØK Roar Storleer roar.storleer@ub.ntnu.no tel.: 73 59 51 23 adr.: NTNU - UB Høgskoleringen 1 7491 Trondheim 2
Verdens største høystakk? 3
Hvorfor starte i en høystakk? 4
Hvor viktige er de tradisjonelle krav for god søketeknikk? Internett, Web, Mail, SM, Sosiale media Databasekunnskap Referanse databaser Bibliografiske databaser Fulltekst databaser Internett databaser Informasjonsarkitektur Dublin Core metadata MARC format Feltkoder Trunkering, maskering, stemming Boolske operatorer Proximity Frasesøk Naturlig språk 5
Fakta Google er her og hvordan forholder vi oss til det? Nei dette toget vil vi ikke ha noen billett på og kjemper i mot? Eller bare springer vi om bord på dette toget for her vil vi være med og utnytter de gode mulighetene? 6
Hvem er størst? (16.03.2011) Søk på the gir i: Google ca. 25,270,000,000 treff Yahoo! 7,470,000,000 treff Bing 1,490,000,000 treff 7
8
GOOGLE (Gogool = 10 100 ) HISTORIE Antall atomer i universet er estimert til ca 10 80 Utviklet av Larry Page og Sergey Brin ved Stanford University Basis-ide: Webs lenkestruktur som en stor graf Startet som et prosjekt i mars 1996 Mål: To develop the enabling technologies for a single, integrated and universal digital library." Hoved-ide for kvalitet: lenkesiteringer (PageRanking) Å google ble lagt til Merriam Webster Collegiate Dictionary and the Oxford English Dictionary in 2006 kilde: Wikipedia: http://en.wikipedia.org/wiki/history_of_google 9
- tjenester igoogle (tilpasset oppstartside) gmail GoogleDocs Kan tilpasse eget søkeoppsett som lagres i nettleser (preferences) Google Translate (også norsk) Egen firma/produktdatabase (produktsøk) Google Books (BIBSYS Ask er der) Google Scholar (DIVA er der + NTNU UBs beholdning av e- tidsskrifter) Google News Google Talk (chatting) Google Custom Search (lag din egen søkemotor) 10
-tjenester Google Toolbar/Deskbar Google Chrome (nettleser) Egen Spider kalt GoogleBot GoogleSquared eks: Norway Google Analytics GoogleStats (snusk?) Google Blogs Blogspot (e-blogger) Google Calender YouTube (Google kjøpte den for 1,65 milliarder USD i 2006) Google sites Google Voice (foreløpig bare i USA) Google Sets 11
Google - tjenester Alfabetisk liste over ALLE tjenester http://www.usabilityviews.com/simply_google.htm 12
GOOGLE søkemuligheter (Help Center) Oversikt over søkemuligheter: http://websearch.about.com/library/cheatsheet/blgooglecheatsheet.htm Mangler delvis Boolske op., trunkering og nærhetsoperatorer, men har frasesøk, + og og OR Automatisk AND søk ved flerordssøk Kan ikke bruke () og AND/NOT derfor uvanlig søkesyntaks (virker i Scholar, men må bruke «-» i stedet for NOT) Ikke følsom på små/store bokstaver Ingen datosortering sorterer etter relevans Kan maskere ord i flerordssøk med (*) Stoppord og logiske operatorer søkes ut med + foran Synonymsøk: med ~ foran ord eg.: ~food (Default) Tallintervall: med.. mellom intervall eg: 1958..1972 Takler $, men ikke og 13
Hvem gir best relevansrangering? Google eller Yahoo! Thumbshots Ranking (AV,Google,Yahoo!,alltheweb,bing) http://ranking.thumbshots.com 14
Google ordmaskering OIL * POLLUTION fanger opp: oil (flere ord imellom) pollution Bruk Staggernation (http://www.staggernation.com/cgi-bin/gaps.cgi) Live/bing har near:x operator Exalead.com NEXT (ved siden av hverandre) og NEAR (kort avstand) har *trunkering 15
Google - feltkoder Link:www.ub.ntnu.no Related:www.vg.no Info:www.google.com Define:hoemopathy Daterange:200801-201101 Site:www.google.com help / site:edu, site:org Allintitle:solar power Intitle:solar power Allinurl:google search Inurl:google search Intext: søker i body felt Allintext: søker i body felt Safesearch:breast cancer Filetype: zoology filtype:ppt Author: ugelstad (i Scholar) ++ noen feltkoder kun for USA (movie, phonebook, weather) 16
SØKING Google 17 Kilde: Greg Notess: Search Engines Showdown http://www.searchengineshowdown.com/features/google/googleboolean.html
Søketeknikk - Google dog OR pet cat food sukkerveien Norge OR Sverige hoteller oslo OR camping stockholm (virker ikke) sykkeltur OR båttur norge OR sverige -danmark museer trondheim OR ålesund OR kristiansund - oslo 18
Men: (wave OR wind) AND (power OR energy) AND norway NOT denmark Går fint i fagdatabasene og BIBSYS, men hva med Google: wave OR wind power OR energy norway - denmark 19
Google søketips Har google autostemming og fletalls s? Søking på : child helmet bycycle fanger ikke opp: child s, children, or children s bicycles, bicycle s, bicycling, or bicyclists helmets Ønsker du å søke på stoppord: sett + foran søkeord? +and 20
Child child s children children s Autostemming virker ikke 21
Flertalls s - fanges ikke opp! 22
23
Hva med bindestrek (-) Ett ord, to ord eller bindestrek (-) Søker du på e mail vil Google automatisk søke på: Ordet med bindesterk: e-mail Ordet hvor bindestrek er erstattet med mellomrom: e mail - foran ordkombinasjoner med går ikke 24
Hva skjer her? 25
OBS! OBS! Bruk feltkoden rett Søker bare på første del ved flere allintitle 26
Nyttig men hvor lenge? Er en av sidene fra nettsidene våre blitt borte? Google har et enormt cachet arkiv prøv der Eks. En side om RSS overvåkning av e-tidsskrifter ble borte da vi la ned vår gamle webserver Et søk i Google på URL ga: http://tinyurl.com/28mggl7 Velg bufret Men hvor lenge blir sidene i bufferet? Søket ble foretatt høsten 2010, men er nå (mars 2011) borte 27
Mars 2011 28
Snertne søketriks Snertne søketriks (Shortcuts) : Time in Jerusalem Weather in Trondheim Population in Norway Map Telaviv 1200 EUR to USD 43 C to F 150 pounds to kg Define: ASCII ~pretty 5.77 * (258+477) patent 6588078 29
30
Google og oss på godt og vondt Jan Erik Kofoed, BIBSYS
På godt og vondt Google s slagord: Don t be evil BIBSYS brukermøte 2011 2011-03-23 / 2
Google og norske institusjoner BIBSYS har tilrettelagt høsting av Bibliotekbasen Alle Brage-arkiv Ønsker synlighet i Google Scholar De fleste norske publiseringsarkivene er allerede høstet av Google Lenker til publiseringsarkivet, Eller fulltekst BIBSYS brukermøte 2011 2011-03-23 / 3
Google og OCLC Mai 2008, avtale om utveksling av data fra WorldCat til Google Books. Metadata fra WorldCat gjort tilgjengelig for Google Lenke fra Google Books til WorldCat.org Google deler data og lenker til digitaliserte bøker med OCLC. Data til Google sendes direkte fra OCLC for medlemsbibliotekene. Kopling mellom WorldCat og Google er basert på OCLC-number, ISBN og LCCN (Library of Congress Control Number) Kopling er toveis mellom Google og WorldCat. 1 mill fulltekst-utgaver fra deltakende institusjoner tilgjengelig. BIBSYS brukermøte 2011 2011-03-23 / 4
Blir neste skritt Google Buys OCLC, Announces New Products we want to alert librarians to the changes they'll be seeing when they arrive at work Monday morning. The rumors you've been hearing are true. At the ACRL Conference in Baltimore this morning, Google announced it has purchased OCLC and all of its holdings Submitted by Jenny Levine on April 1, 2007-6:24am BIBSYS brukermøte 2011 2011-03-23 / 5
Google og lisensiert materiale Google's mission is to organize the world's information and make it universally accessible and useful Library Links Program Biblioteket eksporterer beholdningen til Google Fra Google Scholar går det lenke til bibliotekets lenketjener Aksess via bibliotekets lenketjener Support for Library Search Aktuell for Open WorldCat bibliotek Lenke fra Google Scholar til WorldCat WorldCat ruter til nærmeste bibliotek Gjenkjenning IP-adresse Innstillinger i Google Scholar BIBSYS brukermøte 2011 2011-03-23 / 6
Forlik for Google-bøker Gjelder for bøker utgitt i USA, England, Canada og Australia Berører norske forfattere av oversatte verker Forfattere kan reservere seg 34,5 mill USD til opprettelse av register over rettighetshavere Vederlag for hele og deler av verk, minst 60 USD pr verk 63 % av Googles inntekter fra Google boksøk skal gå til rettighetshaverne Åpner for at Google kan selge hele, digitaliserte verker Vil en slik avtale være aktuell for norske utgivelser? SISTE: Forliket avvist av føderal dommer i new York BIBSYS brukermøte 2011 2011-03-23 / 7
Fra søking til sosiale media Anonym bruk Søk Kart Etc Autentisert Epost Grupper Kalender Dokumenter Etc BIBSYS brukermøte 2011 2011-03-23 / 8
Google og personvern Prinsipper: Vi bruker opplysningene til å gi våre brukere verdifulle produkter og tjenester. Vi utvikler produkter som er basert på omfattende personvernstandarder og -praksis. Vi gir brukerne innsyn i hvilke personlige opplysninger vi samler inn. Vi gir brukerne en rimelig mulighet til å beskytte sitt personvern. Vi håndterer opplysningene vi får tilgang på med største forsiktighet, slik at du kan føle deg trygg. BIBSYS brukermøte 2011 2011-03-23 / 9
Personvernmyndigheten i Canada, Frankrike, Irland, Israel, Italia, Nederland, New Zealand, Spania, Storbritannia og Tyskland har sammen sendt et brev til Google-sjef Erics Schmidt. I brevet heter det at man er bekymret over at Google for ofte ser ut til å glemme personvernrettighetene til verdens innbyggere. BIBSYS brukermøte 2011 2011-03-23 / 10
BIBSYS brukermøte 2011 2011-03-23 / 11
Sporene etter alle Google-søk blir lagret. Dette bekymrer Datatilsynet, som i dag vil gjennomføre kontroll hos søkemotorgiganten i Norge. BIBSYS brukermøte 2011 16-12-08 / 12
Et scenario: Google som biblioteksystem Google lagrer referanser til alle trykte og digitale utgivelser Direkte tilgang til alt som er fritt Google gis tilgang til beholdningsinfo fra institusjonene Tilgang til lisensiert materiale basert på: IP-gjenkjenning, Google vet hvilke campus som har tilgang til hva. Gjenkjenning via din Google-konto: Du har gitt Google lov til å kople din institusjonstilhørighet med lisensinfo. Automatisk bestilling av bøker og kopier fra ditt bibliotek Du har lagt til info om ditt bibliotek og låntaker-id i din Googlekonto WorldCat ruter Google til riktig bibliotek BIBSYS brukermøte 2011 16-12-08 / 13
Mye støy Upresise søk Det du ikke finner i Google, - fins ikke Monopoliserende Enveis-kommunikasjon Tvilsomt personvern Data kan bli misbrukt Kommersielt styrt Hemmeligholdelse av hvordan den arbeider Komplisert søkesyntaks Vanskelig å forstå resultat Lang «hale» Hvordan arbeider relevansalgoritmen? Mangler thesaurus-ord (Scholar) Er de første 10 de beste Sensurering? Mangler forfattersøk Mgl delvis feilmeldinger BIBSYS brukermøte 2011 2011-03-23 / 14
Mange tjenester Gratis Enorm tilgang på info Kort vei fra søk til aksess Enkel og intuitiv Stort utvalg av tjenester Demokratisk Sosialt perspektiv Gjør venner synlige (f.eks. WorldCat) Store cachede arkiv Enkel søkesyntaks Mange søkemuligheter Har feilskrivingskontroll Google Instant Preferences Har referanseliste (Scholar) Har forfattersøk (Scholar) Full SFX kompatibilitet (GS) BIBSYS brukermøte 2011 16-12-08 / 15
BIBSYS brukermøte 2011 16-12-08 / 16
Oppsummering Nytter ikke å kjempe i mot Google La Google få mest mulig info Utnytt tjenestene til Google Utnytt samarbeidet med OCLC og WorldCat Vær varsom med personopplysninger Takk for oppmerksomheten! BIBSYS brukermøte 2011 16-12-08 / 17