HUIN100 Essay nr. 3 Antall ord: 991 Søking på internett kan være en utfordring, og kan lett avstedkomme en større mengde resultater enn man ønsker. For å avhjelpe denne situasjonen har de fleste søkemotorer implementert hjelpemidler som brukerne kan benytte for å gjøre søkene mer finmasket. Jeg har definert et søk som jeg skal teste på tre forskjellige søkemotorer og deretter se nærmere på resultatene av søket. Søkemotor Hva er så en søkemotor? En rask sjekk på Wikipedia gir følgende forklaring (noe forkortet): Søkemotor er en betegnelse for en type programvare som leter frem nettsider på internett som samsvarer med et gitt søk, og rangerer disse etter hva den oppfatter som mest relevant. Typisk ligger søkemotoren tilgjengelig som et nettsted, der brukeren legger inn søkeord, og treffet vises som klikkbare lenker. Søket Jeg ønsker å finne forekomster på nettet som omtaler skuespilleren Sverre Anker Ousdal og hans aktivitet som teaterskuespiller. Jeg er ikke interessert i hans filmaktiviteter eller eventuelle dvdutgivelser. Jeg ønsker heller ikke å lese om Ridder Sverre 1, og resultatet skal inneholde både norske og engelskspråklige artikler som dekkes av søket. Søkemotorene jeg har valgt til testen er: AltaVista Google Snap 1 Sverre Anker Ousdal ble i 1997 slått til Ridder av 1. klasse av St. Olavs Orden for sin innsats for norsk scenekunst (www.kulturnett.no) Side 1 av 5
For å grovsjekke litt vil jeg først se hvor mange treff jeg får på navnet Sverre Anker Ousdal på de tre forskjellige motorene: AltaVista: Google: Snap: ukjent antall treff (mange) 64100 treff 2626 treff AltaVista opplyste ikke om antall treff, det gjør for så vidt ingen ting, det var uansett mange flere enn jeg orker å lese. Så la oss se på de tre søkemotorene og hvilke hjelpemidler de har til rådighet: AltaVista En av de første, eller kanskje den første, fulltekst søkemotoren for web. Den så dagens lys i regi av DEC (Digital Equipment Corp) og har hatt en omflakkende tilværelse under forskjellige forretningsregimer før den i 2004 kom i Yahoos eie, noe som selvsagt påvirket hvilken søketeknologi som ligger i bunn. AltaVista tilbyr mulighet for å bygge logiske uttrykk med boolske operatorer og gir dermed brukerne et godt verktøy for finmaskede søk. Google Et prosjekt som ble startet av to Ph.D studenter ved Stanford University i 1996. Google er den udiskutabelt største og mest brukte søkemotoren på web i dag. Som en kuriositet kan det nevnes at verbet to google i 2006 fant veien inn i Oxford English Dictionary I likhet med AltaVista, tilbyr også google mulighet for bygging av logiske uttrykk ved hjelp av boolske operatorer. Snap Er den yngste av kandidatene her. Den så dagens lys i mai 2006, og er altså under ett år gammel. Snap gir ikke mulighet for å søke med logiske uttrykk, hverken direkte med boolske operatorer eller med predefinerte tekstbokser/ nedtrekksmenyer. De skriver imidlertid i sin FAQ at det kommer snart den som lever får se. Søkeresultatene Søkestrengene som ble benyttet måtte tilpasses den enkelte søkemotoren, og selv om AltaVista og Google er temmelig lik i sin bruk av boolske operatorer, så er det likevel mindre forskjeller man må ta hensyn til. Side 2 av 5
AltaVista: "sverre anker ousdal" AND (theatre OR theater OR teater) AND (norsk OR norwegian) AND (skuespiller OR actor) AND NOT (ridder OR knight OR film OR DVD) Resultatet her er litt forvirrende AltaVista påstår at søket ga 17 treff, den første siden med 1-10 viser reelle treff, men når man ber om neste side så skjer det merkelige ting. Det virker som om søkemotoren ikke lenger forholder seg til det opprinnelige uttrykket, og henter dermed fram en rekke sider med angivelige treff som dessverre ikke lenger er i nærheten av hva man søkte etter. En slik håndtering av søket er ikke veldig tillitvekkende og resulterer fort i at jeg dropper denne søkemotoren til fordel for motorer med mer konsistente resultater. Dersom man fjerner operatoren AND mellom parentesene, får man et annet resultat enn om de er med. Jeg har ikke greid å finne hva som er standardhåndtering hos AltaVista (Yahoo), en mulighet er at den betrakter søket med forskjellig avstand mellom søkeordene. Google sverre anker ousdal (theatre OR theater OR teater) (norsk OR norwegian) (skuespiller OR actor) (-ridder -knight -dvd -film) Google ga litt varierende tilbakemelding om antall treff. Først fikk jeg opplyst at det var ca. 29 treff, når jeg så skulle se de neste ti treffene kom følgende melding opp: Resultater 11-11 av ca. 23 for sverre anker ousdal (theatre OR theater OR teater) (norsk OR norwegian) (skuespiller OR actor) (-ridder -knight -dvd -film). (0,06 sekunder) Jeg kjenner ikke til hvilke data eller hvilken algoritme som brukes for å beregne antall treff og har dermed vanskelig for å si noe fornuftig om årsaken til dette misforholdet. Å bruke AND operatoren mellom parentesene eller ikke har ingen effekt på resultatet. Den eneste forskjellen er en melding som forteller at man ikke trenger å skrive AND mellom ord/parenteser. Resultatet er, i motsetning til AltaVista, likt. Snap sverre anker ousdal theatre theater teater norsk norwegian skuespiller actor Side 3 av 5
Snap har åpenbart ikke samme størrelse på sin søkedatabase som de to andre, noe som gjør at man, enn så lenge, kan leve med manglende støtte for boolske operatorer. Snap returnerte en melding som opplyste at det forelå 20 treff på dette søket, noe som forøvrig stemte bra. Søket inneholdt selvsagt ikke ordene fra de to foregående søkenes NOT-lister, siden denne funksjonaliteten ikke er tilstede i Snap. Avslutning Dette var på ingen måte noen dyptpløyende undersøkelse av søkemotorers egenskaper eller pålitelighet, men jeg er likevel litt overrasket over AltaVistas lite konsistente resultater og rene applikasjonsfeil. Google viste bra styrke både når det gjaldt responstid og konsistens, mens Snap brukte temmelig lang tid på å produsere resultater på relativt enkle søk. Konklusjonen for meg er enkel, det er en grunn til at Google har en markedsandel på mellom 50-70% (størrelsen diskuteres flere steder), både hastighet, enkelhet i bruk og konsistente resultater gir en vesentlig bedre søkehverdag enn hva konkurrentene oppviser, og det er litt nedslående. Jeg skulle gjerne sett at Google fikk reell konkurranse. Side 4 av 5
Litteraturliste Wikipedia (jan. 2007) AltaVista http://en.wikipedia.org/wiki/altavista Wikipedia (jan. 2007) Google http://en.wikipedia.org/wiki/google Wikipedia (jan. 2007) Snap (search engine) http://en.wikipedia.org/wiki/snap_%28search_engine%29 Kulturnett.no (des. 2006) Sverre Anker Ousdal http://www.kulturnett.no/personer/person.jsp?id=t7906370 AltaVista.com (2007) Syntax http://www.altavista.com/help/search/syntax Google.com (2007) basics http://www.google.no/intl/no/help/basics.html www.snap.com (2007) tips & tricks http://www.snap.com/about/tips.php Side 5 av 5