|
Søkemotor er en betegnelse for en type
programvare som leter frem nettsider på internett som samsvarer med et gitt
søk, og rangerer disse etter hva den oppfatter som mest relevant. Typisk
ligger søkemotoren tilgjengelig som et nettsted, der brukeren legger inn
søkeord, og treffet vises som klikkbare lenker.
Søkemotoren kan enten gjøre søk på hele Internett (for eksempel Google og
Yahoo!), innenfor et bestemt nettsted (for eksempel søk innenfor VGs
nettavis), eller innenfor et bestemt tema (f.eks. Kelkoo som søker i priser
på produkter, Picsearch som søker bilder). En bedrift kan også sette opp en
intern bedrifts-søkemotor for å få enklere tilgang til alle dokumenter og
databaseri bedriften.
Hvordan fungerer søkemotorer
Søkemotorer er stadig i utvikling, og de fleste har forbedret grunnteknikken
som er beskrevet her. Dette betyr stort sett at de bruker andre teknikker i
tillegg til de som er beskrevet her.
De forskjellige søkemotorene er laget forskjellig, men det er to ting de
ikke klarer seg uten: En søkerobot og en indeks. Søkeroboten leser en
nettside, identifiserer eventuelle linker, og følger en av de mulige linkene
videre. «Kommersielle» søkemotorer har gjerne også en database med nettsider
den tidligere har besøkt, som den besøker igjen etter en viss tid. Indeksen
er som en indeks bak i en bok, bare mye større. Den består av alle ordene
som den har komme over på alle nettsider den har besøkt. Hvert av ordene i
indeksen har en liste over alle nettsider der ordene forekommer.
Når søkeroboten leser en ny nettside legges den til i søkemotoren:
Søkemotoren registrerer alle ordene som forekommer i dokumentet. For hvert
av ordene, legges nettsiden til i listen over steder dette ordet forekommer.
Det vil for eksempel si at hvis søkeroboten leser en side med 50 ord som
forekommer en eller flere ganger, så legges nettsiden til i forekomstlisten
til alle disse 50 ordene.
Søkeroboten må ha minst en side å starte fra, deretter foregår
traverseringen langs lenker den finner på sidene den leser. Dette betyr at
en søkerobot bare registrerer de sidene som det finnes lenker til.
|