Digitalarkivet har skiftet søkemotor

Gjennom våren og forsommeren har Digitalarkivet skiftet søkemotor for søkene på digitalarkivet.no. Søkemotoren Elasticsearch erstatter den tidligere søkemotoren Sphinx, som Digitalarkivet har benyttet siden 2010. Bakgrunnen for skiftet er at Sphinx som produkt ikke lenger blir vedlikeholdt på en for Arkivverket tilfredsstillende måte.

Publisert: 2021-06-15

Digitalarkivets søkefunksjoner er i hovedsak videreført, men det er noen endringer som følge av at Elasticsearch og Sphinx fungerer litt forskjellig. Av hensyn til å gjøre søkene i Digitalarkivet mer like hverandre, er det også gjort noen endringer uavhengig av søkemotorskiftet.

Oppdaterte veiledninger foreligger ennå ikke. Oppdaterte veiledninger vil være en prioritert oppgave for Digitalarkivets redaksjon før sommerferien. Så langt kan vi gi en kort oppsummering av de viktigste endringene som har skjedd:

  • Variantsøk er innført i alle søk. Tidligere har variantsøk bare vært tilgjengelig i enkelt og avansert personsøk. Du kan skru av variantsøk ved å hake av i boksen «Skru av variantsøk», som finnes i øverst i søkeskjemaene.

  • I avansert personsøk er det nå mulig å benytte trunkeringstegn og andre spesialtegn ved søk på relatert person. Med Sphinx var det bare mulig med eksakte søk på relatert person.

  • Elasticsearch tillater såkalt «Fuzzy search». Søk på «Marte~2» gir treff på «Marte» og alle staveformer med inntil to tegns avvik. Et avvik kan være at ett tegn er byttet med et annet, eller at ett tegn er fjernet eller lagt til. Således gir «Marte~2» treff på f.eks. «Marthe», «Martha», «Marta», «Maritte» og «Marit».

  • Ved trunkerte søk er det nå tilstrekkelig med ett tegn, mot tidligere to. Det er dermed mulig å søke med f.eks. «P*» og få treff på alt som begynner på P. Ved trunkerte søk med få tegn vil det ofte være hensiktsmessig å skru av variantsøk.

  • Trunkeringstegnet * kan være etterhengt («P*») eller foranstilt («*e»), men det er i Elasticsearch ikke mulig med både foranstilt og etterhengt trunkeringstegn (f.eks. «*risto*»). De tilgjengelige alternativene er «Fuzzy search» og variantsøk.