maandag 11 januari 2010

Het volgende Omega-decennium (2)


In mijn vorige blogpost keek ik naar ontwikkelingen met betrekking tot geïntegreerd zoeken. Daaruit bleek dat er steeds meer aanhang komt voor de weg die we in Utrecht 10 jaar geleden met Omega waren ingeslagen - met een eigen zoekmachine zelf zo veel mogelijk materiaal indexeren, in plaats van een metasearch-oplossing. Of kortweg "integrated search" in plaats van "federated search".

In dit kader wil ik eens bekijken of en hoe we meer soorten materiaal dan alleen wat nu in Omega zit, op een betere manier geïntegreerd kunnen aanbieden. Steeds verdergaande integratie past in elk geval in een trend. We zagen dat al bij enkele van de vorige keer gesignaleerde ontwikkelingen.
We zagen het recent ook bij OCLC, dat in Worldcat niet alleen de fysieke collecties van deelnemende bibliotheken doorzoekbaar maakt, maar die sinds kort integreert met de inhoud van OAIster. Die zoekmachine voor OAI materiaal, met ruim 20 miljoen publicaties die zijn geoogst uit institutionele repositories (niet beperkt tot OCLC-bibliotheken) heeft OCLC onlangs overgenomen van de Universiteit van Michigan. Hij is zelfs zover geïntegreerd, dat het OAIster-materiaal niet meer apart kan worden doorzocht.
We zien het ook bij webzoekmachines zoals Google. Onder het motto "Universal search" mengt die - op bescheiden schaal - resultaten uit image-search, video-search, News, Scholar, Books, blog-search en (sinds kort) "real-time web" (o.a. Twitter) door zijn gewone zoekresultaten.

Ook al is iets een kennelijke trend, toch blijft de vraag of verregaande integratie altijd wenselijk is. Wil iemand die op zoek is naar inhoudelijke informatie uit websites, worden afgeleid door afbeeldingen, video's of 2-regelig tweets die wellicht iets met het gezochte onderwerp te maken hebben (Google)? Wil iemand die op zoek is naar een eenvoudig leerboek ook superspecialistische OAI-artikelen over dat onderwerp vinden, of bij een zoekactie naar vrij online toegankelijke artikelen, juist afgeleid worden door boeken uit onbereikbare collecties aan de andere kant van de wereld (Worldcat)?

In onze situatie verdient de vraag hoe nauw en hoe volledig ander materiaal met het huidige Omega geïntegreerd zou moeten worden, dus zeker enige aandacht. Verregaande integratie, waarbij je alles in één grote vergaarbak gooit, heeft ontegenzeggelijk voordelen. Gebruikers hoeven niet vooraf te bepalen waarin ze gaan zoeken en bovendien lopen ze hierdoor de kans informatie te vinden die ze anders nooit zouden zijn tegengekomen. Toch spelen de nadelen waarop ik net zinspeelde ook in onze situatie en rol.


  • Gebruikers lopen de kans een grote verscheidenheid aan soorten materiaal te vinden waarnaar ze niet op zoek waren, waardoor het gezochte materiaal (in het slechtste geval) aan het oog wordt onttrokken door de overmaat aan ander materiaal.
  • Gebruikers vinden zowel materiaal dat zij meteen op het scherm kunnen krijgen (zoals zij intussen van Omega gewend zijn), als materiaal dat alleen fysiek beschikbaar is en waarvoor zij dus ergens heen moeten om het op te halen (en dat op dat moment misschien zelfs helemaal niet beschikbaar is, omdat het is uitgeleend of vermist).

Voor deze nadelen kan een te ontwikkelen "faceted search" in principe een oplossing bieden. Als resultaat van een zoekvraag kunnen gebruikers dan een uitsplitsing van hun zoekresultaat te zien krijgen
- naar aard van het materiaal,
- naar full-text digitale beschikbaarheid / fysieke beschikbaarheid,
- naar andere nog nader vast te stellen geformaliseerde kenmerken.
Van elke afzonderlijk aanklikbare deelverzameling zal daarbij vermeld staan, hoeveel van het oorspronkelijke resultaat die bevat. Dat vereist natuurlijk wel dat alle materiaal consistent en uniform van metadata voor deze kenmerken is voorzien. Nadeel voor gebruikers blijft dat bij deze methode nog altijd een extra keuzeactie nodig is. Bijvoorbeeld voor zo iemand die uit is op de "instant satisfaction" die het thema was van mijn column in het november-nummer van InformatieProfessional, die bij voorbaat dus al uitsluitend op zoek is naar direct digitaal op het scherm verkrijgbaar materiaal.

Belangrijker nog, is dat faceted search functionaliteit geen oplossing biedt voor zoek-technische problemen die optreden als gegevens uit ons huidige Omega worden gemengd met gegevens uit de catalogus. Enerzijds is er een retrievalprobleem: voorlopig zijn nog heel verschillende aanpakken vereist voor die twee soorten materiaal. Anderzijds worden in een catalogus vaak andersoortige zoekacties gedaan, die ook andere zoekfunctionaliteit vereisen. Op deze twee punten zal ik in een volgende aflevering verder ingaan.


[wordt vervolgd]
[vorige aflevering]

Geen opmerkingen: