vrijdag 15 januari 2010

Het volgende Omega-decennium (3)


[aflevering 1]
[aflevering 2]

De eerste post in deze serie ging over nieuwe ontwikkelingen rond "geïntegreerd zoeken". De tweede ging in op algemene voor- en nadelen van verdergaande integratie, met het huidige Omega als uitgangspunt. Dit keer wat specifieker over retrievalproblemen die daarbij kunnen optreden.

Het overgrote merendeel van de artikelen in Omega bevat uitgebreide inhoudelijke metadata in de vorm van samenvattingen, die geheel doorzoekbaar zijn. Van het fysieke materiaal, zoals dat in Aleph gecatalogiseerd is, hebben we daarentegen nauwelijks inhoudelijke metadata. Behalve een vaak korte en soms ook weinigzeggende titel, zijn er hoogstens nog twee of drie tamelijk algemene trefwoorden toegekend. Dat verschil in hoeveelheid en specificiteit van de aanwezige zoekingangen voor die beide soorten materiaal, maakt dat daar op heel verschillende wijze in gezocht moet worden om een enigszins optimaal resultaat te krijgen.
Om de gespecialiseerde artikelen in Omega te vinden, zijn zoekacties op vrij specifieke zoekwoorden nodig. Maar die zullen in Aleph-materiaal vrij weinig opleveren. Zelfs boeken die wel degelijk informatie over het gezochte specialisme bevatten, zullen niet gevonden worden, omdat ze alleen vindbaar zijn op een paar titelwoorden en enkele veel algemenere trefwoorden (zo die al zijn toegekend). Die problematiek had ik in zijn algemeenheid al eens beschreven in een digitale bijdrage aan InformatieProfessional, "De mythe van de catalogus".

Om fysiek materiaal uit de catalogus te kunnen vinden, is het dus vaak nodig om op vrij algemene zoekwoorden te zoeken. Maar die zullen in Omega-materiaal juist weer weinig opleveren, omdat artikelen veel vaker specialistische deelonderwerpen behandelen dan zulke algemene onderwerpen. Wel degelijk aanwezige gespecialiseerde artikelen over onderdelen van het gevraagde onderwerp zullen daarbij voor het grootste deel gemist worden, omdat gebruikte algemene zoektermen daar niet in voorkomen, en er ook geen hiërarchische thesaurus is, waarmee zogenaamd "generiek" gezocht kan worden. Daarbij had een zoekvraag automatisch uitgebreid kunnen worden met in zo'n thesaurus beschikbare specifieke zoekwoorden.
Zoeken in de catalogus vraagt dus in de meeste gevallen een andere zoekaanpak dan zoeken in het huidige Omega. Deze zoekaanpakken zullen pas op termijn naar elkaar toegroeien, als ook van het merendeel van het in de catalogus beschreven materiaal uitgebreider gegevens digitaal beschikbaar en doorzoekbaar zijn, zoals inhoudsopgaven, samenvattingen, inleidingen en/of besprekingen. Op termijn zullen dat hopelijk ook de volledige teksten zijn, als meer E-books aan onze collectie worden toegevoegd. Daarmee kan voor dit materiaal dan ook meteen de Omega-meerwaarde van de "instant satisfaction" verwezenlijkt worden.

[wordt vervolgd]

4 opmerkingen:

WoW!ter zei

Maar hoe lost Summon dat dan op? Summon toon bij vrij veel vragen een catalogusreultaat. Lijkt mij een simpele rekenkundige truc.

Jan de Boer zei

Wat zegt dit dan over WorldCat? Artikelen van JSTOR zijn nu te vinden en benaderen via WorldCat (IP, 19 januari 2010). Eerder was dit al het geval voor artikelen uit ScienceDirect, Medline, ArticleFirst en British Library Serials.
Is WorldCat een twee, of misschien zelf drie- of vierkoppig monster?

Eric zei

@WoW!ter
Maar alleen rekenkundig kom je er niet. Als een woord niet voorkomt in schaars aanwezige metadata, blijft het onmogelijk een boek daarop te vinden. Je kan hooguit wat aan relevantieparameters sleutelen, zodat een boek per definitie hoger scoort.

PS: Overigens excuus dat jullie reacties in de moderator-bak waren blijven liggen. Even niet opgelet. Er bleken nu trouwens alleen maar serieuze in te zitten, zodat ik de reacties misschien wel weer open kan zetten.

Eric zei

@Jan de Boer
Maar zie ook de reactie van Jeroen op Nedbib