woensdag 25 april 2007

De probabilistische catalogus

Door mijn eerdere opmerkingen over catalogi, naar aanleiding van de NVB-WB dag, was ik een artikel uit D-Lib magazine van begin dit jaar nog een keer wat beter gaan lezen:
The Online Library Catalog: Paradise Lost and Paradise Regained? van Karen Markey.
Met de meeste meningen en overwegingen daarin kon ik het zonder meer eens zijn. Opmerkelijk was dat de vier na te streven oplossingen voor het re-animeren van de catalogus die hierin werden opgesomd al in begin jaren '90 waren geformuleerd.


  1. Make subject searching in online catalogs easier using post-Boolean probabilistic searching with automatic spelling correction, term weighting, intelligent stemming, relevance feedback, and output ranking. [daar kom ik zo op terug]
  2. Streamline users' book selection decisions at the catalog by adding tables of contents and back-of-the-book indexes to cataloging (i.e., metadata) records [nog altijd op ons verlanglijstje]
  3. Reduce the many failed subject searches by expanding the online catalog with full texts—journal and newspaper articles, encyclopedias, dissertations, government documents, etc. [in Omega wel gerealiseerd; nu de catalogus nog]
  4. Increase finding strategies in online catalogs through the library classification [dat is natuurlijk typisch Amerikaans, waar classificaties een veel belangrijker rol zijn blijven spelen]

De elf literatuurreferenties die aan deze vier hoofdpunten uit Markey's betoog hingen, bleken inderdaad allemaal uit de periode van 1978-1991 te dateren!! Had er in die 16 (of zelfs 29) jaar dan niet wat meer kunnen gebeuren?

Interessant was verder dat onder punt 1 een lans wordt gebroken voor het vervangen van het puur Booleaanse zoeken in onze bibliotheeksystemen, door probabilistische zoektechnieken. Die benaming "post-Boolean" klinkt natuurlijk wel wat demagogisch, als het ware implicerend dat Booleaans dus maar akelig ouderwets is. Maar het is wel een duidelijke ondersteuning dat wij in Utrecht 8 jaar geleden een goede keuze hebben gemaakt, voor de na te streven wijze van zoeken in Omega en zijn voorganger. De meeste van de door Mackey genoemde technieken vormden daarvoor namelijk het belangrijkste uitgangspunt – ook al wordt die zoektechniek door sommige bibliotheekmedewerkers nog altijd met enige achterdocht bekeken.

Geen opmerkingen: