maandag 21 mei 2007

Zoeken à la Lyonnaise

Op Nedbib verscheen gisteren een berichtje dat de Bibliothèque Municipale de Lyon, als tweede grootste bibliotheek van Frankrijk, met Google Books ging meedoen. Dat bracht me in herinnering dat die bibliotheek destijds ook al door Autonomy was genoemd als voorbeeld van een eerdere klassieke bibliotheektoepassing van hun zoeksoftware.
Op het eerste gezicht inderdaad klassieker dan waar wij Autonomy voor gingen gebruiken. Opnieuw nog eens goed naar de site van Lyon kijken, leverde in elk geval nog wel een paar constateringen op.


  1. Ze hebben in Lyon zowel een gewoon klassiek bibliotheeksysteem "Catalogue, recherche traditionnelle", als een op Autonomy gebaseerd zoeksysteem "Catalog+, recherche élargie" [let op het spellingsverschil !].
  2. Wat je met de "recherche élargie" doorzoekt blijkt toch wel iets meer/anders te zijn dan de "klassieke" catalogus. Behalve de catalogusrecords, blijken daarin ook de inhoudelijke antwoorden te zitten die informatiespecialisten voor gebruikers op allerlei onderwerpsvragen bij elkaar gezocht hebben ("le guichet du savoir", een beetje zoals de Nederlandse OB's voor Al@din doen). En bovendien nog de inhoud van een kennelijk recente dienstverlening "Points d'Actu" (Le point sur l'actualité) met nieuws en achtergrondinformatie om mensen te helpen de actualiteit beter te begrijpen. Dat die twee categorieën veel meer inhoudelijke tekst bevatten dan de - ook in Lyon nog tamelijk kale - catalogusrecords, wordt al gauw duidelijk als je ziet dat zoekvragen bovenproportioneel veel resultaten uit die twee categorieën opleveren.
  3. Interessant ook om hier het standaard Autonomy-interface (Retina) terug te zien. Na onze Proof of Concept met Autonomy - al weer twee jaar geleden - was die een beetje uit mijn geheugen weggezakt. Niettemin goed om ook voor ons eigen interface nog weer eens te kijken hoe in dat standaard interface

    • onder "suggested terms" de suggesties voor aanvullende zoektermen worden gepresenteerd;
    • in het "Advanced" interface ook meteen een Federated Search in een ander zoeksysteem (hier webzoekmachines) kan worden uitgevoerd (alleen jammer dat het Autonomy zoekresultaat dan meteen achter het scherm met Google- of Yahoo-resultaten verdwijnt);
    • ook een "Boolean" interface wordt geboden, dat behalve de verwarrende Google-advanced opties (all of these words / this exact phrase / any of these words / none of these words) ook nog een groot venster biedt om een echte (native) Booleaanse zoekvraag in te tikken; dat laatste blijft toch ook voor Omega het overwegen waard;
    • bij elke opgevraagde detail-presentatie ook meteen een aantal "gelijksoortige" documenten getoond wordt (al ben ik niet altijd onder de indruk van de inhoudelijke verwantschap, hoewel dat zo te zien vooral mis gaat - begrijpelijkerwijs - bij de kale catalogusrecords).


Enkele (voorbarige?) conclusies:

  • Voordat we een echte zoekmachine op onze catalogus loslaten moet er eerst meer tekst inzitten (maar dat had ik al eerder beweerd ;-)
  • Met het mengen van tekstrijke en tekstarme records moet je oppassen (ook geen echte eye-opener).
  • We moeten maar snel proberen om Autonomy's "suggested terms" en "document suggestions" ook in Omega te implementeren.
  • Moet Utrecht ook maar niet met Google Books gaan meedoen? We verkeren dan in goed gezelschap en we hebben meteen een heleboel meer full-text te doorzoeken tekst.

dinsdag 15 mei 2007

Wiki’s for professionals

Op de NVB-studiedag van 5 april 2007 werd door Barend Mons een lezing gehouden onder de noemer ‘Wiki’s, the good, the bad and the ugly’ (http://www.nvbonline.nl/4218/nvb-wb_studiedag_onderwerpsontsluiting_ii,_vinden_en_verbinden.html). De minder prikkelende en meer accurate titel van de presentatie was ‘Second Order Semantic Enrichment and the role of Wiki’s for professionals’. Mons houdt zich bezig met de vraag hoe professionals de groeiende stroom publicaties de baas kunnen blijven. Hij is medeoprichter van Knewco (http://www.knewco.com/) dat de ideeën van Mons en de zijnen probeert te vermarkten.

Tijdens een discussie bij I&O hebben we geprobeerd helder te krijgen hoe de aanpak van Mons en Knewco werkt en welke doelgroepen baat hebben bij hun producten.

Het uitgangspunt is de constatering dat een professional geconfronteerd wordt met zoveel nieuwe publicaties dat het onmogelijk is om die allemaal te lezen. Zelfs het maken van een goede selectie is voor velen al niet meer te doen. Gelukkig(?) bevatten al die publicaties hooguit 10% nieuwe informatie, de rest is herhaling. Het doel is om die 10% eruit te filteren door relaties met al bestaande informatie te achterhalen (=al bestaande kennis) en de nieuwe informatie te laten annoteren door een community van specialisten (de million minds approach). Wat resulteert zijn de feiten die werkelijk nieuw zijn. Dit proces werkt het best bij goed afgebakende vakgebieden met veel publicaties.

De achterliggende techniek maakt gebruik van text-mining om de informatie in de documenten te ‘fingerprinten’. Uit de fingerprints worden (mogelijke) relaties gedestilleerd, resulterend in een ‘cloud’ met publicaties die aan een begrip gerelateerd zijn. Tot zover is het proces geautomatiseerd.
De clouds worden geanalyseerd door mensen uit de community (de specialisten) die hun conclusies neerslaan in een Wiki, waar de community weer op kan reageren. De informatie en de relaties in de Wiki krijgen op die manier gewicht.

De combinatie van feiten die uit de oorspronkelijke data gedestilleerd zijn , de annotaties door specialisten en de vastgestelde relaties met andere begrippen wordt een Knowlet genoemd. De Knowlet wordt steeds verfijnd door informatie uit nieuwe publicaties en nieuwe annotaties en relaties.

Maar is het ook iets waar een universiteitsbibliotheek een (initiatiefnemende) rol in moet spelen? Waarschijnlijk niet, was de conclusie uit de discussie. De wiki’s voor professionals werken vooral goed bij een zo groot mogelijke deelname van specialisten op een zo klein mogelijk vakgebied. Wereldschaal dus, en niet de schaal van een individuele universiteit. Ook voor het mede beoordelen van nieuwe informatie is meer kennis nodig dan de vakreferenten van de bibliotheek kunnen bieden, daar zijn onderzoekers voor nodig.
De bibliotheek kan wel een rol spelen bij het onder de aandacht brengen en toegankelijk maken van de informatie die in dit en andere nieuwe gereedschappen voor kenniscreatie en kennisdeling zit.

Voorbeelden van andere gereedschappen: Webcite (http://www.webcitation.org/), Collexis (http://www.collexis.com/)