maandag 30 juni 2008

Calais

Wat zijn je eerste associaties bij Calais?
Dover, ferry, Kanaal, Eurostar, .....

Jammer, allemaal fout!
"Calais enhances your content with rich semantic metadata."

CALAIS is een (voorlopig [?] gratis) webservice van Reuters die automatisch metadata aan (verder ongestructureerde) tekstdocumenten kan toekennen. Bij die "metadata" moet je dan niet denken aan formele gegevens, maar aan bepaalde soorten entiteiten waarover een tekst gaat, zoals personen, plaatsnamen, organisaties en gebeurtenissen.
Jammer genoeg heb ik zelf niet kunnen uitproberen hoe het werkt, want daarvoor moet je meteen een hele API doorgronden die je in een eigen applicatie moet aanroepen. En daar ben ik zelf niet technisch genoeg voor.
Ik kan dus alleen verwijzen naar een dienst die er gebruik van maakt, de collectiebeschrijving van het Powerhouse Museum in Sydney. Hoewel beschrijvingen van museumobjecten niet de meest typische toepassing lijken, zien de resultaten er niet zo gek uit. Anderzijds worden uit lange beschrijvingen soms wel erg veel metadata gepeurd, terwijl ze, halverwege de tekst in dit voorbeeld, de stad "Utrecht" nog niet eens herkend hebben. Deze voorbeelden tonen dat het systeem geen overdreven anglosaksisch accent heeft (met uitzondering van de taal van de trefwoorden dan). Misschien iets om ook eens voor Igitur mee te experimenteren?

Bron: Lorcan Dempsey

Geen opmerkingen: