Vangst en precisie
Uit onderzoek van Mondosoft blijkt dat de meeste zoekers gebruik maken van de quick-and-dirty-methode. De gemiddelde duur van een zoekactie is 1 minuut en 50 seconds.
De meeste gebruikte hulpmiddel is de zoekmachine en in het bijzonder Google. Vaak maken ze slechts gebruik van een of twee zoektermen (gemiddelde 1,7). Ze willen het liefst zo veel mogelijk resultaat met zo min mogelijk moeite.
Of de zoekvraag ook de gewenste resultaten oplevert hangt natuurlijk af van de manier waarop de zoekvraag wordt geformuleerd. Begrippen die hierbij een rol spelen zijn: opbrengst, vangst en precisie (Foskett, 1982). In dit onderdeel wordt ingegaan op deze begrippen en hoe bepaalde factoren deze kunnen beinvloeden.
Toelichting begrippen
Elke zoekactie levert nul of meer resultaten c.q. documenten op. Dit resultaat wordt (bruto)opbrengst genoemd.
De opbrengst kan worden verdeeld in resultaten die handelen over het onderwerp waarop gezocht wordt en resultaten die niet over het gezochte onderwerp gaan. De verhouding tussen de resultaten die handelen over het onderwerp en de (bruto)opbrengst wordt precisie (nauwkeurigheid) of precision genoemd. Lees meer over Precisie
Bij de meeste zoekacties worden niet alle resultaten die relevant zijn voor de vraag gevonden. De verhouding tussen de gevonden relevante resultaten en alle relevante resultaten in de collectie wordt vangst(verhouding) of recall genoemd. Lees meer over Vangst
Zoekprof zegt het volgende over deze twee begrippen:
" Precision is een van de twee criteria waaraan de prestaties van een zoekmachine kan worden afgemeten. Nauwkeurigheid (precision): Het deel van de resultaatpagina's dat voldoet aan de gestelde vraag of opdracht. Als in 35 procent van de resultaatapagina's het gevraagde woord voorkomt, is de precisie van de zoekmachine (slechts) 35 procent. "
De verhouding tussen het aantal resultaten dat uit een database komt, en het aantal daarin opgeslagen documenten dat eveneens aan de gestelde vraag zou kunnen voldoen. Samen met precision een van de twee criteria waaraan de prestaties van een zoekmachine kan worden afgemeten. In theorie kan de recall 100 procent zijn, maar door netwerkproblemen, onderhoud, slechte programmering e.d. wordt dat zelden of nooit bereikt.
Er wordt gesteld dat een vergroting van de vangst ten koste gaat van de precisie en omgekeerd. De grootte van beide hangt af van de gebruikte informatietaal, de kwaliteit van het indexeren, de mogelijkheden van het gebruikte zoeksysteem, de bekwaamheden van de zoeker en de te besteden tijd.
Hoe beter de zoeker in staat is de juiste zoekvraag te formuleren, des te beter de vangst en de precisie.
Links
- Relevantie
Korte toelichting op Relevantie (recall en precision). (Bron: Universiteitsbibliotheek Erasmus Rotterdam)
Literatuurverwijzingen
- "Web Site Usability Metrics: Search Behavior and Search Trends", door: Mondosoft, tweede druk, 2004, http://www.mondosoft.com/behavior-survey.asp (laatste bezoek: 23/12/04, rapport is niet meer beschikbaar, alleen samenvatting)
- "The Subject Approach to Information", door: A.C. Foskett, vierde druk, 1982.
- "Woordsystemen. Theorie en praktijk van thesauri en trefwoordensystemen", onder redactie van: H. Magrijn, S.A.Th.M. Pontzen e.a., tweede herziene druk, 2000, Biblion., ISBN 9054832150
- "Online opsporen van informatie. Theorie en praktijk van het gebruik van interactieve informatiesystemen", onder eindredactie van E.G. Sieverts en M.W. de Jong-Hofman, zesde herziene druk, 1996, NBLC Uitgeverij, ISBN 9054830999
- "Informatiesystemen", onder eindredactie van E.G. Sieverts en M.W. de Jong-Hofman, zesde herziene druk, 1996, NBLC Uitgeverij, ISBN 9054830999
Toegevoegd op zondag 15 februari 2009 | Laatst gewijzigd op zondag 15 augustus 2010