Informatie Retrieval Termen
De termen zijn gesorteerd op alfabet. Met de link 'ALL' kan je alle termen bekijken. Beperk het overzicht door een letter te kiezen; je krijgt alleen de termen met die beginletter te zien. Als je met de muis over een letter gaat, verschijnt boven de letter het aantal termen met die beginletter.
- Adjacency
Adjacency is de mate waarin zoektermen in elkaars nabijheid verkeren. De nabijheid kan bij sommige zoekmachines worden opgegeven. NEAR/20 betekent binnen 20 woorden voor of na het gezochte woord.
- Booleaanse operatoren
Logische zoekoperatoren ontwikkeld door de wiskundige George Boole (1816-1854). Met behulp van operatoren als AND, NOT en OR kunnen relaties tussen zoektermen worden aangegeven, waardoor er preciezer gezocht kan worden. (Term uit de Information Retrieval c.q. Web Search)
- Boolean modifiers
De vervangende tekens of woorden die in plaats van Booleaanse codes worden ondersteund door sommige zoekmachines. Het gaat dan bijvoorbeeld om + en - in plaats van AND en OR, of Nederlandse vertalingen: EN en OF.
Zie ook 'Geimpliceerde Booleaanse operatoren'
- Bouwsteenmethode
Deze methode (of zoekstrategie) ontleedt het onderwerp waarnaar men op zoek is in verschillende aspecten. Voor ieder aspect worden zoektermen bepaald die vervolgens met elkaar verbonden worden (binnen aspecten met OR, tussen aspecten met AND). De bouwsteenmethode vereist een gedegen voorbereiding. (Term uit de Information Retrieval c.q. Web Search)
- Citatenindex
Een nadeel van de sneeuwbalmethode is dat men vaak verwijzingen vindt naar oudere literatuur. Met behulp van een citatenindex is het mogelijk om te zoeken naar actuele publicaties, doordat er verwezen wordt naar recente uitgaven die verwijzen naar bekende oudere publicaties (Boekhorst, 2000).
Voorbeeld: Google Scholar
- Conceptuele zoekstijl
Deze zoekstijl wordt gekenmerkt door aandacht voor de conceptuele structuur van de vraag. De vraag wordt ontleed in aspecten, maar daarbij wordt onderscheid gemaakt in de belangrijkheid daarvan. Eerst wordt geprobeerd het belangrijkste aspect goed gerepresenteerd te krijgen. Vervolgens wordt er binnen de gevonden resultaten verder gezocht. De methoden van meest-specifieke-aspect-eerst en van achtereenvolgende-inperkingen vertonen kenmerken van deze zoekstijl. (Fidel, 1984)
- Diepgaand zoeken
Wanneer je grondig kennis wil nemen van een onderwerp of wanneer je veel informatie over een bepaald onderwerp wil vinden, spreken we van diepgaand zoeken. Hiervoor kunnen twee methoden worden gebruikt: de sneeuwbalmethode en het gebruik van de citatenindex. (Term uit de Information Retrieval c.q. Web Search)
- False drop
Zoekresultaten die niet relevant zijn voor de gevraagde zoektermen. Kan worden veroorzaakt door wijzigingen in de content van de pagina's, of spamdexing.
- Field searching
Het zoeken in een bepaald veld van een webpagina, bijvoorbeeld de titel of URL. Voorbeeld: in een boekendatabase kan je zoeken op titel, auteur of ISBN. (Term uit de Information Retrieval c.q. Web Search)
- Geimpliceerde Booleaanse operatoren
In plaats van de Booleaanse operatoren AND en NOT worden plusteken (+) en minteken (-) gebruikt om aan te geven dat een trefwoord wel of niet aanwezig moet zijn.
- Globaal zoeken
zie 'Quick-and-Dirty-methode'
- LSI / Latent Semantic Indexing
Een algoritme dat gebruikt wordt door Google (en mogelijk ook door andere zoekmachines) om te bepalen hoe woorden op een pagina gerelateerd zijn aan andere woorden over ongeveer hetzelfde onderwerp. Het is een search ranking factor die mogelijkerwijs in de toekomst een belangrijkere rol zal krijgen rondom het bereiken van hoge zoekresultatenposities in zoekmachines in combinatie met andere ranking metrics.
- Meest specifieke aspect eerst-methode
Soms kan aan een onderwerp duidelijk één heel specifiek aspect onderkend worden, waarvan te verwachten valt dat het maar betrekkelijk weinig referenties zal opleveren. In zo’n geval kan men het best eest alleen op dit aspect zoeken. (Hawkins en Wagers, 1982)
- Methode Achtereenvolgende inperkingen
Bij deze methode begint men met het maken van een grote set trefwoorden over een algemeen onderwerp, verkregen door te zoeken op één breed begrip of op een combinatie van twee of drie zeer algemene concepten. Vervolgens verfijnt men de zoekactie in een aantal stappen, bijvoorbeeld door middel van de booleaanse operator AND en/of inperkingen op datum, taal en dergelijke, totdat men een bevredigend resultaat heeft, zowel naar relevantie als naar het aantal van gevonden referenties. (Hawkins en Wagers, 1982)
- Methode van interactief scannen
Deze methode is vooral handig wanneer de gebruiker nog geen goed idee heeft van het onderwerpsterrein waarop de zoekvraag betrekking heeft. In eerste instantie maakt men een brede set met veel referenties. Daarvan worden er zoveel op het scherm getoond of op papier afgedrukt als nodig is om een goed beeld te krijgen van de kenmerken van de publicaties. Op basis van deze informatie wordt een alternatieve zoekstrategie opgezet en uitgevoerd. (Hawkins en Wagers, 1982)
- NEAR-operator
De NEAR-operator vertelt de zoekmachine dat beide woorden (links en rechts van de operator) moeten voorkomen in de resultaatpagina's. Lijkt in werking op AND, maar als bijzondere voorwaarde geldt bij NEAR dat beide woorden zich in elkaars nabijheid moeten bevinden. Deze nabijheid is soms in te stellen (bijvoorbeeld: NEAR=20), maar vaak vast ingesteld.
Niet alle zoekmachines ondersteunen het gebruikt van Booleaanse operatoren (raadpleeg de help-functie!). De instelling verschilt per zoekmachine. Van de grote zoekmachines biedt alleen AltaVista (Advanced Search-optie) deze operator aan.
- NOT-operator
De NOT-operator vertelt de zoekmachine dat het woord na de operator niet mag voorkomen in de zoekresultaten. De zoekterm mag dus niet in het document voorkomen, hij wordt dus uitgesloten. Het effect van deze operator is dat de zoekresultaten worden beperkt en dat er meer relevante hits gevonden worden. Niet alle zoekmachines ondersteunen het gebruikt van Booleaanse operatoren (raadpleeg de help-functie!).
Standaard in zoekmachines: NOT, -
Soms moet de syntax luiden: AND NOT (bijvoorbeeld AltaVista). - Opbrengst
Elke zoekactie levert nul of meer resultaten c.q. documenten op. Dit resultaat wordt (bruto)opbrengst genoemd.
- Operationele zoekstijl
Deze zoekstijl stelt de betekenis van de vraag steeds voorop wat inhoudt dat het zoekprofiel nauwkeurig afgestemd wordt op alle aspecten van de vraagstelling. Soms levert dit geen resultaten op, omdat men de vraag direct op een heel specifieke manier inbrengt, maar in andere gevallen wordt informatie verkregen die de vraagstelling precies beantwoordt. De bouwsteen- en in zekere zin ook de parelgroeimethode zouden onder deze stijl onderverdeeld kunnen worden. (Fidel, 1984)
- OR-operator
De OR-operator vertelt de zoekmachine dat de zoekresultaten of het ene woord als het andere woord mogen bevatten. Een van de zoektermen moet dus in het document voorkomen. Het effect van deze operator is dat er meer relevante hits worden gevonden. Dit is vooral handig wanneer de zoekterm die je gebruikt een of meerdere synoniemen heeft of een vertaling is. Niet alle zoekmachines ondersteunen het gebruikt van Booleaanse operatoren (raadpleeg de help-functie!).
Standaard in zoekmachines: OR
- Parelgroeimethode
In een eerste stap gaat men op zoek naar enkele zeer relevante referenties. Vervolgens worden deze referenties grondig geanalyseerd en wordt er een lijst opgesteld met veel voorkomende trefwoorden. Met deze zoektermen bouwt men vervolgens een nieuwe zoekstrategie op. (Hawkins en Wagers, 1982)
- Phrase searching
Zoeken naar een zinsnede, een phrase, een exacte string met woorden. Bij de meeste search engines zoek je op een phrase door de woorden tussen aanhalingstekens te plaatsen. Bijvoorbeeld "Vrede van Versailles". (Term uit de Information Retrieval c.q. Web Search)
- Presicion
De opbrengst van de zoekactie kan worden verdeeld in resultaten die handelen over het onderwerp waarop gezocht wordt en resultaten die niet over het gezochte onderwerp gaan. De verhouding tussen de resultaten die handelen over het onderwerp en de (bruto)opbrengst wordt precisie of precision (=nauwkeurigheid) genoemd. Als in 35 procent van de resultaatapagina's het gevraagde woord voorkomt, is de precisie van de zoekmachine (slechts) 35 procent. Het andere criterium waaraan de prestaties van een zoekmachine kan worden afgemeten is recall.
Zie ook: recall.
- Quick-and-Dirty-methode
Je zoekt globaal wanneer je snel ‘even’ iets te weten wil komen, of wanneer je informatie zoekt om je te oriënteren. Deze methode wordt ook wel de quick and dirty-methode genoemd. Vaak maak je geen gebruik van een zoekplan, maar zoek je snel met behulp van een, meestal beperkt, aantal zoekingangen in een beperkt aantal informatiebronnen. (Term uit de Information Retrieval c.q. Web Search)
- Recall
Recall is de verhouding tussen het aantal resultaten dat uit een database komt, en het aantal daarin opgeslagen documenten dat eveneens aan de gestelde vraag zou kunnen voldoen.
Samen met precision een van de twee criteria waaraan de prestaties van een zoekmachine kan worden afgemeten. In theorie kan de recall 100 procent zijn, maar door netwerkproblemen, onderhoud, slechte programmering e.d. wordt dat zelden of nooit bereikt.Zie ook: precision.
Andere definitie:
De verhouding tussen de gevonden relevante resultaten en alle relevante resultaten in de collectie wordt vangst(verhouding) of recall genoemd. - Sneeuwbalmethode
Bij de sneeuwbalmethode begint de zoekactie bij een sleutelpublicatie, waarin verwijzingen zitten naar andere bronnen over hetzelfde onderwerp of er worden citaten gebruikt. Op deze manier wordt steeds meer relevante informatie gevonden. Een nadeel van deze methode is dat men (vaak) verwijzingen vindt naar oudere literatuur (Boekhorst, 2000). (Term uit de Information Retrieval c.q. Web Search)
- Trefwoord
Een trefwoord is een woord waarmee een document of record in een database kan worden gevonden. Strikt genomen werken zoekmachines niet met trefwoorden, maar met vrije tekst of zoekwoorden.
- Vertical search
Een zoekmachine die zich in een bepaalde markt specialiseert, bijvoorbeeld een zoekmachine voor alle politiediensten (Bleu view) of een zoekmachine voor mp3-bestanden.
- Zoekterm, keyword
- Bij zoeken: keyword, zoekterm, zoekwoord. Een van de termen waaruit een zoekopdracht (query) is samensteld.
- In een database wordt een lijst met keywords (keys) gebruikt die ieder verwijzen naar een record. Bij bewerkingen zoals sorteren, worden de keys bewerkt in plaats van de hele database om zo bewerkingstijd te besparen
- Zoekvraag
Zoekopdracht voor een zoekmachine. Kan bestaan uit een enkel woord, meerdere woorden eventueel gecombineerd met syntactische elementen, zoals Booleaanse operatoren e.d. Meervoud is queries.
- Zoekzin, Keyword phrase
Kortweg: phrase. Zoekzin, combinatie van de termen waarmee een zoekopdracht wordt samengesteld. De zoekmachine zoekt documenten waarbij de woorden in precies dezelfde volgorde worden aangetroffen als in de zoekzin. Levert dus een ander resultaat op dan de combinatie van zoekwoorden met + of AND.
Toegevoegd op vrijdag 06 maart 2009 | Laatst gewijzigd op zaterdag 14 augustus 2010