Zoekmachines
<meta> codes
r zijn <meta>-codes zijn in veel smaken, maar voor het indexeren door een zoekmachine zijn vooral description en keywords van belang. In de eerste beschrijf je de pagina in maximaal 200 tekens, in de tweede zet je de trefwoorden op een rijtje, gescheiden door komma's. Je neemt ze op in de <head> van je pagina.
- Heeft het nog nut?
- Synoniemen
- Omschrijving van De Webmees
- Meer mogelijkheden: copyright, auteur, taal ...
- Codes voor robots
- Cache en houdbaarheidhaarheidsdatum
- Bestandstypen: css, html, javascript ...
<meta> ondersteuningHet nut van de <meta>-codes voor het omschrijven van een pagina en steekwoorden neemt snel af. Grote jongens als Google negeren ze helemaal. Reden is de enorme vervuiling van de zoekresultaten die optreedt door verkeerde en soms ronduit misleidende omschrijvingen en steekwoorden. |
Synoniemen
Bedenk hierbij dat veel begrippen synoniemen kennen. Gebruik dat dan ook. Met de Meta Medic kan je online controleren of je de zogenaamde <meta> codes goed hebt gebruikt.
Omschrijving van De Webmees
Dit is mijn invulling van description en keywords:
<meta name="description" content="Uitleg zoekmachines. Links met search engines. Gebruik en validatie meta tags. Robots en spiders. Onderdeel van De Webmees van Hans Werksman"> <meta name="keywords" content="ranking, aanmelden, search, engines, zoekmachines, zoeken, validatie, controle, meta, tags, robots, exclusion, Webmees">
Meer mogelijkheden
Daarnaast gebruik ik voor mijn bestanden deze mogelijkheden van de <meta> code:
<meta name="author" content= "Hans Werksman - werksman@xs4all.nl"> <meta name="publisher" content= "Hans Werksman - werksman@xs4all.nl"> <meta name="copyright" content= "(c) 1997-2004 Hans Werksman"> <meta name="language" content="NL">
De code voor language voorkomt dat je bezoekers opeens tegen een taal aankijken waar ze niets mee kunnen. Als je iets zoekt via AltaVista staat er dan bij in welke taal het gevonden bestand is geschreven. Handig.
Codes voor robots
De code voor robots is van belang om de zoekmachine te laten weten of een pagina al dan niet geïndexeerd moet worden.
<meta name="robots" content="ALL">
Wil je een pagina niet laten opnemen, omdat er alleen een formulier op staat bijvoorbeeld, gebruik dan:
<meta name="robots" content="noindex">
Wil je ook de links van zo'n pagina uitsluiten, dan gebruik je:
<meta name="robots" content="noindex,nofollow">
Helaas worden noindex en nofollow nog niet door alle zoekmachines herkend. De grote jongens houden zich er aan, de kleintjes minder. |
Maak gebruik van een robots.txt, een tekstbestand waarin staat wat er wel en niet geïndexeerd mag worden op je site. Je kunt complete directories, bestandstypen of juist een enkel bestand uitsluiten.
Hoe je zo'n bestand maakt en waar je moet neerzetten op de server wordt uitgelegd in de HTML Author's Guide to the Robots Exclusion Protocol. NB Het werkt alleen als je eigen domein hebt.
Cache en houdbaarheidhaarheidsdatum
Tijdelijke pagina's moeten niet eindeloos in de index van een zoekmachine achterblijven. Denk hierbij aan aanbiedingen en kortlopende acties. Je kunt een uiterste houdbaarheidhaarheidsdatum opgeven met Expires:
<meta http-equiv="Expires"
content="Fri, 13 Dec 2002 00:00:01 GMT">
Als een pagina regelmatig wijzigt, is het handig om er voor te zorgen dat de bezoeker de meest actuele versie te zien krijgt. Om te voorkomen dat een oude pagina uit de cache wordt gehaald, gebruik je het volgende:
<meta http-equiv="Pragma" content="no-cache">
Google bewaart van elke pagina een ge-cache-te versie. Wil je dat niet, gebruik dan:
<meta name="GOOGLEBOT" content="noarchive">
Bestandstypen
De volgende codes vertellen iets over de inhoud van je bestand. Zo geef ik aan dat het een HTML-bestand is waarin ik CSS en JavaScript gebruik, en wat mijn email adres is:
<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1"> <meta http-equiv="content-style-type" content="text/css"> <meta http-equiv="content-script-type" content="text/javascript"> <meta http-equiv="reply-to" content="werksman@xs4all.nl">

