De Webmees van Hans Werksman - een begrip sinds 1997 De Webmees

Zoekmachines

<meta> codes

» Zoekmachines

E

r zijn <meta>-codes zijn in veel smaken, maar voor het indexeren door een zoekmachine zijn vooral description en keywords van belang. In de eerste beschrijf je de pagina in maximaal 200 tekens, in de tweede zet je de trefwoorden op een rijtje, gescheiden door komma's. Je neemt ze op in de <head> van je pagina.

pas op <meta> ondersteuning
Het nut van de <meta>-codes voor het omschrijven van een pagina en steekwoorden neemt snel af. Grote jongens als Google negeren ze helemaal. Reden is de enorme vervuiling van de zoekresultaten die optreedt door verkeerde en soms ronduit misleidende omschrijvingen en steekwoorden.
top

Synoniemen
Bedenk hierbij dat veel begrippen synoniemen kennen. Gebruik dat dan ook. Met de Meta Medic kan je online controleren of je de zogenaamde <meta> codes goed hebt gebruikt.

top

Omschrijving van De Webmees
Dit is mijn invulling van description en keywords:

<meta name="description"
 content="Uitleg
 zoekmachines. Links met search engines.
 Gebruik en validatie meta tags.
 Robots en spiders. Onderdeel van
 De Webmees van Hans Werksman">
<meta name="keywords" content="ranking,
 aanmelden, search, engines, zoekmachines,
 zoeken, validatie, controle, meta, tags,
 robots, exclusion, Webmees">
top

Meer mogelijkheden
Daarnaast gebruik ik voor mijn bestanden deze mogelijkheden van de <meta> code:

<meta name="author" content=
 "Hans Werksman - werksman@xs4all.nl">
<meta name="publisher" content=
 "Hans Werksman - werksman@xs4all.nl">
<meta name="copyright" content=
 "(c) 1997-2004 Hans Werksman">
<meta name="language" content="NL">

De code voor language voorkomt dat je bezoekers opeens tegen een taal aankijken waar ze niets mee kunnen. Als je iets zoekt via AltaVista staat er dan bij in welke taal het gevonden bestand is geschreven. Handig.

top

Codes voor robots
De code voor robots is van belang om de zoekmachine te laten weten of een pagina al dan niet geïndexeerd moet worden.

<meta name="robots" content="ALL">

Wil je een pagina niet laten opnemen, omdat er alleen een formulier op staat bijvoorbeeld, gebruik dan:

<meta name="robots" content="noindex">

Wil je ook de links van zo'n pagina uitsluiten, dan gebruik je:

<meta name="robots"
 content="noindex,nofollow">
pas op Helaas worden noindex en nofollow nog niet door alle zoekmachines herkend. De grote jongens houden zich er aan, de kleintjes minder.

Maak gebruik van een robots.txt, een tekstbestand waarin staat wat er wel en niet geïndexeerd mag worden op je site. Je kunt complete directories, bestandstypen of juist een enkel bestand uitsluiten.

Hoe je zo'n bestand maakt en waar je moet neerzetten op de server wordt uitgelegd in de HTML Author's Guide to the Robots Exclusion Protocol. NB Het werkt alleen als je eigen domein hebt.

» Zo ziet de mijne er uit

top

Cache en houdbaarheidhaarheidsdatum
Tijdelijke pagina's moeten niet eindeloos in de index van een zoekmachine achterblijven. Denk hierbij aan aanbiedingen en kortlopende acties. Je kunt een uiterste houdbaarheidhaarheidsdatum opgeven met Expires:

<meta http-equiv="Expires"
 content="Fri, 13 Dec 2002 00:00:01 GMT">

Als een pagina regelmatig wijzigt, is het handig om er voor te zorgen dat de bezoeker de meest actuele versie te zien krijgt. Om te voorkomen dat een oude pagina uit de cache wordt gehaald, gebruik je het volgende:

<meta http-equiv="Pragma"
 content="no-cache">

Google bewaart van elke pagina een ge-cache-te versie. Wil je dat niet, gebruik dan:

<meta name="GOOGLEBOT" content="noarchive">
top

Bestandstypen
De volgende codes vertellen iets over de inhoud van je bestand. Zo geef ik aan dat het een HTML-bestand is waarin ik CSS en JavaScript gebruik, en wat mijn email adres is:

<meta http-equiv="content-type"
 content="text/html; charset=ISO-8859-1">
<meta http-equiv="content-style-type"
 content="text/css">
<meta http-equiv="content-script-type"
 content="text/javascript">
<meta http-equiv="reply-to"
 content="werksman@xs4all.nl">
top
 
DE WEBMEES
Home Home Post Kaart