Actividad 2.1

Codificación de caracteres

Si la fuente no fue previamente definida en el header del archivo HTTP, es necesario hacerlo usando HTML. Así se evita, por ejemplo, que la ñ o las tildes no se muestren correctamente. El meta tag que usaremos es este:

<meta charset="UTF-8">

este metadato es, además, relevante en el caso de que un navegador acceda a los archivos HTML directamente desde el disco duro y no los reciba por HTTP.

Descripción (Description)

En la descripción o meta description podemos describir brevemente el contenido de la página web. Esta información se muestra como snippet (una síntesis en dos líneas del tema de una página que aparece bajo la URL) en los buscadores de uso más generalizado como Google o Bing, por lo que se recomienda cuidar su redacción. Por su papel central en tanto que influye de manera decisiva en la elección del usuario del mejor resultado acorde con su búsqueda, este meta tag es considerado uno de los más importantes en cuanto a la optimización para los buscadores. La descripción no debe sobrepasar los 160 caracteres de longitud, ya que se corre el riesgo de que esta aparezca incompleta en la lista de resultados. La metadescripción se dirige principalmente al usuario, por lo que debería contener un resumen preciso del contenido que le espera cuando haga clic en la página. Según Google, cada subpágina de una página web debería contar con una descripción propia que facilite información útil y precisa sobre su contenido. Esto aporta al usuario un valor añadido y ayuda a los administradores a aumentar su ratio de clics. En la metadescripción se puede encontrar, por ejemplo, la siguiente información:

<meta name="description" content="Los meta tags de HTML codifican información para ser interpretada por el navegador y los buscadores. ¿Sabes cuáles son imprescindibles?">

Palabras clave (Keywords)

Con esta etiqueta meta los administradores tienen la posibilidad de definir palabras clave para el buscador. Las keywords son aquellos criterios a los que responde un buscador para ofrecerle al usuario páginas HTML como respuesta, donde tales palabras clave son parte de los meta tags. Anteriormente, esta etiqueta era considerada como el factor SEO más importante, ya que los buscadores primitivos recurrían a este atributo como característica central para el posicionamiento en las listas de resultados. Pero hoy es ignorado por Google y su importancia ha sido minimizada por Bing y otros buscadores populares debido a la facilidad con que puede ser manipulado en el cálculo del factor de ranking. Es por ello que ha perdido todo su valor en el campo de la optimización para los buscadores, aunque esto no significa que un mal uso de este meta tag no pueda llevar a la devaluación en el posicionamiento.
La elección de las palabras clave requiere de cierta sutileza: hay que evitar su uso abusivo, fenómeno conocido como keyword stuffing, así como aquellas sin relación con el contenido de las páginas en una web. A consecuencia de que los archivos locales de búsqueda y los metabuscadores acuden a la información en los meta tags de las palabras clave, se recomienda introducir términos relevantes.
Una línea puede contener varios elementos. Las palabras clave se separan por comas.

<meta name="keywords" content="palabra clave 1, palabra clave 2, palabra clave 3">

Autor (author) y copyright

Estos dos meta tags, de uso opcional desde el punto legal, permiten hacer referencia al diseñador de una página web y al propietario de los derechos del código fuente de una página HTML. En algunos sistemas de gestión de contenido (CMS), las etiquetas de autor se generan automáticamente y en ellas se nombra a la persona que ha trabajado la página en último lugar. De esta forma, los administradores pueden extraer del directorio quién gestiona cada página.

<meta name="author" content="Nombre del autor">

<meta name="copyright" content="Propietario del copyright">

Index

Esta directriz permite al robot de búsqueda la indexación de una página de HTML, algo innecesario si se piensa que la indexación forma parte de su actividad habitual, así:

<meta name="robots" content="index">

Noindex

Se tiene que indicar expresamente si una página no debe ser incluida en el índice. Este tag prohíbe al buscador transferir contenidos de una página HTML a su base de datos:

<meta name="robots" content="noindex">

El atributo “robots” se dirige a todos los buscadores, y “noindex” indica que no se permite la indexación. Si queremos impedirle el proceso solo a un buscador, podemos indicarlo con un atributo alternativo como, por ejemplo, “googlebot”.

Follow

El comportamiento estándar de los motores de búsqueda consiste en recorrer los enlaces que encuentra en una página de HTML, a no ser que se les indique lo contrario. Esta información se puede incluir en las metaetiquetas, aunque no es necesario:

<meta name="robots" content="follow>

Nofollow

Si se quiere impedir que un robot de búsqueda alcance determinadas subpáginas de un sitio o rastree los enlaces en otro dominio se añade:

<meta name="robots" content="nofollow">

El robot ignora, así, los enlaces por completo, pero no el contenido de la página, que sí será transferido a la base de datos del buscador.
Los meta tags Index/Noindex y Follow/Nofollow se pueden usar solos o combinados. Se puede, por ejemplo, determinar que una página sea indexada pero que los links sean ignorados, así como permitir o impedir ambas acciones a los robots.
<meta name="robots" content="index,nofollow">

<meta name="robots" content="index,follow">

<meta name="robots" content="noindex,nofollow>

Control de caché

Para asegurar la fluidez del funcionamiento de Internet, las webs se suelen guardar en servidores proxy intermedios o en el caché del navegador para ser descargadas fácilmente en el futuro. Para impedirlo usamos el meta tag “cache-control” con el valor no-cache:

<meta http-equiv="cache-control" content="no-cache">

Las páginas web que cuentan con este meta tag se cargan nuevamente desde el servidor web cada vez que se accede a ellas. Esto puede ralentizar la navegación, pero puede ser conveniente en el caso de páginas que actualizan su contenido diariamente.

Expires

Es posible que no se quiera prohibir el almacenamiento temporal en caché de forma absoluta. En este caso se puede usar el atributo “http-equiv” para definir una fecha de expiración para los datos HTML solicitados. Se haría de esta manera:

<meta http-equiv="expires" content="tiempo de expiración en segundos">

Así es posible asignar a las páginas HTML la fecha de caducidad que se deseen. Una vez se supera esta fecha, el navegador tiene que cargar el documento HTML desde la página de origen. Pero si tiene que acudir siempre a la página original entonces se introduce un punto de caducidad de 0 segundos. En caso de que se quiera indicar un período de 12 horas, se introducen 43.200 segundos.
<meta http-equiv="expires" content="0">

<meta http-equiv="expires" content="43200">