Poseer contenido duplicado significa que varias URLs tienen el mismo contenido, siendo esto un factor negativo al ser considerado contenido redundante o plagio en caso de que el contenido esté asociado a diferentes dominios. Esto es un problema muy común que puede conllevar consecuencias negativas para el posicionamiento en Google de tu página web. Por ejemplo, ciertas páginas podrían no indexarse y mostrarse con el estado «Rastreada, actualmente sin indexar» en la Search Console de Google.
Generalmente, el contenido duplicado se produce cuando tu página de inicio tiene más de una URL y cada una dirige a la misma página con el mismo contenido, por lo cual es necesario indicar a Google cuál es la URL correcta para que la pueda posicionar adecuadamente. Existen tres problemas y soluciones comunes como opciones para eliminar el contenido duplicado cuando éste es igual o muy similar.
Contenidos
¿Qué hacer si es posible acceder al mismo contenido mediante distintas URLs?
En este caso podemos podemos hacer una redirección de una página a otra, asegurándonos de que solamente es posible acceder a una de las direcciones. Esta solución, por lo general, se aplica cuando solamente tenemos un contenido pero que, por problemas en la gestión de las URLs, es posible acceder al mismo a través de varias URLs. Para lograr ésto tenemos que editar el archivo .htaccess que se encuentra en el directorio raíz de nuestra web, siempre y cuando utilicemos el servidor Apache. Si el archivo no existe, tendremos que crearlo. Para editarlo o crearlo, podemos acceder a nuestra web mediante FTP, utilizando algún cliente FTP como Filezilla u otro programa similar.
Por ejemplo, si queremos redireccionar la URL «antigua-url» a otra URL «nueva-url», tenemos que editar el archivo .htaccess y agregar la siguiente línea:
Redirect 301 /vieja-pagina http://www.miweb.com/nueva-pagina
Tras esta redirección, podremos verificar que solamente hay una página visible y accesible para los usuarios. Ahora, cuando accedamos a la URL /vieja-pagina, seremos redirigidos a la URL /nueva-pagina.
¿Cómo redireccionar varias URL a la vez?
Este caso se da cuando, por ejemplo, es posible acceder a nuestra web tanto con el prefijo www delante de nuestro dominio como sin el prefijo www. Es decir, que podríamos acceder a una misma URL de los siguientes modos:
- http://miweb.com/nueva-pagina
- http://www.miweb.com/nueva-pagina
Esto es considerado como contenido duplicado para algunos robots buscadores como el de Google y, para arreglarlo, debemos crear una regla que redireccione todas las direcciones que sigan un determinado patrón. Aquí podréis encontrar más información para gestionar las redirecciones mediante el archivo .htaccess.
Redireccionar a la URL con o sin www
Lo primero que se recomienda realizar es entrar en Google Search Console y escoger nuestra versión favorita de entre la versión de nuestra web que lleva «www» y la que no lleva «www».
Para redireccionar desde la versión con www a la que no lleva www tendremos que agregar las siguientes líneas a nuestro archivo .htaccess:
Options +FollowSymlinks RewriteEngine On RewriteCond %{HTTP_HOST} !^www\. [NC] RewriteRule ^ http://www.%{HTTP_HOST}%{REQUEST_URI} [L,R=301]
Para redireccionar desde la versión sin www a la que lleva www tendremos que agregar las siguientes líneas a nuestro archivo .htaccess:
Options +FollowSymlinks RewriteEngine On RewriteCond %{HTTP_HOST} ^www\.(.+)$ [NC] RewriteRule ^ http://%1%{REQUEST_URI} [L,R=301]
La etiqueta canonical: Cuando tenemos diferentes versiones del mismo contenido,
Cuando tenemos diferentes versiones del mismo contenido y éste es muy similar, podemos dejar que nuestros usuarios accedan a ambas versiones, pero tendremos que decirle a Google cual de las versiones es la que debe indexar. Para ello, podemos agregar una etiqueta en nuestros código HTML para indicar a los buscadores si la versión actual es la correcta o si por el contraro debe indexar otra versión del contenido.
La etiqueta que debemos agregar es la etiqueta «rel=canonical» en cada versión del mismo contenido. De este modo indicaremos a Google y a los demás buscadores cuál es nuestra versión canónica o principal. Esto mejorará significativamente el proceso de indexación y posicionamiento de tu web en SERPS. Esta etiqueta se colocará en la sección <head> de nuestra web. Un ejemplo de etiqueta canónica podría ser:
<link rel="canonical" href="http://www.mi-dominio.com/mi-url.html" />
La páginas que contengan la etiqueta anterior no se indexarán, puesto que Google y los demás buscadores optarán por indexar la URL que hemos indicado en su lugar. Para aplicar la etiqueta canónical de forma correcta en términos de SEO, simplemente tenemos que seguir estos sencillos pasos que se explican a continuación:
- Primeramente, selecciona cuál será tu página canónica o principal.
- Luego, elige cuál o cuáles serán tus páginas secundarias que podran competir en el posicionamiento con la canónica. Generalmente son páginas con contenido muy parecido.
- Posteriormente, agrega la etiqueta canonical a las páginas secundarias indicando cual es la página principal entre «<head>» y «</head>».
- Finalmente, coloca la etiqueta canonical en la página principal o favorita enlazándose a sí misma entre «<head>» y «</head>».
Las URLs canónicas están activadas por defecto en WordPress cuando, por ejemplo, tenemos varias versiones de un mismo contenido. Para los que queráis desactivarlas, podéis consultar esta guía para deshabilitar las URLs canónicas en WordPress.