En nuestra agencia de posicionamiento seo, prestamos especial atención al contenido duplicado seo cuando realizamos una página web, o creamos productos, secciones, o páginas internas, ya que se puede caer en un error importante sin darnos cuenta, que nos hará perder posiciones, o que no alcancemos los primeros puestos en las búsquedas de nuestros clientes.
Si te estás preguntando cómo saber si tienes contenido duplicado en tu web, lee este práctico artículo y lleva a cabo las mejoras necesarias.
Qué es contenido duplicado
Podríamos definir el contenido duplicado como el conjunto de texto y/o código de una página web o url específica que coincide en su mayoría o se parece mucho a otra página. Ya sea dentro de nuestra página web (lo cual sería duplicado interno), o de una página web distinta a la nuestra (que sería externo).
Es importante conocer el concepto teórico para poder detectar posteriormente este error, ya que suele ser una confusión recurrente pensar que contenido duplicado es solamente lo que es exactamente igual, y como hemos puesto en la definición, no es así.
Consecuencias negativas del contenido duplicado
Las consecuencias de tener contenido duplicado en tu web son varias, y dependiendo de la gravedad, o de cómo tratemos el asunto, sus consecuencias pueden ser realmente malas, o no suponer nada para tu negocio.
Páginas no específicas
Una de las consecuencias más importantes del contenido duplicado es que Google no sepa qué página es la correcta para la búsqueda que ha realizado el usuario, por este mismo motivo, Google no “pondrá” tu página en las primeras posiciones, sino que relegará tu página a posiciones más bajas, premiando aquellas páginas que sí han creado un contenido único y que aporte valor.
Canibalización de términos
Otra consecuencia del contenido duplicado es canibalización de palabras clave. Esto significa que varias páginas de tu web están intentando posicionar por los mismos términos, lo que se incurre en otro error seo. Cada página de tu web debe intentar posicionar por términos específicos
Posible causa de spam
Si generas contenido duplicado de manera consciente, copias el contenido de otra web, o realizas prácticas no permitidas por Google, es posible que tu contenido sea denominado y tratado como spam. Esto puede hacer que tu página baje en los resultados y no consigas los objetivos comerciales.
¿Se penaliza el contenido duplicado? Sí o no.
El contenido duplicado, por sí mismo, NO penaliza, pero sí es cierto que tampoco ayuda a tu empresa a posicionar por las palabras clave que quieras, sino más bien todo lo contrario. Google entiende que el contenido duplicado es natural que aparezca, sobre todo en páginas grandes, con variantes idiomáticas, paginaciones, productos similares, productos actualizados, etc.
Por ese motivo, en 2013, Matt Cutts publicó un vídeo en YouTube explicando cómo Google gestiona el contenido duplicado y qué efectos negativos podría tener en el ranking si no se hace de manera correcta.
En el vídeo, explican cómo entienden ellos los contenidos duplicados y por qué no los penalizan de primeras, sino que hacen un análisis más exhaustivo para ver si hay malas prácticas detrás de ese contenido duplicado.
Tipos de contenido duplicado
Existen dos tipos de contenido duplicado seo, el que está dentro de tu propio dominio, el cual es interno. Y el que se encuentra fuera de tu web completamente, que sería externo.
Contenido duplicado interno
Como decíamos antes, el contenido duplicado interno es el que se encuentra dentro de nuestra propia página web, o mejor dicho, dentro del propio dominio.
El problema de esto es que Google también rastreará, analizará e indexará ese tipo de contenido si no hacemos nada para solucionarlo, ya que Google tiene un tiempo limitado para analizar nuestra web.
Lo más interesante es hacer que Google rastree y analice solo las páginas que queremos nosotros, y que se centre en encontrar y analizar las páginas más importantes para nosotros.
Contenido duplicado externo
Por el contrario, el contenido duplicado externo es aquel que se encuentra copiado o muy similar de dos sitios webs distintos, de dos dominios diferentes que utilicen el mismo contenido.
Esto suele pasar con artículos de productos se venden en distintas páginas webs o comercios electrónicos. Si el propietario o gestor del ecommerce no cambia los contenidos del producto, o se lo copia a la competencia, estaría incurriendo en un problema de contenido duplicado externo.
Incluso suele pasar que el contenido original se encuentre por debajo del contenido copiado, ya que la raíz del dominio tiene más autoridad y relevancia que la original, y eso le ayuda mucho a posicionar.
Para estos casos, Google pone a disposición de las personas o webs afectadas una herramienta para denunciar, más abajo explicaremos esta manera de corregir el contenido duplicado.
Cómo detectar contenido duplicado
Detectar el contenido duplicado en una auditoría seo es crucial para que no haya problemas a la hora de intentar posicionar nuestra webs en las partes más altas del buscador.
Hay varias manera de detectar contenido duplicado en una web. Se puede hacer manualmente, haciendo comprobaciones por tu cuenta dentro de la web, o a través de herramientas informáticas que analizan numerosos factores de nuestra web en busca de contenido duplicado.
Nosotros recomendamos usar herramientas para comprobar contenido duplicado, ya que son más específicas que las manuales, y se tarda menos tiempo.
Herramientas para detectar contenido duplicado
Siteliner
Siteliner es una herramienta para detectar contenido duplicado interno, y lo que hace es analizar toda la web en busca de contenido que sea duplicado, igual, o muy similar.
De esta manera podrás saber qué páginas exactamente tienen los problemas de duplicidad en pocos segundos, y ya solo será cuestión de tu habilidad el poder solucionarlo
La versión gratuita de esta herramienta alcanza analizar 250 páginas internas dentro de tu web, lo que será suficiente para muchas empresas.
Ahrefs
Ahrefs, dentro de su herramienta site audit permite conocer el contenido duplicado seo del title, descripción, H1 y contenido de nuestra web.
De esta manera conoceremos todas las urls que están causando este error, y poder arreglarlo de manera correcta para que Google tenga claro qué página es la más adecuada y no lo tengan en cuenta como contenido duplicado.
Evidentemente, cuanto mayor contenido único, mejor será valorado por los motores de búsqueda, ya que es un requisito indispensable para posicionar nuestras páginas webs.
Screaming Frog
La famosa herramienta de la “ranita” tiene también una manera de conocer las url que ofrecen un contenido duplicado o pobre.
Hay que realizar el “Crawl Analysis”, luego iremos a la configuración de contenido en la parte de arriba, y activaremos el análisis del contenido duplicado.
De esta manera podremos ver qué páginas internas están teniendo problemas de contenido seo.
Copyscape
Esta herramienta analiza las copias que haya de una url concreta a lo largo de toda la web.
Es útil si queremos ver si nos han copiado la descripciones de productos, algún artículo o cualquier contenido que queramos comprobar.
7 Causas del contenido duplicado seo
Ahora analizaremos las causas más probables de catalogar un contenido como duplicado.
Hay que tener cuidado antes de realizar una web o crear contenido nuevo para no incurrir en estos errores y así evitar tener que solucionarlos luego.
Dominio duplicado
Es posible que no hayamos indicado a nuestro servidor la versión el dominio que queremos usar. Si esto ocurre, nuestra web funcionará con www o sin las tres w, funcionará con https o sin el certificado de seguridad, etc.
Lo más apropiado es elegir bien cuál va a ser nuestro único dominio y evitar que el resto de versiones estén activas.
Filtros de productos
Los filtros de los productos de los ecommerce crean urls constantemente, esto hay que tenerlo controlado, y evitar que Google entienda esto como contenido duplicado.
No está mal tener filtros, pero sí hay que configurarlo todo correctamente para que entienda como única o válida la página original del producto, que además es la que nos interesará posicionar.
Localización mal etiquetada
El tema de idiomas es complejo si no se entiende bien desde la raíz. Si se utiliza el mismo contenido para distintas regiones o zonas donde se hablen el mismo idioma, puedes tener un problema, o incluso si está traducido.
Es conveniente usar etiquetas hreflang para indicar a Google que es contenido para otras zonas geográficas.
Etiquetas, archivos o categorías
Si no tenemos cuidado, a la hora de etiquetar, categorizar o crear archivos en los blogs, podemos tener problemas con el contenido duplicado, ya que si, por ejemplo, etiquetamos 4 artículos con dos etiquetas diferentes, las url de las etiquetas mostrarán los mismos 4 artículos, lo que sería contenido duplicado, ya que ambas etiquetas muestran lo mismo.
Desde La Biznaga Digital recomendamos ser lo más específicos posibles a la hora de categorizar entradas de blog.
De esta manera no repetimos e incurrimos en este tipo de errores muy comunes.
Paginaciones
Las paginaciones generan muchos problemas de contenido duplicado en las empresas ya que crean muchas urls con contenido similar.
Evita las paginaciones o etiquétalas muy bien para que Google entienda que no es contenido duplicado, de esta manera te ahorrarás problemas.
Os dejamos un vídeo sobre paginaciones muy interesante.
Fichas de productos
Hay que tener cuidado a la hora de escribir las fichas de producto, ya que si, por ejemplo, copiamos la descripción de nuestro proveedor, es probable que estemos copiando, sin saberlo, a algún competidor nuestro, ya que el proveedor habrá vendido más unidades de su producto.
También suele pasar que productos actualizados se analizan como contenido duplicado, ya que las diferencias con respecto a la anterior versión son escasas.
Asegúrate bien de escribir siempre contenido auténtico, ya que es la mejor solución para evitar problemas.
Parámetros en url
Muchas urls tienen parámetros en su dirección, y esto se debe a una búsqueda realizada o un filtro implementado.
Asegúrate de configurar bien el CMS, plugin o herramienta para que no caigas en un problema de duplicidad de contenido.
Corregir contenido duplicado SEO
Una vez que sabemos las causas, y detectados los problemas de duplicidad de contenido, vamos a corregir o solucionar los problemas originados.
Original
Una de las mejores soluciones para corregir los problemas causados por la duplicidad de contenidos, es escribir siempre el contenido más original que podamos.
Ya sea la descripción de un producto, una pagina de localización o un artículo del blog. Escribir contenido único y original siempre será la mejor opción, y eso Google sabe recompensarlo.
Canonical
Escribir la url canonical es decirle a Google qué página es la “importante” u “original”, y la que debe de recibir toda la autoridad.
Esto quiere decir que si tenemos paginaciones, la canonical será siempre la página 1, o si tenemos filtros, la url canonical será siempre la del producto original, o si tenemos varias urls parecidas y la de más valor es una de ellas, podemos poner en el resto de url, que la canonical sea la que nosotros queramos.
No index
Otra opción para evitar problemas de duplicidad de contenido, es evitar que Google indexe las páginas.
De esta manera no tendremos indexadas páginas que no nos interesan que aparezcan en los resultados de búsqueda.
Redireccion 301
Una opción muy viable es crear redirecciones 301 para todas aquellas páginas que no nos interesen. De esta forma, al visitar una web, el robot de Google se irá inmediatamente a la url que sí queremos posicionar.
Además por normal general, las páginas con redirecciones 301 no suelen estar indexadas, por lo que un problema menos.
Robots.txt
También podemos mandar una directiva a los robots directamente, e indicarles que no accedan a ciertas partes o contenidos de nuestra web.
Así podemos decirle a Google que no queremos que se pasee por las páginas de autor, de login, etc…
Eliminar página índice
Hay varias maneras de retirar páginas del índice de Google.
Una es usando su herramienta de retirada, que podemos indicar a Google que la retire durante un tiempo limitado de 180 días, tenéis más información sobre cómo usar esta herramienta haciendo clic aquí -> Herramienta de retirada.
También debéis hacer un “redireccionamiento” 410 Gone. De esta manera Google sabe que esa url o contenido no estará disponible, y en un tiempo (Google no dice cuánto) se acabará eliminando.
Google pone a tu disposición una página de ayuda en la que puedes retirar contenido e ir paso a paso para informar de su retirada.
El enlace a esta página de ayuda lo puedes encontrar aquí -> Página ayuda retirar contenido de Google
Reescribir contenido
Otra manera de solucionar problemas de contenido duplicado, es reescribir los contenidos para hacerlos lo más diferentes posible.
Recuerda cambiar sobre todo los puntos críticos SEO como url, title, metatitle, descripcion, etiquetas H1, H2, etc…
De esta manera, Google sabrá, gracias al contenido nuevo y las distintas etiquetas, que el contenido es original y no está copiado de otro.
Denunciar en Google
Google tiene una herramienta de ayuda legal que facilita las denuncias por contenido duplicado que vulneran la ley.
Google pone a disposición una herramienta de retirada de contenido por una infracción de propiedad intelectual como el plagio.
Puedes entrar al formulario pinchando en el enlace siguiente -> Formulario de retirada contenido Google