Cómo hacer una auditoría de enlaces

El objetivo de este artículo es ser capaz de entender y detectar los problemas de link building que puede tener un sitio web. Este tutorial es una guía de trabajo para explicar cómo se puede hacer un análisis de enlaces entrantes con SISTRIX usando a la web de edreams.es como ejemplo. Es una simple auditoría de backlinks de las cosas que se ven desde fuera sin conocer a la empresa auditada y sus vicisitudes intrínsecas.

Seguramente todo lo que se diga aquí ya lo tienen o lo han tenido en cuenta internamente en algún momento. Conozco de primera mano que es difícil gestionar proyectos tan grandes, con deuda tecnológica, equipos multitudinarios y prioridades internas tan dispares, por lo que no pretende ser ninguna crítica.

Ya sea porque te contratan para limpiar una penalización por enlaces o simplemente te lleves una sorpresa auditando un sitio, llega el momento de analizar un perfil de backlinks.

En este tutorial vamos a analizar el site edreams.es imaginando que estuviéramos empezando un proyecto de revisión de los mismos paso a paso.

SISTRIX es una muy buena herramienta para realizar este estudio ya que cuenta con una de las bases de datos más grandes de links desde la integración con Majestic. Existe el falso mito que no es así, pero os animo a probarlo por vosotros mismos. Es más, SISTRIX no limita funcionalidades como otras herramientas.

Además, de SISTRIX me gusta que ordene los enlaces externos según el índice de visibilidad del host, que de alguna forma un indicador de los dominios que Google considera dignos de confianza.

Siempre se dice que el mejor link es el que tiene tráfico (a parte de ser temático), por lo que este indicador es muy útil para encontrar links de poco valor si ordenamos de menor a mayor visibilidad en el informe de Links:

Edreams links list es

Y también es útil para encontrar sitios interesantes donde publicar contenido como veréis en este artículo si ordenamos de mayor a menor visibilidad.

La importancia de los enlaces para SEO

Cuando hacemos una búsqueda en Google, en realidad no hacemos una búsqueda en internet, estamos buscando en el índice de Google. El índice de Google es como el índice de una biblioteca, donde podemos encontrar todos los libros que existen en ella.

Google trata de tener toda la información existente y clasificarla de modo que alguien la encuentre cuando realiza una búsqueda. Para cada búsqueda, Google puede contener de miles a millones de resultados posibles, pero trata de organizarlos en base a lo relevantes y útiles que sean.

Resultados indexados google serp

Existen aproximadamente 27.300.000 resultados en Google para la búsqueda “qué visitar en valencia”

Una de las formas que tiene Google de conocer todas las páginas web que existen es siguiendo los enlaces, también llamados hipervínculos o “links”, que hay dentro de ellas. Lo consigue mediante unos robots rastreadores, también conocidos como “spiders” o “crawlers”. A esta primera fase se le conoce como rastreo o “crawling”.

Bot spider crawler google

Ilustración que representa el proceso de rastreo. Fuente.

Una vez Google ha encontrado una página web, guarda y clasifica en un índice el contenido de la misma (a menos que se lo impidamos con métodos que existen para ello) de forma que pueda ser recuperada después. Este sería la segunda fase y se la conoce como indexación o “indexing” (más información aquí).

La tercera y última fase sería la clasificación o “ranking”. Como hemos mencionado antes, Google trata de mostrar la información más relevante y útil para cada búsqueda y para ello tiene que decidir cómo clasificar los resultados que tiene indexados. Esto lo consigue con numerosos algoritmos entre los que tiene en cuenta factores como si el contenido existe en la página, si la página es fácil de usar, la localización, lo importante y confiable que sea esa página entre otros.

Para decidir la importancia de una página usa el PageRank o PR. El PR es un valor numérico que representa la importancia de una página en la web. Cuando una página enlaza hacia otra, estaría emitiendo un voto hacia ella.

Page rank diagrama

Grafo que representa la importancia de cada página web (círculos) según los enlaces que recibe (flechas). Fuente: elaboración propia usando la fórmula original del PageRank para el cálculo

El PR está considerado uno de los factores más importantes que determina el ranking de una página en los resultados de búsqueda. Lo comenta un responsable de Google en el minuto 30:20 de este vídeo:

Video - Cómo hacer una auditoría de enlaces

Es por ello que cuantos más votos se tenga una página, más importante debe de ser y los votos que emita valdrán más. En resumen, Google calcula la importancia de una página a partir de los enlaces recibidos.

Además, los buscadores como Google tienen en cuenta el texto de anclaje o “anchor text” de un enlace para entender de qué trata una página. El texto de anclaje sería el texto clicable de un enlace, veamos dos ejemplos:

  1. Vista nuestra web para comprar entradas para el teatro.
  2. Vista nuestra web para comprar entradas para el teatro.

El segundo texto de anclaje es mucho más relevante e indica a los buscadores de qué trata la página destino, lo cual le ayuda a clasificarse mejor por esos términos cuando alguien busque “comprar entradas para el teatro” en Google.

Buenas y malas prácticas de link building

Como los enlaces tienen un peso muy importante en la clasificación de las páginas web, es algo que se ha intentado manipular artificialmente por parte de los propietarios de éstos sitios.

"En Internet, hay muchos sitios web con contenido fraudulento que tratan de posicionarse en los primeros sitios de los resultados de búsqueda mediante técnicas fraudulentas, como repetir palabras clave constantemente o comprar enlaces que mejoren la clasificación de PageRank.

Además, estos sitios ofrecen una experiencia de usuario muy pobre y es posible que causen daños o engañen a los usuarios de Google. Por este motivo, diseñamos algoritmos que identifican el spam y retiran de los resultados de búsqueda los sitios web que infringen las directrices para webmasters de Google."

Fuente: Cómo funciona la búsqueda de Google

Por esa razón, Google desarrolló algoritmos como Google Penguin (ya integrado en el core) que intentan encontrar estos patrones artificiales (esquemas de enlaces) y penalizan a las páginas que participan en ellos. Dentro de los esquemas de enlaces tenemos:

  • Enlaces creados con el objetivo de manipular el PageRank, ya sean pagados o no.
  • Enlaces con texto ancla optimizado.

Para evitar que nuestro sitio sea penalizado por participar en un esquema de enlaces, Google creó un atributo llamado “nofollow” (o "sponsored" para los artículos pagados en medios). Con él le indicamos los enlaces que no queremos que tenga en cuenta para el calculo del PageRank ni para el paso de texto de anclaje.

Más información oficial de Google sobre el “nofollow” aquí:

Ilustremos con un ejemplo cómo se añade el “nofollow” con el siguiente enlace:

Vista nuestra web.

El código que tendría que tener la web para que un usuario o Google viera el enlace anterior sería:

Visita <a href="https://www.visitvalencia.com/">nuestra web</ a >.

Y el enlace anterior con el atributo “nofollow” quedaría de la siguiente forma:

Visita <a href="https://www.visitvalencia.com/" rel="nofollow">nuestra web</>a>.

De ese modo le indicamos a Google que no tratamos de manipular la clasificación con esta acción y, tanto el origen como el destino, no serán susceptibles de recibir una penalización por participar en un esquema de enlaces.

Sin más dilación, vayamos a ver los pasos necesarios para analizar links externos con SISTRIX.

Cómo analizar un perfil de backlinks

Paso 1: Consulta del informe “Links > Resumen” para un primer vistazo general

En esta pantalla tenemos varios informes que nos dan una idea del enlazado externo de un sitio web.

Edreams links overview es

En el informe de “Mejores dominios de referencia” podemos ver en la caso de edreams.es que la mayoría son de medios generalistas con visibilidad (más grande el nombre, más visible es el dominio), de sitios de aplicaciones e incluso la Wikipedia (de estos enlaces que tiene edreams.es de la wiki hablaremos en siguientes puntos).

Edreams links cloud es

Un perfil de enlaces más sospechoso en este punto sería de este estilo:

Twitter.com natzir9 status 1172428408820600832

El informe “Índice de Links profundos” también nos dice bastante. Tener casi un 95% de links profundos es extraño, a priori, en un sitio como edreams con una estrategia de contenidos editoriales muy pobre a mi parecer.

Edreams links depth nofollow es

eDrams.es

No sería tan extraño en un ZARA, que aún sin tener una estrategia de contenidos editoriales, la gente enlaza mucho a los productos y sus imágenes.

Asimismo, sería muy extraño que todos los links fueran contra la home.

El informe “Índice-Nofollow” también nos da una idea de que muy normal no es perfil de enlaces de edreams.es en principio. En las siguientes imágenes podemos ver como el perfil de Skyscanner o Expedia de entrada parece más natural.

Skyscanner links depth nofollow es

Skycanner.es

Expedia links depth nofollow es

Expedia.es

Paso 2: Ver las páginas más enlazadas en el informe “URLs enlazadas”

Como decíamos antes, es sospechoso a priori que en el caso de edreams.es la home no sea la más enlazada:

Edreams links targets es

Si clicamos en el “+” de la URL /viajes/ vemos desde donde se están generando tantos enlaces hacía ahí y es desde opodo.es, que una de las marcas de eDreams ODIGEO:

Edreams board type links es

Lo hace desde un side-wide link en el menú con el anchor “Vuelo + Hotel” que apunta directamente a /viajes/:

Opodo vuelos zurich

Es común que esto sea una práctica normal entre webs del mismo grupo, otra cosa el peso que Google quiera darle o si pueda llegar a considerarlo un Esquema de enlaces según cómo se haga:

Google webmasters answer es

Matt Cutts recomendó incluir estos links entre páginas del mismo grupo sólo en la página principal y no en todas, pero pocos sitios han llegado a ser penalizados por esto. Si fueran links desde decenas de sitios y páginas muy dispares puede llegar a ocurrir, y como comento, ha ocurrido en otros portales.

Aquí podemos ver el origen de los links externos hacia /vuelos/baratos/ que es otra de las páginas internas más enlazada. Parece que vienen de alguna colaboración entre TheFork.com y edreams.es:

Edreams board type links 2 es

Paso 3. Revisión de anchor text en el informe “Textos ancla”

En este informe lo que vemos son los anchors text que se usan para enlazarnos. No existe ningún porcentaje bueno o malo, pero a simple vista se puede ver que han jugado a la “ruleta rusa”:

Edreams links anchor text es

Si clicamos el “+” en vuelos baratos vemos los sitios desde donde vienen esos links:

Edreams board type links 3 es

En un primer vistazo vemos que siguieron una estrategia de enlaces muy agresiva en el pasado según las fechas de los artículos con esos anchors. Nos podemos encontrar, por ejemplo, links desde foros con el anchor “vuelos baratos” de usuarios de recién creación:

Perros forum penality es

Viendo este tipo de links con estos anchors creo que muy probablemente hayan podido recibir una penalización manual por enlaces en el pasado.

Este esquema antiguo se observa para otras URLs como la de "hoteles en barcelona":

Edreams board type links 4 es

Como curiosidad, esas urls de edreams.es incluyen /seo/ en el directorio. Esto es algo bastante gracioso que me encuentro a veces. Suele ocurrir porque desde SEO se pide un desarrollo y en IT le añaden la palabra “seo” al mismo 🙂

En el blog de Google escribieron tras el Penguin una guía de las consideraciones a tener en cuenta a la hora de conseguir enlaces con ejemplos de lo que no se debe de hacer:

Google webmaster blog es

Por lo que muchos de los links conseguidos en aquella época por edreams.es van en contra de sus directrices.

Lo curioso es que esto lo sigo viendo en 2020 y no aprendemos. Os comparto algunos ejemplos de un portal que ha sido penalizado por Google recientemente por hacer este tipo de prácticas:

Image18

Image19 Image20

Estos artículos en el mejor de los casos no ayudan al site a rankear mejor por esas keywords (es tirar el dinero) y en el peor de los casos te puedes llevar una penalización.

Si algún día véis esto y tenéis una manual por enlaces, no tengáis miedo de aplicar un disavow de todos los links de este tipo y pedir una reconsideración.

Cuando tengo que limpiar enlaces externos también uso los que detecta Search Console. Lo que hago es descargármelos todos y analizar los anchors con Screaming Frog. Ya que a día de hoy Search Console no nos deja cruzar esta información. Otra opción para sacar los datos de Search Console es hacer lo que veremos en el punto número 5 con SISTRIX.

Como consejo, a la hora de elegir un anchor text, dejo que el redactor del artículo me enlace como quiera. Sobre los textos ancla me gustaría también romper el mito que existe sobre que los anchors de marca son a prueba de balas. También se puede recibir una penalización por anchors de marca si vienen de sitios sospechosos.

Paso 4. Analiza el máximo número de enlaces posibles “LinkRating”

En este caso yo no tengo acceso al Search Console o Google Analytics de edreams.es, pero podemos conectar Sistrix con otras herramientas para sacar los links de todas las fuentes posibles y no sólo del crawler de Sistrix y de Majestic. Esto lo haremos con LinkRating:

Link rating 2

Como podéis ver, además de poder extraer los enlaces de Search Console y de las referencias de Google Analytics, podemos subir un fichero de Ahrefs, de OpenSiteExplorer, o cualquier otro tipo. De este modo y siguiendo los pasos 1 al 4 de este tutorial, podemos hacer una análisis mucho más exhaustivo:

Link rating

Paso 5: Cómo recuperar enlaces rotos o perdidos y conseguir los de tu competencia

No podemos permitirnos perder enlaces que hemos ganado con el tiempo por cambios históricos en URLs. Si un enlace en un medio puede costar tranquilamente 2.000€, ¿cuánto dinero has perdido por no revisar tus enlaces?

Con SISTRIX podemos recuperar una infinidad de enlaces de una forma muy sencilla y es algo que siempre hago de entrada al empezar un proyecto. Solo con este paso ya amortizas el coste de una auditoría a tu cliente 🙂

5.1 Cómo recuperar tus enlaces rotos por errores 4XX, 5XX, exceso de redirecciones o redirecciones temporales

Esto lo podemos ver en el informe de «Links > Enlaces rotos». En esta página, pulsamos sobre «Verificar disponibilidad» y esperamos unos segundos:

Edreams broken links es

Cuando termine de procesar veremos los enlaces rotos o con otras características:

Edreams broken links overview es

Si usamos el filtro de arriba de «Enlaces rotos», nos dirán las URLs de nuestro portal más enlazadas con un código 4XX:

Edreams broken links 2 es

Este informe prefiero trabajarlo sobre un Sheets para poder filtrar mejor, ya que en SISTRIX de momento no es posible filtrar por más códigos de estado que lo que tenemos en el menú superior (redirecciones 302, más de una redirección o enlaces rotos).

Si no lo hubiera hecho así me habría perdido estos enlaces rotos porque dan error de certificado, por lo que un navegador no es capaz de entrar a ver el estado final, que realmente es un 404.

Edreams broken links ssl es

Gracias a haber filtrado en Sheets vemos que existen enlaces desde la Wikipedia, entre otros orígenes de autoridad, que acaban en un 404:

Edreams wikipedia carnaval tenerife 1

Edreams carnaval tenerife 1

Edreams wikipedia corpus christi 1

Edreams corpus christi 1

Parece ser que tanto el subdominio «fiestas» como «dreamsguide» están mal migrados y son una fuente de enlaces de calidad hacia edreams.es. Creo que sería interesante recuperar el contenido a través de herramientas como Archive.org: https://web.archive.org/web/20110715000000*/http://fiestas.edreams.es/corpus-christi/corpus-christi-en-la-orotava/

O como mínimo hacer una redirección hacia un contenido equivalente en edreams.es.

Otras de las URLs rotas con más enlaces es la de “/ofertas/vuelos/baratos/”:

Edreams links type ofertas vuelos es

Edreams 404 error es

Esta URL tiene su homóloga en https://www.edreams.es/vuelos/baratos/ pero no está redirigida por alguna razón que desconozco (pudo ser una URL penalizada en el pasado que hayan dejado morir pero es mucho suponer).

5.2 Cómo revisar quién te ha quitado un enlace

Ésto lo podemos ver en el informe de «Links> Enlaces perdidos». Se trata de enlaces que antes teníamos y han desaparecido por alguna razón.

Si es un enlace que habías comprado molesta bastante. Es por ello que cuando compro un enlace intento hacerlo con un contrato en el que me aseguren un tipo de enlace y una permanencia mínima, en caso contrario se me tendría que devolver el dinero o incluirlo de nuevo.

Hay medios que te venden enlaces y luego te incluye un nofollow u «ocultan» el enlace con un redirect hacia un directorio bloqueado por el robots.txt.

5.3 Cómo conseguir los enlaces rotos o perdidos de tu competencia

Es tan sencillo como ver los informes los informes de «Enlaces perdidos» y «Enlaces rotos» de SISTRIX con los dominios de tu competencia.

Si vemos una URL con muchos enlaces rotos y en la cual tengamos un contenido similar o que podamos generar, entonces iremos a ver los enlaces para encontrar los orígenes:

Skyscanner links list es

Además, podemos pulsar el filtro «Con alto índice de visibilidad» para filtrar en el caso que fueran muchos y nos quisiéramos quedar con los mejores:

Skyscanner links list 2 es

Una vez visto esto, habría que contactar con ellos para que incluyan un enlace a nuestro contenido homólogo, explicándoles que tienen un enlace que no funciona. En mi experiencia, para hacer este tipo de «outreach» se obtienen mejores resultados si nos hacemos pasar por un usuario normal y no usamos un correo corporativo.

Como consejo a la hora de crear el contenido homólogo, podemos usar de base el extraído de Archive.org.

Conclusión

Hemos visto con SISTRIX cuatro pasos para auditar links de una forma muy sencilla. Si queréis más información sobre cómo funciona el módulo de links os comparto estas guías:

En los siguientes artículos veremos:

Natzir Turrado 17 junio 2020

Compartir

Facebook Linkedin Twitter

Otros artículos

SEO Local para ChatGPT

Foursquare anunció su asociación con OpenAI hace 4 meses para alimentar las búsquedas locales en ChatGPT a través de su Places API. Desde entonces, su base de datos, que incluye más de 100 millones de puntos de interés en más de 200 países, se ha convertido en una de las principales fuentes utilizadas por el […]

Leer más