Tenemos a nuestra disposición múltiples herramientas que detectan y localizan enlaces rotos internos de nuestros sitios web. Sin embargo, los enlaces entrantes rotos («backlinks«), que apuntan a una página desde el exterior, requieren procesos indirectos para ser detectados; básicamente, rastrear todos los sitios web de Internet. Aunque existen herramientas especializadas para ello, la Consola de Búsqueda de Google también puede ayudarnos.
Tiempo medio de lectura: 5 min (1.500 palabras).
Si no tienes tiempo ahora, puedes saltar directamente al resumen del artículo.
Tabla de contenidos
- ¿Se pueden detectar los enlaces entrantes rotos?
- Utilizando Google Search Console
- Resumen
- Actualización (04/12/2015): Google no lo rastrea todo

¿Se pueden detectar los enlaces entrantes rotos?

En el artículo de análisis de herramientas de detección de enlaces rotos, vimos que todas se limitaban a detectar enlaces internos o salientes rotos; esto es, los enlaces que hay en nuestro sitio web. Sin embargo, ¿qué ocurre con los enlaces entrantes rotos, aquellos que están en otro sitio web y apuntan a una página inexistente en nuestro sitio web?
Para este caso, no existe una solución directa: la única forma de detectar todos los enlaces entrantes rotos a una web es buscándolos en todos los sitios webs existentes. Evidentemente, es una hazaña imposible: no podemos rastrear todos los sitios webs de Internet… ¿O sí? Quizás no todos, pero sí un importante número es lo que precisamente hace un motor de búsqueda, como Google o Bing. Y, en el caso de Google, su herramienta Search Console (o Consola de Búsqueda, antigua Webmaster Tools) nos puede ayudar a detectar enlaces entrantes rotos.
En este punto, un inciso. A decir verdad, no sólo podemos valernos de las herramientas de un buscador para detectar enlaces entrantes rotos. También existen herramientas alternativas (como Majestic SEO o Web Me Up) que también rastrean la Web, pero que están optimizadas para detectar enlaces rotos entre sitios web. Sin embargo, no suelen ser gratuitas o tienen limitaciones, pero ese sería tema para otro artículo…
Volviendo a la Consola de Búsqueda de Google, también nos permite detectar enlaces rotos internos y salientes. Sin embargo, no tenemos control alguno sobre el rastreo: éste se realiza cuando Google decide, se rastrean las páginas que Google decide y se siguen los enlaces que Google decide.
Puede parecer arbitrario, pero no hay que olvidar que el algoritmo de rastreo de Google está optimizado para indexar el contenido, no para detectar enlaces rotos. Es imposible saber a priori cuándo el rastreador seguirá el enlace de una página. Por estos motivos, no es la mejor herramienta para estos tipos de enlaces. Por otro lado, tampoco queremos que sea Google quien nos diga que tenemos enlaces rotos en nuestro sitio, ¿verdad? 😉
Para los enlaces entrantes rotos, la situación se repite: el rastreo depende sola y exclusivamente del algoritmo de Google, aunque al menos tenemos la certeza que se realiza con cierta frecuencia (aunque pueda ser incluso de semanas).
Utilizando Google Search Console

Hacer pruebas con esta herramienta es algo más complicado que los enlaces internos y salientes. No es tan simple como crear un enlace roto desde otra web: hay que esperar que Google rastree esa página y que tenga la feliz idea de seguir ese enlace. Lo que puede ser días, semanas o…
Pero la fortuna se puso (parcialmente) de mi parte. Después de publicar el artículo anterior, el rastreador de Google detectó un error en un enlace entrante a mi web. No es un enlace roto, pero el mecanismo de detección es el mismo y lo puedo utilizar como ejemplo (a este respecto, poco después de publicar este artículo, la consola de búsqueda detectó un enlace roto entrante «real»; lo he recogido y documentado en la actualización al final de este artículo).
1. Al entrar en la consola de Búsqueda, el panel de control muestra que hay un error en el sitio:
2. Pinchando en la doble flecha “>>” y después en la pestaña “Otros”, se muestra una descripción del error:
Por lo que parece, una o más páginas están enlazando al fichero “xmlrpc.php” (¿para qué?). Quizás la causa del error sea que ese fichero está protegido (consejo de seguridad que los expertos recomiendan). Sigamos mirando…
3. Pinchando sobre la fila del enlace que ha producido el error, se muestra el detalle del error:
Ajá, el error se detectó dos días atrás y hay una pequeña explicación del error. Pero, lo que es más importante, ¿desde dónde se enlaza a este fichero?
4. Nada más fácil. Pinchando en la pestaña “Enlazada desde”:
Y ya tenemos identificados los enlaces entrantes rotos (bueno, en este caso no son enlaces rotos, pero el proceso para detectarlos es exactamente el mismo). Ahora solo falta buscar la forma de resolverlos, ya sea mediante redirecciones 301 o, si existe esa posibilidad, pidiendo a la Web de origen que corrija el enlace, que lo quite, o incluso no hacer nada. Dependiendo de la calidad del enlace, se optaría por una opción u otra.
Resumen
El proceso para detectar enlaces entrantes rotos con la Consola de Búsqueda de Google es un poco engorroso, poco automatizable y a poco que el sitio web sea de tamaño medio, con una buena arquitectura de enlaces, sería un proceso inmanejable en la práctica. Como con los enlaces internos o salientes, para sitios webs grandes hay que plantearse utilizar algunas de las herramientas optimizadas para este proceso.
Sin embargo, sea con la Consola de Búsqueda de Google o con herramientas especializadas, la dinámica para detectar backlinks rotos varía con respecto a los enlaces internos en dos aspectos fundamentales:
- Falta de inmediatez. No podemos detectar los backlinks rotos «cuando queramos». El rastreo de los backlinks no se realiza cuando nosotros lo pedimos, como así sucedía con la detección de enlaces internos rotos, sino que se realiza periódicamente bajo las directrices que el proveedor de la herramienta considera óptimas para su algoritmo. Por tanto, sólo podemos ver los resultados del último rastreo, aunque normalmente no deberían de ser más que unas pocas horas de retraso.
- Resultados incompletos. Por ese mismo motivo, es imposible garantizar que obtengamos todos los backlinks rotos. No sólo porque alguno haya podido romperse desde el último rastreo, sino porque el sitio web que contiene el enlace no está en la base de datos del proveedor y, por tanto, no lo rastrea (aunque poco debería preocuparnos esto: si no está en sus bases de datos debe de ser, es que tiene bastante poca relevancia).
Google no lo rastrea todo (actualización, 04/12/2015)
Poco después de terminar este artículo, la Consola de Búsqueda mostró un error de rastreo debido a un enlace roto. En el poco tiempo que estuvo activa la página de prueba mientras hacía el análisis de herramientas de detección de enlaces rotos, el rastreador de Google llegó a indexarla (aunque no lo mostró hasta al menos un día después).
Muestro a continuación las sucesivas pantallas de la Consola de Búsqueda hasta localizar la ubicación del enlace roto:
1. La Consola de Búsqueda muestra un error de rastreo “No se encuentra” (el error “Otros” es el del fichero “xmlrpc.php”, que lo he dejado como recordatorio para investigarlo en cuanto tenga un poco de tiempo):
2. Pinchando en la doble flecha “>>” de los Errores de rastreo, se puede ver que hay un error 404 (“recurso no encontrado”) para la dirección “no-existe/”. Este fue precisamente uno de los enlaces que puse en la página de prueba:
3. Pinchando sobre la fila del enlace, se obtiene más información sobre el error. En efecto, Google confirma que esa página no existe:
4. Pinchando ahora en la pestaña “Enlazada desde”, se puede ver en qué página(s) se encuentra el enlace roto. Como era de esperar, es la página de pruebas:
El rastreador de Google detectó uno de los enlaces rotos internos de la página de prueba, pero… esta página tenía dos enlaces rotos: uno interno y otro saliente; sin embargo, el rastreador no ha detectado el saliente. La propia Google nos avisa en esta última pantalla, con un elocuente “Puede que no aparezcan todas las URL”. Esto nos confirma que, con esta herramienta, nunca tendremos la certeza de haber detectado todos los enlaces entrantes rotos, ni siquiera los internos o salientes. Después de todo, el rastreador de Google está optimizado para indexar y asignar rankings, no para localizar enlaces rotos.
¿Qué te parece la Consola de Búsqueda de Google como herramienta para detectar enlaces entrantes rotos? Hay otras alternativas, sí, ¿pero crees que tienen la misma cobertura que el rastreador de la todopoderosa Google? La pregunta que me queda es… ¿sabe alguien porqué hay tres sitios webs, todas de estadísticas sobre webs, que tienen un enlace a mi fichero xmlrpc.php?
Imágenes: rgbstock, elaboración propia.