¿Web muerta en Google? Aprende cómo indexar tu Sitemap paso a paso

Escrito por:
Pedro Amador
Ver contenido del artículo ▼
¿Has trabajado en la creación de contenido de calidad y, sin embargo, tu tráfico sigue estancado? Esto es más común de lo que parece y, en muchos casos, el problema no está en el contenido, sino en la forma en que el buscador Google lo interpreta y almacena. Si tu web no está correctamente indexada, es como si no existiera en el buscador.
En AutoridadOnline, sabemos que incluso una web con años de existencia puede quedar en el olvido digital si no se gestiona correctamente. Por eso, en este artículo, vamos a mostrarte paso a paso cómo revivir una web dormida con más de 5,000 artículos que hoy son prácticamente invisibles en Google. Pero antes de comenzar, es crucial entender tres conceptos clave que muchas veces se confunden:
Rastrear, Indexar y Construir Autoridad: ¿En qué se diferencian?
El proceso de aparecer en Google no se limita a subir contenido y esperar tráfico. Hay tres fases esenciales que definen la visibilidad de una web en el buscador:
- Rastrear (crawl): Es cuando los bots de Google (o de otros motores como Bing y Yandex) visitan tu sitio para descubrir qué páginas existen. Piensa en estos bots como exploradores que recorren una biblioteca para ver qué libros hay disponibles. Aquí el fichero robots.txt, que mencionamos en otro artículo, tiene mucho que aportar en el proceso.
- Indexar (index): No todo lo que Google rastrea lo almacena en su base de datos. La indexación es el proceso mediante el cual decide qué contenido es relevante y debe aparecer en los resultados de búsqueda. Siguiendo con el ejemplo, sería cuando la biblioteca decide registrar ciertos libros en su catálogo para que los usuarios puedan encontrarlos.
- Construir Autoridad: Una vez que Google indexa tu contenido, el siguiente desafío es lograr que lo considere confiable y relevante frente a la competencia. Esto se traduce en posiciones más altas en los resultados de búsqueda y, a largo plazo, en mayor tráfico cualificado. En el mundo real, es como cuando una librería destaca ciertos libros porque sabe que tienen más valor para sus clientes.
Este artículo se enfocará en los dos primeros pasos: cómo asegurarnos de que Google rastree correctamente nuestra web y cómo garantizar que indexe lo que realmente debe indexar. Muchos sitios acumulan problemas de rastreo e indexación, ya sea por mala configuración, errores técnicos o la presencia de páginas innecesarias generadas por plugins obsoletos.
Si has notado que tu web no aparece en Google como debería, este es el punto de partida para recuperar su visibilidad.
¿Por qué es vital indexar correctamente tu sitemap?
Un sitemap es como el mapa de carreteras que guía a Google sobre qué rutas debe seguir para encontrar todas las páginas importantes de tu web. Una web que lleva años sin mantenimiento probablemente tiene cientos o miles de páginas que Google ignora por completo o ha dejado de rastrear. Para que esas páginas vuelvan a la vida, es clave que Google vuelva a descubrirlas e indexarlas de manera eficaz.
NOTA: Desconfía de los plugins que hacen todo automáticamente y te dicen que tu web va a funcionar perfectamente con los buscadores. No revisar cómo el Google Search Console ha indexado las webs tras recibir la información de los plugins puede ser motivo de sustos. He visto más de un error catastrófico con famosos plugins como el RankMath o el Yoast SEO.
Ejemplos de sitemaps incorrectos
Lo primero que debemos hacer es acceder a Google Search Console y dirigirnos al apartado de Sitemaps, ubicado en el menú lateral izquierdo. Lo habitual es que una web cuente con un único archivo sitemap.xml, bien estructurado y sin errores. Sin embargo, cuando la web nos dicen que no funciona, es habitual encontrarnos algunas configuraciones en el sitemap (que deberá apuntar en el fichero robots.txt que dejamos para otro artículo).
Ejemplo de Sitemap incorrecto
En la imagen siguiente, observamos una situación típica de desorden en los sitemaps. Por un lado, aparece un sitemap.xml con errores, lo que indica que Google no ha podido leerlo correctamente, impidiendo la correcta indexación de las páginas incluidas en él. Por otro lado, hay un sitemap_post_3.xml, el cual ha sido procesado correctamente y contiene 1,000 URLs indexadas. Parece que han ido incluyendo varios sitemaps con el tiempo, lo que puede derivar en una indexación parcial e inconsistente.
Otro ejemplo de sitemap incorrecto
En este caso, podemos ver un problema común en Google Search Console: el sitemap de Pedro Amador ha sido enviado correctamente, pero aparece con el estado “No se ha podido obtener”, lo que indica que Google no ha podido acceder al archivo.
Esto significa que ninguna página del sitio está siendo descubierta a través del sitemap, lo que puede afectar significativamente la indexación y el posicionamiento en los resultados de búsqueda. .
Cómo borrar un sitemap no válido
Algunas veces no parece sencillo borrar los sitemap incorrectos, porque cuando damos a la opción de los tres puntitos, no nos permite borrar directamente el sitemap, Vemos en la siguiente pantalla que no aparece la opción de borrar el sitemap.
Si de verdad quieres borrar el sitemap tienes que hacer clic en el sitemap y se abre el mismo con la información. Ahora sí te saldrá la opción en el menú de tres puntitos de “Quitar Sitemap”.
¿Cómo sabe el buscador dónde está el sitemap?
En todas las webs existe un fichero llamado robots.txt que le facilita al buscador saber qué puede y qué no puede indexar, e igualmente le ofrece el sitemap.xml con la información de lo que queremos indexar.
Para el caso de AutoridadOnline, basta con comprobar en https://www.autoridadonline.com/robots.txt y veremos que aparece el sitemap en la URL: https://www.autoridadonline.com/sitemap.xml
Si no tenemos el Sitemap creado, te recomiendo que analices para tu plataforma, pues cada plataforma, sea WordPress, PrestaShop, Wix, etc, tienen su propia forma.
¿Qué herramientas utilizar para generar un sitemap?
Dependiendo del CMS (gestor web) o plataforma en la que esté construida tu web, puedes utilizar distintas herramientas para generar un sitemap actualizado y funcional:
- Para WordPress: cuentas con plugins como Rank Math SEO, Yoast SEO o All in One SEO, entre otros.
- Para tiendas online (PrestaShop, Shopify, WooCommerce, Magento, etc.) tienes Google XML Sitemap o Módulos específicos del CMS
- Para sitios estáticos o personalizados, Screaming Frog que permite exportar un sitemap XML, XML-Sitemaps.com (generador online)
- Generadores de sitemaps en Python o PHP personalizados
Aquí sólo te listamos algunas habituales, no pretendemos hacer una análisis de cuál es mejor.
Pasos para dar de alta el sitemap
Bien, ya tenemos nuestro sitemap creado, así que a continuación, te mostraremos paso a paso cómo realizar este proceso con casos reales: una web con más de 5000 artículos periodísticos que, actualmente, está casi “invisible” en Google y otra que actualmente está mal indexada.
Analizar el estado actual del Sitemap
Puede parecer algo básico, pero es más común de lo que se piensa: configuramos el sitemap.xml cuando iniciamos un proyecto web y luego, con el tiempo, simplemente nos olvidamos de él. La web sigue creciendo, se publican nuevos artículos, se instalan plugins, se realizan cambios en la arquitectura… y un día, sin previo aviso, el sitemap deja de funcionar o desaparece. En AutoridadOnline, verificamos esto constantemente en nuestros clientes, pero es un problema frecuente en sitios que no cuentan con una estrategia de autoridad activa.
Si tu web está perdiendo tráfico y sospechas que Google ha dejado de indexarla correctamente, lo primero que debes hacer es comprobar el archivo robots.txt. Busca la línea donde se indica la ubicación del sitemap y pruébala en el navegador. Si no carga correctamente o devuelve un error, hay un problema que debe resolverse de inmediato.
Por ejemplo, aquí te muestro un error… ¡no se puede acceder al índice de la web!
Esto ocurre porque simplemente no hemos configurado el sitemap.xml, no tenemos un plugin que lo genere, o tenemos algún problema de seguridad que hace que se bloquee el fichero. ¡Empiezan las cuestiones técnicas que hay que resolver!
En este caso había apagado el plugin que genera el sitemap para que vieras el error.
Te comparto algo errores comunes que pueden impedir el acceso al sitemap.xml:
- Sitemap inexistente: No se ha configurado correctamente o el plugin que lo generaba ha sido eliminado.
- Errores en robots.txt: El archivo robots.txt impide al buscador acceder al sitemap o no lo referencia correctamente.
- Restricciones del servidor: Algunas configuraciones de seguridad (en los plugins) pueden bloquear el acceso al archivo, lo que impide que los motores de búsqueda lo lean.
- Errores HTTP (403, 404, etc.) específicos que aparecen al intentar acceder al sitemap.
- Sitemap mal estructurado: Errores en el formato del archivo XML pueden hacer que Google no lo procese.
- Problemas de permisos: El archivo sitemap.xml tiene restricciones en el servidor que impiden su acceso público.
Enviar el sitemap a Google Search Console
Ahora desde Google Search Console (o el Bing Webmaster Tools, Yandex Webmaster, …) probaremos a añadir el sitemap que ya hemos testado previamente y que sabemos, que aparentemente, es accesible y funciona.
Si todo ha ido bien, tendremos un mensaje parecido a:
Se ha enviado el sitemap correctamente: Google lo procesará de forma periódica para saber si se ha modificado. Si detectamos algún problema, recibirás una notificación.
Si aparecen los primeros errores, habrá que ir analizando error, y en este caso, el buscador de Google, o tu GPT favorito pueden ayudarte a resolver la incidencias que te vayas encontrando. Lo ideal es borrar todos los errores, pero tampoco hay que desesperarse si alguna página da error.
Análisis de cobertura en GSC
El 80% de las expertos SEO que me he encontrado (si estás leyendo esto sabrás que escribimos desde el ámbito de la autoridad digital, no desde el SEO), una vez enviado el fichero y visto el primer correcto… ¡ya han dado su trabajo por terminado). Y ahora es donde, después de unas horas o días, empieza “el salseo”, ¿qué está indexando realmente Google?
Veamos el siguiente ejemplo, ¡parece correcto con más de 5.500 páginas descubiertas!
Es más, si hacemos clic en el sitemap veremos que nos aparece información que nos puede tranquilizar (como habrás podido comprobar ya, oculto el nombre de la web por privacidad).
Cómo interpretar los resultados correctamente
Una cosa es lo hayamos puesto en el sitemap.xml, que debería ser cómo el índice de nuestro sitio web. Otra cosa es el primer rastreo que hace el buscador Google al incluir nuestro sitemap. Y la última cosa, y más interesante, es ver qué está realmente indexando de todo lo que damos. Aquí es donde es muy importante ver la indexación de páginas que realiza.
Pulsando en “Ver la indexación de páginas“, veremos que las 5.519 descubiertas (rastreadas)… ¡apenas han sido indexadas 660!
En estos momentos, es donde debemos ir error a error y probar en la herramienta de inspeccionar de GSC qué está pasando. Tarea que puede llevar bastante tiempo si la web está mal, o digámoslo de otra forma, “si la web no está maquillada como al buscador le gusta”.
El que tengamos nuestro primer sitemap indexado correctamente es la clave para empezar a tener éxito.
Seguimiento y optimización continua
Como hemos visto, asegurar de enviar el primer sitemap es solo el primer paso. Ahora toca un trabajo continuo Una estrategia efectiva de indexación requiere monitoreo constante y ajustes estratégicos basados en la información que nos proporciona Google Search Console (GSC).
Cómo utilizar GSC para mejorar la indexación
Dentro de GSC, en la sección de Cobertura de Indexación, podemos encontrar métricas clave como:
- Páginas descubiertas, pero no indexadas: Indican que Google ha rastreado la URL, pero por alguna razón no la ha incluido en su índice. Puede deberse a baja calidad del contenido, problemas técnicos o falta de autoridad.
- Páginas excluidas: Aquí podemos ver URLs con etiquetas noindex, bloqueadas por robots.txt, duplicadas sin canonical, entre otros factores que impiden su indexación.
- Errores de rastreo: GSC nos alertará si hay problemas técnicos que impiden el acceso a ciertas páginas.
En general si notas que ciertas páginas no se indexan, realiza una auditoría del contenido y enlazado interno. Prueba la herramienta de inspección de URL en GSC para ver cómo Google ve tu página y, si es necesario, solicita la indexación manualmente.
Este proceso, además, lo puedes aplicar en otros motores de búsqueda como Bing y Yandex, ya que la lógica detrás es muy similar.
Construcción de Autoridad post-indexación
Una vez que asegures que tienes el rastreo y al indexación correcta, es cuando comienza el trabajo de autoridad… que te contamos en distintos artículos.
Ideas finales
Recuerda: indexar un sitemap correctamente es como entregarle a Google un mapa actualizado y claro de tu sitio web. Solo así podrás asegurar que cada página reciba la atención y valoración que merece, impulsando tu Autoridad Digital y garantizando que tus contenidos se posicionen en los resultados de búsqueda.
Si después de seguir estos pasos aún tienes dudas o necesitas ayuda para optimizar tu estrategia digital, en AutoridadOnline estamos disponibles para ayudarte a posicionar tu negocio. ¡Contáctanos!