¿Se puede indexar su sitio web si bloquea la búsqueda de los rastreadores?

¡El rastreo y la indexación son dos cosas diferentes! Sí, parte del contenido de su sitio web aún puede indexarse. Si bloquea los rastreadores utilizando su archivo robots.txt, esto controla el rastreo y no la indexación. Si otro sitio se ha vinculado a su sitio web, un rastreador puede rastrear ese enlace e indexar esa página en su sitio. Si no desea indexar ciertas páginas, debe colocar una etiqueta de meta robots en cada página con noindex. Bloquear rastreadores no es la forma correcta de no indexar contenido.

Esto es directamente de Google, “No debe usar robots.txt como un medio para ocultar sus páginas web de los resultados de la Búsqueda de Google. Esto se debe a que otras páginas podrían apuntar a su página, y su página podría indexarse ​​de esa manera, evitando el archivo robots.txt. Si desea bloquear su página de los resultados de búsqueda, use otro método como protección con contraseña o etiquetas o directivas noindex “.

Aprenda acerca de los archivos robots.txt

¡Espero que esto ayude!

Difícilmente es posible bloquear los rastreadores buscando tu sitio. Puede usar robots.txt para decirles que no indexen su sitio, pero si quieren indexarlo, simplemente continuarán, incluso si intenta bloquear tanto como sea posible los diferentes rastreadores, aún pueden usar servicios como Proxy Rastreo: proxy de rastreador anónimo para evitar las protecciones de su servidor y aún rastrear su sitio.

Entonces, si desea asegurarse de que su sitio no se rastree, lo mejor es protegerlo con contraseñas, moderación del usuario u otro tipo de protección.

Su sitio web se indexa una vez que un rastreador lo visita. Por lo tanto, si bloquea los rastreadores, no está indexado.

Puede encontrar este artículo interesante: Uso de Noindex, Nofollow HTML Metatags: Cómo decirle a Google que no indexe una página en la búsqueda