¿Cómo funciona la web profunda? ¿Por qué Googlebots no puede buscarlo?

Ampliando la respuesta de Mazarovici, la web profunda representa contenido que los robots de búsqueda no pueden rastrear porque están prohibidos por robots.txt o la etiqueta de meta robots (como lo ha descrito Mazarovici) o son físicamente incapaces de acceder a los datos.

Hay varias razones por las cuales este puede ser el caso. Aquí hay algunos que vienen a la mente:

El contenido está protegido por contraseña
El contenido vive en bases de datos no rastreables y solo está disponible a través del motor de búsqueda del sitio
El contenido se obtiene dinámicamente a través de JavaScript
El contenido es huérfano (en realidad, nada lo vincula)
El contenido vive en objetos Flash

Estoy seguro de que hay otras razones.

Algo sobre lo que su pregunta no preguntó pero que está recibiendo mucha atención en estos días es la darknet (también llamada dark web). Esto se refiere más comúnmente a los sitios .onion que viven en la red Tor. Tor es en realidad un acrónimo de The Onion Router, que es un sistema de anonimato que protege las direcciones IP del visitante del sitio, así como el sitio para que ninguno pueda ver al otro.

Me imagino que Google y Bing son perfectamente capaces de rastrear estos sitios (como otros lo son … Digital Shadows recientemente lanzado con esta capacidad), pero sería una experiencia horrible para un buscador desconocido en un motor de búsqueda importante hacer clic en un sitio .onion si no estaban usando un navegador Tor.

También hay implicaciones legales, ya que hay mucho contenido en la red oscura al que es ilegal acceder o descargar.

BotsBúsquedaBúsqueda de GoogleDeep WebGoogleMotores deweb

Related Content

¿Es posible ser contratado como agente encubierto para investigar la web profunda?

¿Cuáles son los sitios web más extraños / extraños / diferentes en Internet?

¿Cómo se formaron la Tierra y otros planetas? ¿Se formaron planetas en Situ? ¿Qué determinó las diferentes capas profundas de los planetas solares?

¿Cómo se crean los sitios web profundos?

¿En qué consiste específicamente la web profunda?

¿Algunas cosas desconocidas encontradas en la web profunda?

¿Cuáles son los mejores flashes Speedlite (flashes externos) de menos de 10k para Canon dslrs?

La Deep Web está representada por la parte de la web que no está indexada en ningún motor de búsqueda público.
Se llama “profundo” porque tendría que buscarlo a fondo o conocer el sitio web que desea de antemano.

Googlebots (y la mayoría de los otros bots) pueden agregar al índice si encuentran dicha URL en algún lugar de la web. El caso es que no lo hacen. Debido a que las reglas en el archivo robots.txt (generalmente ubicado en la raíz de un dominio, por ejemplo: http://dominio.com/robots.txt ) no lo permiten.

Es una especie de protocolo que respetan.

Mazarovici Marian

More Interesting

¿Puede el gobierno ver lo que está haciendo en la web oscura?

¿Qué podría hacer alguien si piratea la Web profunda?

Cómo usar dark web desde Android

¿Por qué la policía no puede deshacerse de la pornografía infantil en la web profunda?

¿Cuáles son algunos cuentos interesantes de la web profunda?

¿Por qué el gobierno no hace algo con respecto a la red oscura / profunda?

¿Hay corporaciones legítimas en la web profunda además de las universidades? ¿Es porque es mucho más grande que la web de superficie y es un mercado sin explotar?

Siento un poco de pánico cada vez que visito Dark Web. ¿Debo renunciar?

¿Es seguro acceder a la web profunda?

Informé un sitio en la web oscura a missingkids.org, ¿estoy en problemas?

¿Es seguro descargar algún video de la web oscura? Descargué muchos videos de los últimos 6 meses.

¿Cómo afectará el cierre del FBI de Silk Road a Bitcoins? ¿Término corto? ¿A largo plazo?

Cómo usar la web profunda

¿Cuál es la posibilidad de que yo, viviendo en Bélgica, sea arrestado por comprar pequeñas cantidades de drogas en la web oscura?

¿Cuáles son los riesgos de acceder a la web oscura? ¿Es ilegal hacerlo? ¿Estaré bajo los reflectores de la policía?

Web Analytics