La Web invisible se refiere a la parte de la WWW que los motores de búsqueda no indexan. La mayoría de nosotros cree que las potencias de búsqueda como Google y Bing son como el Gran Oráculo “… lo ven todo. Desafortunadamente, no pueden porque no son divinos en absoluto; son solo arañas web que indexan páginas siguiendo un hipervínculo después del otro.
Pero hay algunos lugares donde una araña no puede entrar. Tome las bases de datos de la biblioteca que necesitan una contraseña para acceder. O incluso páginas que pertenecen a redes privadas de organizaciones. Las páginas web generadas dinámicamente en respuesta a una consulta a menudo quedan sin indexar por las arañas de los motores de búsqueda.
La tecnología de motores de búsqueda ha progresado a pasos agigantados. Hoy, tenemos búsqueda en tiempo real y la capacidad de indexar contenido basado en Flash y PDF. Incluso entonces, quedan grandes extensiones de la web que un motor de búsqueda general no puede penetrar. El término, Deep Net , Deep Web o Invisible Web persiste.
Para tener una idea más precisa de la naturaleza de este ‘Continente Oscuro’ que involucra a los motores de búsqueda invisibles y web, lea lo que Wikipedia tiene que decir sobre la Deep Web. Las cifras son llamativas: el tamaño de la red abierta es de 167 terabytes . La Web Invisible se estima en 91,000 terabytes. Mira esto: ¡la Biblioteca del Congreso, en 1997, tenía cerca de 3.000 terabytes!
¿Cómo llegamos a esta carga madre de información?
Anuncio
De eso se trata esta publicación. Conozcamos algunos recursos que serán nuestro barco de buceo profundo para la Web Invisible. Algunos de estos son motores de búsqueda web invisibles con información indexada específicamente.
Infomina
Infomine ha sido construido por un grupo de bibliotecas en los Estados Unidos. Algunos de ellos son la Universidad de California, la Universidad Wake Forest, la Universidad Estatal de California y la Universidad de Detroit. Infomine información de “minas” de bases de datos, revistas electrónicas, libros electrónicos, tableros de anuncios, listas de correo, catálogos de tarjetas de biblioteca en línea, artículos, directorios de investigadores y muchos otros recursos.
Puede buscar por categoría de tema y ajustar aún más su búsqueda utilizando las opciones de búsqueda. Infomine no es solo un motor de búsqueda independiente para la Web profunda, sino también un punto de partida para mucha otra información de referencia. Consulte los enlaces de Otras herramientas de búsqueda y Referencia general en la parte inferior.
La biblioteca virtual WWW
Este es considerado el catálogo más antiguo de la web y fue iniciado por Tim Berners-Lee, el creador de la web. Entonces, ¿no es extraño que encuentre un lugar en la lista de recursos web invisibles? Tal vez, pero la Biblioteca Virtual WWW enumera una gran cantidad de recursos relevantes sobre una gran cantidad de temas. Puede ir verticalmente a las categorías o usar la barra de búsqueda. La captura de pantalla muestra la disposición alfabética de los temas cubiertos en el sitio.
Intute
Intute se centra en el Reino Unido, pero tiene algunas de las universidades más estimadas de la región que proporcionan los recursos para el estudio y la investigación. Puede buscar por tema o hacer una búsqueda por palabra clave de temas académicos como la agricultura y la medicina veterinaria. El servicio en línea tiene especialistas en temas que revisan e indexan otros sitios web que atienden a los temas de estudio e investigación.
Intute también ofrece gratuitamente más de 60 tutoriales en línea gratuitos para aprender habilidades efectivas de investigación en Internet. Los tutoriales son guías paso a paso y se organizan en torno a temas específicos.
Planeta completo
Complete Planet se llama a sí misma la “puerta de entrada a la Deep Web”. Este recurso de directorio gratuito y bien diseñado facilita el acceso a la gran cantidad de bases de datos dinámicas que se ocultan en una búsqueda de propósito general. Las bases de datos indexadas por Complete Planet suman alrededor de 70,000 y van desde Agricultura hasta Clima. También se incluyen bases de datos como Food & Drink y Military.
Para una búsqueda de Deep Web realmente efectiva, pruebe las opciones de Búsqueda avanzada, donde, entre otras cosas, puede establecer un rango de fechas.
Infoplease
Infoplease es un portal de información con una serie de características. Usando el sitio, puede acceder a una buena cantidad de enciclopedias, almanaques, un atlas y biografías. Infoplease también tiene algunas ramificaciones agradables como Factmonster.com para niños y Biosearch , un motor de búsqueda solo para biografías.
DeepPeep
DeepPeep tiene como objetivo ingresar a la Web Invisible a través de formularios que consultan bases de datos y servicios web para obtener información. Las consultas escritas abren resultados dinámicos pero de corta duración que los motores de búsqueda normales no pueden indexar. Al indexar bases de datos, DeepPeep espera rastrear 45,000 formularios en 7 dominios.
Los dominios cubiertos por DeepPeep (Beta) son Automóvil, Tarifa aérea, Biología, Libro, Hotel, Trabajo y Alquiler. Al ser un servicio beta, hay fallas ocasionales ya que algunos resultados no se cargan en el navegador.
IncyWincy
IncyWincy es un motor de búsqueda web invisible y se comporta como un metabuscador al acceder a otros motores de búsqueda y filtrar los resultados. Busca en la web, directorio, formularios e imágenes. Con un registro gratuito, puede realizar un seguimiento de los resultados de búsqueda con alertas.
DeepWebTech
DeepWebTech le ofrece cinco motores de búsqueda (y complementos de navegador) para temas específicos. Los motores de búsqueda cubren ciencia, medicina y negocios. Usando estos motores de búsqueda de temas específicos, puede consultar las bases de datos subyacentes en la Web profunda.
Scirus
Scirus tiene un enfoque puramente científico. Es un motor de investigación de gran alcance que puede rastrear revistas, páginas de inicio de científicos, material didáctico, material de servidor de preimpresión, patentes e intranets institucionales.
TechXtra
TechXtra se concentra en ingeniería, matemáticas y computación. Le brinda noticias de la industria, anuncios de trabajo, informes técnicos, datos técnicos, eprints de texto completo, recursos de enseñanza y aprendizaje junto con artículos e información relevante del sitio web.
Al igual que la búsqueda en la web general, buscar en la Web invisible también se trata de buscar la aguja en el pajar. Solo aquí, el pajar es mucho más grande. La Web Invisible definitivamente no es para el buscador casual. Es profundo pero no oscuro porque si sabes lo que estás buscando, la iluminación está a unas pocas palabras clave de distancia.