¿Google, Microsoft Bing, Yandex y Baidu rastrean la web profunda?

Sí.

Muchos motores de búsqueda completan formularios básicos, así como fuente de datos, utilizando arreglos especiales para proporcionar dicha información. Pruebe consultas de vuelos, hoteles, clima, cotizaciones de bolsa, etc., por ejemplo, en cualquier motor de búsqueda popular.

De hecho, habíamos construido una plataforma de extracción vertical en Yahoo! (empresa) alrededor de 2005-2006 (y un motor de búsqueda casi verticalmente independiente llamado Zook en una startup) que empleó técnicas de rastreo enfocadas basadas en heurística. Había ayudado a rastrear The New England Journal of Medicine para contenido solo por suscripción que se mostrará selectivamente a aquellos Y! Buscar usuarios que están suscritos con ellos. Para ese propósito, me proporcionaron una cuenta premium y envié los detalles de autenticación en el sitio utilizando el módulo Mechanize de Perl.

Ahora hay herramientas sofisticadas que permiten a los motores de búsqueda imitar a un surfista humano en los sitios web de rastreo.

La web profunda es la parte de Internet inaccesible para el público: protegida con contraseña, cortafuegos o simplemente no vinculada. Entonces NO.