¿Existe una herramienta que pueda descargar todo el sitio web en un formato de hoja de cálculo Excel estructurado?

He hecho esto varias veces para clientes.

Imagine que hay un sitio web de listado de fabricantes, con fabricantes en todo el país, y publican todos sus detalles en su sitio web, pero con un fabricante en cada página. Ahora imagine una compañía que, por ejemplo, hace energía eólica marina. Es posible que quieran que el fabricante invierta en su empresa, pero tal vez solo quieran hablar con sucursales que se encuentran en la costa. Un enfoque es descargar todos los detalles de los fabricantes en una hoja de cálculo y luego buscarlos en la costa.

Escribiría código para descargar estos detalles (que han publicado) y luego la compañía puede filtrar o procesar como quiera.

Sin embargo, cada sitio web está construido de manera diferente y he tenido que volver a escribir mi código de acuerdo con la forma en que enumeran y muestran sus datos. Esto es principalmente útil cuando hay una larga lista de datos, o si la compañía quiere descargarlos regularmente.

No lo hago para listas de personas (para privacidad y protección de datos), aunque me imagino que otros lo hacen.

No, no existe tal herramienta.

  1. No existe una herramienta capaz de descargar todo el sitio web. El código detrás de las páginas, el código que las crea dinámicamente, no se puede acceder desde afuera, ni se puede acceder a la base de datos que el código usa para llenar las páginas con datos.
  2. Descargar un sitio web y ponerlo en una hoja de cálculo de Excel es similar a tomar su Ferrari y golpearlo repetidamente con un martillo. Puede hacerlo, pero el resultado ya no será útil para nada.