Hay muchas herramientas diferentes de raspado web disponibles ahora para extraer datos de sitios web. Podrías ver este blog Top 30 Free Web Scraping Software para tener una comprensión básica de las herramientas de scraping web.
Personalmente, le recomendaría que use Octoparse, la herramienta de raspado de sitios web, que es un software muy fácil y conveniente para los novatos. Aunque no podía extraer las imágenes directamente, sí podía extraer las URL de las imágenes y con la ayuda de la extensión de Chrome Tab Save, podía descargar fácilmente las imágenes. Los pasos son bastante fáciles de extraer datos e imágenes de sitios web:
- Abra el sitio web que desea en Octoparse;
- Elija los datos que desea extraer;
- Termine de configurar la tarea para extraer los datos;
- Ejecute la tarea y luego obtendrá los datos que desea;
- Exporte los datos a los formatos que desee (Excel, Txt, MySql y otras bases de datos).
Si está interesado, puede ver el tutorial ¿Cómo descargar en masa imágenes de un sitio web? aprender más.
- Cómo hacer un sitio web de cualquier tipo en línea
- Cómo construir sitios web para clientes en WordPress
- ¿Los sitios web que venden material para la prueba analítica UBER son confiables?
- ¿Qué es playerup.com? ¿Cuál es su procedimiento de intermediario?
- ¿Cuáles son los primeros pasos que debo tomar antes de comenzar a codificar un sitio web como Quora?
Si tiene más preguntas al usar Octoparse, puede unirse al Octoparse Users Club en Facebook directamente para obtener más ayuda.
Espero que esto pueda ayudarte.