Bueno, te recomiendo Octoparse. Proporciona todos los soportes que mencionó anteriormente, navega por la página web, admite raspar sitios web con paginación y filtrar etiquetas adicionales con información adicional.
- Puede ver la interfaz visual a continuación que le mostrará cómo navegar por la página web en el navegador integrado de Octoparse.
- Para extraer el sitio web con paginación, puede seguir el tutorial Raspar datos de sitios web con paginación (cadenas de consulta) (1) o raspar datos de sitios web con paginación (cadenas de consulta) (2) – No se encontró el “botón siguiente” para aprender cómo raspe datos de sitios web con diferentes tipos de paginación.
- Para extraer las etiquetas de HTML, puede personalizar el valor extraído.
- ¿Cuáles son los principales problemas y soluciones de seguridad para las aplicaciones móviles empresariales?
- ¿Cuáles son los sitios web más extraños en Internet?
- ¿Qué compañía obtendría el mayor valor de adquirir Foursquare?
- ¿Qué conocimiento le gustaría transmitir a las personas que nunca conocerán un mundo sin Internet?
- ¿Cuáles son las cosas básicas que debo saber sobre Internet de las cosas?
O puede consultar directamente el tutorial Extraer texto de HTML: uso de la herramienta RegExp para obtener más información.
Espero que esto pueda ayudarte.