¿Qué es un buen raspador web en línea (SaaS) que tiene una GUI y un modelo de negocio freemium?

Portia tiene todo lo que está buscando, excepto que se necesita un trabajo adicional para generar URL.

Primero debe elegir qué URL desea que visite Portia cuando comience el rastreo. Por defecto, Portia rastreará todos los enlaces que encuentre que pertenezcan al mismo dominio que estas URL.

Crea una muestra para una página que le interesa y asigna datos de la página a los campos. Una vez que haya terminado, puede visitar otras páginas que son similares para asegurarse de que Portia también extraiga de ellas. Si el diseño de la página es diferente, puede crear otra muestra para que se ajuste también a ese diseño.

Este video debería ayudarlo a comenzar rápidamente:

Portia está totalmente integrado con la plataforma Scrapinghub, que puede utilizar de forma gratuita. No hay límites para la cantidad de solicitudes, y el plan gratuito le permite ejecutar un rastreo por hasta 24 horas. Si necesita ejecutar varios rastreadores a la vez durante más de 24 horas, puede actualizar en cualquier momento.

Si desea generar URL, puede escribir un script para hacerlo localmente y luego enviarlo a través de la API. Puedes encontrar un ejemplo aquí.

Como se mencionó anteriormente, Portia rastrea todos los enlaces dentro del dominio. Si solo desea visitar y eliminar esas URL, puede cambiar la política de rastreo de enlaces a “No seguir enlaces” en el panel izquierdo. También puede elegir seguir URL que coincidan con un patrón específico. Ver aquí para más detalles.

Portia también es de código abierto. Scrapinghub te permite descargar tus arañas, para que puedas ejecutarlas en tus propios servidores si es necesario.

Para obtener más información, consulte el tutorial y la documentación.

Hay una startup bien invertida en esta área (probablemente ahora más negocios regulares que startup) que se llama Import.io | Plataforma de datos web y herramienta gratuita de raspado web

sus capacidades extienden el raspado web simple con GUI para crear API automáticamente para que pueda usar y reutilizar y combinar varias fuentes de datos con aplicaciones externas.

Además, hubo Kimono Labs que convierte los sitios web en API estructuradas desde su navegador en segundos, pero se suspende después de la adquisición por parte de Palantir Technologies.

Obviamente recomendaría Dexi.io – herramienta de extracción de datos web para profesionales. Pero es una herramienta profesional y para el raspado web requiere algunas habilidades técnicas básicas.

Echa un vistazo a este video:

Acabamos de lanzar una herramienta gratuita para esto. Inténtalo, todavía está en versión beta pero estamos recibiendo excelentes críticas. Link abajo:

Grepsr para Chrome: herramienta de raspado web habilitada para API

More Interesting

Para las empresas saas, ¿utiliza una aplicación interna o un proveedor externo para el reconocimiento de ingresos? ¿por qué?

Cómo crear un software de punto de venta basado en la web

Servicios basados ​​en computadora: ¿por qué surgió primero SaaS, seguido de IaaS y luego PaaS?

¿Las compañías SaaS usan contratos, productos u órdenes en Salesforce para rastrear suscripciones y renovaciones?

¿Cuáles son los cuatro KPI más importantes que gestiona su empresa SAAS?

¿Es mejor tener una estrategia de producto SaaS única o múltiple?

¿Qué beneficios proporciona el software CRM a un negocio de agencia?

¿Cuáles son los principales KPI de marketing para productos de software basados ​​en SaaS?

¿Por qué algunas compañías SaaS usan Chargify o Recurly junto con Stripe?

¿Cómo definir ventas vs ingresos vs ingresos para una empresa de suscripción (SaaS)? ¿Cuáles son las diferencias de su variante bruta y neta para cada término? ¿Dónde está incluido el impuesto a las ventas?

¿Algún buen programa gratuito o casi gratuito que ayude a guiar a un nuevo usuario a través de un producto SAAS?

¿Cuáles son las SaaSs o compañías de productos que son las mejores en técnicas de venta cruzada y venta cruzada en línea?

¿Es viable un producto SaaS con una rotación extremadamente alta pero un costo de adquisición extremadamente bajo?

¿Qué tipo de dinero es posible ganar vendiendo productos SaaS?

¿Cuál es la mejor manera de configurar el procesamiento de pagos y la nómina para un inicio de equipo remoto SaaS?