Para HTML / CSS, puede probar algunos sitios de tutoriales como http://codeacademy.com y similares, pero realmente, si se acerca a aprender a codificar con el objetivo de aprender a codificar, no lo logrará. Abórdelo con un problema que necesita resolver, y use el tutorial para ayudarlo, solo aplicando lo práctico puede aprenderlo adecuadamente, los tutoriales lo dejarán como un generador de cuerpo plagado de esteroides: un montón de insignias y premios, un inflado sentido de autoestima, y nada en el interior. Elige un propósito y trabaja para lograrlo.
En cuanto al scraping, básicamente funciona así: descargue una página por URL (con algo como CURL), analice el resultado como texto normal (o con algunas bibliotecas transversales DOM) para identificar los elementos que necesita, extraer los valores, aplicarlos a la siguiente URL con la que descargue la página siguiente, y así sucesivamente.
Por ejemplo:
1) Descargar la página de la lista de cursos
2) Buscar curso en la lista de cursos
3) Analiza y extrae el enlace al curso para obtener la URL del curso
4) Descargar la página del curso por la URL obtenida
5) Analizar y extraer el número de estudiantes matriculados.
6) Enviar correo electrónico si se detecta un cambio positivo.
- ¿Cuáles son las partes que necesitaría para construir una supercomputadora y dónde las encontraría? ¿Hay algún sitio web?
- Cómo traducir sitios web en inglés
- Dado que la web está abarrotada, ¿es posible tener éxito en ella hoy en día?
- Cómo hacer un sitio web básico
- ¿Por qué no puedo abrir mi sitio web clotee.com? ¿Es solo por mi conexión a Internet o el sitio web ha sido bloqueado?
Para esto, sin embargo, debe tener un conocimiento básico de HTML / CSS para identificar correctamente los elementos que necesita extraer del marcado que descarga. Por ejemplo, el enlace para el curso podría ser:
Luego, tendría que extraer la parte intermedia en el atributo “href” como el enlace del curso, y luego descargarla. En el contenido que luego se descarga, verá el número de estudiantes inscritos en un elemento como este:
Actualmente matriculado: 23
Usando regex o una biblioteca transversal DOM, entonces extraería este elemento y lo analizaría para el valor numérico, y así sucesivamente.