¡Solo por hacerlo! Comience con poco y amplíe su proyecto cada vez en pequeños pasos.
Primero decida qué herramienta de raspado le gusta usar, probablemente en función de la disponibilidad para su lenguaje de programación deseado. El raspador que uso es Selenium dentro de R. Aprendí los conceptos básicos de este sitio web, Cómo manejar un navegador web con R (y RSelenium) combinado con otros tutoriales. El selenio es un complemento para R que puede raspar. También puedes usar este rascador con Python y Java si te gusta más.
Elija un sitio web con información aleatoria. Me gustan especialmente los sitios web con números. Por ejemplo, información sobre acciones o tasas hipotecarias. Elija un sitio web con la información que desea obtener. Este ejemplo es con información sobre acciones de yahoo finance.
- Aprendizaje profundo: ¿Qué técnica de preprocesamiento es necesaria para los parches de imágenes para obtener características relevantes?
- ¿Cuáles son algunos de los obstáculos que evitan que las empresas aprovechen el poder del aprendizaje automático?
- ¿Qué son las redes neuronales profundas?
- ¿Hay algún kit de herramientas LSTM disponible en MATLAB?
- Cómo aplicar ConvNet en el análisis de sentimientos
- Deje que su raspador abra la página web que necesita Trending Tickers – Yahoo Finanzas
- Elimine una lista que contiene información sobre lo que desea eliminar, por ejemplo, una lista con tickers con los enlaces correspondientes a esos tickers.
- Ponga el nombre del ticker en una bonita mesa, acompañado de su enlace.
- Abra el enlace para cada ticker y raspe la información que le parezca interesante.
- Poner los datos en una tabla.
- Revisa todos los tickers usando un bucle.
- ¡Expanda esto aún más!
- Práctica práctica práctica.