Voy a responder a esto de dos maneras diferentes.
- Asumiendo que no tienes experiencia en programación.
Adivina qué, curiosamente, esto puede ser realmente bueno para ti. Las personas que conocen la programación, que intentan aprender algo, son como jugadores de tenis con una técnica establecida que intenta cambiar la forma en que sirven. Es realmente difícil detener su forma de pensar en la memoria muscular.
Por ejemplo, para codificar recientemente la regresión en un conjunto de datos laaaarge, en lugar de simplemente usar XW = Y, aplicar la codificación CSR y terminarla sin problemas, encapsulé todo como objetos y escribí una reina del drama de un repositorio que tardó años en ejecutarse.
- ¿Hay algún buen conjunto de datos de huellas dactilares y / o iris disponibles públicamente para el aprendizaje automático?
- Cómo estimar errores debido al peso de los datos
- ¿Qué temas de estadística debo aprender antes de aprender ciencia de datos si soy de un entorno no estadístico?
- ¿Cuáles son algunas simulaciones modificables gratuitas de código abierto disponibles para el público?
- ¿Cómo se puede determinar si un conjunto de datos es grande o pequeño?
Entonces, mi punto más importante es que usted no tiene la carga de paradigmas establecidos y debe comenzar con R. R está escrito por estadísticos para estadísticos. Es muy útil para usted centrarse en el problema en lugar del código
2. Suponiendo que conoces un lenguaje tradicional como Java
Vaya a Python y sus millones de bibliotecas (numPy, Scipy, SciKitLearn et al.). Están muy bien documentados. Inicialmente tendrá dificultades con las cosas “pitónicas”, pero lo superará lo suficientemente rápido y luego es un proceso de aprendizaje muy rápido. El único inconveniente es la velocidad porque Python es casi un idioma además de un idioma, porque te lo hacen más fácil, es más difícil para la máquina entenderlo rápidamente y no hay escapatoria del “trabajo” (ya sea por ti o por la máquina, el el trabajo neto realizado será una constante).
PD: Gracias hombre, me pediste que escribiera esto: Minería de datos: mi mundo de características y objetos