Así que estoy a punto de completar el curso el próximo mes. Esbozaré mi proceso de mantener el equilibrio entre el curso y la aplicación práctica.
Si ha completado el curso, habría seguido los siguientes conceptos:
- Regresión lineal (multivariante)
- Regresión logística
- K significa agrupación
- Clasificación
- Redes neuronales
- SVM
- Sistemas de recomendación
Creo en el aprendizaje mediante la práctica. Aprender haciendo cosas, fallando y volviendo a levantarse. Entonces, comencé a trabajar en conjuntos de datos reales a medida que aprendía un nuevo conjunto de datos.
- ¿Necesito conocer algoritmos de aprendizaje automático para asegurar un trabajo como analista de datos?
- ¿Cuáles son los 10 mejores algoritmos del siglo XX?
- ¿Cuál es el mejor algoritmo para calcular automáticamente un puntaje de crédito?
- Deje G (V, E) ser un gráfico conectado, no dirigido, dar un algoritmo O (| V | + | E |) para calcular una ruta en G que atraviesa cada borde en E exactamente una vez en cada dirección?
- ¿Qué es una matriz en Java? ¿Y cuál es un ejemplo de su uso?
Aquí hay algunos conjuntos de datos en los que trabajé para los conceptos respectivos:
- Regresión lineal / Regresión logística
- Vivienda de Boston | Kaggle
- K significa agrupamiento
- Iris Species | Kaggle
- Conjunto de datos de modelado de conocimiento del usuario
- Conjunto de datos de lecturas por hora de la Junta de electricidad de Tamil Nadu
- Estadísticas de partidos de torneos importantes de tenis
- Clasificación
- Conjunto de datos de recopilación de spam de SMS
- Sistemas de recomendación
- Conjunto de datos de datos de recomendación Chicago de entrada
- Interacciones Subreddit para 25,000 usuarios
- SVM
- Datos LIBSVM: clasificación, regresión y etiquetas múltiples
Te sugiero que trabajes un poco más en los siguientes temas:
- Análisis de series temporales
- Estimacion
- Prueba de hipótesis
- Prueba T
- prueba de chi-cuadrado
- Anova
- Correlación
- Spark para manejar gran cantidad de datos
- Hadoop
- Colmena
- SQL (en el mundo real no tendrá conjuntos de datos listos en la mano. Deberá extraerlos manualmente ejecutando consultas en bases de datos o volcados)
- Bases de datos relacionales y no relacionales
- Procesamiento natural del lenguaje
- Trabaja con herramientas como Scipy, Matplotlib, Numpy
De aquí en adelante, tendrá la opción de trabajar, ya sea aplicando Machine Learning o investigando sobre ello.
Si planea ir del lado de la aplicación, es decir, trabajar en alguna empresa como Data Scientist, luego pasar a las herramientas utilizadas en la industria y tratar de ponerlas en práctica. Las empresas quieren contratar personas que no necesitan entrenar desde cero.
Si planeas seguir adelante en el frente de la investigación, deberás trabajar mucho en tu partido en lugar de en las herramientas. Sin embargo, incluso si elige el lado de la aplicación, necesitará trabajar un poco en matemáticas según el dominio en el que trabaja su empresa.
Espero que la respuesta te ayude 🙂