La respuesta, por supuesto, es: postula y lo descubrirás.
Una lista más detallada de temas, a través de ¿Cómo debo prepararme para preguntas de estadísticas para una entrevista de ciencia de datos?
- Estadísticas : intervalos de confianza, estimación de parámetros, valor p, prueba de hipótesis.
- Métricas comunes : tasa de participación / retención, conversión, productos similares / coincidencia de duplicados, cómo medirlos.
- Funciones de costo útiles : pérdida de registro, otras basadas en entopy, DCG / NDCG, etc.
- Aprendizaje automático básico : problemas de clasificación / regresión / clasificación, sobreajuste, optimización convexa, árboles, conjuntos, refuerzo, filtrado colaborativo, etc.
- Herramientas : R / Python / Mathematica, Weka y similares. Codifique algo usted mismo también ayudaría, Kaggle es muy útil.
- Matemáticas y complejidades : vectores propios, valores singulares, PCA, LDA, Gibbs Sampling, Information Bottleneck et. Alabama.
- Números e intuición de la vida real : comportamiento esperado del usuario, rangos razonables para la tasa de registro / retención de usuarios, duración / recuento de sesiones, usuarios registrados / no registrados, interacción profunda / de alto nivel, tasa de spam, tasa de quejas, eficiencia publicitaria.
- ¿Cuál es el mejor idioma para aprender a entrar en la ciencia de datos o big data en los requisitos actuales como graduado de comercio?
- ¿Qué es mejor para analizar datos de redes sociales: almacén de datos o una solución de big data?
- ¿Qué tan útil es Matlab, para Kaggle, en comparación con R y Python?
- ¿Es la astrología la implementación de la ciencia de datos antiguos?
- ¿Cuáles son algunos proyectos interesantes de Clojure para Big Data y Data Science?