Cómo saber si estoy listo para una entrevista de ciencia de datos

La respuesta, por supuesto, es: postula y lo descubrirás.

Una lista más detallada de temas, a través de ¿Cómo debo prepararme para preguntas de estadísticas para una entrevista de ciencia de datos?

  • Estadísticas : intervalos de confianza, estimación de parámetros, valor p, prueba de hipótesis.
  • Métricas comunes : tasa de participación / retención, conversión, productos similares / coincidencia de duplicados, cómo medirlos.
  • Funciones de costo útiles : pérdida de registro, otras basadas en entopy, DCG / NDCG, etc.
  • Aprendizaje automático básico : problemas de clasificación / regresión / clasificación, sobreajuste, optimización convexa, árboles, conjuntos, refuerzo, filtrado colaborativo, etc.
  • Herramientas : R / Python / Mathematica, Weka y similares. Codifique algo usted mismo también ayudaría, Kaggle es muy útil.
  • Matemáticas y complejidades : vectores propios, valores singulares, PCA, LDA, Gibbs Sampling, Information Bottleneck et. Alabama.
  • Números e intuición de la vida real : comportamiento esperado del usuario, rangos razonables para la tasa de registro / retención de usuarios, duración / recuento de sesiones, usuarios registrados / no registrados, interacción profunda / de alto nivel, tasa de spam, tasa de quejas, eficiencia publicitaria.

Data Science es un campo relativamente nuevo y cada empresa tiene su propia interpretación de lo que es. En resumen, necesita conocer algunas estadísticas, algo de aprendizaje automático, algo de programación, algo de SQL, algo de procesamiento de señal, algo de RDBMS, algunos paquetes (Weka, R, etc.), algo de python / Java, algo de minería de datos, algo de ingeniería de características, algo computación en la nube, algunos Hadoop … y así sucesivamente … La mejor idea es leer cuidadosamente lo que el trabajo necesita específicamente y luego prepararse en consecuencia.

Curiosamente, conocí a un Científico de Datos en un hilo sobre Quora y estaba luchando por comprender el concepto de validación cruzada para optimizar los parámetros. Ese es el lado oscuro de ‘algo’ de conocimiento en todos los campos 🙂

Editar

20 preguntas para detectar científicos de datos falsos

ATA Creo que simplemente lo dirigiría a mi respuesta a … La respuesta de Sean Owen a ¿Cómo puede un estudiante graduado de ciencias de la computación prepararse en 2–3 meses para entrevistas de pasantías en aprendizaje de datos / científico de máquina? ¿Qué conjuntos de habilidades se esperan, como cikit-learn, R, Weka, Kaggle, etc.?

El hecho de que esté listo depende de sus antecedentes, a qué tipo de empresa se postula, etc.

Soy Ingeniero en Electrónica y Comunicación por educación. Después de completar la ingeniería, trabajé con Accenture y lentamente me abrí camino hacia el campo del análisis de datos.

He escrito este blog que ayudará a los principiantes a comenzar sus carreras en este campo:
¿Cómo comenzar una carrera en análisis de forma gratuita?

Una vez que esté preparado y aparezca para las entrevistas, puede tomar algunos consejos de este blog mío:
¿Qué esperar en una entrevista analítica?

Saludos!

More Interesting

¿La optimización está relacionada con la ciencia de datos? ¿Y cómo?

¿Qué tipo de habilidades se requieren para probar las pruebas de rendimiento de aplicaciones de big data?

¿Debo usar big data como tema de investigación para mi tesis? ¿Cuál es la diferencia entre cloud computing y big data?

¿Qué es ciudadano de datos?

¿Cuáles son las empresas analíticas de big data que figuran en los EE. UU. Y Europa en el ámbito de la atención médica?

¿Qué marcos serían beneficiosos al usar Python para las ciencias de datos para principiantes?

¿Qué país debería elegir para una maestría en ciencia de datos?

El programa MSAN en USF se ve muy bien. Pero, ¿por qué el curso no se menciona en ninguno de los 10 mejores rankings de cursos de análisis empresarial?

¿Qué tan buena es la colocación cooperativa para el programa de Big Data en SFU? ¿Cómo son las oportunidades de trabajo para el programa de Big Data en Vancouver para graduados de SFU?

¿Cuáles son algunas ideas muy buenas de minería de datos o algoritmos de búsqueda basados ​​en gráficos para un proyecto menor?

¿Cómo funciona la tecnología detrás de las tarjetas magnéticas en términos de datos? ¿Cómo se manejan los datos del usuario y los datos de RFID / Bar de la compra desde el deslizamiento del terminal a los sistemas de back-end?

¿Podrá Kaggle sobrevivir a la explosión en la industria del software de análisis?

Estoy interesado en aprender ciencia de datos, aprendizaje automático y lenguaje R. ¿Cómo debo comenzar para cualquiera de estos cursos?

¿Qué es mejor para un estudiante de análisis de datos para estudiar, aprendizaje automático o series de tiempo? Tenemos que elegir uno como módulo electivo

¿Cuáles son las habilidades valiosas necesarias para comenzar con Data Analytics?