¿Qué habilidades y conocimientos debo tener para poder responder a estas?

Gracias por el A2A.

No estoy seguro de si desea conocer todas y cada una de las herramientas que necesita cada una de esas líneas o si desea una respuesta genérica.

Si es lo primero, hay muchos libros, cursos y documentos que encajan en el momento en que escribiría una respuesta sobre Quora. Es simplemente demasiado complejo responder aquí.

Si quieres una respuesta genérica, entonces es un poco más fácil. Puedes pensar en análisis en tres reinos:

  • Descriptivo es cuando ves lo que ha sucedido. Piense en paneles con series de tiempo y otras visualizaciones o informes sofisticados con relaciones de los datos (también conocido como inferencia).
  • Predictivo es cuando elige los datos que tiene (y que también usó en descriptivos por cierto) y predice un resultado futuro basado en el conocimiento que tiene.
  • Prescriptivo es cuando sus modelos recomiendan (o incluso actúan automáticamente) basarse en predicciones.

Hay muchas habilidades que necesitas aprender para ir de una a otra. Para una descripción, un buen conocimiento de estadísticas y visualización le permitirá llegar bastante lejos.

Para la predicción, deberá sumergirse en el maravilloso mundo de los algoritmos de aprendizaje. Puede ser aprendizaje estadístico, aprendizaje automático y luego hay modelos supervisados, modelos no supervisados, etc. Las habilidades, tanto en volumen como en especie, dependen mucho de la industria en la que trabaje. Hay algunas cosas comunes como la validación cruzada, la regularización y la selección de funciones, pero en su mayor parte hay cosas que aprende más y otras que no aprende. Por ejemplo, sé lo que es la PNL, pero no sé nada sobre la aplicación de la PNL porque, francamente, ¡no la uso!

Prescriptivo es, en mi humilde opinión, predictivo con esteroides. Los modelos deben tener un poder de predicción muy alto y, a menudo, deben ejecutarse en aplicaciones de datos de producción. Como probablemente haya notado, esta es el área con la que me siento menos cómodo. Cuando comencemos a pasar al ámbito de la analítica predictiva en tiempo real, es muy probable que involucre al equipo de ingeniería de datos. No solo aman estas cosas, sino que pueden manejar estos entornos de producción en tiempo real mucho mejor que yo.

La mayoría de estas preguntas se pueden responder con una variedad de herramientas, desde simples “cortar y cortar dados” hasta modelar. Aquí solo hay dos preguntas que “no son como las demás”, que son las recomendaciones número 1 y 2: comprender cómo lograr que los clientes cambien su comportamiento requiere experimentos, lo que significa que debe conocer el diseño del experimento. Sin embargo, la mayoría de las personas con inclinaciones analíticas pueden diseñar experimentos basados ​​en el sentido común y la experiencia sin ningún conocimiento formal.

Lo que creo que es importante entender aquí es que los métodos no son importantes. Realmente no importa si usa regresión simple, regresión logística, agrupamiento o simplemente ejecuta un montón de tablas de referencias cruzadas; cualquier método algo apropiado le dará un resultado similar. Lo importante es cómo define las variables de su análisis, que es un resultado directo de su diseño. Estas son cosas que define antes de ejecutar cualquier análisis, y ahí es donde realmente se pierden o ganan estas batallas.

Creo que la clave está en qué características de datos tiene. Vea si puede encontrar un modelo que pueda explicar el comportamiento.

Aquí veo que puede usar un modelo lineal generalizado simple y algún tipo de agrupación / asociación para presentar la recomendación.

More Interesting

¿Cuáles son algunas cosas interesantes que la gente ha hecho con Google Refine?

¿Cuáles son las técnicas más modernas de minería de datos / aprendizaje automático en datos CRM?

¿Cuál es el futuro de las carreras en datos?

Vivo en Bangalore y no soy ingeniero informático. ¿Puedo aprender big data y Hadoop y cambiar mi campo?

¿Cuáles son algunas áreas de investigación desafiantes / declaraciones de problemas en la minería de datos?

¿Cuál tiene una mejor oportunidad de carrera, desarrollo web, estructuras de datos, codificación algorítmica, ciencia de datos o algo más para un estudiante de BTech CSE en cuarto año en India?

¿Cuáles son los mejores campos de arranque de ciencia de datos en términos de inserción laboral?

¿Con qué frecuencia los científicos de datos usan Matlab?

¿Hay algún beneficio al agregar las características originales junto con las reducidas por PCA?

¿Cuál es la diferencia entre análisis inferencial y descriptivo de datos?

Como analista de negocios de TI, ¿cómo pasar de un fondo de depósito de datos a análisis de datos y proyectos de inteligencia empresarial?

¿Qué tipo de eventos de usuario deben enviarse a Kafka para sitios de comercio electrónico clásicos?

¿Qué son las certificaciones de Big Data? ¿Es necesario tener una buena carrera en el dominio de big data?

¿Cuándo se espera desarrollar la versión completa del lenguaje de programación Julia?

Cómo verificar que no haya sesgo en su muestra al hacer una prueba A / B