Para alguien sin experiencia en ciencia de datos, ¿cómo me convenzo de que los modelos predictivos son importantes, ya que no garantizan eventos futuros?

La estadística y la ciencia de datos tratan con la incertidumbre. Siempre se reconoce que ni sus predicciones ni sus inferencias serán perfectas. Recuerde, todos los modelos están equivocados, ¡pero algunos son útiles!

La pregunta no es si puede garantizar un evento futuro, es si puede hacerlo mejor o no con un modelo predictivo basado en datos, en lugar de su antiguo “instinto” o “experiencia”.

Esta es una pregunta bastante diferente, pero la respuesta y los ejemplos que escribí aquí son relevantes: la respuesta de Justin Ma a Si la correlación no es igual a la causalidad, ¿de qué sirve? En particular, algunos ejemplos que usan modelos predictivos:

¿Este cliente comprará mi producto? ¿Cuánto inventario necesito? ¿Cuánta electricidad se necesitará generar? ¿Debería aprobarse este préstamo? Del mismo modo, puede hacer preguntas de “por qué”. ¿Qué factores causan cambios en la demanda de electricidad? ¿Por qué un cliente es más arriesgado?

Nada garantiza eventos futuros. Aquí hay algunas preguntas para hacer:

  1. ¿Se usó el modelo de buena reputación? ¿Tiene un historial en otros problemas similares?
  2. ¿El modelo estuvo sujeto a una validación rigurosa durante el desarrollo?
  3. ¿Qué tan bien parece funcionar el modelo de forma predictiva?
  4. ¿El proceso que está modelando está sujeto a intervención o experimentación? Si es así, ¿cómo se ha mantenido el modelo?
  5. ¿Hay un protocolo de revisión?

More Interesting

¿Cuáles son las mejores consultoras de ciencia de datos?

¿Qué puede lograr realmente el análisis predictivo?

¿Cuál es la diferencia entre análisis inferencial y descriptivo de datos?

¿En qué consiste la minería de datos?

¿Hay algún software de Big Data de código abierto disponible en este momento?

¿Qué se entiende por clasificación de datos?

¿Cuál es el mejor instituto en Mumbai para hacer ciencia de datos y certificación de big data?

¿Qué es mejor, Data Science M.Tech de IIT Hyderabad o Big Data Analytics Certification de IIM Bangalore?

¿Dónde podemos encontrar conjuntos de datos para procesar? Quiero usar estos datos para mi proyecto Hadoop.

Si elimino un archivo, lo sobrescribo con otro archivo en la misma carpeta y destruyo el nuevo archivo, ¿puedo recuperar el archivo original que estaba inicialmente en la carpeta?

¿Puedo convertirme en un científico de datos sin aprender Python, pero solo con conocimientos de programación Java y aprendiendo el lenguaje R?

Estoy interesado en el análisis de conocimiento / ciencia de datos, y tomaré una Maestría en Consumer Analytics, ¿sería difícil conseguir un trabajo con poca experiencia?

¿Hay compañías tecnológicas en el Área de la Bahía que patrocinarán a los estudiantes aceptados en los programas de Stanford MS?

¿Qué curso en línea debo hacer, aparte de R, para comenzar mi carrera en el campo del análisis de datos?

¿Cuáles son algunos de los temas de investigación en el campo de Hadoop Framework?