¿Cuál es la importancia de encontrar el tipo de distribución de datos para fines de modelado predictivo?

El tipo de distribución puede desempeñar un papel importante al decidir cuál puede ser el modelo que puede usar, pero no todo el tiempo. Para su ejemplo, si ve una distribución exponencial con solo ver el gráfico, puede usar Regresión para predecir cuál será el próximo bosque aleatorio. Pero hay muchas maneras de ver qué tipo de modelo usará, como su conjunto de datos (características, clasificaciones). Un buen ejemplo es el conjunto de datos de Titanic, por supuesto, obtendrá diferentes tipos de distribución cuando visualice los datos, tal vez pueda visualizar las características mediante gráficos e histogramas. Las características como la relación del género y la supervivencia y muchas otras características si intenta combinarlas en diferentes aspectos, le darán la idea de qué modelo puede usar, y al principio puede haber muchos modelos que pueden encajar con su conjunto de datos En el conjunto de datos del Titanic, por ejemplo, utilicé el árbol forestal aleatorio al obtener (Entropía y recuperación de información) para predecir algo dado entradas.

Pero lo que la distribución de tipos sí le da idea de qué modelo puede usar, pero recuerde no todo el tiempo a primera vista. Investigar los datos es mejor y le dará información más concreta para que pueda llegar con una solución más factible.

Related Content

¿Por qué mi CNN proporciona una buena precisión en los datos de entrenamiento y prueba (división 80-20 del total de datos de entrenamiento) pero falla miserablemente en los datos de validación (no vistos)?

¿A qué coaching / instituto debo unirme para un curso de aprendizaje de big data?

¿Cuáles son las perspectivas de empleo si completo el Master de Ciencia de Datos de Código Abierto en http://datasciencemasters.org?

¿Alguien está haciendo capacitación en Big Data y Hadoop en DataFlair? ¿Es una buena idea hacer el curso?

Hay tantas cosas en Python. ¿Qué conceptos necesito saber para el análisis de datos?

En términos muy simples, ¿qué es FTP (protocolo de transferencia de archivos) y cómo funciona?

¿Cómo se usa la ciencia de datos en fintech?

More Interesting

¿Cuál es la estructura de datos más eficiente para admitir agregar al final del conjunto, así como acceder o actualizar el i-ésimo valor?

¿Un tipo de ciencia de datos de corte de cookies captaría el impulso suficiente de las compañías no tecnológicas que no quieren invertir dinero ni siquiera en un equipo de ciencia de datos de un solo hombre?

¿Cómo se puede aumentar artificialmente la varianza de un conjunto de datos?

¿Qué tan malo es estandarizar variables ficticias?

¿Se puede utilizar la ciencia de datos para ayudar a tomar decisiones personales?

¿Cómo es Data Mining and Predictive Analytics, de Chantal d larose?

¿Alguien ha tomado un curso inmersivo de ciencia de datos con la Asamblea General cuando ya había hecho algo lejos de las computadoras? ¿Pudieron encontrar un trabajo?

¿Cuál es la diferencia entre Data science, Big Data y Hadoop?

¿Cuáles son algunas aplicaciones donde el análisis de datos topológicos tiene una ventaja sobre otros enfoques de LD?

Econometría: ¿Cuáles son algunas iniciativas de aprendizaje automático sobre datos económicos?

¿Cuál es el mejor: ciencia de datos, aprendizaje automático o informática?

¿Vale la pena un Master en Business Analytics para convertirse en un Data Scientist o los bootcamps son tan efectivos para conseguir un trabajo para alguien sin experiencia?

¿Puedo obtener un trabajo como analista de datos si aprendo análisis de datos de Internet?

Cómo planificar un autoestudio de ciencia de datos

¿Cuál es el equilibrio entre técnica e intuición para un científico de datos exitoso?

Web Analytics