¿Qué técnicas podrían usar datos para predecir un valor específico y asignar un grado de confianza a esa predicción?

La forma clásica: utilice la validación cruzada [1] para obtener una estimación del valor medio previsto en diferentes pliegues y la varianza correspondiente.

De lo contrario, haría lo siguiente:

Para [matemáticas] i \ en {1,2, .., N} [/ matemáticas]:

¿Cuál es el significado de los derivados de datos en el contexto de big data?
¿Cómo se importan los datos en la programación R y qué metodologías se utilizan?
¿Cuáles son los principios de recopilación y análisis de datos?
Cómo convertirse en un científico de datos en 4-5 meses si no tengo experiencia previa con ningún lenguaje de programación
¿Qué tan bien se está utilizando la ciencia de datos en Quora?

Elija una semilla aleatoria [2] número [matemática] s_ {i} [/ matemática]
Ejecute su modelo con la semilla seleccionada y guarde las predicciones en una columna [math] p_ {i} [/ math]

Calcule la media (muestra) y la varianza de sus predicciones:

[matemáticas] p_ {m}: = \ frac {1} {N} \ sum_ {i = 0} ^ {N} p_ {i} [/ matemáticas]

[matemáticas] p _ {\ sigma}: = \ frac {1} {N} \ sum_ {i = 0} ^ {N} (p_ {i} -p_ {m}) ^ {2} [/ matemáticas]

En ambos casos, calcule el intervalo de confianza [3] suponiendo una distribución normal (esto no siempre es preciso, pero podría proporcionarle una línea de base).

Lucro.

Espero que esto haya sido útil.

Notas al pie

[1] Validación cruzada (estadísticas) – Wikipedia

[2] Semilla aleatoria – Wikipedia

[3] Intervalo de confianza – Wikipedia

Análisis de datosAnálisis PredictivoAprendizaje automáticoBig DataCiencia de datosdatosMinería de

Related Content

Cómo comenzar en ciencia de datos

¿Cuáles son ejemplos de big data en fabricación?

¿Dónde debo comenzar a aprender ML y minería de datos?

¿Qué servidor utiliza Google para guardar grandes datos?

¿Vale la pena organizar un concurso de dinero de Kaggle?

Cómo mantener las etiquetas de datos al reducir la dimensionalidad de los datos con scikit-learn

¿Cuáles son algunos buenos institutos de capacitación para aprender big data y análisis de datos en Bangalore?

El aprendizaje automático bayesiano se trata de eso …

Yassine Alouini

La mayoría de las técnicas estadísticas hacen esto.

Yassine Alouini

More Interesting

¿Cuál es la naturaleza del big data?

Cómo convertirse en un científico de datos en la NASA

¿Qué gráficos de Nvidia, GeForce o Quadro, son los mejores para aplicaciones de análisis de datos grandes, modelado computacional y ciencia de datos?

¿Qué es big data, análisis de negocios, análisis de datos y cómo uno puede convertirse en analista de datos o científico de datos? ¿Hay algún curso a corto plazo?

¿Existe alguna herramienta de inteligencia empresarial que aproveche algoritmos como "Edgerank" para controlar qué informes se muestran?

Acabo de regresar de Strata 2017 y todas las demás botas mostraban una plataforma de ciencia de datos (es decir, Domino). ¿Cuál es tu plataforma favorita y por qué?

¿Cuáles son las mejores prácticas para construir algo así como un servicio de noticias?

¿Es la velocidad de la luz una restricción para los grandes datos?

¿Qué tiene más alcance y permanecerá durante mucho tiempo en el mercado, la ciencia de datos, la computación en la nube o Hadoop y big data?

Si me uno a Microsoft como Científico de datos sénior y obtengo un rendimiento superior al promedio, ¿cuánto tiempo debo esperar para llegar al nivel principal?

¿Cuáles son los desafíos de construir un equipo de datos en una startup?

¿Cuál es el mejor instituto para la ciencia de datos?

¿Hay algún curso ejecutivo de M.Tech o MS sobre Análisis de Datos o Ciencia de Datos en Chennai?

¿Cómo se usa MySQL en ciencia de datos?

¿Cómo se puede construir un conjunto de datos donde podamos consultar la deuda total para cada sección censal?

Web Analytics