¿Cuál es el entorno libre de distribución en la teoría del aprendizaje estadístico? La tecnología cambia la vida futura

El bootstrap

Puede aproximar la distribución con una muestra lo suficientemente grande y aplicar bootstrap para aproximar la distribución de muestreo. Luego usa la muestra de bootstrap para calcular su parámetro. Esto puede incluir la media, la mediana, la desviación estándar, el cuantil u otra medida estadística . Obtiene muchas muestras de bootstrap para obtener la distribución del parámetro o medida estadística.

Trazar conjuntos de datos

Si no asume ninguna distribución, entonces necesita una distribución empírica, o necesita aproximar la distribución utilizando los datos. Puede tener algún trabajo que no requiera la estimación de la distribución. Pero en general, debe tener una idea de la distribución . Esto se muestra en histogramas, diagramas, diagramas de caja y gráficos similares que lo ayudan a comprender los datos.

Aprendizaje estadístico

El algoritmo de aprendizaje estadístico simplemente puede hacer un problema de predicción, un problema de estructura de datos, un problema de selección de variables, un problema de modelo o un problema de exploración de datos. Estos nombran algunos métodos para tener una idea de los datos. El primero aplica los datos y la respuesta para realizar predicciones sobre datos futuros. El segundo realiza cualquier reducción de dimensionalidad. El tercero elige las variables relevantes basadas en la experiencia del dominio o el conocimiento de los datos. El cuarto elige el modelo, como la regresión lineal o los vecinos K más cercanos, más adecuados para el conjunto de datos. El quinto realiza cualquier exploración en los datos, incluidas las variables o en las definiciones de datos. Todos estos le dan al analista una mejor comprensión del conjunto de datos y de cualquier método que aplique.

Práctica estadística

El aspecto más importante de la recopilación de datos, análisis de datos e interpretación de datos puede incluir detalles que algunos analistas no consideran. Estos enfatizan un mejor diseño y experimento , métodos de muestreo, uso de bibliotecas estadísticas o sistemas de bases de datos . Todo esto se aplica al esfuerzo de organizar datos, analizar datos, compartir datos y evaluar datos.

Estudio de práctica

Por último, el analista siempre necesita estudiar el protocolo , el dominio de fondo, las definiciones de datos, los roles de los compañeros de equipo y, en gran caso, los objetivos del estudio . Estos últimos puntos proporcionan un contexto bien redondeado y mejor para el analista estadístico. Proporcionan un contexto para organizar datos, experimentar datos, recopilar datos, analizar datos, evaluar datos e interpretar datos. Y le da un mejor sentido de estudio común o sentido de grupo de trabajo . Previene la sobreespecialización con la práctica estadística y abre la puerta a la comprensión compartida y al aprendizaje multidisciplinario .

AprendizajeAprendizaje automáticoEstadística