¿Cuál es el entorno libre de distribución en la teoría del aprendizaje estadístico?

El bootstrap

Puede aproximar la distribución con una muestra lo suficientemente grande y aplicar bootstrap para aproximar la distribución de muestreo. Luego usa la muestra de bootstrap para calcular su parámetro. Esto puede incluir la media, la mediana, la desviación estándar, el cuantil u otra medida estadística . Obtiene muchas muestras de bootstrap para obtener la distribución del parámetro o medida estadística.

Trazar conjuntos de datos

Si no asume ninguna distribución, entonces necesita una distribución empírica, o necesita aproximar la distribución utilizando los datos. Puede tener algún trabajo que no requiera la estimación de la distribución. Pero en general, debe tener una idea de la distribución . Esto se muestra en histogramas, diagramas, diagramas de caja y gráficos similares que lo ayudan a comprender los datos.

Aprendizaje estadístico

El algoritmo de aprendizaje estadístico simplemente puede hacer un problema de predicción, un problema de estructura de datos, un problema de selección de variables, un problema de modelo o un problema de exploración de datos. Estos nombran algunos métodos para tener una idea de los datos. El primero aplica los datos y la respuesta para realizar predicciones sobre datos futuros. El segundo realiza cualquier reducción de dimensionalidad. El tercero elige las variables relevantes basadas en la experiencia del dominio o el conocimiento de los datos. El cuarto elige el modelo, como la regresión lineal o los vecinos K más cercanos, más adecuados para el conjunto de datos. El quinto realiza cualquier exploración en los datos, incluidas las variables o en las definiciones de datos. Todos estos le dan al analista una mejor comprensión del conjunto de datos y de cualquier método que aplique.

Práctica estadística

El aspecto más importante de la recopilación de datos, análisis de datos e interpretación de datos puede incluir detalles que algunos analistas no consideran. Estos enfatizan un mejor diseño y experimento , métodos de muestreo, uso de bibliotecas estadísticas o sistemas de bases de datos . Todo esto se aplica al esfuerzo de organizar datos, analizar datos, compartir datos y evaluar datos.

Estudio de práctica

Por último, el analista siempre necesita estudiar el protocolo , el dominio de fondo, las definiciones de datos, los roles de los compañeros de equipo y, en gran caso, los objetivos del estudio . Estos últimos puntos proporcionan un contexto bien redondeado y mejor para el analista estadístico. Proporcionan un contexto para organizar datos, experimentar datos, recopilar datos, analizar datos, evaluar datos e interpretar datos. Y le da un mejor sentido de estudio común o sentido de grupo de trabajo . Previene la sobreespecialización con la práctica estadística y abre la puerta a la comprensión compartida y al aprendizaje multidisciplinario .

More Interesting

¿Cómo manejo la recompensa retrasada en el aprendizaje por refuerzo?

¿Qué clasificador es el más adecuado para clasificar los signos en un video de lenguaje de señas?

Cómo comprender mejor las funciones de activación en el aprendizaje automático, especialmente las matemáticas detrás de ellas

¿Cuáles son las distribuciones bayesianas anteriores y posteriores? ¿Cuáles son sus roles en las redes neuronales?

Si pronostico grupos en un conjunto de trenes completo y los uso como características categóricas y realizo CV, ¿sería una fuga?

Robótica: ¿Cuáles son algunos proyectos interesantes de aprendizaje automático relacionados con UAV / drones?

¿Dónde puedo ir para averiguar cómo extraer características de un documento de texto para usar en el entrenamiento de un clasificador?

Cómo comenzar mi investigación sobre el aprendizaje por refuerzo si no soy bueno en Python

Antes de elegir y aplicar incluso el modelo de aprendizaje automático lineal más simple, ¿qué aspectos estadísticos de los datos debo considerar?

¿Cuáles son los diferentes métodos de reducción de dimensionalidad en estadística?

¿Hay alguien aquí que pueda darme una lib correcta para R-Tree en Java?

¿Qué es un clasificador transductivo?

¿Cuántos idiomas hay para las redes neuronales?

¿Cómo se puede hacer la experimentación de aprendizaje profundo en una PC en casa?

¿Qué alternativas a las redes convolucionales para las tareas de aprendizaje automático de imágenes se están investigando ahora?