El bootstrap
Puede aproximar la distribución con una muestra lo suficientemente grande y aplicar bootstrap para aproximar la distribución de muestreo. Luego usa la muestra de bootstrap para calcular su parámetro. Esto puede incluir la media, la mediana, la desviación estándar, el cuantil u otra medida estadística . Obtiene muchas muestras de bootstrap para obtener la distribución del parámetro o medida estadística.
Trazar conjuntos de datos
- ¿Qué es el aprendizaje por refuerzo?
- ¿En qué condiciones funcionaría un algoritmo lento más rápido que un algoritmo rápido?
- ¿Cuál es el editor preferido para un tipo de aprendizaje automático que trabaja principalmente en Python?
- Algunas cosas "fueron modeladas como procesos de Poisson". ¿Qué quieren decir con eso?
- ¿Cómo desarrollar una intuición para diseñar nuevos algoritmos?
Si no asume ninguna distribución, entonces necesita una distribución empírica, o necesita aproximar la distribución utilizando los datos. Puede tener algún trabajo que no requiera la estimación de la distribución. Pero en general, debe tener una idea de la distribución . Esto se muestra en histogramas, diagramas, diagramas de caja y gráficos similares que lo ayudan a comprender los datos.
Aprendizaje estadístico
El algoritmo de aprendizaje estadístico simplemente puede hacer un problema de predicción, un problema de estructura de datos, un problema de selección de variables, un problema de modelo o un problema de exploración de datos. Estos nombran algunos métodos para tener una idea de los datos. El primero aplica los datos y la respuesta para realizar predicciones sobre datos futuros. El segundo realiza cualquier reducción de dimensionalidad. El tercero elige las variables relevantes basadas en la experiencia del dominio o el conocimiento de los datos. El cuarto elige el modelo, como la regresión lineal o los vecinos K más cercanos, más adecuados para el conjunto de datos. El quinto realiza cualquier exploración en los datos, incluidas las variables o en las definiciones de datos. Todos estos le dan al analista una mejor comprensión del conjunto de datos y de cualquier método que aplique.
Práctica estadística
El aspecto más importante de la recopilación de datos, análisis de datos e interpretación de datos puede incluir detalles que algunos analistas no consideran. Estos enfatizan un mejor diseño y experimento , métodos de muestreo, uso de bibliotecas estadísticas o sistemas de bases de datos . Todo esto se aplica al esfuerzo de organizar datos, analizar datos, compartir datos y evaluar datos.
Estudio de práctica
Por último, el analista siempre necesita estudiar el protocolo , el dominio de fondo, las definiciones de datos, los roles de los compañeros de equipo y, en gran caso, los objetivos del estudio . Estos últimos puntos proporcionan un contexto bien redondeado y mejor para el analista estadístico. Proporcionan un contexto para organizar datos, experimentar datos, recopilar datos, analizar datos, evaluar datos e interpretar datos. Y le da un mejor sentido de estudio común o sentido de grupo de trabajo . Previene la sobreespecialización con la práctica estadística y abre la puerta a la comprensión compartida y al aprendizaje multidisciplinario .