¿Cuál es la diferencia entre estadística y aprendizaje automático?

Personalmente, creo que la predicción y la clasificación se enfatizan mucho más en el aprendizaje automático que en las estadísticas. También los estadísticos se preocupan más por cuantificar la incertidumbre (cobertura) que el aprendiz de máquina promedio.

Aquí hay algunos pensamientos de estadísticos famosos que también están activos en el aprendizaje automático.

Según Michael Jordan,
Según Larry Wasserman (Estadísticas versus Aprendizaje automático),

La respuesta corta es que no hay diferencia.

La estadística enfatiza la inferencia estadística formal (intervalos de confianza, pruebas de hipótesis, estimadores óptimos) en problemas de baja dimensión.

El aprendizaje automático enfatiza los problemas de predicción de alta dimensión.

Pero esta es una gran simplificación excesiva.

También realmente encuentro útil su tabla de terminología equivalente entre los dos campos. Encontrará un gran grado de superposición entre las dos áreas.

Aprendizaje automático de estadísticas
———————————–
Aprendizaje de Estimación
Hipótesis del clasificador
Punto de datos Ejemplo / Instancia
Regresión aprendizaje supervisado
Clasificación de aprendizaje supervisado
Característica covariable
Etiqueta de respuesta

Todas las estadísticas tienen una lista más detallada de terminología equivalente.

Si solo observa los métodos estudiados en ambos campos, el aprendizaje automático y las estadísticas se parecen bastante. Sin embargo, si observa cuáles son los objetivos que intentan alcanzar ambos campos, verá que en realidad hay una gran diferencia:

  • Las estadísticas están interesadas en aprender algo sobre los datos, por ejemplo, que se han medido como parte de algún experimento biológico. Las estadísticas son necesarias para apoyar o rechazar hipótesis basadas en datos ruidosos, o para validar modelos, o hacer predicciones y pronósticos. Pero el objetivo general es llegar a una nueva visión científica basada en los datos.
  • En Machine Learning, el objetivo es resolver algunas tareas computacionales complejas ‘dejando que la máquina aprenda’. En lugar de tratar de comprender el problema lo suficientemente bien como para poder escribir un programa que sea capaz de realizar la tarea (por ejemplo, reconocimiento de caracteres escritos a mano), en su lugar, recopila una gran cantidad de ejemplos de lo que debe hacer el programa y luego ejecuta un algoritmo que puede realizar la tarea aprendiendo de los ejemplos. A menudo, los algoritmos de aprendizaje son de naturaleza estadística. Pero mientras la predicción funcione bien, no es necesario ningún tipo de información estadística sobre los datos.

Esta diferencia también se vuelve clara cuando observa el papel de la validación en ambos campos. En estadística, la validación es necesaria para asegurarse de si las conclusiones extraídas de los datos son verdaderas o no. En el aprendizaje automático, la validación adecuada es importante para saber qué algoritmo funciona mejor en los datos.

La estadística se trata de sacar conclusiones válidas

Se preocupa profundamente por cómo se recopilaron los datos, la metodología y las propiedades estadísticas del estimador. Gran parte de la estadística está motivada por problemas en los que necesita saber con precisión lo que está haciendo (ensayos clínicos, otros experimentos).

Las estadísticas insisten en una metodología adecuada y rigurosa, y se sienten cómodos al hacer y observar suposiciones. Se preocupa por cómo se recopilaron los datos, las propiedades resultantes del estimador o experimento (por ejemplo, valor p, estimadores imparciales) y los tipos de propiedades que esperaría si realizara un procedimiento muchas veces.

El aprendizaje automático se trata de predicción

Se preocupa profundamente por la escalabilidad y el uso de las predicciones para tomar decisiones. Gran parte del aprendizaje automático está motivado por problemas que necesitan respuestas (por ejemplo, reconocimiento de imágenes, inferencia de texto, clasificación, visión por computadora, medicina y atención médica, motores de búsqueda).

ML se complace en tratar el algoritmo como una caja negra siempre que funcione. La predicción, el rendimiento y la toma de decisiones son el rey, y el algoritmo es solo un medio para un fin. Es muy importante en ML asegurarse de que su rendimiento mejorará (y no tomará una cantidad absurda de tiempo) con más datos.

Si combina los dos, obtiene el aprendizaje automático estadístico , que se trata de predicciones realizadas utilizando muchos supuestos y técnicas estadísticas válidas.

More Interesting

Aprendizaje automático: ¿Puede alguien que es horrible en los concursos de kaggle seguir siendo bueno como científico de datos?

¿Cuál es el estado de la investigación sobre chatbots y la PNL en 2017?

¿Cómo analizan los algoritmos de aprendizaje automático y los algoritmos basados ​​en léxico las palabras coloquiales en un análisis de sentimientos de Twitter?

¿Qué es el generador Deep Dream?

¿Cuáles son los diferentes modelos de aprendizaje automático?

¿Qué es el análisis de componentes principales en términos de super laicos?

Si planeo obtener un doctorado en aprendizaje de refuerzo teórico, ¿qué profesores y universidades debería considerar?

Cómo construir un proyecto de aprendizaje profundo en dos meses

¿Cuál es el algoritmo detrás de LinkedIn Pulse?

¿Cuál es el asistente virtual personal más avanzado?

¿De dónde obtienen los sistemas de conducción autónomos sus datos de entrenamiento?

¿Has utilizado Google Translate recientemente? ¿Cómo es la calidad de la traducción con su nueva traducción automática neuronal? ¿Cómo es para cualquier par de idiomas?

¿Por qué los modelos gráficos probabilísticos tienen un rendimiento inferior en las tareas de clasificación en comparación con las redes neuronales o las máquinas de vectores de soporte?

¿Alguna forma de dormir será esencial en la IA (inteligencia artificial)?

¿Qué campos están siendo afectados por el progreso de la investigación en el procesamiento del lenguaje natural?