¿Cuál es la diferencia entre estadística y aprendizaje automático?

Personalmente, creo que la predicción y la clasificación se enfatizan mucho más en el aprendizaje automático que en las estadísticas. También los estadísticos se preocupan más por cuantificar la incertidumbre (cobertura) que el aprendiz de máquina promedio.

Aquí hay algunos pensamientos de estadísticos famosos que también están activos en el aprendizaje automático.

Según Michael Jordan,
Según Larry Wasserman (Estadísticas versus Aprendizaje automático),

La respuesta corta es que no hay diferencia.

La estadística enfatiza la inferencia estadística formal (intervalos de confianza, pruebas de hipótesis, estimadores óptimos) en problemas de baja dimensión.

El aprendizaje automático enfatiza los problemas de predicción de alta dimensión.

Pero esta es una gran simplificación excesiva.

También realmente encuentro útil su tabla de terminología equivalente entre los dos campos. Encontrará un gran grado de superposición entre las dos áreas.

Aprendizaje automático de estadísticas
———————————–
Aprendizaje de Estimación
Hipótesis del clasificador
Punto de datos Ejemplo / Instancia
Regresión aprendizaje supervisado
Clasificación de aprendizaje supervisado
Característica covariable
Etiqueta de respuesta

Todas las estadísticas tienen una lista más detallada de terminología equivalente.

Aprendizaje automáticocomparacionesEstadística (disciplina académica)

¿Cuáles son algunos modelos de detección de rostros basados en aprendizaje profundo disponibles gratuitamente?

¿Qué significa el término difusión en bibliotecas numéricas con matrices como MATLAB, Numpy o TensorFlow?

¿Qué es la inteligencia artificial? ¿Cuáles son los sujetos si queremos estudiar inteligencia artificial?

¿Qué tan difícil sería implementar el aprendizaje por refuerzo para un juego de mesa?

¿Qué importancia tienen los datos en UPSC CSE? ¿Cómo memorizo un tramo tan enorme de fechas y datos?

¿Cuáles son los buenos programas de inteligencia artificial para escribir contenido?

Si solo observa los métodos estudiados en ambos campos, el aprendizaje automático y las estadísticas se parecen bastante. Sin embargo, si observa cuáles son los objetivos que intentan alcanzar ambos campos, verá que en realidad hay una gran diferencia:

Las estadísticas están interesadas en aprender algo sobre los datos, por ejemplo, que se han medido como parte de algún experimento biológico. Las estadísticas son necesarias para apoyar o rechazar hipótesis basadas en datos ruidosos, o para validar modelos, o hacer predicciones y pronósticos. Pero el objetivo general es llegar a una nueva visión científica basada en los datos.
En Machine Learning, el objetivo es resolver algunas tareas computacionales complejas ‘dejando que la máquina aprenda’. En lugar de tratar de comprender el problema lo suficientemente bien como para poder escribir un programa que sea capaz de realizar la tarea (por ejemplo, reconocimiento de caracteres escritos a mano), en su lugar, recopila una gran cantidad de ejemplos de lo que debe hacer el programa y luego ejecuta un algoritmo que puede realizar la tarea aprendiendo de los ejemplos. A menudo, los algoritmos de aprendizaje son de naturaleza estadística. Pero mientras la predicción funcione bien, no es necesario ningún tipo de información estadística sobre los datos.

Esta diferencia también se vuelve clara cuando observa el papel de la validación en ambos campos. En estadística, la validación es necesaria para asegurarse de si las conclusiones extraídas de los datos son verdaderas o no. En el aprendizaje automático, la validación adecuada es importante para saber qué algoritmo funciona mejor en los datos.

Mikio L. Braun

La estadística se trata de sacar conclusiones válidas

Se preocupa profundamente por cómo se recopilaron los datos, la metodología y las propiedades estadísticas del estimador. Gran parte de la estadística está motivada por problemas en los que necesita saber con precisión lo que está haciendo (ensayos clínicos, otros experimentos).

Las estadísticas insisten en una metodología adecuada y rigurosa, y se sienten cómodos al hacer y observar suposiciones. Se preocupa por cómo se recopilaron los datos, las propiedades resultantes del estimador o experimento (por ejemplo, valor p, estimadores imparciales) y los tipos de propiedades que esperaría si realizara un procedimiento muchas veces.

El aprendizaje automático se trata de predicción

Se preocupa profundamente por la escalabilidad y el uso de las predicciones para tomar decisiones. Gran parte del aprendizaje automático está motivado por problemas que necesitan respuestas (por ejemplo, reconocimiento de imágenes, inferencia de texto, clasificación, visión por computadora, medicina y atención médica, motores de búsqueda).

ML se complace en tratar el algoritmo como una caja negra siempre que funcione. La predicción, el rendimiento y la toma de decisiones son el rey, y el algoritmo es solo un medio para un fin. Es muy importante en ML asegurarse de que su rendimiento mejorará (y no tomará una cantidad absurda de tiempo) con más datos.

Si combina los dos, obtiene el aprendizaje automático estadístico , que se trata de predicciones realizadas utilizando muchos supuestos y técnicas estadísticas válidas.

Naran Bayanbat

More Interesting

Aprendizaje automático: ¿Puede alguien que es horrible en los concursos de kaggle seguir siendo bueno como científico de datos?

¿Cuál es el estado de la investigación sobre chatbots y la PNL en 2017?

¿Cómo analizan los algoritmos de aprendizaje automático y los algoritmos basados en léxico las palabras coloquiales en un análisis de sentimientos de Twitter?

¿Qué es el generador Deep Dream?

¿Cuáles son los diferentes modelos de aprendizaje automático?

¿Qué es el análisis de componentes principales en términos de super laicos?

Si planeo obtener un doctorado en aprendizaje de refuerzo teórico, ¿qué profesores y universidades debería considerar?

Cómo construir un proyecto de aprendizaje profundo en dos meses

¿Cuál es el algoritmo detrás de LinkedIn Pulse?

¿Cuál es el asistente virtual personal más avanzado?