¿Cómo aprendo estadísticas y probabilidad de aprendizaje automático?

(¡Todos estos recursos están disponibles en línea de forma gratuita!)

Echa un vistazo a Think Stats: Probability and Statistics for Programmers . Es específicamente útil para el aprendizaje automático, ya que enfatiza las aplicaciones con conjuntos de datos reales e incorpora ejercicios en Python.

¡Para una ventaja adicional, el autor ha lanzado el PDF del libro gratis! Probabilidad y estadística para programadores

Si está buscando un tratamiento más avanzado de estadísticas y probabilidad, consulte:

  • Estadísticas para el aprendizaje automático: Introducción al aprendizaje estadístico y minería de datos, inferencia y predicción. 2da edición.
  • Probabilidad a través de la intuición y la narración de historias : Estadísticas 110: Probabilidad y ¿Dónde puedo encontrar una buena guía de referencia rápida o una hoja de referencia para la probabilidad?

Suponiendo que esté comenzando con Machine Learning, los recursos mencionados anteriormente, aunque muy buenos, están bastante avanzados en su tratamiento. Le sugiero que eche un vistazo a “Una introducción elemental a la teoría estadística del aprendizaje”. El libro es sorprendentemente útil y simple y da una idea de todos los conceptos requeridos.

Una introducción elemental a la teoría estadística del aprendizaje (Serie Wiley en probabilidad y estadística): Sanjeev Kulkarni, Gilbert Harman: 9780470641835: Amazon.com: Libros

Muy interesante e importante pregunta! La mayoría de los programadores que se familiarizan con el aprendizaje automático están limitados por su comprensión de las estadísticas (yo estaba). Sugeriría “Los elementos del aprendizaje estadístico de Hastie, Tibshirani y Friedman” ( http://www-stat.stanford.edu/~ti …) como un excelente punto de partida. Introduce técnicas de aprendizaje automático junto con los conceptos estadísticos necesarios.

Aquí hay algunos conceptos estadísticos que son considerablemente importantes desde el punto de vista de ML (lista incompleta, sugerencias bienvenidas):

  • Regresión
  • Regularización
  • Inferencia Probabilística
  • Selección de modelo
  • Estimación de densidad

Nota: Hay (o hubo) una cierta “guerra de llamas” con respecto a la naturaleza de Estadística versus Aprendizaje automático, y algunos afirman que ML es solo Estadística reempaquetada en una forma atractiva sin nada nuevo que agregar al conocimiento humano. (¡Lea Estadísticas versus Aprendizaje automático, lucha!) Me gusta alejarme de este debate, principalmente porque no soy lo suficientemente experto en ninguno de los campos, y en segundo lugar porque me quita el tiempo que puedo pasar tratando de convertirme en uno.

Hay muchos cursos en línea para estadísticas y probabilidad. Es mejor tomar cualquiera de estos …

Le sugeriré el mejor curso en línea de probabilidad y estadística para el aprendizaje automático

Estadísticas de la Universidad de Amsterdam | Mejor Curso de Estadística [Mejor Estadística]

Sobre este curso [Descripción]:

Comprender las estadísticas es esencial para comprender la investigación en las ciencias sociales y del comportamiento. En este curso aprenderás los conceptos básicos de estadística; no solo cómo calcularlos, sino también cómo evaluarlos. Este curso también lo preparará para el próximo curso de especialización: el curso Estadística inferencial.

En la primera parte del curso discutiremos métodos de estadística descriptiva. Aprenderá qué son los casos y las variables y cómo puede calcular medidas de tendencia central (media, mediana y moda) y dispersión (desviación estándar y varianza). A continuación, discutimos cómo evaluar las relaciones entre variables e introducimos los conceptos de correlación y regresión.

La segunda parte del curso se refiere a los conceptos básicos de probabilidad: cálculo de probabilidades, distribuciones de probabilidad y distribuciones de muestreo. Debe conocer estas cosas para comprender cómo funcionan las estadísticas inferenciales.

La tercera parte del curso consiste en una introducción a los métodos de estadística inferencial, métodos que nos ayudan a decidir si los patrones que vemos en nuestros datos son lo suficientemente fuertes como para sacar conclusiones sobre la población subyacente en la que estamos interesados. Discutiremos los intervalos de confianza y pruebas de significación

No solo aprenderá sobre todos estos conceptos estadísticos, sino que también recibirá capacitación para calcular y generar estas estadísticas usted mismo utilizando un software estadístico disponible gratuitamente.

==> Una Introducción Intuitiva a la Probabilidad [MEJOR Curso de Probabilidad]

Sobre este curso:

Este curso le proporcionará una introducción intuitiva y práctica a la Teoría de la probabilidad. Podrá aprender a aplicar la Teoría de la probabilidad en diferentes escenarios y obtendrá una “caja de herramientas” de métodos para lidiar con la incertidumbre en su vida diaria.

El curso se divide en 5 módulos. En cada módulo, primero tendrá una introducción fácil al tema, que servirá como base para desarrollar aún más su conocimiento sobre el tema y adquirir las “herramientas” para lidiar con la incertidumbre. Además, tendrá la oportunidad de completar 5 sesiones de ejercicios para reflexionar sobre el contenido aprendido en cada módulo y comenzar a aplicar sus conocimientos adquiridos de inmediato.

Los temas tratados son: “Probabilidad”, “Probabilidad condicional”, “Aplicaciones”, “Variables aleatorias” y “Distribución normal”.

¡Verá cómo se enseñan los módulos de una manera animada, centrándose en tener una experiencia de aprendizaje entretenida y útil! ¡Esperamos verte en línea!

Todo lo mejor.

All of Statistics es un buen libro que cubre gran parte de las estadísticas y la probabilidad utilizadas en los libros de aprendizaje automático.

Think Stats describe estadísticas y probabilidades más básicas. Sin embargo, puedes leerlo gratis en línea y es un buen comienzo.

El análisis de datos bayesianos ofrece una introducción a la probabilidad y las estadísticas desde un punto de vista bayesiano.

El siguiente es el mejor curso para obtener información sobre probabilidad y estadística para desarrollar una base sólida para el aprendizaje automático:

http://online.stanford.edu/cours …: Probabilidad y estadísticas de Stanford.

  • Sin plazos, es decir, curso a su propio ritmo.
  • No hay declaración de logro.
  • Libre de costo.
  • Sin crédito.
  • Sin verificación
  • No hace falta decir, material de clase mundial.

Todo lo que necesitas es un poco de motivación para completar el curso.

Contenido del curso:

  1. Análisis exploratorio de datos.
  2. Produciendo datos.
  3. Probabilidad.
  4. Inferencia.

Además de este curso, también hay una especialización de Coursera:

https://www.coursera.org/special …: Estadísticas con R de Duke U.

Los 4 cursos junto con el capstone son pertinentes a su pregunta:

  1. Introducción a la probabilidad y los datos.
  2. Estadística inferencial.
  3. Regresión lineal y modelado.
  4. Estadísticas Bayesianas.
  5. Proyecto Capstone de estadísticas.

Hay muchos temas que son comunes tanto en estadística como en aprendizaje automático (que es simplemente reinventar la rueda). Algún concepto de teoría de probabilidad se utiliza en algunas de las técnicas de aprendizaje automático. Ejemplo anterior

  1. Reglas de probabilidad (especialmente probabilidad condicional, teoría de Bayes, etc.)
  2. Distribuciones de probabilidad
  3. Inferencia estadística (prueba de hipótesis y confianza

Puedes aprender teoría estadística y de probabilidad leyendo un libro especializado para eso. De lo contrario, muchos de los libros de aprendizaje automático cubren la teoría de probabilidad de conceptos básicos. En tal caso, no tiene que preocuparse por la fuente del tema.

Aprendizaje automático: un enfoque probabilístico es un buen libro, por ejemplo. Hay muchos en el campo.

Primero, estar interesado en ello.

Segundo, aprende de los mejores. Aprenda ciencia de datos de expertos de la industria en Harvard, Columbia, Cisco, Apple y Google. Existe una plataforma llamada Los instructores de Experfy son líderes de opinión de la industria que le brindan capacitación en profundidad en temas introductorios como estadísticas a avanzados como el aprendizaje automático.

Aquí hay algunos cursos que pueden serle útiles:

Probabilidad y estadística para la ciencia de datos con R

Fundamentos de aprendizaje automático: aprendizaje supervisado

Buena suerte aprendiendo.

Bueno, el campo de aprendizaje automático es un campo realmente complejo. En la parte de modelado, hay modelos gráficos de probabilidad, modelos de optimización tradicionales como SVM, etc. En la parte teórica, puede encontrar estadística / teoría de probabilidad, análisis convexo, etc. Por lo tanto, la estadística y la probabilidad son importantes en aprendizaje automático Son herramientas básicas para modelar y analizar. Es realmente lento aprender todos los aspectos de estadística y probabilidad.
Sin embargo, si eras un principiante de ML, te recomiendo probar algunos libros conocidos de aprendizaje automático. Creo que los primeros capítulos del libro de texto de aprendizaje automático “Machine Learning: A Probabilistic Perspective” (MLAPP) son un buen tutorial para aprender estadísticas y probabilidad de aprendizaje automático.

Creo que un fondo básico en estadística es esencial antes de aventurarse en el aprendizaje automático. Un buen libro para estadísticas ajustadas a los aprendices automáticos es el de Wassermann llamado All of Statistics. Si eres más un novato en busca de la perspectiva de un programador en Estadísticas, entonces te recomiendo Think Stats [http://www.greenteapress.com/thi…font>byallen downey. Y la mejor parte es que esta es gratis.

Estas recomendaciones no son para libros técnicos que le enseñarán sobre algoritmos y matemáticas, sino más bien introducciones a la filosofía general o actitud hacia el mundo que alguien que piensa en términos de probabilidades y aleatoriedad debería tener.

Absolutamente la señal y el ruido de Nate Silver. Una buena introducción al “pensamiento modelo” y un punto de vista bayesiano del mundo.

Engañado por Aleatoriedad por Nassim Nicholas Taleb también podría ser útil.

El Lady Tasting Tea de David Salsburg ofrece una buena descripción histórica de cómo se desarrollaron varios métodos y pruebas estadísticas, lo que proporciona un buen contexto para los tipos de situaciones que requieren (digamos) una prueba t versus una prueba de ji cuadrado. Pero está muy centrado en ser pionero de los métodos frecuentistas, mientras que el aprendizaje automático se basa (principalmente) en métodos bayesianos.

La presentación visual de información cuantitativa por Edward Tufte también puede ser útil: en realidad se trata de cómo se presentan y comunican los datos, pero tiene mucho que decir sobre las “responsabilidades” de un estadístico con sus datos y audiencia.

Elements of Statistical Learning es el mejor libro que he encontrado para Machine Learning. Es muy complicado, pero si puedes superarlo, es muy valioso.

Data Mining, realmente creo que los libros son una pérdida de tiempo. Lea el intercambio de pila y busque los PDF de API que puedan tener sus fuentes. El aprendizaje de RegEx también sería valioso en ese esfuerzo

Realmente no necesita estudiar estadísticas en detalle antes de comenzar a estudiar aprendizaje automático. Siempre y cuando tenga un fondo suficientemente fuerte en probabilidad y álgebra lineal, todos los básicos son totalmente accesibles. Puede recoger los conceptos estadísticos según los necesite.

Hay muchos recursos excelentes de aprendizaje automático en línea.

Los recursos más universales, independientemente de la experiencia, son:

Aprendizaje automático – Universidad de Stanford | Coursera

kseow.com

Dominio del aprendizaje automático

Si su énfasis está más en la probabilidad que en las estadísticas, “Probabilidad y computación” de Mitzenmacher y Upfal y “El arte de la probabilidad para científicos e ingenieros” de Hamming son destacados para los tipos de CS. “Probabilidad y procesos aleatorios” de Grimmett y Stirzaker es bien considerado pero más avanzado.

Para el material de S&P basado en cálculo general, “Estadísticas para científicos e ingenieros” de Navidi y “Probabilidad y estadísticas para ingenieros y científicos” de Walpole son sólidas y están ampliamente disponibles. Los libros de Ross son ampliamente utilizados, pero su afición es menos aficionada.

Por favor, eche un vistazo a este enlace. ¿Cómo aprendo estadísticas y probabilidad de aprendizaje automático? Hay muchos recursos de aprendizaje de probabilidad y estadísticas para ML

More Interesting

¿Cuáles son las ventajas y desventajas de cada método de regresión no lineal existente?

¿Cuál es la relación entre covarianza cero e independencia? ¿Cuáles son ejemplos en la ciencia de variables que no son independientes pero tienen cero covarianza?

¿Cuáles son las ventajas y desventajas de usar Statsmodels sobre Scikit-learn?

¿Cuál es el mejor lenguaje de programación para el aprendizaje automático? ¿Qué idioma es mejor para programar microcontroladores y otras partes de hardware?

¿Cómo podemos usar la herramienta Weka para crear un sistema de recomendación?

¿Cómo debo proceder después de completar el curso de aprendizaje automático de Andrew Ng?

¿Hay algún otro clasificador de aprendizaje profundo como softmax?

¿Qué debe saber un profesional de aprendizaje profundo para un hackathon?

¿Qué consejo daría Yoshua Bengio a los jóvenes investigadores que ingresan al campo del aprendizaje automático?

¿Es posible verificar manualmente si los vectores de soporte siguen hiperplanos teóricos en SVM usando un núcleo de base radial?

Tengo un conjunto de datos (audios y transcripciones), necesito saber cómo entrenaré estos datos para crear un modelo acústico que se utilizará para un reconocimiento de voz.

¿Cómo cambiará la TPU de Google el mercado de CPU + GPU? ¿Cómo responderán los fabricantes de chips a este cambio?

¿Cuál es el mejor curso de aprendizaje automático en Hyderabad?

¿Cómo uso la regresión logística si la variable dependiente tiene más de 2 dimensiones?

¿Cómo se puede reducir el tamaño del modelo TFIDF sin reducir significativamente la precisión?