¿Cómo debo entender el marco experto en aprendizaje en línea?

Los algoritmos de expertos son extremadamente útiles, incluso si no está combinando explícitamente los consejos de “expertos”. Los expertos solo corresponden a “opciones”.

Por ejemplo, suponga que quiere jugar un juego contra un oponente. Puedes identificar a los expertos con las acciones en el juego, y la pérdida de los expertos con la pérdida que experimentas por jugar esas acciones contra tu oponente. Aquí la garantía de que logras una pérdida no mayor que el mejor experto en retrospectiva corresponde a alcanzar tu valor mínimo en el juego.

En términos más generales, los algoritmos expertos son realmente solo algoritmos para la optimización lineal en línea. Suponga que desea encontrar el mejor clasificador [math] \ theta \ in \ mathbb {R} ^ d [/ math] cuando tiene funciones de pérdida lineal [math] \ ell ^ t: \ mathbb {R} ^ d \ rightarrow \ mathbb {R} [/ math] viene con el tiempo. Aquí, simplemente identifique a los “expertos” con los vectores básicos estándar [math] e_1, \ ldots, e_d \ in \ mathbb {R} ^ d [/ math]. Por lo tanto, hacerlo tan bien como los mejores (distribución sobre) expertos en retrospectiva corresponde a tener una pérdida que no sea más que el minimizador empírico de riesgos [matemática] \ theta ^ * [/ matemática] en retrospectiva, ya que cualquier punto puede escribirse como una combinación lineal de vectores de base. Los algoritmos como el descenso de gradiente en línea (y Perceptron, que es un caso especial) son solo algoritmos expertos, generalizados para operar en conjuntos convexos distintos del simplex de probabilidad. Si ejecuta un descenso de gradiente en línea dentro del simplex de probabilidad, siempre puede interpretar su punto actual como una distribución sobre expertos.

More Interesting

¿Es posible que una computadora aprenda a distinguir gatos de perros de solo un conjunto de imágenes sin que le digamos qué imágenes son gatos y cuáles son perros, o incluso si hay cosas como gatos y perros, y si es así, cómo es exactamente esto? ¿hecho?

¿Se pueden usar datos generados por simulación por computadora para algoritmos de aprendizaje automático?

¿Cuáles son los beneficios de usar el Descenso de gradiente de mini lotes?

¿Cómo se entrenan las redes estocásticas generativas?

En la clasificación binaria, ¿es una buena práctica siempre sobre / submuestrear su conjunto de datos para tener un número idéntico de muestras de las dos clases?

¿Cuáles son las principales diferencias entre los MOOC de aprendizaje automático de Caltech y Stanford?

¿Por qué el aprendizaje de refuerzo (profundo) no es adecuado o se usa más para resolver problemas de optimización combinatoria?

¿Es posible hacer una selección de características para las tareas de regresión por XGBoost?

¿Cuál es la diferencia entre un sistema experto y el aprendizaje automático?

¿Qué es diferenciar los bosques aleatorios de otros métodos de conjunto en Data Science y por qué?

¿Cuál es la relación de la matriz de curvatura y el aprendizaje profundo?

¿Hay algún lugar donde los métodos tradicionales de aprendizaje automático puedan vencer el aprendizaje profundo o las redes neuronales?

Como estudiante que realiza un curso de algoritmos de aprendizaje automático, ¿en qué debe centrarse el objetivo principal para maximizar el conocimiento aplicable al final del semestre?

¿En qué se diferencia el método de agrupamiento en el aprendizaje automático de disparar una consulta SQL 'select' para agrupar personas u objetos? ¿Cuáles son las diferencias y necesidades reales?

¿Se está separando la ciencia de datos / aprendizaje automático de la informática tradicional?