¿Por qué es importante aprender el descenso de gradiente en el aprendizaje automático?

A2A.

No necesita conocer el descenso de gradiente para la regresión lineal, pero en general, para optimizar funciones objetivas arbitrarias, el descenso de gradiente o una de sus variantes es el algoritmo de facto.

Aquí hay algunas razones por las cuales usar una biblioteca para optimizar funciones arbitrarias no siempre es la mejor:

¿Cómo funcionan las capas de incrustación en TensorFlow?
¿Debo aprender el aprendizaje automático y el desarrollo de aplicaciones de Android simultáneamente? En caso afirmativo, ¿a qué lenguaje (s) de programación debo recurrir?
¿Cuál sería su guía para un hombre de 46 años que conoce la programación primaria y está interesado en obtener un conocimiento práctico del aprendizaje automático?
¿Cómo se puede reducir el tamaño del modelo TFIDF sin reducir significativamente la precisión?
¿Qué es el filtrado colaborativo en términos simples?

A menos que proporcione a la biblioteca la función objetivo y la función de gradiente, podría ser bastante lenta, ya que aproximar el gradiente de la función objetivo podría ser computacionalmente costoso. Entonces, si necesita proporcionar la función objetivo y una función de gradiente, ya ha realizado la mayor parte del trabajo necesario para escribir un algoritmo de descenso de gradiente.
Obtienes un mejor control del algoritmo. La mayoría de las bibliotecas, por ejemplo, no le permitirán controlar cómo se reduce el tamaño del paso.

Y el descenso de gradiente es uno de los algoritmos más simples en el aprendizaje automático. Entonces no, no deberías saltarte.

Si hay investigaciones que muestran que una máquina interactúa con un humano dentro de la realidad a través de una conciencia cuántica, ¿cómo se recibirá?

¿Qué utiliza la aspiradora robótica como recompensa si utilizan el aprendizaje por refuerzo como algoritmo?

Cómo evaluar mi modelo cada época en TensorFlow

Cómo usar la red neuronal de retardo de tiempo para la clasificación del conjunto de datos MNIST

El presidente de China insiste en voz alta en que su pueblo innova, luego bloquea el acceso a Internet de académicos y científicos chinos. ¿Es esto una contradicción?

Cómo decidir el tamaño de la muestra para el aprendizaje automático con datos de series temporales

No lo omita de ninguna manera. Partiendo de la respuesta de Prasoon Goyal aquí, Gradient Descent es una herramienta poderosa y puede ajustarla para optimizar CUALQUIER función objetivo y cualquier hipótesis establecida siempre que tenga alguna noción de gradiente.

Hay varias ideas que se basan en esto y es una pieza fundamental y fundamental de Machine Learning. Para darle una idea, Gradient Descent y sus variantes son la mejor herramienta que tenemos para aprender Redes neuronales que son muy, muy grandes hasta el día de hoy. Es el “estándar de la industria” en este sentido.

Adarsh Jois

No puede obtener una solución de forma cerrada para la regresión lineal regularizada L1.

Aparte de eso, el descenso de gradiente es una técnica general: si lo sabe, en principio puede resolver cualquier problema de ML que venga con una función de error diferenciable.

Kuba Bartczuk

Gracias por el A2A.

No tiene que comprender el funcionamiento del descenso de gradiente para la regresión lineal. Pero lo ayudaría a tener su base correcta y también puede ayudarlo a proponer otra dirección o solución.

En mi opinión, no debe omitirlo, ya que es bastante simple de entender. Y proporcionará una base para lo que vendrá.

Prasoon Goyal ha cubierto bien el punto.

Espero que esto ayude

Kuba Bartczuk

More Interesting

¿Debo hacer un gran proyecto de investigación de aprendizaje profundo con mi propio dinero (y tiempo), sin que me paguen, solo para que alguien pueda contratarme debido al trabajo?

¿Qué conocimiento se requiere para la pasantía de ML como estudiante universitario de CS?

¿Qué componentes de hardware (CPU, RAM, GC, etc.) se necesitan para que una PC / computadora doméstica de aprendizaje automático / aprendizaje profundo funcione rápidamente?

¿Cómo ganan dinero las startups de aprendizaje profundo o aprendizaje automático?

¿Hay nueva información sobre el tema X o la gente sigue copiando y pegando?

¿Cuándo se lanzará sklearn 0.18?

¿Qué es la inteligencia artificial? ¿Cuáles son los sujetos si queremos estudiar inteligencia artificial?