¿Cuál es la diferencia entre SVM y ANN?

Un hiperplano es un hiperplano es un hiperplano. Dicho esto, debemos tener cuidado aquí. De hecho, podría agarrar a mi amigo Ben y pedirle que señale un hiperplano separador. Ahora, ¿cuál es la diferencia entre Ben, un SVM y un ANN? 😉

De acuerdo, bromas aparte, seamos un poco más precisos.

El SVM , como lo concibió Vapnik, se deriva completamente sobre la base de varias técnicas matemáticas simples (a saber, la derivada parcial y los multiplicadores de Lagrange). Dicho hiperplano del SVM se encuentra resolviendo un problema de optimización restringido en el que se intenta maximizar el ancho del margen mientras se intenta clasificar correctamente los puntos en el espacio ND .

El ANN (supongamos que algunos MLP genéricos) tiene un hiperplano (el vector de los pesos) que se encuentra minimizando algunas funciones de pérdida a través de la propagación hacia atrás de los errores. Este hiperplano intenta clasificar correctamente los puntos (penalizando las respuestas incorrectas) pero no intenta directamente maximizar el ancho del margen .

Ben es un tipo inteligente que trabaja en una empresa genial.

En resumen , no es el destino, es el viaje …

¿Cómo sugeriría Carlos Matias La Borde que un novato aprenda el aprendizaje automático?

¿Cuáles son las mejores técnicas para crear vectores de oraciones para el procesamiento del lenguaje natural?

¿Cuáles son las diferentes técnicas de minería de texto?

¿Qué es el aprendizaje automático?

¿Qué nivel de sofisticación matemática / estadística se espera de una persona que comienza en el campo de la ciencia de datos?

¿Cómo puede una red neuronal convolucional aprender características invariables?

Una sola capa ANN y SVM aprenden formas muy similares de modelos, salida (x) = sum_over_all_i weight_i * nonlinear_function_i (x). Si no fuera por los diferentes métodos de Optimización que usan para dibujar el hiperplano, también podrían haber obtenido los mismos resultados (los resultados usando incluso métodos diferentes estarán cerca).
Mientras que uno usa SMO (optimización mínima secuencial), los ANN generalmente usan el descenso de gradiente. SMO no tiene los problemas típicos de los modelos estocásticos, que se estanca en los extremos locales.

Ravin Gunawardena

Creo que te has confundido un poco sobre la idea detrás de Neural Network y Support Vector Machine. Hay muchos tipos de redes neuronales utilizadas para diversas implementaciones.

Máquina de vectores de soporte (SVM)
Red neuronal recurrente (RNN)
Máquina de Boltzmann restringida (RBM)
Red neuronal de alimentación directa (FFNN)
Red neuronal convolucional (CNN)

Estos son algunos de los muchos diseños que se utilizan para implementar diseños. Algunos burlan a otros en circunstancias específicas y se usan en consecuencia. Como ejemplo, un SVM es muy bueno en clasificación y regresión. Pero solo hasta cierto número de clasificadores. Una CNN es mejor para reconocer imágenes. Y así sucesivamente. Espero que hayas entendido.

Ravin Gunawardena

More Interesting

Cómo construir y ejecutar mi primera red de aprendizaje profundo

¿Cómo agrega Quora el aprendizaje automático a su aplicación web?

¿Hay algún ejemplo en la inferencia bayesiana de que, incluso con infinitos puntos de datos, el efecto de lo anterior no puede ser "eliminado"?

¿Cuál es mejor? ¿AI o machine learning nanodegree por Udacity?

¿Cuáles son las principales razones contra el uso de apilamiento cuando tenemos redes neuronales?

¿Tiene sentido la regularización (L2, abandono, etc.) alguna vez para datos muy ruidosos, pero también abundantes, como series de tiempo financieras?

¿Con qué facilidad pueden los actuarios cambiar a carreras relacionadas con TI como la ciencia de datos, el aprendizaje automático y el desarrollo de software?

¿Cómo utilizan las empresas los algoritmos de IA en aplicaciones prácticas?

¿Qué es un componente principal y por qué se llama así?

¿Cuál es el estado del arte en la síntesis de texto?