¿Qué son los SVM?

La máquina de vectores de soporte es una herramienta utilizada para resolver problemas supervisados de aprendizaje automático.

Dado un conjunto de puntos dimensionales altos, cada uno asociado con una etiqueta binaria (verdadero / falso), tratamos de encontrar una separación simple entre las dos clases.

Un SVM regular (también llamado lineal o sin núcleo) encuentra un hiperplano óptimo que separa las muestras positivas de las negativas. Es muy similar a un perceptrón a este respecto. Sin embargo, un SVM está garantizado para encontrar una separación de margen máxima. Si es posible encontrar un plano con todos los puntos positivos en un lado y todos los negativos en el otro lado, los datos se denominan linealmente separables. Un SVM no solo encontrará dicho plano, sino que también encontrará el que maximiza el margen entre las muestras y el plano que lo ayuda a generalizar mejor a nuevos puntos. Además, cuando los datos no son perfectamente separables, un SVM todavía encuentra el mejor plano de separación posible.

Muchos problemas no son uniformemente linealmente separables como es, pero podemos encontrar una traducción entre los puntos originales a un espacio que es linealmente separable o al menos bastante cercano a eso.

Para resolver SVM se observa que en realidad no necesitamos los puntos en sí mismos, es suficiente calcular el producto de punto entre dos puntos que se puede ver como una especie de función de distancia. En lugar de traducir a un espacio diferente, podemos reemplazar el producto de punto con uno que coincida con un espacio diferente, normalmente una dimensión más alta o incluso una infinita que no podríamos manejar directamente. Estos son núcleos SVM, hay familias de los cuales se ha demostrado que funcionan bien para muchos problemas, especialmente el núcleo RBF.

Related Content

¿Cómo se realiza el aprendizaje automático supervisado cuando sus datos no caben en una sola máquina? ¿Los clasificadores de libros de texto como los clasificadores SVM o Naive Bayes siguen siendo tan importantes o incluso factibles a medida que aumenta el tamaño de sus datos o los algoritmos diferentes se vuelven más populares?

Cómo manejar una imagen de diferentes tamaños en una red convolucional de MatConvNet con un contenedor DagNN

¿Por qué la optimización convexa es tan importante en el aprendizaje automático?

¿Cómo se puede aplicar RL (método de gradiente de política) al problema de selección de subconjunto, donde cada prueba consiste en seleccionar un subconjunto de elementos de un conjunto más grande?

¿Vale la pena adquirir un conocimiento profundo tanto del aprendizaje automático como de la biología? ¿Debo concentrarme?

Cuando elimino un archivo de mi PC, ¿cómo puedo recuperarlo?

¿Hay algún lugar para ingenieros de software que no aprendan IA o Machine Learning en los próximos 10 años o todos tienen que aprenderlo?

More Interesting

¿Puedo usar el aprendizaje por refuerzo para ayudar a las personas a elegir la ruta más barata cuando viajan en avión?

¿Cuáles son algunas falacias o errores comunes cometidos por los principiantes en estadística, aprendizaje automático y análisis de datos?

¿Estamos presenciando las primeras etapas del uso de ML en la industria o cree que la aplicación de ML hacia la industria ya está muy extendida?

¿Cuáles son algunas de las ventajas del aprendizaje por diferencia temporal y cómo se puede mejorar?

¿Cuáles son las diferencias entre los algoritmos CHAID y CART para el crecimiento de los árboles de decisión?

¿Cómo puede alguien usar los datos de la secuencia de genes para encontrar genes responsables de una enfermedad genética en particular?

¿Por qué la optimización del aprendizaje profundo es más rápida en las CPU que en las GPU?

¿Cuáles son las cosas tecnológicas que más impactarán en el futuro de los trabajos (aprendizaje automático, aprendizaje profundo, redes neuronales, etc.)?

¿Existen demostraciones efectivas de relevancia semántica?

¿Cuáles son los primeros usos de la regresión logística?

¿Cuál es la explicación intuitiva y práctica del algoritmo AdaBoost utilizado en el artículo de Viola-Jones sobre detección de rostros, en lenguaje moderadamente técnico?

¿Existe un programa de tipo PageRank para organizar mis canales RSS diarios?

¿Puede el aprendizaje automático realizar un análisis de sentimientos de una palabra clave dada de una conversación?

¿Vale la pena seguir una maestría en aprendizaje automático de NCSU? ¿Es una mejor opción solo por el triángulo de investigación?

¿Qué son las redes neuronales profundas?

Web Analytics