¿Por qué se supera un clasificador supervisado?

Es un poco extraño decir “clasificador supervisado”. La clasificación es un tipo de aprendizaje supervisado solamente. Y también es una pregunta vaga porque hay varios tipos de algoritmos / modelos de clasificación utilizados en el aprendizaje automático como Naive Bayes, Neural Nets, SVM, K-Nearest Neighbour, Gaussian, modelos de mezcla, etc. Estos clasificadores se pueden comparar entre sí. en rendimiento como SVM y Neural Nets supera a otros clasificadores básicos como Naive Bayes y Nearest Neighbour. El modelo de mezcla gaussiana supera en su mayoría a cualquier otro clasificador en el problema de reconocimiento de altavoces. Entonces, el rendimiento es una cuestión de relatividad.

Y, si desea decir por qué la clasificación supera en términos de predicción porque cada modelo está diseñado de tal manera que puede predecir el resultado de los datos dados en función de los datos etiquetados. Cada clasificador utiliza un enfoque matemático o estadístico diferente para lograrlo. Pero, nuevamente, el rendimiento de cualquier clasificador depende de varios factores, como su tipo de datos, la cantidad de datos, sus funciones de costos, etc.

Es una pregunta un poco extraña, ya que sería difícil definir cómo se correlaciona el ‘rendimiento’ aquí. El aprendizaje supervisado y el aprendizaje no supervisado están destinados a abordar diferentes desafíos en función de los datos conocidos disponibles.

La probabilidad y las distribuciones condicionales son fundamentalmente diferentes. Dicho esto, si está utilizando algún tipo de modelo conjunto, entonces la razón más probable por la que está encontrando resultados más * precisos * se debe a su modelo de capacitación y datos en el conjunto de aprendizaje supervisado. Las entidades etiquetadas para su modelo de aprendizaje supervisado pueden ser un número mucho más bajo que sus entidades no etiquetadas para su conjunto no supervisado (si es un entrenamiento previo), lo que resulta en un factor más bajo. Un modelo ‘generativo’ puede ser el camino a seguir si ese es el caso.

More Interesting

¿Por qué Bayes ingenuo se considera un modelo generativo?

¿Cómo está transformando el aprendizaje automático la investigación en biociencia?

¿Qué debo hacer para poder contribuir al campo de la visión por computadora y trabajar en Google en el futuro?

¿Es posible o valioso obtener otro doctorado en Machine Learning (Deep Learning) de una de las 50 mejores universidades de los Estados Unidos?

Cómo visualizar características de alto nivel en una red neuronal convolucional profunda

Cómo calcular la retropropagación en una capa de agrupación promedio global

¿Cómo utiliza Foursquare el aprendizaje automático para mejorar el producto?

¿Cómo podemos hacer una buena predicción usando el aprendizaje profundo MXNet R?

¿Cómo funciona una red neuronal?

¿Cuál es la diferencia entre la red neuronal profunda y la factorización de matriz profunda?

¿Cuándo se debe agregar una segunda capa oculta a una red neuronal?

No tengo dinero para comprar una computadora poderosa, ¿cómo puedo aprender en la GPU?

¿Qué se entiende por agrupamiento jerárquico aglomerativo?

¿Cuáles serán las características de la próxima generación de servicios de monitoreo social?

Los algoritmos de ML escritos en Java funcionan bien para un conjunto de datos más pequeño. Para un conjunto de datos grande, ¿cómo podemos escalar estos algoritmos? ¿Necesitamos buscar algoritmos distribuidos / mapas distribuidos en memoria / NOSQL / archivos para leer y escribir grandes conjuntos de datos o hay alguna buena API?