¿Cuál es el mejor algoritmo de reconocimiento de patrones hoy?

Primero, el reconocimiento de patrones se puede usar para al menos 3 tipos de problemas: clasificación de múltiples clases, clasificación de dos clases (binario) o una clase (detección de anomalías típicamente). Lo más probable es que, para lograr los mejores resultados para cada uno de ellos, utilice un algoritmo diferente.

Soy mejor en el reconocimiento de patrones basado en dos clases y en una clase, por lo que le daré un poco de información sobre estos dos solamente. Supongamos también que los datos vienen en forma de vectores numéricos, o datos categóricos.

Un reconocimiento de patrón de dos clases es cuando desea reconocer, por ejemplo, si alguien es hombre o mujer en función de algunos datos personales a los que tiene acceso. Los algoritmos que le darán la mayor precisión son típicamente aquellos basados ​​en redes neuronales (redes de alimentación hacia adelante, redes de convección, mlp harían) y árboles de decisión (aumento de gradiente, xgboost o bosque aleatorio).

Normalmente, el problema de clasificación de dos clases es un problema de LR (regresión logística), pero no obtendrá muy buenos resultados con LR a menos que el problema sea muy lineal. También puede probar SVM o SVC (SVM para clasificación) y KNN, pero si desea la mayor precisión, lo hará mejor si se adhiere a los árboles de decisión y las redes neuronales.

Para el reconocimiento de patrones de una clase, normalmente desea detectar anomalías, todo lo que ES o NO ES miembro de una sola clase. Es un caso particular de clasificación de dos clases donde solo tienes una clase y todo lo demás … Mi primer consejo es tratar de repensar el problema como una clase de dos y usar los métodos anteriores. Si realmente se trata de un problema de detección de anomalías, como la detección de fraude o el diagnóstico biomédico, busque primero SVM, KNN y PCA de primera clase. También es posible que desee tomar autoencoders para dar una vuelta, una “alternativa” muy interesante para PCA (una especie de PCA no lineal) muy útil para eliminar ruido de datos y detectar anomalías utilizando una función de diferencia.

¡Buena suerte!

No hay una sola. depende del problema / dominio

Pero la lista de los buenos son (y deberías probar al menos una de estas “famelies”)

1.SVM

2 árbol de decisión

3.LDA / QDA

4.Bayes

5.K-significa

6. Redes (de cualquier tipo)

7. Aprendizaje reforzado

Por último, pero no menos importante, las condiciones previas son la reducción de dimensiones, la manipulación métrica y la eliminación de valores atípicos.

¡El principal problema con preguntas como la suya es que no menciona lo que significa “mejor”! ¿Mejor en qué? ¡No hay un “mejor” algoritmo! Cada algoritmo funciona para un tipo específico de problema / datos.