Primero, el reconocimiento de patrones se puede usar para al menos 3 tipos de problemas: clasificación de múltiples clases, clasificación de dos clases (binario) o una clase (detección de anomalías típicamente). Lo más probable es que, para lograr los mejores resultados para cada uno de ellos, utilice un algoritmo diferente.
Soy mejor en el reconocimiento de patrones basado en dos clases y en una clase, por lo que le daré un poco de información sobre estos dos solamente. Supongamos también que los datos vienen en forma de vectores numéricos, o datos categóricos.
Un reconocimiento de patrón de dos clases es cuando desea reconocer, por ejemplo, si alguien es hombre o mujer en función de algunos datos personales a los que tiene acceso. Los algoritmos que le darán la mayor precisión son típicamente aquellos basados en redes neuronales (redes de alimentación hacia adelante, redes de convección, mlp harían) y árboles de decisión (aumento de gradiente, xgboost o bosque aleatorio).
- ¿La técnica de dos punteros se considera una búsqueda binaria en algunos problemas?
- ¿Con qué frecuencia los desarrolladores de iOS requieren estructuras de datos y diseño de algoritmos?
- Cómo hacer una matriz de entradas de usuario en JavaScript
- ¿Por qué los algoritmos no hacen las preguntas sobre Quora?
- ¿Qué depara el futuro para los algoritmos genéticos y qué tan relevantes serán en 20 años?
Normalmente, el problema de clasificación de dos clases es un problema de LR (regresión logística), pero no obtendrá muy buenos resultados con LR a menos que el problema sea muy lineal. También puede probar SVM o SVC (SVM para clasificación) y KNN, pero si desea la mayor precisión, lo hará mejor si se adhiere a los árboles de decisión y las redes neuronales.
Para el reconocimiento de patrones de una clase, normalmente desea detectar anomalías, todo lo que ES o NO ES miembro de una sola clase. Es un caso particular de clasificación de dos clases donde solo tienes una clase y todo lo demás … Mi primer consejo es tratar de repensar el problema como una clase de dos y usar los métodos anteriores. Si realmente se trata de un problema de detección de anomalías, como la detección de fraude o el diagnóstico biomédico, busque primero SVM, KNN y PCA de primera clase. También es posible que desee tomar autoencoders para dar una vuelta, una “alternativa” muy interesante para PCA (una especie de PCA no lineal) muy útil para eliminar ruido de datos y detectar anomalías utilizando una función de diferencia.
¡Buena suerte!