¿Qué parámetros en los datos de entrenamiento / prueba deben considerarse para decidir la elección de un método de clasificación de aprendizaje automático (fuera de SVM, red neuronal, regresión logística, etc.)?

En gran medida es impulsado por su intuición. Es muy esencial que comprenda bien el problema. Todos y cada método tiene sus ventajas. & contras. Para la clasificación en conjuntos de datos pequeños, SVM funciona bastante bien porque tiene la flexibilidad de usar núcleos no lineales. También SVM es un algoritmo teóricamente sólido y bien versado. A medida que aumenta el tamaño del conjunto de datos, el rendimiento de SVM tiende a disminuir. Para conjuntos de datos muy grandes, no se puede usar el método tradicional del núcleo y aquí las pérdidas de SVM son una ventaja. La regresión logística nuevamente no difiere mucho de la SVM, aparte del hecho de que siempre que desee proporcionar al problema una formulación probabilística. Además, la regresión logística es adecuada para la capacitación en línea y en condiciones de alto ruido funciona bien. Pero una vez más, la regresión logística pierde la pista como no. de categorías aumenta. Para las redes neuronales, el misterio aún no está completamente resuelto. Todavía es un tipo de caja negra para una gran cantidad de personas que generalmente funciona. El poder principal de las redes neuronales radica en su capacidad para representar funciones complejas no lineales. En días anteriores, el gradiente tiende a desaparecer después de algunas capas y todos nos quedamos con ruido aleatorio, por lo que tiende a sobreajustar los datos. Pero recientemente, debido a las nuevas técnicas de regularización para evitar el sobreajuste, la disponibilidad de alta potencia de cálculo y el descenso de gradiente estocástico (sí, es imp.) Las redes neuronales (o algún tipo de variante) se han convertido en la mejor apuesta que se jugaría para datos a gran escala y Lo interesante es que no decepciona 😛
Entonces, nuevamente diría que comprenda bien el algoritmo, estudie sus fundamentos lógicos y eso le dará el sabor de cada técnica.
Hablando francamente en la mayoría de los escenarios, la gente todavía tiende a creer en la validación cruzada. Prueban varios algoritmos y tienden a elegir el que se desempeña mejor para ese caso.

More Interesting

¿Es generalmente una buena idea entrenar en caso real, desarrollar y probar conjuntos de datos para la traducción automática?

¿Cuál es un buen lugar para comenzar a trabajar en el uso del aprendizaje automático para el modelado de riesgo de crédito?

¿Qué te sorprendió después de ver algo relacionado con el aprendizaje automático, la IA, la PNL o la visión por computadora?

¿Cómo modifica una red neuronal su peso sin entrar en un efecto de ping-pong? La función de modificación de peso se basa en el error (l * e * o [1, 2]), por lo que los valores de error altos dan modificaciones de peso drásticas.

¿Cuál es el significado intuitivo de una matriz de covarianza?

En la optimización matemática, ¿por qué alguien usaría el descenso de gradiente para una función convexa? ¿Por qué no encontrarían simplemente la derivada de esta función y buscarían el mínimo de la manera tradicional?

¿Cuáles son los pros y los contras del aprendizaje en línea y fuera de línea? ¿En qué escenarios son útiles cada uno?

No tengo dinero para comprar una computadora poderosa, ¿cómo puedo aprender en la GPU?

¿Cuáles son algunas de las ventajas de usar PyTorch sobre TensorFlow?

¿Por qué las celdas LSTM tienen dos puertas de escritura?

¿Cómo manejan las empresas en Silicon Valley sus datos de flujo de red?

¿Cuáles son algunos de los documentos fundamentales sobre el aprendizaje profundo?

¿Cuál es el mejor algoritmo para implementar un reconocimiento de voz robusto en entornos ruidosos?

¿Dónde puedo encontrar el código fuente para construir un árbol de decisión usando el algoritmo ID3 en C?

¿Cuál es el mejor software de reconocimiento facial en el mercado?