¿Cómo decidimos qué algoritmo usar en el aprendizaje automático?

Hola, hay una serie de factores que ayudan a decidir qué algoritmo elegir y por qué. Los factores principales incluyen:

  1. La cantidad de datos.
  2. El tipo de problema que está tratando de resolver (¿está buscando predicción basada en secuencias, etc.)
  3. La capacidad de explicación de un algoritmo puede ser un requisito especialmente en un escenario de la industria.
  4. el tipo de límite de decisión que requiere el conjunto de datos (esto es si puede visualizar el conjunto de datos) Los algoritmos dibujan diferentes líneas de decisión, algunos son lineales y otros no tanto …

Hay muchas familias de clasificadores por ahí y como estudio comparativo entre estos http://www.jmlr.org/papers/volum… es una buena lectura. pero en los que realmente necesita concentrarse son 4 básicamente SVM, bosques aleatorios, redes bayesianas y redes neuronales. (Los dos últimos son más como familias … pero estos cuatro deberían ser suficientes). También sugeriría leer documentos de investigación relevantes para el mismo, estos le darían consejos sobre qué enfoques es probable que tengan éxito.

He escrito sobre la elección de clasificadores, por lo que es posible que desee consultar mis respuestas a

La respuesta de Vaibhav Arora al Aprendizaje automático: ¿Cuáles son las ventajas de SVM sobre las redes neuronales y k- los vecinos más cercanos?

La respuesta de Vaibhav Arora a ¿Cómo puedo saber si Deep Learning funcionará mejor para un problema específico, que SVM o bosque aleatorio?

ps: – las otras respuestas a estas preguntas también son una buena lectura 🙂

Parece que necesita un clasificador para el propósito de su trabajo. Según las dimensiones de sus datos y su correlabilidad general, puede optar por un SVM con un kernel bien elegido o un ANN con una base radial, tal vez.

Este es un diagrama que tomé prestado de internet

More Interesting

¿La normalización de datos tiene otros beneficios además de acelerar el descenso del gradiente? Después de calcular los parámetros (pesos), ¿es necesario normalizar los casos de prueba proporcionados por el usuario para la predicción?

¿Debería aprender aprendizaje automático, desarrollo en la nube o desarrollo de juegos en Unity como estudiante universitario de primer año?

¿Cómo se puede aplicar el aprendizaje profundo a los sistemas de recomendación en el mercado de valores?

¿Qué criterios deberían ser apropiados para terminar el entrenamiento codicioso no supervisado de autoencoder por capas?

¿Necesito implementar modelos de aprendizaje profundo desde cero?

Cómo obtener colores 'visualmente distinguibles' de las imágenes

¿Cuál es la diferencia entre bootstrapping y validación cruzada?

¿Cómo analizan los algoritmos de aprendizaje automático y los algoritmos basados ​​en léxico las palabras coloquiales en un análisis de sentimientos de Twitter?

¿Cómo se relaciona la RNN con el aprendizaje profundo?

¿Hay orden entre las características de las incrustaciones de palabras?

¿Qué IIT en India tiene el mejor programa de CS para el aprendizaje automático?

¿Cuáles son los fundamentos programáticos del procesamiento del lenguaje natural?

¿Podemos agregar la capa SVM como capa inferior en la arquitectura CNN para una mejor clasificación?

¿Cuáles son algunas publicaciones importantes en estadísticas bayesianas?

¿Aprendizaje automático sin historia matemática?