Soy un novato en la minería de datos. ¿Cuál es el mejor algoritmo de aprendizaje automático para la minería de datos en términos de precisión y tiempo? Me parece que SVM se ha utilizado ampliamente, pero ¿hay alguna otra opción mejor que SVM?

Si te pregunto qué película de género es mejor ver? ¿Cuál sería tu respuesta? Sí, sé que no puedes elegir un solo género de películas para todas las ocasiones. Es posible que desee ver películas de comedia cuando está triste, es posible que desee ver películas inspiradoras cuando está deprimido, es posible que desee ver una película romántica cuando echa de menos a alguien.

Del mismo modo, no hay un algoritmo de aprendizaje automático disponible para todas sus tareas de minería de datos.

Puede encontrar la lista de varios algoritmos disponibles para varias tareas de ML

Clasificación: De nuevo, aquí también hay muchos algoritmos disponibles y cualquiera de ellos podría ser el algoritmo más adecuado para su conjunto de datos. Tiene SVM, KDE, árboles de decisión, bosques aleatorios, redes neuronales, etc.

Regresión: regresión lineal, regresión logística, redes neuronales, etc.

Agrupación: k-significa agrupación, agrupación jerárquica, DBSCAN, etc.

Estudio de asociación: algoritmo Apriori, algoritmo Eclat, algoritmo de crecimiento FP, etc.

Hay muchas más secciones de minería de datos / aprendizaje automático que actualizaría más adelante.

Entonces la versión tl; dr de la respuesta es

Debe seleccionar el algoritmo que mejor se adapte a su problema y el conjunto de características / variables que está utilizando.

Aunque descubrió que SVM tiene un amplio uso que cualquier otro algoritmo de ML, no existe una regla general o teoría que indique que un algoritmo de ML en particular sea el mejor. Esto es lo que los expertos de ML dicen como “sin almuerzo gratis”. El uso más amplio debido a una disponibilidad más fácil en forma de biblioteca / API de código abierto no significa que un algoritmo sea mejor que cualquier otro. Si ve que los algoritmos de ML superan el rendimiento en competencias como kaggle, rara vez puede encontrar SVM. Hay muchas opciones para trabajar.

La precisión de cualquier algoritmo depende en gran medida de la naturaleza de los datos para los que desea crear una ‘máquina de aprendizaje’. La precisión depende igualmente de todo el proceso de aprendizaje automático; mezcla de datos, ingeniería de características, aprendizaje y evaluación.

Incluso los algoritmos de ML deben personalizarse para adaptarse a los datos disponibles para una mejor generalización y precisión deseada en lugar de utilizar una biblioteca / API generalizada.

También puede explorar otros algoritmos, como bosques aleatorios, muchas variaciones de ANN, incluyendo RBF, redes profundas, etc.

More Interesting

Cómo elegir un modelo ML cuando el objetivo es tanto una predicción razonable como una inferencia

¿Vale la pena cambiar de carrera de ciencia de datos a actuario?

¿Qué tipo de predicción puede ser posible usando la ciencia de datos en LinkedIn?

Después de tener 15 años de experiencia en la industria de semiconductores, ¿vale la pena cambiar a la ciencia de datos para paquetes de salarios más altos?

¿Cuáles son las principales herramientas de ciencia de datos utilizadas por las organizaciones líderes?

¿Puedo comenzar a aprender ciencia de datos y ser digno de mercado en 6 meses? Acabo de terminar mi maestría en ingeniería mecánica y tengo habilidades de programación muy básicas (solo C) a partir de ahora.

¿Cuál es su experiencia con la combinación de datos?

¿Cómo ayuda la normalización de datos en Machine Learning?

¿Cuáles son los pros y los contras de los algoritmos genéticos en comparación con otros métodos de optimización global?

Cómo restringir datos de fondo en mi redimi note3

¿Qué tan difícil es ser admitido en el campo de entrenamiento de ciencia de datos de Insight?

¿Esperas que Apple Swift gane impulso en el dominio de aprendizaje automático?

¿Big data es útil para los ingenieros industriales?

¿Dónde puedo encontrar preguntas y problemas sobre análisis de datos y ciencia de datos?

¿Cuál es la diferencia entre hacer ciencia de datos en Google, Amazon y WalmartLabs y hacerlo en Mu Sigma, Accenture y Opera Solutions?