Entonces, en resumen, los enfoques basados en reglas tienden a tener una generalización muy pobre, pero pueden tener un rendimiento excelente dentro de un dominio estrecho. En el aprendizaje automático, esto se conoce como sobreajuste y es un gran problema que el aprendizaje automático pretende evitar. Con los sistemas basados en reglas se considera en gran medida inevitable.
Los enfoques de aprendizaje automático tienen una mayor variedad de rendimiento, incluso desde modelos que crean enfoques internos basados en reglas (podría decirse que el bosque aleatorio cae en esta categoría). Además, los enfoques de aprendizaje automático tienden a funcionar mejor en la mayoría de las tareas en términos de precisión absoluta cuando el conjunto de entrada tiene un tamaño decente (más de 100k ejemplos).
Además, los sistemas basados en reglas tienden a ser extremadamente laboriosos de crear (a menudo requieren varias semanas de pruebas y ajustes por parte de expertos antes de que sean utilizables). Los sistemas de aprendizaje automático no son triviales de implementar, pero con la gama de herramientas poderosas que existen hoy en día, desde scikit-learn en python, hasta weka en java, hasta indico, los enfoques de aprendizaje automático pueden lograr excelentes resultados con muy poca sobrecarga.
- ¿Qué nos dicen las cargas de variables del análisis de componentes principales?
- ¿Cómo afectan los registros duplicados en el conjunto de datos de entrenamiento a un clasificador Naive Bayes?
- ¿Cuál es un algoritmo de detección de imagen apropiado para detectar corrosión / óxido?
- ¿Cuál es mejor? ¿AI o machine learning nanodegree por Udacity?
- ¿Se puede solicitar un doctorado en aprendizaje automático sin conocimientos y habilidades de CompSci? ¿Se puede aprender en el trabajo?
Si tiene un conjunto de datos (al menos 10k ejemplos), entonces algo como sklearn o weka es una excelente apuesta para un buen rendimiento sin una gran sobrecarga, si no los tiene, entonces use un sistema basado en reglas o un sistema previo El sistema de aprendizaje automático (indico) probablemente sea su mejor opción.