Naive Bayes es probablemente uno de los mejores clasificadores para este tipo de problema (muchas tareas de clasificación de texto tienen el mismo carácter: las características son la presencia o ausencia de palabras, y se ha demostrado que Naive Bayes funciona muy bien en las tareas de clasificación de texto). Si bien la representación de Naive Bayes no es tan expresiva como otras, es muy buena para aprovechar al máximo un pequeño número de muestras.
Tanto el enfoque basado en el árbol de decisión como el del vecino más cercano van a tener dificultades con este tipo de datos: el vecino más cercano tendrá dificultades porque en 100,000 dimensiones nada se acerca a nada; y los árboles de decisión tendrán dificultades porque se sobreajustarán con 100,000 atributos. Las redes neuronales tendrán los mismos problemas, porque hay demasiados parámetros para entrenar.
El único otro clasificador que podría funcionar bien con este tipo de datos será la máquina de vectores de soporte, especialmente si puede encontrar un núcleo específico de dominio.
- ¿Qué tipo de programas de back-end ejecuta YouTube, como el aprendizaje automático y otros programas funcionales?
- ¿Qué tan útil es un trabajo cuantitativo en Goldman Sachs para un doctorado posterior en Machine Learning?
- ¿Qué herramientas estadísticas se necesitan para la extracción de características y el reconocimiento de patrones en el procesamiento de imágenes?
- ¿Hay algún resumen de las mejores modelos para el premio de Netflix? ¿Cuáles son las ideas de alto nivel e intuitivas detrás de los modelos ganadores que finalmente fueron utilizados en el aprendizaje conjunto por los mejores equipos?
- ¿Cuál es una buena manera de aprender aprendizaje profundo para que un estudiante graduado se una a un grupo de aprendizaje profundo de buena reputación?