Esto es difícil porque realmente necesitas los tres, y casi siento que estoy perjudicando a mis lectores al implicar lo contrario, pero aún así lo intentaré.
Lo siguiente asume problemas de regresión y clasificación de estilo kaggle. Tome una lista de características básicas y calcule una asignación de clase o prediga un valor. Esa clase de cosas.
- Buenos datos. Esto es fundamental Si no tiene suficientes datos, o los datos correctos, o datos que reflejen con precisión el problema tal como aparecerá, entonces nada más importa y también podría ver qué tan bien puede hacerlo con una heurística inteligente y renunciar al aprendizaje automático enteramente. Además, con suficientes datos, puede hacer bastante para compensar características o algoritmos simplistas, pero lo contrario solo es cierto si encuentra alguna forma inteligente de simplificar el problema.
- Buenas características. Las características bien pensadas pueden hacer que sea mucho más fácil capturar detalles interesantes de un problema. Características mal elegidas, o el número incorrecto, o el conjunto incorrecto, y el problema se vuelve imposible.
- Buenos algoritmos Estos también son de vital importancia, al menos para muchos problemas más interesantes. Sin embargo, si su problema parece una clasificación bastante estándar o un problema de regresión, la mayor parte del tiempo la diferencia entre los algoritmos de vanguardia cuidadosamente ajustados y lo primero que alguien pensaría intentar resulta ser mucho menos que diferencias entre diferentes conjuntos de características, por ejemplo.
Sin embargo, cuando se trata de problemas del tipo que a menudo se llama “reconocimiento de patrones” y casi nunca se llama “ciencia de datos”, me inclinaría a cambiar los números 2 y 3. Las características siguen siendo importantes, pero en esos problemas el El algoritmo correcto hace una diferencia mucho más drástica.
- ¿Qué significa el espacio de hipótesis en Machine Learning?
- ¿Cuál es la explicación intuitiva y práctica del algoritmo AdaBoost utilizado en el artículo de Viola-Jones sobre detección de rostros, en lenguaje moderadamente técnico?
- ¿Cuáles son algunos trabajos de investigación basados en ciencia de datos y aprendizaje automático en los que R se utiliza como lenguaje de programación?
- ¿Cuáles son las máquinas CNC más vendidas en todo el mundo?
- ¿Qué tipo de programas de back-end ejecuta YouTube, como el aprendizaje automático y otros programas funcionales?