Los investigadores de aprendizaje automático están más o menos convencidos de que el empuje de píxeles (esencialmente lo que hacen los algoritmos de visión por computadora) realmente no puede hacerlo mejor que una caja negra (lo que hacen las redes neuronales), ya que no existe una estructura intuitiva en la que basar el modelo. Tenga en cuenta que esto tiene una relevancia marginal para la cognición; Es una interpretación errónea común del aprendizaje profundo y lo que hace otra respuesta a esta pregunta.
Sin embargo, sería ingenuo decir que la visión por computadora es el fin de todas las tareas de aprendizaje automático. Incluso Michael Jordan es citado en alguna parte (creo que de la reddit AMA) proclamando su propio escepticismo al aprendizaje profundo para muchos problemas de PNL. Tampoco terminan los problemas con el aprendizaje profundo. Muchos, si no la mayoría de los modelos en otros dominios hacen suposiciones paramétricas fuertes formadas a partir de distribuciones estadísticas, y están justificadas al hacerlo porque saben con precisión que tal relación es más o menos el caso.
La ventaja para los no paramétricos bayesianos se inclina hacia la ventaja de los métodos bayesianos en su conjunto (interpretabilidad con formas increíblemente intuitivas para cuantificar la incertidumbre), además de extenderse a espacios de parámetros de dimensiones infinitas. El primero le permite a uno formar pruebas de significación y continuar planteando todo tipo de preguntas interesantes, en lugar de detenerse simplemente en el modelo discriminatorio; este último hace que el modelo sea teóricamente más justificado que un espacio finito y, por lo tanto, más prometedor, ya que no depende tanto de la “ingeniería de características”.
- ¿Cómo se realiza la investigación en informática?
- ¿Cuál es el estado actual del arte en visión biomimética por computadora?
- ¿Cuál es el tema digno de investigación en un dominio de computación en la nube, específicamente relacionado con el almacenamiento de datos?
- ¿Cuáles son las mayores diferencias entre la programación con fines científicos (por ejemplo, para modelos en física o economía) y la programación para la web?
- ¿Cómo se explica NP Complete y NP-hard a un niño?