¿Qué es mejor para la dirección de investigación de visión por computadora, redes neuronales o modelos gráficos probabilísticos?

Estoy respondiendo esto desde el punto de vista de una persona con visión por computadora. Creo que la razón principal por la que los modelos gráficos parecen abundar en la literatura de la visión, mientras que las redes neuronales no lo hacen, es porque un modelo gráfico es un buen marco para codificar el conocimiento del dominio. Por poner un ejemplo, el mundo consiste en una pequeña cantidad de objetos, y estos cuando se ven desde una cámara, en presencia de luz, le dan una imagen. Un modelo gráfico probabilístico es una forma conveniente de formalizar tal intuición: solo tiene nodos que representan objetos, nodos que representan fuentes de luz, nodos que representan píxeles y ¡listo!

Por otro lado, las redes neuronales se parecen más a un algoritmo de propósito general que simplemente puede aplicar a una tarea de visión por computadora. Realmente no ofrecen muchas oportunidades para codificar intuiciones y conocimientos previos; de hecho, se supone que su fuerza es el hecho de que no necesitan ningún conocimiento previo. Si las redes neuronales se convierten en este tipo de caja negra que puede resolver cualquier tarea de visión por computadora, supongo que todos cambiarán a redes neuronales. Hasta entonces, a muchos investigadores de visión por computadora les gustaría codificar las intuiciones que tienen, y alguna fracción de ellos lo hará utilizando modelos gráficos.

Dicho esto, no existe realmente una dicotomía entre los modelos gráficos y las redes neuronales; uno se funde suavemente con el otro. Además, desde una perspectiva de visión por computadora, ambas son herramientas útiles y vale la pena conocer. Entonces, si tuviera que dar un consejo, probablemente diría: conozca ambos y luego elija lo que quiera para el problema en cuestión. Después de todo, esta es una ciencia, cómo el enfoque X funciona para la tarea Y siempre será una pregunta importante, para todos los X en la carrera y todos los Y que vale la pena conocer.

Lo que otros han olvidado mencionar es que en este momento hay muchos buenos laboratorios de investigación (por ejemplo, Google, Baidu) que trabajan en el aprendizaje profundo. Eso definitivamente dice algo sobre lo prometedor que es el campo de aprendizaje profundo. Además, estos laboratorios tienen dinero, ingenieros de software excepcionales y excelentes instalaciones informáticas, lo que los hace capaces de aprender a gran escala y rápidamente. Por lo tanto, sería relativamente difícil publicar trabajos y competir con ellos en los dominios de aplicación en los que están investigando.

PGM combina la teoría de gráficos y la teoría de probabilidad y funciona mejor con datos limitados e incluso con datos faltantes (al azar). PGM también necesita una descripción de los datos continuos antes del aprendizaje de las redes y luego inferir de estas redes aprendidas. Con PGM, uno podrá comprender cómo las variables subyacentes interactúan entre sí para producir los resultados.
Las redes neuronales, por otro lado (con mi conocimiento limitado), creo que hasta ahora no es capaz de proporcionar / visualizar la forma en que las variables en estudio están interactuando como por PGM. Por favor, corríjame si me equivoco al decir lo anterior. Dicho esto, no significa que ANN no sea poderosa. Tanto PGM como ANN modelan las buenas condiciones y, como Bharath le dijo brillantemente, depende del problema y del usuario para ver cuál usar

Las redes neuronales son en esencia una forma especial de modelo gráfico basado en la distribución de gibbs y se comporta como un algoritmo de propagación de creencias. Es muy similar al llamado modelo de campo aleatorio condicional en la jerga de pgms. Por lo tanto, estudiar pgd requiere un poco de trabajo en redes neuronales al menos.

More Interesting

¿Cuáles son algunas de las investigaciones más alucinantes jamás realizadas o en curso en el aprendizaje automático estadístico?

¿Cómo descifrar cualquier entrevista de aprendizaje automático? ¿Qué tipo de preguntas debo esperar? Qué tipos de proyectos paralelos relevantes se verían bien en un CV

¿Es el hecho de que los algoritmos de aprendizaje profundo requieren grandes extensiones de datos como una limitación final de su potencial en IA?

¿Cómo puedo explicar que las unidades tradicionales de red neuronal recurrente (RNN) sufren el problema del gradiente de fuga?

¿Cuál es el asistente virtual personal más avanzado?

Como ingeniero de ASIC, ¿cómo debo prepararme para la era del aprendizaje automático?

¿Cuáles son algunos de los beneficios del análisis de regresión múltiple?

¿Cuál es el significado de muchas sinapsis entre dos neuronas en la red neuronal?

¿Quiénes son los mejores expertos en Machine Learning en el Área de la Bahía?

¿Cuándo es un bosque aleatorio una mala elección en relación con otros algoritmos?

¿Puede Naive Bayes alcanzar algún rendimiento con suficientes datos?

¿Cómo se convierten los físicos en ingenieros de aprendizaje automático?

Para aquellos que han usado redes neuronales u otro aprendizaje automático, ¿cuánto tiempo de procesamiento les ha llevado entrenarlos y qué tan grande fue el conjunto de datos?

¿Qué es mejor para la dirección de investigación de visión por computadora, redes neuronales o modelos gráficos probabilísticos?

¿Podrían las entradas del algoritmo de entrenamiento Perceptron tener diferentes tipos?