¿Cuáles son las técnicas más populares utilizadas para implementar el “reconocimiento de acción” en la visión por computadora?

Si tiene una idea clara de qué tipo de acciones (o secuencia de acciones) desea reconocer, encontrará dos grandes familias de técnicas en la literatura:

– Las técnicas simbólicas provienen de la comunidad de IA como el razonamiento temporal bajo restricciones [1].
Técnicas probabilísticas como Hidden Markov Models [2] o Bayesian Networks [3].

Minería de datos Las técnicas (minería de reglas de asociación) también se pueden utilizar para descubrir acciones desconocidas.

Para obtener más detalles, puede consultar algunos documentos de revisión de este dominio [4].

No hay bala de plata. Las técnicas simbólicas no manejan bien la incertidumbre y las técnicas probabilísticas requieren una gran cantidad de muestras de video para construir modelos confiables. Tomar la decisión correcta depende de su problema y de la calidad / tamaño de su conjunto de datos.

En los sistemas del mundo real, el desarrollo de detectores de acción ad-hoc debe considerarse para acciones razonablemente simples. El problema aquí es adoptar buenas técnicas de ingeniería de software para poder extender fácilmente el sistema.

[1] Van-Thinh VU, François BRÉMOND y Monique THONNAT. Interpretación automática de video: un algoritmo novedoso para el reconocimiento de escenarios temporales. La Decimoctava Conferencia Conjunta Internacional bianual sobre Inteligencia Artificial (IJCAI’03), Acapulco, México, 15-15 / 08/2003

[2] Yamato, J., Ohya, J. e Ishii, K. 1992. Reconociendo la acción humana en imágenes secuenciales en el tiempo utilizando modelos ocultos de Markov. En Actas de la Conferencia IEEE sobre Visión por Computadora y Reconocimiento de Patrones (CVPR), IEEE, Los Alamitos, CA, 379–385.

[3] Park, S. y Aggarwal, JK 2004. Una red bayesiana jerárquica para el reconocimiento de eventos de acciones e interacciones humanas. Sistema Multimedia 10, 2, 164-179.

[4] JK Aggarwal, MS Ryoo. Análisis de la actividad humana: una revisión. ACM Computing Surveys (CSUR), Volumen 43, Edición 3, abril de 2011 – http://portal.acm.org/citation.c…

More Interesting

¿Cómo es útil el aprendizaje automático en el mundo real?

¿Existe un algoritmo de ML capaz de resolver esto?

¿Cuáles son los problemas más interesantes en los que OpenAI está trabajando?

¿Cuáles son los mejores kits robóticos programables para un ingeniero relativamente novato que desea practicar algunas implementaciones de aprendizaje automático utilizando un robot?

¿Habría alguna vez computadoras concientes / conscientes?

¿Tara Karimi (científica de células madre) realmente resolvió P versus NP como se sugiere en su charla TEDx?

¿Cuál es el mejor algoritmo de aprendizaje automático para predecir datos numéricos?

¿Por qué se llama así el aprendizaje residual profundo?

¿Cuáles son los idiomas más importantes para un ingeniero de aprendizaje automático?

¿Puede la IA en su etapa de desarrollo actual tener la capacidad de reducir la complejidad mediante el desarrollo de abstracciones?

¿Cómo podrían usarse las expresiones faciales para medir los niveles de amenaza usando redes neuronales?

¿Cómo funcionaría un robot que come contaminación?

¿Cuáles son algunos ejemplos de juegos de computadora que usan aprendizaje automático? ¿Los juegos como FIFA 2013 de EA Sports aprenden de un usuario? ¿La computadora cambia sus tácticas de acuerdo con el estilo de juego del oponente? Si no, ¿es esto posible de implementar?

¿Cuál es su proceso de pensamiento al elegir una arquitectura de red neuronal?

¿Estamos cerca de construir potencialmente una IA malvada?