Para darle una breve introducción,
Soy ingeniero en Compellon, una plataforma de tecnología de modelado predictivo totalmente autónoma que (principalmente) utiliza conceptos de teoría de la información para diversas fases de análisis. La tecnología se basa en décadas de investigación de nuestro científico jefe, el Dr. Nikolai Liachenko, un experto en teoría de la información e inteligencia artificial.
Así es como la teoría de la información nos ha ayudado a analizar conjuntos de datos reales de clientes en diferentes dominios:
- Inteligencia artificial: ¿Qué es la 'comprensión de video'?
- ¿La IA es vulnerable a los hackers? En caso afirmativo, ¿será a prueba de piratas informáticos?
- ¿Cómo se usan las redes neuronales en el procesamiento del lenguaje natural?
- ¿Cómo aplican los fondos de cobertura el aprendizaje automático a los mercados financieros?
- Cómo obtener datos para mi chatbot
a) Una de las ideas básicas de la teoría de la información es que el significado y la naturaleza de los datos en sí mismos no importan en términos de cuánta información contienen. Shannon afirma en su famoso artículo “A Mathematical Theory of Communication (1948)” que “los aspectos semánticos de la comunicación son irrelevantes para el problema de la ingeniería”. Esto nos permite construir nuestro enfoque analítico en torno a medidas informativas (entropía de Shannon, información mutua, por ejemplo) y hacer que sea independiente del dominio y de los datos .
b) Ha habido un trabajo interesante sobre el uso del concepto de “cuello de botella de información” para descubrir la “caja negra de la red neuronal profunda”.
Documento original aquí: https://arxiv.org/pdf/1703.00810…
También recomiendo esta publicación de blog muy bien escrita.
https://blog.acolyer.org/2017/11…
Nuestra tecnología utiliza un enfoque variado no solo para diagnosticar “autónomamente” nuestros modelos, sino también para mejorar su calidad y eficiencia y someterlos a “pruebas de ruido” utilizando estas medidas “muy genéricas”.
c) El uso de medidas informativas para el análisis nos libera de algunos de los supuestos que se hacen en el aprendizaje automático convencional. No asumimos que los datos tengan propiedades como la independencia o que alguna distribución de probabilidad conocida se ajuste a los datos.
Aquí hay un artículo que describe algunos de los riesgos prácticos de esos supuestos https://www.edge.org/response-de…
Nuestros experimentos para predecir eventos raros (high-sigma o “cisne negro”) con este enfoque han mostrado resultados muy impresionantes.
https: //www.waterstechnology.com…
Conclusión
Los conceptos de la teoría de la información pueden contribuir enormemente al aprendizaje automático en la práctica (tenemos bastantes estudios de casos e historias de éxito de clientes que se benefician de nuestra plataforma) y creo que proporcionaría una base significativa aún mayor para la ciencia predictiva a medida que nos encontramos con problemas más difíciles en este espacio