¿Existe algún uso práctico de la teoría de la información en los algoritmos de aprendizaje automático aplicados en la industria financiera?

Las finanzas son un área muy amplia y necesita separar la teoría de la información del aprendizaje automático. Podría proporcionar algunas ideas / pensamientos sobre el aprendizaje automático: si retrocede desde el piso de negociación y mira la carne y las papas de Wall Street, notará un par de cosas:

Toda la topografía de los distribuidores más grandes del G14, que trafican en IRD, FX Swaps, CC Swaps todavía está plagada de problemas heredados. ¿Por qué? FpML es enormemente jerárquico y se coloca dentro de SWIFT, que también es una regla muy compleja. Los bancos están poniendo sus derivados a través de conexiones de red SWIFT. Se definen cambios en las acciones corporativas MT 564 se está moviendo a ISO-20022, moviendo un terrible estándar SWIFT a un estándar SWIFT aún más arcano y odioso. Todos tienen que cumplir con este formato. 39,000 bases de datos individuales en un banco. También hay bases de datos de acceso adicionales para desarrollar aplicaciones.

Trabajemos desde el frente hasta el back-office en una operación IRD: (Como una forma de fondo si no está familiarizado con IRD. IRD comprende una gran parte del mercado de derivados, hay aproximadamente 2600 transacciones de formación de precios por día en derivados OTC y el tamaño promedio de la transacción es de aproximadamente $ 300 millones. El intercambio total nocional diario de manos es de $ 700 mil millones. IRD comprende swap base, cap / floor, swap de base cruzada, acuerdos de tasa a plazo, swaps de inflación, OIS, IRS, etc. en la oficina de recepción acordando con un tercero, utilizando el formato FIX, luego intercambiando los movimientos al corredor de bolsa, luego a la compensación y luego a la liquidación. Cuando habla de intercambios, es ITCH y OUCH, pero los contratos se definen en FpML y SWIFT para el back-end y. Los derivados deben informarse a los repositorios comerciales y al DTCC. No conoce los detalles del pago cuando trabaja en la oficina principal.

El SWAP FX típico en FpML tiene 14 niveles de jerarquía y 3000 elementos que no son todos obligatorios. Si fueran obligatorios, serían mucho más fáciles de pegar en una base de datos. FpML proviene de ISDA. En los viejos tiempos, estaba cargando operaciones en RDBMS, una para SWAP, una para acciones, etc., una para divisas, una para contraparte, una para NOSTO, etc. Actualmente hay 80 versiones diferentes de FpML, cada versión más compleja. No hay un solo banco que use ninguno de esos 80 estándares, usan partes de cada uno. ORM no funciona. La versión ORM del intercambio FpML tiene más de 1000 tablas y una sola unión tiene varios k de tamaño. Pero con una nueva versión de FpML, no puede volver a la base de datos relacional existente, con 8 millones de operaciones y agregar 16 tablas diferentes y todas las consultas. Por lo tanto, la incapacidad de una base de datos relacional para cambiar su estructura es el primer requisito para comprender cómo podría encajar el aprendizaje automático. Este es el problema central que enfrentan las huellas heredadas dominadas por Oracle y Sybase.

Creo que la cuadrícula de datos en memoria puede beneficiarse de la aplicación de algoritmos basados en instancias y algoritmos de árbol de decisión. Específicamente, las áreas en las que se centrarían serían los repositorios y los préstamos de seguridad.

¿Cuáles son los criterios principales para la inicialización de los pesos en el aprendizaje profundo? Si quiero diseñar un algoritmo para la inicialización del peso, ¿qué factores debo tener en cuenta?

¿Qué debo hacer para poder contribuir al campo de la visión por computadora y trabajar en Google en el futuro?

¿Es la tasa de falso rechazo (FRR) similar a la tasa de falsos positivos (FPR)? Entonces, si es similar, ¿por qué hay disponibles diferentes definiciones para cada una de ellas?

¿Cuáles son los posibles remedios si está atascado en la comprensión de la parte técnica de un trabajo de investigación de STEM?

Como DBA de Oracle, ¿qué medidas de seguridad de la información se deben tomar para reducir el riesgo de seguridad de la información?

¿Cuáles son las diferencias entre un virus informático, un gusano, un troyano, malware y spyware?

Hugh Sloan ha dado una excelente respuesta para el lado del aprendizaje automático. En cuanto al lado de la teoría de la información, el difunto Thomas Cover de Stanford (Portada de la fama de la Teoría de los elementos de la información ) estaba bastante interesado en la teoría de la cartera teórica de la información y tiene bastantes publicaciones en el área, que puede ver aquí. En realidad, al descifrar mi copia de Elementos , parece que todo el Capítulo 16 está dedicado a la Teoría de la información y la Teoría de la cartera.

Sin embargo, solo una advertencia sobre las limitaciones de la teoría de la información, que en algunos círculos financieros se ha convertido en una palabra de moda menor. La teoría de la información es extremadamente útil, pero no es una bala de plata y no le dará mágicamente la estructura “real” que subyace en todo. De hecho, ¡esto es teóricamente proscrito por la teoría de la información! Cuando las personas hablan de “estructura”, a menudo hablan de la complejidad de Kolmogorov en lugar de la entropía (aunque las dos están relacionadas), pero la complejidad de Kolmogorov es indiscutible . En otras palabras, nunca habrá un algoritmo que pueda decirle cuál es la estructura “real”, o incluso la estructura más parsimoniosa, subyacente a un conjunto de datos.

Si estudias alguna teoría de la información, probablemente ya hayas comentado cuántas de las pruebas de Shannon comienzan con “elegir un libro de códigos aleatorio”; es posible que te hayas preguntado por qué Shannon no solo dio un método para encontrar el mejor libro de códigos. Esto se debe a que la inconfundibilidad de la complejidad de Kolmogorov implica que, en general, es teóricamente imposible elegir el mejor libro de códigos todo el tiempo, así como es teóricamente imposible elegir la mejor cartera todo el tiempo.

Zhenrui Liao

More Interesting

¿De qué manera es una 'Máquina de Turing Neural Lie Access' superior a las NTM normales?

Al cambiar de plataforma, ¿cómo se debe planificar con anticipación para garantizar que el almacenamiento y el análisis de datos se mantengan rápidos y eficientes?

¿Los grandes ingenieros de aprendizaje automático siempre leen nuevos trabajos de investigación sobre ML?

¿Qué función podría usar en R para encontrar los n valores más grandes de un vector?

Como todos están aprendiendo el aprendizaje automático y el aprendizaje profundo ahora, ¿debería adoptar un enfoque diferente para centrarme en un área específica, como la programación de gráficos o una más general, como el desarrollo de backend?

¿Cómo se puede aplicar el aprendizaje automático a la contabilidad?

¿Qué significa realmente el valor semilla en el algoritmo de aprendizaje automático?

¿Qué es una regresión logística condicional?

¿En qué conjuntos de datos se formó el Sistema de traducción automática neuronal (GNMT) de Google?

¿Puedes explicar el hashing de características de una manera fácil de entender?