¿Cuáles serían las mejores entradas para un algoritmo de red neuronal que intenta predecir el mercado de valores?

Como estudiante del mercado de valores, me enfocaría en estos factores como los más explicativos:

Recuento de noticias que hacen referencia a la empresa con un sentimiento positivo.
Recuento de noticias que hacen referencia a la empresa con sentimientos negativos.
Promedio móvil simple de 10 días para la empresa
El promedio móvil simple de 10 días para la empresa del sector está en
Promedio móvil exponencial de 30 días para la empresa
El promedio móvil exponencial de 30 días para la empresa del sector está en
Media móvil simple de 200 días para la empresa
El promedio móvil simple de 200 días para la empresa del sector está en
(Marque todos los puntos cruzados en los promedios móviles como una característica con valor 0 o 1)
Informes financieros trimestrales y financieros de 10K (calcule todas las diversas relaciones rápidas, PE, etc.)
Proporción rápida y promedios de PE para todas las empresas del sector (promedios sectoriales)

Notas sobre cómo manejar el conjunto de características:

Para ganar algo de dinero aquí, deberíamos tratar de resolver el precio específico de las acciones o el cambio direccional en el precio de las acciones (mucho más fácil, obviamente). Sin embargo, las características anteriores están cargadas con datos históricos de precios de acciones. Es posible que desee reducir el peso asignado a los promedios (ya que esto sesgará el modelo hacia el precio de la acción más reciente) y poner más peso en los puntos de inflexión entre 10 sma y 30 ema, por ejemplo. Trataría los puntos de inflexión como el punto de partida de un evento en curso. Cuando 10 sma por encima de 30 ema, el valor de la característica es 1, cuando 10 sma por debajo de 30 ema es -1.

El sentimiento es una característica interesante, pero tendrá que encontrar una manera de manejar las historias escritas sobre la compañía durante los fines de semana y días festivos, ya que todas las demás características del modelo se producen durante los días hábiles. Veo las otras características como puntos de datos diarios u horarios, por lo que necesitará una forma de conformar las noticias … Es posible que también desee limitar las características del sentimiento a solo las historias de Bloomberg en la compañía, ayudaría con precisión allí. También tendrá que encontrar una manera de resolver las empresas menos conocidas que no se conocen ampliamente. Y, por último, para esta característica necesitará descubrir cómo determinar el sentimiento, prefiero una heurística de coincidencia de n-gramas de dominio específico.

Querrá comparar la precisión y exactitud entre un modelo basado solo en los datos del sector, en comparación con uno que incluya los datos de la compañía. Encontrará que el sector es más fácil de predecir que una empresa determinada. Deberá asegurarse de que su modelo no muestre sesgos contra las empresas que son atípicas en su sector.

Ten cuidado al intentar esto. Si solo aplica redes neuronales a las cotizaciones diarias, no le irá muy bien. ¿Por qué? Debido a que este tipo de predicción es algo que MILLONES de personas están tratando de hacer, con millones de métodos diferentes, a menudo con mucha más información o sofisticación de la que podrías aportar. Además, te deja muy vulnerable al riesgo.

Algunas cosas que hacer:
1) Elija un buen modelo de red neuronal: una red neuronal recurrente (destinada a series temporales)
2) Comprender las extensiones del descenso de gradiente ordinario ( http://arxiv.org/abs/1111.4259 , http://www.icml-2011.org/papers/… , http://www.icml-2011.org/papers / …), aunque es posible que no los implemente hasta que su modelo esté funcionando bien con pendiente descendente / backprop.
3) Use la mayor cantidad de datos que pueda obtener: precio, volatilidad, correlaciones, ganancias, volumen. Tenga en cuenta lo que significan los futuros para la predicción. Mira los precios de los derivados. Aplique análisis de precios convencionales, como Black-Scholes, como entradas. No tenga miedo de estructurar su red neuronal de manera diferente a la forma completamente conectada: no necesariamente tiene sentido que la correlación entre XOM y F se alimente en el mismo nodo oculto que los futuros de la panza de cerdo, al menos no al principio capa.
4) obténgalo con la mejor resolución posible: si está buscando citas, ya está detrás del juego. El libro de pedidos, un catálogo de las ventas y compras que se han ofrecido en un momento en particular, es particularmente valioso, pero si está atrapado mirando de segundo a segundo, está bien
5) Prueba tanto como puedas. Ajustar el tamaño de la red, el número de capas, la estructura, la regularización. El ajuste de parámetros lleva más tiempo y es más importante que la elección del modelo inicial (aunque ambos son importantes).
6) Manténgase al tanto del riesgo de “cisne negro”. Una red neuronal no verá venir el colapso de un hermano Lehman, no puede medir el estado de ánimo de Angela Merkel.

Si solo está haciendo esto para un proyecto de clase, puede ser mucho más vago.

Estoy usando indicadores técnicos como entrada. Creo que, muy importantes son los osciladores, indica el cambio de tendencia. Estoy usando MACD, RSI, William ..

También hago algunas entradas generadas a partir de reglas basadas en
– promedios de comaparación exponencial
– Bandas de Bollinger (relación entre precio y BB, ancho de banda)

Más información: http://stockcharts.com/school/do

También importo algunos datos financieros a Excel, y trato de predecir tendencias. Por ejemplo, la tendencia prevista del ingreso neto.

NN también podría saber cómo se mueven las tendencias de acuerdo con la tendencia de las acciones (Dow Jones Industrial Average – índice DJIA). NN copare las tendencias histocales y compare cuán sensible es la tendencia del precio con la tendencia del mercado.

Por ejemplo, aquí está la comparación de DJIA y Hewlett-Packard Company:

http://www.google.com/finance?ch

More Interesting

¿Cuál es el código MATLAB para realizar el algoritmo AntNet?

¿Es obligatorio organizar el número en orden ascendente para averiguar la mediana?

¿Cuál es el árbol más ancho de la India?

Imagine una cerradura de bicicleta combinada con 4 anillos que contienen 10 letras. ¿Cómo se puede calcular qué letras en cada anillo producirán las palabras más válidas?

¿En qué punto una gran notación O de velocidad de aumento más rápida ignora una notación O grande de velocidad de aumento más lenta?

¿Cuál es el algoritmo de Google Map para recomendar rutas?

¿Cuál es el mejor enfoque para adivinar los diacríticos árabes mediante programación?

¿Cuál es el mejor libro para aprender algoritmos?

¿Cuál es la ecuación general para calcular la probabilidad de encontrar una cadena de longitud N en una cadena M más larga de caracteres aleatorios, cada uno elegido de {AZ}?

¿Cómo se escriben funciones explícitas y recursivas cuando se les da un conjunto particular de datos?

Conozco la implementación básica de diferentes estructuras de datos como árboles, gráficos, colas y muchos más para inserción, eliminación, recorrido. Ahora, ¿cómo procedo a construir un sistema operativo?

¿Qué libro debo elegir para estudiar la estructura de datos en lenguaje C?

¿Cómo funciona un árbol de expansión y cómo lo configuro?

En el algoritmo de búsqueda A * deberíamos tener una lista abierta y otra cerrada. ¿Cómo los implementa utilizando tanto el hashmap como una cola prioritaria en Java?

¿Cuáles son algunas explicaciones intuitivas / sencillas de los algoritmos estándar?