Cómo construir una aplicación de predicción de flujo de efectivo personal con extractos bancarios utilizando el aprendizaje automático

Este podría ser uno de esos casos en los que el aprendizaje automático no es necesariamente la herramienta adecuada para el trabajo. ML / MI es bueno en correlación pero no en causalidad.

Para decirlo en términos simples, MI no sabe por qué haces algo, solo eso. La forma en que MI hace una “predicción” es efectivamente diciendo “He visto que algo así sucede antes, y por lo tanto volverá a suceder”. Por ejemplo, un algoritmo de MI podría analizar los extractos bancarios de 10,000 personas y concluir que una factura de Comcast de $ 59.95, después de 12 meses, aumentará a $ 79.95 porque eso es lo que hizo para 3,415 de esas cuentas. Luego puede aplicar ese conocimiento a su cuenta específica, tenga en cuenta que ha pagado $ 59.95 por 12 meses y predecir un aumento de $ 20 el próximo mes. O puede notar que las personas que generalmente compran boletos de avión en abril (digamos, planeando unas vacaciones) lo hacen todos los años.

Simplifico en exceso, por supuesto, ya que este es un gran tema para cubrir en un párrafo, pero el punto subyacente es que MI requiere muchos datos para hacer una predicción. He trabajado con conjuntos de datos que tienen entre 5 y 10 entradas de 10.000 personas, y estos son pequeños y, por lo tanto, inexactos. Para aplicarlo a los datos de una persona, incluso si tiene 30 años de extractos bancarios, eso es 360 puntos de datos.

Dependiendo de la precisión que necesite, puede ser más sencillo clasificar sus ingresos y gastos y crear líneas de tendencia para cada tipo de gasto. A menos que pueda acceder a un depósito de datos de otras personas, es imposible que MI le diga algo que aún no ha sucedido.

More Interesting

¿Cuál es la intuición detrás de la propagación hacia atrás?

¿Por qué en cualquier máquina eléctrica la corriente aumenta cuando aumenta la carga de esa máquina?

¿Qué es la agrupación de datos?

MLconf 2015 Seattle: ¿Cuándo uso la normalización de varianza media / unidad cero frente a la normalización de unidad L1 / L2?

¿Cómo determina el reconocimiento facial al dueño de la cara que detecta?

¿Qué tan buenos antecedentes en ML ofrece el curso Coursera Machine Learning a alguien?

¿Qué tan importante es Octave como primer paso en Machine Learning? ¿Se utiliza en la industria?

Al entrenar y probar conjuntos de datos, ¿es posible probar un conjunto de datos completamente diferente del conjunto de entrenamiento?

¿Se está saturando el aprendizaje automático como campo de investigación?

¿Qué es el aprendizaje por refuerzo?

¿Qué carrera es mejor, Machine Learning o DevOps?

¿Podemos lograr mejor que una disminución sub-lineal en el error al aumentar el número de muestras en regresión lineal?

Tengo un conjunto de entradas y deseo excluir las entradas extremas y calcular el promedio de las restantes. ¿Es este un problema de estadística o uno de aprendizaje automático?

¿Cuáles son las diferencias entre los algoritmos CHAID y CART para el crecimiento de los árboles de decisión?

¿Qué tan similares son los problemas en los diversos campos del análisis de datos (aprendizaje automático, estadísticas, procesamiento de señales, optimización, teoría de la información, etc.)?