¿Cómo debo implementar la detección de fraude con tarjeta de crédito usando redes neuronales?

Transforma todos los valores en números. Por ejemplo, “Dirección” se puede transformar en “Distancia desde el hogar” y las categorías: “Gas” / “En línea” / “Minorista” irán en 3 números [1,0,0], [0,1,0] y [0,0,1] (un error común aquí es asignar 1,2,3 a las categorías).

Obtenga un paquete ANN (aprendizaje profundo, por ejemplo, en TFLearn) y entrene su red con sus datos (espero que ya tenga un gran conjunto de capacitación que contenga tanto fraude como no fraude). Dividirá estos datos en dos conjuntos, entrenamiento y prueba. Usa el entrenamiento para entrenar tu ANN y luego prueba para determinar la precisión. Si no tiene una buena precisión / recuperación / precisión, significa que los datos que tiene son irrelevantes para el problema (como si tratara de decidir fraude / no fraude en función del tamaño del zapato del usuario) o, más probablemente, tiene un error en el ANN.

Particularmente a este problema, creo que enviar una gran tabla de transacciones de hechos (con ID de usuario como columna) es un error, ya que esto no permitirá que ANN conozca el comportamiento del usuario. Más bien, trate de tener la transacción actual a un lado con 9 transacciones relevantes pasadas, de modo que la característica de convolución entre en acción y “modele” el comportamiento del usuario.

Se puede utilizar la detección de anomalías. Hay toneladas de proveedores de servicios o hay APIs como anondot. Realmente se reducirá a sus requisitos para su negocio.

More Interesting

¿Cuál es la diferencia entre el análisis factorial exploratorio (EFA) y el análisis factorial confirmatorio (CFA)?

Dadas las variables / parámetros continuos, ¿cuál es la diferencia entre el aprendizaje automático y la interpolación?

Como principiante, ¿cómo debo estudiar el aprendizaje profundo?

¿Es aconsejable automatizar el trabajo del presidente de la Fed con un software de aprendizaje automático dado que sus decisiones se basan principalmente en datos?

¿Por qué hay una disminución en el rendimiento de los modelos pre-entrenados?

¿Cuál es el análisis de opinión en el caso de TripAdvisor? ¿Como funciona?

¿Cuál es la diferencia entre clasificación (binaria y multiclase), regresión y agrupamiento?

¿Por qué Apple no equipa sus máquinas con mejores opciones de tarjeta de video?

¿Puede la operación de agrupamiento aumentar el número de neuronas en el aprendizaje profundo?

¿Cuán eficientes pueden ser los datos de biomarcadores para predecir el deterioro clínico?

¿Cuál es el orden jerárquico del universo?

¿Qué algoritmo de aprendizaje automático se debe usar para eliminar palabras innecesarias en una consulta de búsqueda realizada para recuperar datos de un texto grande?

¿Cómo afectará el aprendizaje automático a la economía, tanto a corto plazo (2–5 años) como a largo plazo?

¿Cómo calcula Google los sinónimos de los términos en una consulta de búsqueda?

¿Cuál es el mejor libro para aprender el pensamiento algorítmico?