Preocúpese menos por el “estado del arte” y preocúpese más por comprender cómo podría resolver este problema de una manera que demuestre que comprende cómo funciona el aprendizaje automático.
Si tiene datos sobre cuentas que han sido identificadas como fraudes y aquellas que son legítimas, limpie los datos y prepárelos para usarlos como su conjunto de capacitación. Obtenga un conjunto de funciones para esto, incluso las que no creería que son importantes (por ejemplo, qué tan rápido un usuario determinado se inscribió en una nueva cuenta; si el estafador escribió un script para crear nuevas cuentas, es probable que completen esa página demasiado rápido) en comparación con los humanos o en un orden extraño) y luego use esa colección de características para construir algunos modelos.
Francamente, elegir los modelos y ejecutarlos es la parte fácil, la mayor parte del tiempo se dedicará a la recopilación de datos, la limpieza y la preparación. Pero una vez que llegue a la construcción de modelos intente todo lo que pueda. Si eres un tipo de Python, enloquece con Pandas y Scikit-Learn y similares. Si te gusta más R, también hay toneladas de buenas opciones. Una vez que los datos están preparados y listos, es bastante trivial ejecutar diferentes algos en ellos (se puede usar cualquier número de modelos de clasificación). Encuentra los que tienen el mejor rendimiento y ve con ellos.
- ¿Es posible hacer un programa algorítmico de intercambio oscilante?
- Cómo encontrar todos los palíndromos posibles que se pueden generar usando las letras de una cadena dada
- Dado que muchos algoritmos de aprendizaje automático se ejecutan en GPU, ¿Julia sigue siendo una buena opción para eso?
- ¿Cuál es el algoritmo más poderoso en el mundo de las aplicaciones?
- ¿Cuál es la habilidad más importante para desarrollar en algoritmos?
¡Buena suerte!