Esto es realmente interesante ¿Ha finalizado sobre qué variables son significativas para considerar? ¿O qué variables cree que jugarán un papel importante en la identificación del fraude?
Una vez que haya hecho eso, hay muchas cosas que puede hacer:
- Cree variables derivadas que se relacionen fuertemente con su indicador de incumplimiento.
- Haga un análisis de conglomerados para averiguar cuáles son los tipos de transacciones. ¿Quizás agruparlos por cantidad comprada, o tipo de bienes comprados, o ubicación? Edad del cliente? ¿Sexo? ¿O tal vez una combinación de todos estos? Aquí es cuando comienza la parte interesante.
- Una vez que haya hecho eso, puede aplicar muchos métodos de aprendizaje automático como
- clasificador k-NN
- Árbol aleatorio / bosque aleatorio
- Árbol de decisión / CART / ID3
- Red neuronal / perceptrón
- Clasificador bayesiano ingenuo
Una vez que haya hecho eso, puede usar una validación de arranque, con muestreo estratificado o aleatorio. Esto le dará confianza para cada uno de los 750 registros restantes, comenzando de 0 a 1 (0 sin fraude y 1 siendo fraude). Use la validación para dividir su conjunto de datos en dos partes: 1) capacitación (250 registros conocidos) y 2) pruebas (750 registros desconocidos)
- ¿Qué área de IA y aprendizaje profundo es útil para vehículos autónomos?
- Cómo construir sobre modelos de red profunda de detección de objetos pre-entrenados (YOLO) para detectar nuevas clases
- ¿Qué es una descripción general del aprendizaje de múltiples núcleos (MKL)?
- ¿AWS es bueno para ejecutar proyectos de aprendizaje profundo? ¿Qué tan rápido y costoso sería entrenar una red convolucional en aproximadamente 1 millón de imágenes?
- ¿Es probable que Goldman Sachs sea el primero en alcanzar la singularidad?
Hazme un ping si quieres que te ayude. He hecho esto anteriormente para poder darte algunos consejos. ¡También aprenderé muchas cosas nuevas!