¿Cómo entrenamos un clasificador para el cual solo tenemos datos de entrenamiento positivos (no hay datos negativos o sin etiquetar disponibles)?

En tal caso, su mejor opción es entrenar a un clasificador solo con los datos positivos. Esto se llama Clasificación de una clase y hay varias estrategias que puede adoptar, como

  • SVM de una clase: en este se construye una hiperesfera de modo que todos los datos positivos se encuentren dentro y todo lo demás sea atípico / negativo
  • Vecino más cercano de una clase

Existen muchos otros métodos para realizar esta tarea, debe leer el siguiente documento de revisión sobre el tema:

  1. Clasificación de una clase: taxonomía de estudio y revisión de técnicas – Página en cs.uwaterloo.ca
  2. Una versión más corta está disponible aquí Una encuesta de tendencias recientes en una clasificación de clase

Otras lecturas

La respuesta de Shehroz Khan a ¿Qué sucederá si entrenamos clasificadores svm solo en ejemplos positivos?

Vea ¿Cómo entrenamos un clasificador para el cual solo tenemos: 1) un conjunto de datos que son datos de entrenamiento explícitamente positivos y 2) un conjunto de datos que es desconocido (tiene el potencial de ser positivo o negativo)? para algunas ideas