¿Cuáles son algunos métodos para etiquetar datos de entrenamiento para una red neuronal?

Si parte del conjunto de datos ya está etiquetado o si se dedicó a etiquetarlo, puede entrenar un modelo semi-supervisado utilizando todo su conjunto de datos, como una Máquina de vectores de soporte transductivo, y luego predecir cada instancia de datos que no tener una etiqueta con la máquina:

http://users.stat.umn.edu/~xshen…

Este enfoque limitaría la precisión de su conjunto de datos, que es la representación del proceso de generación de datos subyacente a la precisión de su modelo. A pesar de que los SVM son óptimos a nivel mundial, tiene muy pocas posibilidades de clasificar correctamente los datos atípicos no etiquetados, ya que se ubicarán en el espacio de entrada con las instancias de datos de la clase que están imponiendo y no hay forma de tenerlos en cuenta a través de variables flojas como en la máquina de vectores de soporte de margen duro regular ‘. Aparte de esto, esto debería funcionar bien para un etiquetado de datos automatizado.

Si obtiene datos etiquetados, no hay nada igual. En caso de falta de etiquetas, hay 2 escenarios posibles:

  • Tengo etiquetas ‘Algunas’ , pero no todas
  • Use métodos de aprendizaje semi-supervisados ​​para aprender el comportamiento y la distribución de datos y aplique este modelo para generar etiquetas significativas para ejemplos desconocidos
  • Tenga métodos como propagación de etiquetas, etc. para lo mismo. Por favor, consulte el siguiente enlace
  • Scikit Learn Aprendizaje semi-supervisado: 1.14. Semi-supervisado
  • No tengo etiquetas
    • Confíe en métodos de aprendizaje no supervisados ​​para asignar etiquetas significativas
    • Tenga una idea del número de clases: ‘k’ y use el algoritmo K-Means para generar K-Centroides que puedan aproximar las clases
    • Rotule cada punto según su cercanía a cada uno de los centroides

    Pero obtienes mejores resultados cuando tienes buenas etiquetas asociadas con los ejemplos.