¿Qué algoritmo puedo implementar para hacer una reducción de dimensión con restricción no negativa? (PCA se asignará al espacio negativo)

Lo primero que se me ocurrió al leer esta pregunta es preguntar: ¿qué estás tratando de hacer?

La reducción de dimensiones, todo ello, se basa en un conjunto de supuestos, como gran parte de las estadísticas. E ignoras las suposiciones que estás haciendo bajo tu propio riesgo. Por ejemplo, el conjunto más débil de suposiciones de PCA (estándar) incluye la noción de que hay un centro significativo para los datos, y ese centro (= media) se resta antes de que el algoritmo de PCA se aplique a los datos. Las cargas de salida no están correlacionadas entre sí y, bajo ciertas condiciones, normalmente se distribuyen. Pero ciertamente, están destinados a ser simétricos.

Por lo tanto, realizar PCA en datos donde no tiene sentido tener datos negativos (al centrarse) está violando implícitamente una suposición clave. Si tiene sentido tener un centro de datos que esté lejos de cero (es decir, positivamente), hay formas de traducir las cargas de nuevo al centro. Pero hacerlo no tiene ningún sentido ya que no debería ser necesario. Si el algoritmo que está aplicando después de la reducción de dimensiones no acepta números negativos, y restar la media no tiene sentido para los datos, entonces no debe pensar en PCA. Si la palabra o reemplaza la palabra y en la oración anterior, su algoritmo y sus datos no coinciden.

Es posible que desee leer sobre la factorización de matriz no negativa.

Existe este artículo que habla exclusivamente sobre la reducción de dimensionalidad con factorización matricial no negativa http://www.math.uni-hamburg.de/h… . Puede seguir leyendo los documentos que citan este documento para tener una mejor idea.

Puede hacer NMF, Modelos de tema, PLSA para realizar la reducción de dimensiones con restricciones no negativas.