¿Cuáles son las áreas más activas de investigación de aprendizaje automático para la aplicación de datos tabulares? Mis datos están en forma de CSV con unos pocos miles de instancias. La tecnología cambia la vida futura

¿Cuáles son las áreas más activas de investigación de aprendizaje automático para la aplicación de datos tabulares? Mis datos están en forma de CSV con unos pocos miles de instancias.

Podemos clasificar los conjuntos de datos tabulares en función de sus siguientes atributos.

Recuento de filas (registro): pequeño o grande
Recuento de columnas (función): menos o más
Claridad de la característica: distinta o indistinta

El estado actual de las técnicas de aprendizaje automático es aproximadamente (y según mi entendimiento) de la siguiente manera.

Rs Cl Fd [recuento de filas pequeño, recuento de columnas menos, claridad de característica distinta] : técnicas de regresión / clasificación bien conocidas. Se puede hacer a través de Excel o Python o R.
Rb Cl Fd [recuento de filas grande, recuento de columnas menos, claridad de característica distinta] : técnicas de regresión / clasificación bien conocidas. Se puede hacer a través de Hadoop con MapReduce o Spark.
Rs Cm Fd [recuento de filas pequeño, recuento de columnas más, claridad de característica distinta] : técnicas de bosque aleatorio bien conocidas. Se puede hacer a través de Excel o Python o R.
Rb Cm Fd [Recuento de filas grande, Recuento de columnas más, claridad de característica distinta] : técnicas de bosque aleatorio bien conocidas. Se puede hacer a través de Hadoop con MapReduce o Spark.
Rs Cl Fi [recuento de filas pequeño, recuento de columnas menos, claridad de característica indistinta] : análisis de componentes principales seguido de técnicas de regresión / clasificación. Se puede hacer a través de Python o R.
Rb Cl Fi [recuento de filas grande, recuento de columnas menos, claridad de característica indistinta] : análisis de componentes principales seguido de técnicas de regresión / clasificación. Se puede hacer a través de Hadoop con MapReduce o Spark.
Rs Cm Fi [recuento de filas pequeño, recuento de columnas más, claridad de característica indistinta] : Redes neuronales. Utilizable principalmente para analizar audio e imágenes.
Rb Cm Fi [recuento de filas grande, recuento de columnas más, claridad de característica indistinta] : Redes neuronales. Utilizable principalmente para analizar audio y video.

Su problema cae en la categoría Rs Cl Fd.

Actualmente, el “aprendizaje automático para las categorías Rs Cm Fi y Rb Cm Fi” es un área activa de investigación.

Aprendizaje automáticoAprendizaje profundoBig DataCiencia de datosdatosMinería de