¿Cuáles son las áreas más activas de investigación de aprendizaje automático para la aplicación de datos tabulares? Mis datos están en forma de CSV con unos pocos miles de instancias.

Podemos clasificar los conjuntos de datos tabulares en función de sus siguientes atributos.

  • Recuento de filas (registro): pequeño o grande
  • Recuento de columnas (función): menos o más
  • Claridad de la característica: distinta o indistinta

El estado actual de las técnicas de aprendizaje automático es aproximadamente (y según mi entendimiento) de la siguiente manera.

  • Rs Cl Fd [recuento de filas pequeño, recuento de columnas menos, claridad de característica distinta] : técnicas de regresión / clasificación bien conocidas. Se puede hacer a través de Excel o Python o R.
  • Rb Cl Fd [recuento de filas grande, recuento de columnas menos, claridad de característica distinta] : técnicas de regresión / clasificación bien conocidas. Se puede hacer a través de Hadoop con MapReduce o Spark.
  • Rs Cm Fd [recuento de filas pequeño, recuento de columnas más, claridad de característica distinta] : técnicas de bosque aleatorio bien conocidas. Se puede hacer a través de Excel o Python o R.
  • Rb Cm Fd [Recuento de filas grande, Recuento de columnas más, claridad de característica distinta] : técnicas de bosque aleatorio bien conocidas. Se puede hacer a través de Hadoop con MapReduce o Spark.
  • Rs Cl Fi [recuento de filas pequeño, recuento de columnas menos, claridad de característica indistinta] : análisis de componentes principales seguido de técnicas de regresión / clasificación. Se puede hacer a través de Python o R.
  • Rb Cl Fi [recuento de filas grande, recuento de columnas menos, claridad de característica indistinta] : análisis de componentes principales seguido de técnicas de regresión / clasificación. Se puede hacer a través de Hadoop con MapReduce o Spark.
  • Rs Cm Fi [recuento de filas pequeño, recuento de columnas más, claridad de característica indistinta] : Redes neuronales. Utilizable principalmente para analizar audio e imágenes.
  • Rb Cm Fi [recuento de filas grande, recuento de columnas más, claridad de característica indistinta] : Redes neuronales. Utilizable principalmente para analizar audio y video.

Su problema cae en la categoría Rs Cl Fd.

Actualmente, el “aprendizaje automático para las categorías Rs Cm Fi y Rb Cm Fi” es un área activa de investigación.

More Interesting

¿Cuál es la diferencia clave entre un autoencoder variacional y una red adversa generativa, y cuándo debo usar cada modelo?

¿Qué métodos de aprendizaje automático simples e intuitivos ofrecen el mayor valor?

¿Cuál es la diferencia entre los diferentes tipos de funciones de activación para redes neuronales y por qué es importante elegir una sobre otra?

¿El aprendizaje de transferencia es adecuado para modelos que pueden tener características de entrada crecientes?

¿Por qué Python es tan popular en el aprendizaje automático?

¿Cuál es la teoría detrás de ingresar una imagen en una red neuronal?

¿Cuál es el mejor tutorial de Python para el aprendizaje automático?

¿Somos mejores que las máquinas que creamos?

¿Cuál es un buen conjunto de datos para probar mi clasificador vecino más cercano K?

En los campos de redes neuronales o aprendizaje profundo, ¿qué es un "gráfico computacional"?

¿Apache Spark es un buen marco para implementar Reinforcement Learning?

¿Cómo puedo sobresalir en el aprendizaje automático con antecedentes estadísticos?

Kaggle: ¿Cuáles son las técnicas utilizadas para reducir el número de columnas antes de predecir la variable dependiente? Por favor vea la descripción

Cómo lidiar con datos sin patrones en los que necesito realizar un modelo de clasificación

¿Cómo se hace el cambio de C ++ a Python? Me siento más cómodo con C ++ y lo he estado usando para hacer la mayor parte de mi programación; Me parece que lleva mucho tiempo y Python hace las cosas rápidamente. ¿Cuál es la mejor manera de hacer el cambio?