Podemos clasificar los conjuntos de datos tabulares en función de sus siguientes atributos.
- Recuento de filas (registro): pequeño o grande
- Recuento de columnas (función): menos o más
- Claridad de la característica: distinta o indistinta
El estado actual de las técnicas de aprendizaje automático es aproximadamente (y según mi entendimiento) de la siguiente manera.
- Rs Cl Fd [recuento de filas pequeño, recuento de columnas menos, claridad de característica distinta] : técnicas de regresión / clasificación bien conocidas. Se puede hacer a través de Excel o Python o R.
- Rb Cl Fd [recuento de filas grande, recuento de columnas menos, claridad de característica distinta] : técnicas de regresión / clasificación bien conocidas. Se puede hacer a través de Hadoop con MapReduce o Spark.
- Rs Cm Fd [recuento de filas pequeño, recuento de columnas más, claridad de característica distinta] : técnicas de bosque aleatorio bien conocidas. Se puede hacer a través de Excel o Python o R.
- Rb Cm Fd [Recuento de filas grande, Recuento de columnas más, claridad de característica distinta] : técnicas de bosque aleatorio bien conocidas. Se puede hacer a través de Hadoop con MapReduce o Spark.
- Rs Cl Fi [recuento de filas pequeño, recuento de columnas menos, claridad de característica indistinta] : análisis de componentes principales seguido de técnicas de regresión / clasificación. Se puede hacer a través de Python o R.
- Rb Cl Fi [recuento de filas grande, recuento de columnas menos, claridad de característica indistinta] : análisis de componentes principales seguido de técnicas de regresión / clasificación. Se puede hacer a través de Hadoop con MapReduce o Spark.
- Rs Cm Fi [recuento de filas pequeño, recuento de columnas más, claridad de característica indistinta] : Redes neuronales. Utilizable principalmente para analizar audio e imágenes.
- Rb Cm Fi [recuento de filas grande, recuento de columnas más, claridad de característica indistinta] : Redes neuronales. Utilizable principalmente para analizar audio y video.
Su problema cae en la categoría Rs Cl Fd.
- ¿Cómo se utiliza el aprendizaje automático en el análisis de sentimientos?
- ¿Existe alguna justificación para usar características explícitas de usuario / elemento en la recomendación de MF?
- ¿Qué se entiende por agrupamiento jerárquico aglomerativo?
- ¿Cuáles son algunos ejemplos de código de modelos de aprendizaje automático humanos en el circuito? Me ha resultado difícil encontrar tutoriales / documentos que discutan este tema.
- ¿Cuál es la diferencia entre aprendizaje automático, minería de datos y recuperación de información?
Actualmente, el “aprendizaje automático para las categorías Rs Cm Fi y Rb Cm Fi” es un área activa de investigación.