Cuando no tiene datos de entrenamiento, puede comenzar con un aprendizaje no supervisado, alguna técnica de agrupamiento.
Pero existen conjuntos de datos útiles libremente. Este es un conjunto de datos muy útil de revisión de películas de Stanford, con más de 25000 revisiones positivas y negativas seleccionadas manualmente:
Análisis de los sentimientos
- ¿Es posible darle a una computadora millones de imágenes de varios objetos, y se da cuenta de que hay cosas como animales, platos de cocina, montañas, etc. sin que nosotros lo digamos, y cómo se hace esto exactamente?
- ¿Cuáles son los 10 mejores algoritmos de minería de datos o aprendizaje automático? En 2006, la Conferencia IEEE sobre minería de datos identificó los 10 algoritmos principales. ¿Siguen siendo válidos?
- ¿Por qué nadie recomienda JavaScript / Node.js como lenguaje para el aprendizaje automático o el análisis de datos?
- ¿Es más probable que una máquina que no ha otorgado un premio mayor otorgue uno que una máquina que acaba de otorgar un premio mayor?
- ¿Cómo se aplica el aprendizaje automático en genética o biología molecular?
Este es un conjunto de datos para la clasificación de sentimientos binarios que contiene sustancialmente más datos que los conjuntos de datos de referencia anteriores. Proporcionamos un conjunto de 25,000 críticas de películas altamente polares para capacitación y 25,000 para pruebas. También hay datos adicionales sin etiquetar para su uso. Se proporcionan formatos de texto sin procesar y bolsa de palabras ya procesada. Consulte el archivo README contenido en la versión para obtener más detalles.