Cómo crear un sistema de predicción de calificación a partir de los comentarios de los revisores para comentarios 360 dados un comentario del revisor y el conjunto de datos de calificación correspondiente

Puedes ver el concurso de Yelp de DrivenData. Este iPython Notebook describe detalles, desde reseñas crudas de Yelp hasta un modelo de violaciones de higiene (en 3 sencillos pasos). En resumen

  1. Trata tu problema como un problema de regresión
  2. Sus características serían una colección de características textuales extraídas a mano (p. Ej., Uso de palabras positivas / negativas), vectores tf-idf de auto-comentario y comentario de revisor
  3. Utilice el modelo de regresión de mínimos cuadrados ordinarios y realice una validación cruzada.

Dependiendo de los resultados, puede

  1. Elija más extracción de características: por ejemplo, Word2Vec. Usar validación cruzada
  2. Elija modelos alternativos: regresor forestal aleatorio con validación cruzada o eliminación de características recursivas
  3. Finalmente, puede ensamblar sus modelos. Kaggle Ensembling Guide. Probaría Neural Network, OLS Regression y Random Forests.

Nota: He pegado enlaces de Python pero creo que puedes R equivalente para el mismo

More Interesting

Quiero aprender el procesamiento del lenguaje natural en CMU. ¿Es mejor tomarlo como un estudiante de CS o tomarlo como un estudiante de lingüística (como una electiva)?

¿Cuál es la diferencia entre un contenedor y un algoritmo de filtro en Data Mining / Machine Learning?

¿Cómo ganan dinero las startups de aprendizaje profundo o aprendizaje automático?

¿Puedes explicar el hashing de características de una manera fácil de entender?

¿Qué son los componentes del procesamiento del lenguaje natural?

¿Soy un desarrollador de dinosaurios si no uso Github, no conozco CI / CD y docker y solo conozco el aprendizaje profundo de la palabra de moda?

En un modelo gráfico dirigido, el aprendizaje es fácil pero la inferencia es difícil. ¿Es esto cierto?

¿Puedo usar el aprendizaje profundo para aprender el aprendizaje profundo?

¿Qué título debo tomar para entrar en la investigación de Deep Learning? (Graduado de CS)

¿Son las redes aditivas recurrentes universalmente mejores que las LSTM y GRU?

Cómo convertir datos categóricos en numéricos por Excel

Si quiero desarrollar una carrera en aprendizaje automático e inteligencia artificial, ¿debería comenzar con chatbots?

¿Cómo se puede aplicar el aprendizaje automático a la contabilidad?

Durante la validación cruzada k-fold, ¿cuáles son algunas soluciones posibles cuando la varianza de las estimaciones de error de prueba es muy alta?

¿Cuáles son algunos de los conjuntos de habilidades esenciales que debe tener un desarrollador de aprendizaje automático?