Cómo crear un sistema de predicción de calificación a partir de los comentarios de los revisores para comentarios 360 dados un comentario del revisor y el conjunto de datos de calificación correspondiente

Puedes ver el concurso de Yelp de DrivenData. Este iPython Notebook describe detalles, desde reseñas crudas de Yelp hasta un modelo de violaciones de higiene (en 3 sencillos pasos). En resumen

Trata tu problema como un problema de regresión
Sus características serían una colección de características textuales extraídas a mano (p. Ej., Uso de palabras positivas / negativas), vectores tf-idf de auto-comentario y comentario de revisor
Utilice el modelo de regresión de mínimos cuadrados ordinarios y realice una validación cruzada.

Dependiendo de los resultados, puede

Elija más extracción de características: por ejemplo, Word2Vec. Usar validación cruzada
Elija modelos alternativos: regresor forestal aleatorio con validación cruzada o eliminación de características recursivas
Finalmente, puede ensamblar sus modelos. Kaggle Ensembling Guide. Probaría Neural Network, OLS Regression y Random Forests.

Nota: He pegado enlaces de Python pero creo que puedes R equivalente para el mismo

Related Content

¿Por qué se usa Python para el aprendizaje profundo si es tan lento?

¿Cómo podemos suprimir el ruido de fondo en un teléfono durante una llamada telefónica?

¿Cuáles son las mejores marcas de CPU y GPU para el aprendizaje automático?

¿Qué hace exactamente esta función, tf.nn.embedding_lookup (), en TensorFlow?

En el aprendizaje automático, ¿cómo estima el descenso de gradiente la pendiente de la función de pérdida en un punto dado?

Cómo comenzar la investigación en Machine Learning

¿Dónde puedo obtener prácticas en inteligencia artificial y aprendizaje automático?

More Interesting

Quiero aprender el procesamiento del lenguaje natural en CMU. ¿Es mejor tomarlo como un estudiante de CS o tomarlo como un estudiante de lingüística (como una electiva)?

¿Cuál es la diferencia entre un contenedor y un algoritmo de filtro en Data Mining / Machine Learning?

¿Cómo ganan dinero las startups de aprendizaje profundo o aprendizaje automático?

¿Puedes explicar el hashing de características de una manera fácil de entender?

¿Qué son los componentes del procesamiento del lenguaje natural?

¿Soy un desarrollador de dinosaurios si no uso Github, no conozco CI / CD y docker y solo conozco el aprendizaje profundo de la palabra de moda?

En un modelo gráfico dirigido, el aprendizaje es fácil pero la inferencia es difícil. ¿Es esto cierto?

¿Puedo usar el aprendizaje profundo para aprender el aprendizaje profundo?

¿Qué título debo tomar para entrar en la investigación de Deep Learning? (Graduado de CS)

¿Son las redes aditivas recurrentes universalmente mejores que las LSTM y GRU?

Cómo convertir datos categóricos en numéricos por Excel

Si quiero desarrollar una carrera en aprendizaje automático e inteligencia artificial, ¿debería comenzar con chatbots?

¿Cómo se puede aplicar el aprendizaje automático a la contabilidad?

Durante la validación cruzada k-fold, ¿cuáles son algunas soluciones posibles cuando la varianza de las estimaciones de error de prueba es muy alta?

¿Cuáles son algunos de los conjuntos de habilidades esenciales que debe tener un desarrollador de aprendizaje automático?

Web Analytics