La respuesta de Kevin es correcta, pero déjame probar un enfoque diferente.
Pregunta 1 : La primera pregunta que debe hacerse es cómo funcionará este clasificador. ¿Cómo sabrá ” clasificar los aspectos en algunas categorías predefinidas “?
Imagínese esto: una empresa con sede en el país Eslovenia lo contrata como un “clasificador de reseñas”. Su trabajo es mirar las revisiones entrantes y clasificarlas como ‘buenas’, ‘malas’, ‘favorables’ y ‘desfavorables’. Lamentablemente, no hablas esloveno. Ni siquiera tienes un diccionario. ¿Qué puedes hacer para mantener tu trabajo?
- ¿Cuáles son algunas buenas ideas de proyectos en el área de análisis / predicción del mercado de valores utilizando Bayes ingenuo?
- ¿Hay alguna debilidad en el uso de la agrupación máxima y la agrupación promedio?
- ¿Es posible comenzar la investigación académica en matemáticas / aprendizaje automático sin la ayuda de un asesor? Está ocupado con su propuesta de subvención.
- ¿Es Bayes jerárquico básicamente una introducción de hiperparámetros en el modelo?
- ¿Cuáles son los mejores recursos en línea para mejorar los algoritmos de aprendizaje automático?
Antes de comenzar a clasificar las revisiones entrantes sobre la marcha, tal vez comience a mirar las revisiones archivadas y cómo fueron clasificadas por el tipo que ocupó este trabajo antes que usted. Empiezas a notar patrones .
Notará que las reseñas que tenían la palabra ‘ dobro ‘ en ellas, en la mayoría de los casos, se clasificaron como ‘buenas’. Por el contrario, las revisiones que tenían el mundo ‘slabo’ fueron clasificadas, la mayoría de las veces, como ‘malas’. No necesita saber qué significan esas palabras, pero después de ver suficientes datos, está convencido de que esos patrones se mantendrán para la mayoría de las revisiones entrantes .
Ahora regresa a su estación, y su trabajo se reduce a simplemente buscar las palabras ‘dobro’ o ‘slabo’ en las revisiones entrantes, y clasificar las revisiones como buenas o malas, respectivamente.
La analogía anterior es más o menos cómo funciona un clasificador de análisis de sentimientos ML. A menos que le dé a su clasificador algunos ‘datos resueltos’ para aprender patrones, no puede hacer las clasificaciones sobre la marcha.
Pregunta 2: ¿Cómo mejorar la clasificación? ( Desafío al lector )
Su jefe ahora se queja de que sus comentarios no están a la par con sus otros colegas. Aún no has aprendido esloveno, todavía no tienes un diccionario.
Reto: ¿Cómo puedes mejorar en tu trabajo? Sigue mi analogía eslovena, responde en los comentarios si quieres.