No sé cómo funciona el algoritmo de Amazon. Un esquema simple que podría usar para seleccionar los fragmentos en el ejemplo que dio es el siguiente:
Cree un diccionario de adjetivos positivos y negativos que las personas usualmente usan para describir productos. P.ej. “bueno”, “malo”, “agradable”, “perfecto”, “bueno”, “simple”, “complicado”, “complicado”, “molesto”, “decepcionante”, etc.
Cuanto más larga sea la lista, mejor. Probablemente hay listas muy buenas en línea que puede obtener para arrancar esto.
- ¿Cuál es el propósito de Google Dream?
- Cómo demostrar el aprendizaje automático
- ¿La inteligencia artificial viene bajo la ingeniería informática o informática?
- ¿Cuál es el método de búsqueda adversarial?
- ¿Cómo funcionan los algoritmos genéticos?
Luego, construya una lista de calificadores. P.ej. “realmente”, “muy”, “levemente”, “algo”, “extremadamente”, etc. El anteponer estos a sus adjetivos enriquece su diccionario. P.ej. “bueno”, “realmente bueno”, “muy bueno”, …
(¿Puedes ver a dónde va esto?)
Ahora, implemente un algoritmo de puntuación simple. Lea cada oración de cada revisión. Si se produce un adjetivo positivo, +1 para puntuar. Si se encuentra uno negativo, -1. Quizás agregue / reste “length (adjetivo-frase)” en lugar de 1 para preferir frases adjetivas más largas. Necesita una lista de pares (oración, puntaje) para cada revisión. Ordenar la lista de oraciones por puntaje.
Sus oraciones superiores e inferiores en esa lista son candidatos para el fragmento de esa revisión (most + ve, most -ve). Podría decirse que los lectores se preocupan tanto por las evaluaciones negativas como por las positivas. Incluso podría tomar las 2 oraciones superiores y las 2 inferiores y combinarlas en un fragmento más grande:
“Funciona muy bien … fuente de alimentación impecable … imagen pobre … sonido decepcionante”