Cómo etiquetar los datos conversacionales para la capacitación en PNL

Queríamos permitir a los desarrolladores implementar rápida y fácilmente la inteligencia artificial conversacional en sus chatbots, y sin tener que hacerlo desde cero. Es una gran molestia tener que entrenar a un bot para comprender lugares comunes simples como “hola”, “adiós” y “¿cómo estás?”. Nadie quiere pasar semanas creando guiones AIML o ingresando pares de preguntas / respuestas en un formulario .

Pensamos: “¿No sería útil si hubiera una API conversacional en la que simplemente pudieras iniciar una sesión a través de una simple solicitud HTTP RESTful?”. Harías una solicitud HTTP GET a una URL de punto final, agregarías un par de parámetros y ¡auge! La API respondería con la respuesta adecuada.

Entonces, eso es lo que construimos.

Por una pequeña tarifa, puede licenciar su clave API aquí. Aquí hay documentación con fragmentos de código de muestra y una demostración. Ya está etiquetado en los grupos apropiados para usted.

¿Por qué quieres etiquetar los datos? ¿Podrá realmente crear una taxonomía que capture todos los “grupos”. ¿Será esta taxonomía realmente útil en la tarea que finalmente desea hacer? En mi experiencia, dicha clasificación generalmente no es el resultado final, y este es generalmente un paso intermedio que es útil solo para la presentación de informes humanos, a menos que se utilice un producto que le diga a la gente que “Hola” es un saludo. En mi humilde opinión, es contraproducente intentar forzar los datos a una taxonomía.

El campo del análisis del discurso etiqueta las expresiones como varios “actos de habla”.
No puedo recomendarlo personalmente porque considero que las categorías son bastante arbitrarias y la investigación lleva 50 años desactualizada, pero hasta donde yo sé, es el único intento formal de categorizar la conversación.

More Interesting

¿Qué tan importante es la optimización de hiperparámetros en los modelos gráficos bayesianos, como la asignación de Dirichlet latente?

En la regresión cuadrática, ¿por qué tengo que mantener una variable y su aumento exponencial en el mismo modelo?

¿Cuáles son las diferencias, similitudes, pros, contras, aplicaciones y descripciones de Keras, TensorFlow, Theano?

He completado la clase Coursera de Andrew Ng sobre aprendizaje automático. ¿Qué debería hacer después? ¿Qué puedo hacer a continuación?

¿Cuál es la diferencia entre regresión lineal y logística?

¿Es posible que AI / ML aprenda el patrón subyacente en los siguientes problemas y prediga la respuesta?

Cómo obtener colores 'visualmente distinguibles' de las imágenes

Cómo comenzar a implementar un sistema de recomendación para juegos

¿Cómo se emplea una parada temprana en TensorFlow?

¿Cuál es el mejor método de selección de características cuando los datos del tren tienen más características que el número de puntos de datos? ¿Asumir que los datos son muy grandes?

¿Por qué la regresión logística se considera un modelo lineal?

¿Por qué algunas personas confunden las estadísticas con el aprendizaje automático?

¿Por qué utilizamos el CDF de distribución logística para calcular las probabilidades en la regresión logística?

¿Hay nueva información sobre el tema X o la gente sigue copiando y pegando?

¿Por qué no hay implementaciones de aprendizaje profundo (populares) escritas en Golang?