Cómo etiquetar los datos conversacionales para la capacitación en PNL

Queríamos permitir a los desarrolladores implementar rápida y fácilmente la inteligencia artificial conversacional en sus chatbots, y sin tener que hacerlo desde cero. Es una gran molestia tener que entrenar a un bot para comprender lugares comunes simples como “hola”, “adiós” y “¿cómo estás?”. Nadie quiere pasar semanas creando guiones AIML o ingresando pares de preguntas / respuestas en un formulario .

Pensamos: “¿No sería útil si hubiera una API conversacional en la que simplemente pudieras iniciar una sesión a través de una simple solicitud HTTP RESTful?”. Harías una solicitud HTTP GET a una URL de punto final, agregarías un par de parámetros y ¡auge! La API respondería con la respuesta adecuada.

Entonces, eso es lo que construimos.

Por una pequeña tarifa, puede licenciar su clave API aquí. Aquí hay documentación con fragmentos de código de muestra y una demostración. Ya está etiquetado en los grupos apropiados para usted.

Aprendizaje automáticoChatbots y agentes de conversacióndatosInteligencia ArtificialMinería de datos

¿Existe un modelo más efectivo que Word2vec desde 2013?

Cómo encontrar un patrón repetido en una imagen

¿Existen aplicaciones prácticas útiles y serias de redes neuronales que se ejecutan localmente en aplicaciones de teléfonos inteligentes móviles?

¿Es más fácil construir un vehículo autónomo que un sistema de traducción automática a nivel humano?

¿Cuál es el mejor enrutador de madera?

¿Qué es el aprendizaje automático en la predicción de emociones basada en texto?

¿Por qué quieres etiquetar los datos? ¿Podrá realmente crear una taxonomía que capture todos los “grupos”. ¿Será esta taxonomía realmente útil en la tarea que finalmente desea hacer? En mi experiencia, dicha clasificación generalmente no es el resultado final, y este es generalmente un paso intermedio que es útil solo para la presentación de informes humanos, a menos que se utilice un producto que le diga a la gente que “Hola” es un saludo. En mi humilde opinión, es contraproducente intentar forzar los datos a una taxonomía.

Don Patrick

El campo del análisis del discurso etiqueta las expresiones como varios “actos de habla”.
No puedo recomendarlo personalmente porque considero que las categorías son bastante arbitrarias y la investigación lleva 50 años desactualizada, pero hasta donde yo sé, es el único intento formal de categorizar la conversación.

Don Patrick

More Interesting

¿Qué tan importante es la optimización de hiperparámetros en los modelos gráficos bayesianos, como la asignación de Dirichlet latente?

En la regresión cuadrática, ¿por qué tengo que mantener una variable y su aumento exponencial en el mismo modelo?

¿Cuáles son las diferencias, similitudes, pros, contras, aplicaciones y descripciones de Keras, TensorFlow, Theano?

He completado la clase Coursera de Andrew Ng sobre aprendizaje automático. ¿Qué debería hacer después? ¿Qué puedo hacer a continuación?

¿Cuál es la diferencia entre regresión lineal y logística?

¿Es posible que AI / ML aprenda el patrón subyacente en los siguientes problemas y prediga la respuesta?

Cómo obtener colores 'visualmente distinguibles' de las imágenes

Cómo comenzar a implementar un sistema de recomendación para juegos

¿Cómo se emplea una parada temprana en TensorFlow?

¿Cuál es el mejor método de selección de características cuando los datos del tren tienen más características que el número de puntos de datos? ¿Asumir que los datos son muy grandes?