No hay una respuesta simple a esto. La regla teórica es cuanto más grande, mejor , pero en realidad es lo que consideres suficiente para cubrir una gran parte del espacio modelado. Para un chatbot también depende realmente del tipo de bot que desee. Si se centra en una industria, entonces podría ser un conjunto de datos mucho más pequeño que un bot de asistente personal general.
Finalmente, la cantidad es en realidad mucho menos importante que la calidad. Su conjunto de datos de entrenamiento debe cubrir la mayoría de sus casos de uso. Esto significa que realmente necesita comprender los casos de uso más importantes de su cliente objetivo.
En datapure creamos conjuntos de datos personalizados todo el tiempo y últimamente gran parte se ha centrado en los bots. El problema que declara no es único, pero una cosa que hemos encontrado es que nuestra calidad es tan alta que el cliente a menudo tiene que crear un conjunto de datos mucho más pequeño de lo que creía que era necesario.
- ¿Cuál es su experiencia con la combinación de datos?
- ¿Cuál es el mejor instituto de investigación para la ciencia de datos en India?
- ¿De dónde puedo obtener una lista de compañías que usan Big Data?
- ¿Cómo se relacionan el big data, el análisis de datos y la ciencia de datos con los temas de probabilidad y estadística?
- ¿Qué habilidades son necesarias para conseguir un trabajo en análisis de datos?