Esta tarea generalmente se conoce como identificación de autoría en la literatura NLP / CL. Generalmente funciona mediante la extracción de características de un gran cuerpo de texto escrito por los autores que uno está interesado en identificar y luego entrenar un modelo con estas características. Es una pregunta empírica si los enfoques habituales, que se han aplicado a la literatura científica y a los textos históricos, funcionarán para las respuestas de Quora. Un factor de confusión es que es probable que cualquier conjunto grande de muestras escritas en Quora para un autor dado contenga respuestas a preguntas de diferentes temas y no sobre el mismo tema. Algunas características lingüísticas aún pueden compartirse entre las respuestas para diferentes temas, pero puede ser un poco más desafiante de lo que cabría esperar. Aquí hay una publicación de Language Log de 2008 que podría arrojar algo más de luz sobre este tema: http: //languagelog.ldc.upenn.edu…
Respuesta corta: es posible, pero para empezar tendría que ser una muestra de escritura muy grande y qué tan bien funciona es una pregunta empírica.
- ¿Cómo creo un conjunto de datos como MNIST para reconocer caracteres de otro idioma? Tengo un conjunto de datos como una carpeta de imágenes. ¿Cómo uso eso en Tensorflow?
- ¿Por qué se usa Python para el aprendizaje profundo si es tan lento?
- ¿Cuáles son los populares paquetes ML de adopción (Machine wise)?
- ¿Apache Spark es un buen marco para implementar Reinforcement Learning?
- ¿Cómo se recupera la información de las cajas negras?