¿Es posible identificar automáticamente escritores en función de sus estilos de escritura?

Esto es posible, con algunos falsos positivos y falsos negativos.

Los elementos clave del enfoque serían:

  1. Restringir el espacio de búsqueda; por ejemplo, comenzar con un programa que pueda distinguir a Kurt Vonnegut de Anthony Burgess
  2. Saber algo sobre el estilo literario: ¿qué tipo de cosas podrían ser relevantes al comparar los estilos de dos autores? Por ejemplo: frecuencia de adjetivos, vocabulario, tamaño de vocabulario, uso de modismos, estructura de oraciones, puntuación, temas recurrentes, longitud del párrafo.
  3. Decida si desea definir explícitamente los criterios de diferenciación, o si desea que algo como una máquina de vectores de soporte resuelva los criterios de diferenciación
  4. Construye un prototipo e itera
  5. Una vez que esté funcionando, generalícelo a más autores (si puede), o deséchelo usando lo que ha aprendido para crear una versión nueva, mejorada y generalizada.

Algo parecido a una huella digital estilística también se puede usar para síntesis; Por ejemplo, hace 20 años, un autor asistido por computadora escribió la novela “Just This Once” al estilo de Jacqueline Susann. Hiliaridad de derechos de autor se produjo.

Por diversión:

  • Burgess: “La maldad es de uno mismo, de uno, de usted o de mí en nuestros extraños golpes, y ese yo está hecho por el viejo Bog o Dios y es su gran orgullo y su radosidad. Pero el no-yo no puede tener lo malo, lo que significa ellos del gobierno y los jueces y las escuelas no pueden permitir lo malo porque no pueden permitirse lo propio “.
  • Vonnegut: “Y Dios dijo:” Hagamos criaturas vivientes del barro, para que el barro pueda ver lo que hemos hecho “. Y Dios creó a todas las criaturas vivientes que ahora se mueven, y una era hombre. Lodo como el hombre solo podía hablar. Dios se inclinó hacia el barro mientras el hombre se sentaba, miraba a su alrededor y hablaba: “¿Cuál es el propósito de todo esto?”, Preguntó cortésmente “.

¿Cómo podrías comenzar a distinguirlos?

El estudio de esto se llama estilometría. No soy un experto, pero sí sé que la estilometría computacional implica análisis estadísticos y técnicas del área de la inteligencia artificial. Hay una serie de herramientas de software estilométricas como The Signature Stylometric System desarrollado en la Universidad de Oxford y el sistema Stylene para holandés / flamenco desarrollado en la Universidad de Antwerpen.

Y así como hay criptografía y criptoanálisis, también existe el estudio de la estilometría de confrontación , que trata sobre la ofuscación estilística: ¿cómo puede evitar ser detectado como el autor de un texto dado?

Pruebe este sitio web: I Write Like