Hay muchas herramientas disponibles para la investigación estilométrica disponibles en la web, pero la mayoría de ellas están orientadas a la investigación y requieren cierta familiaridad con los lenguajes de programación que se han desarrollado. Para limitar su lista, me centraré en dos herramientas que son de código abierto, tienen una GUI descendente y funcionan en todas las plataformas del sistema operativo:
- El Programa de Atribución de Autoría Gráfica de Java (JGAAP): Una buena herramienta desarrollada por Patrick Juola y sus colaboradores en los Laboratorios EVL en la Universidad de Duquesne. Está basado en JAVA y utiliza una GUI amigable que puede ayudarlo a seleccionar una gran cantidad de características estilométricas y entrenarlas utilizando algoritmos de aprendizaje automático de última generación en su corpus. Admite UTF8 y puede usarlo como un cuadro negro en problemas de atribución de autoría tanto cerrados como abiertos. El repositorio de GitHub donde puedes descargar la última versión está aquí: evllabs / JGAAP
- paquete stylo R: es un paquete escrito para el lenguaje R. Proporciona implementaciones fáciles de usar de varios análisis establecidos en el campo de la estilística computacional, incluida la atribución de autoría no tradicional, el reconocimiento de género, el desarrollo del estilo (“estilocronometría”), etc. El paquete incluye varios métodos explicativos (escalamiento multidimensional , análisis de componentes principales, análisis de conglomerados, árboles de consenso bootstrap). Además, hay disponibles varios métodos supervisados de aprendizaje automático (Delta, máquinas de vectores de soporte, Bayes ingenuos, vecinos más cercanos a k, centroides reducidos más cercanos). La función rolling.delta () analiza trabajos colaborativos e intenta determinar la autoría de los fragmentos extraídos de ellos. La función rolling.classify () ofrece una interfaz más flexible para la clasificación secuencial de trabajos colaborativos. La función opuesta () realiza un análisis contrastante entre dos conjuntos de textos dados: entre otras cosas, genera listas de palabras significativamente preferidas y evitadas por uno o más autores en comparación con los textos de otro autor (o un conjunto de ellos). Su página de CRAN es: CRAN – Stylo del paquete
Espero que estas referencias te ayuden.
- ¿Cómo aprendo matemáticas del nivel cero? Soy un graduado en informática y bastante decente en mi función de programación. Extraño el contexto del uso de las matemáticas en la vida; No puedo visualizarlo.
- ¿Cómo es la práctica en FiscalNote?
- ¿El aprendizaje automático es realmente emocionante?
- ¿Cuáles son los pros y los contras de ir a la UC Santa Cruz para la informática? ¿Cómo pesa UCSC en comparación con otras universidades en términos de CS y empleo después de la universidad?
- ¿Qué tan bueno es NIIT Neemrana para CSE?