¿Cómo debo diseñar una red neuronal de traducción de novelas chinas?

Si. Es factible.

Podrías usar el sistema de traducción automática neuronal de Google listo para usar. Eso ya produciría traducciones razonables para su corpus fuente en chino, ya que el sistema está capacitado en una gran cantidad de datos sobre diversos temas.

Para obtener un mejor rendimiento de traducción específicamente para novelas web chinas de ciencia ficción y fantasía, se podría realizar una selección de datos de manera que los datos de entrenamiento en los que se entrenará su propio sistema de traducción automática neuronal sean del tema deseado. Puede basar su selección de datos en maximizar la entropía cruzada, la información mutua, la optimización submodular, etc. También hay otros trucos cuando se trata de la selección de datos, como la derivación y el revestimiento, que probablemente ayudarán a seleccionar datos de entrenamiento que compartan más similitudes con los deseados. tema.

Una vez que realice algún tipo de selección de datos y entrene un sistema de traducción automática neuronal estándar, es probable que obtenga traducciones razonables de ciencia ficción china al inglés.

La mayor parte de la traducción automática estadística para documentos largos que conozco se realiza oración por oración. Los modelos están entrenados en pares de oraciones extraídos de corpus paralelos alineados (un corpus que está disponible en ambos idiomas. Así que ya sabes que el texto habla de lo mismo pero en diferentes idiomas). Incluso los modelos de vanguardia basados ​​en redes neuronales que utilizan técnicas como la atención [1] están capacitados en datos de oración a oración. Si bien recientemente hubo avances muy buenos con los métodos neuronales (tenga en cuenta que la traducción automática basada en frases es bastante competitiva y todavía se está produciendo en muchos lugares), no capturan el discurso correctamente, es decir, la transición de oración a oración para formar un todo coherente. Este no es un gran problema para documentos como artículos de noticias, ya que las oraciones independientes tienen significado y se mantienen por sí mismas. Por lo tanto, traducir oración por oración tiene sentido. No estoy seguro de si es válido para el texto presente en las novelas. Le sugiero que intente traducir algunos párrafos en la aplicación web Google Translate y ver si produce una traducción satisfactoria. Los modelos de vanguardia no están muy por delante de la aplicación web de Google del número que veo en los documentos. Entonces, eso debería ser un buen proxy.

Notas al pie

[1] [1409.0473] Traducción automática neuronal aprendiendo conjuntamente a alinear y traducir

Usualmente leo webnovels en webnovel chino en línea TODOS. espero que puedas encontrar algo útil en él

More Interesting

'La IA podría ser' el peor evento en la historia de nuestra civilización '. ¿Qué opinas sobre la última declaración de Hawking?

¿Qué tipo de roles tendrían los robots y la IA en la industria hotelera?

¿Podemos predecir la personalidad humana en función del uso de las redes sociales utilizando Machine Learning?

¿Cuál es la próxima gran novedad en tecnología aparte de la IA y el automóvil sin conductor?

¿Qué tipo de problemas funciona bien con la técnica de Deep Learning?

¿Cómo debo diseñar una red neuronal de traducción de novelas chinas?

¿Cuáles son las aplicaciones de las redes neuronales en economía?

Cómo utilizar mejor mis grados de informática y contabilidad, teniendo en cuenta el advenimiento de la inteligencia artificial, la automatización, etc.

¿Cómo invierte Salesforce en inteligencia artificial en 2017?

¿Cuáles son las trampas / trampas / deudas técnicas a tener en cuenta si alguien está comenzando una codificación de visión por computadora y una aplicación de aprendizaje automático en C ++?

¿Cuáles son algunos temas nuevos de investigación en electrónica?

¿Qué tan probable es que, como en la película "Terminator", las computadoras del sistema de defensa interconectado se vuelvan conscientes de sí mismas y ataquen a la humanidad?

¿Cómo funciona Siri?

¿Qué aprendes de crear un chatbot?

¿Debería leer el libro Inteligencia artificial: un enfoque moderno a pesar de que no tengo mucho conocimiento de algoritmos?