Si las reglas son completamente arbitrarias, puede que no haya nada que aprender. En cuyo caso puedes memorizar los pares, y eso es lo mejor que puedes hacer.
Si cree que hay algunas reglas, considere entrenar un transductor de estado finito. Estos pueden usarse para generar una probabilidad de transformar X a Y.
Si esto es demasiado complicado, puede utilizar una red neuronal u otro algoritmo de ML incrustando. Puede incrustar cada palabra X en el espacio [matemático] R ^ n [/ matemático] y, a continuación, tener características con valor real [matemático] 2n [/ matemático] y entrenar un clasificador / regresión sobre eso. Con las redes neuronales puede aprender una incrustación automáticamente, pero el modelo de incrustación también puede ser bastante complicado, ya que probablemente no pueda usar una bolsa de caracteres.
- ¿Cuál es el mejor chatbot basado en preguntas frecuentes?
- ¿Qué campo será bueno para elegir, inteligencia artificial, análisis de big data o piratería?
- ¿Qué piensa la mayoría de las personas sobre el aprendizaje automático?
- Cómo dominar las redes neuronales artificiales
- ¿Cómo sabemos cuándo entramos en la economía de la automatización donde la inteligencia artificial impregna nuestras ciudades como la fuerza impulsora de la productividad?
También puede construir un árbol de decisión. Ese podría ser el algoritmo más sencillo, pero no estoy seguro de qué tan bien funcionaría. Las características pueden ser cualquier propiedad de cualquiera de las cadenas.
En cualquier caso, sugeriría agregar algunos ejemplos negativos, lo que sea que use para entrenar.