¿Qué algoritmos de aprendizaje automático pueden producir una función de puntuación para medir la “similitud” entre dos objetos?

Si las reglas son completamente arbitrarias, puede que no haya nada que aprender. En cuyo caso puedes memorizar los pares, y eso es lo mejor que puedes hacer.

Si cree que hay algunas reglas, considere entrenar un transductor de estado finito. Estos pueden usarse para generar una probabilidad de transformar X a Y.

Si esto es demasiado complicado, puede utilizar una red neuronal u otro algoritmo de ML incrustando. Puede incrustar cada palabra X en el espacio [matemático] R ^ n [/ matemático] y, a continuación, tener características con valor real [matemático] 2n [/ matemático] y entrenar un clasificador / regresión sobre eso. Con las redes neuronales puede aprender una incrustación automáticamente, pero el modelo de incrustación también puede ser bastante complicado, ya que probablemente no pueda usar una bolsa de caracteres.

También puede construir un árbol de decisión. Ese podría ser el algoritmo más sencillo, pero no estoy seguro de qué tan bien funcionaría. Las características pueden ser cualquier propiedad de cualquiera de las cadenas.

En cualquier caso, sugeriría agregar algunos ejemplos negativos, lo que sea que use para entrenar.

AlgoritmosAprendizaje automáticoinformáticaInteligencia Artificial

Related Content

¿La traducción automática hará que aprender un idioma extranjero sea innecesario?

¿Cómo se mide el puntaje de precisión para cada clase cuando se prueba el clasificador en sklearn?

¿Cuáles son algunos libros sobre aprendizaje automático e inteligencia artificial para un laico?

¿Cómo se puede desarrollar un algoritmo de aprendizaje automático?

Cómo modelar este problema como un problema de aprendizaje automático

¿Cómo cambiará la inteligencia artificial la biblioteca y la ciencia de la información?

¿Cuál es el mejor marco de aprendizaje profundo, Theano, Torch7 o Caffe?

No entiendo la necesidad de un algoritmo de aprendizaje automático aquí. Lo que podría necesitar sería una métrica de similitud.

Existen algunas medidas de similitud que proporcionan un valor cuantificado después de comparar dos o más objetos. En su caso, Jaccard Index sería un buen lugar para comenzar. También puede echar un vistazo a las medidas no simétricas como la divergencia Kullback-Leibler.

Dmitriy Genzel

More Interesting

Cómo implementar AI en mi aplicación de Android

¿Qué tan probable es que AI tome el trabajo de los programadores? ¿Hay perspectivas de ese tipo en el horizonte?

¿Por qué solo se utilizan redes neuronales convolucionales para imágenes, en lugar de otras técnicas de aprendizaje profundo?

¿Cuál es el mejor programa con la mejor IA disponible para interactuar?

¿La IA tiene futuro y puede ser accesible?

En el futuro, ¿será posible que la inteligencia artificial lidere una empresa como la inteligencia ejecutiva detrás de la estrategia?

Ray Kurzweil siente que es probable que la IA poderosa sea buena para la humanidad, mientras que Bill Joy siente lo contrario. ¿Quién es correcto y por qué?

Cómo interpretar los resultados de la red neuronal

Cómo hacerme inteligente

¿Cuál es la mayor hazaña de inteligencia que una persona haya logrado?

Los Upanishads: Si se supone que la conciencia está presente en todas partes, ¿por qué no los robots son conscientes?

¿Qué significa el término aumento de datos en el contexto del aprendizaje automático?

¿Cómo se vería el sueño en una red neuronal artificial?

Bioinformática: ¿cómo y qué técnicas de aprendizaje automático son más favorables para el análisis de secuencias de proteínas?

¿Prefieres aprender inteligencia artificial o ciencia espacial?

Web Analytics