Hay muchas herramientas gratuitas para ayudar con esto. No estoy seguro de si hay una solución lista para usar; Puede tomar tiempo seleccionar algunas herramientas que le gusten y juntarlas.
Si las palabras son palabras inglesas estándar, puede buscar su pronunciación en el Diccionario de pronunciación de CMU (quizás después de aplicar la corrección ortográfica). Pero si necesita poder predecir la pronunciación de palabras desconocidas a partir de su ortografía, entonces debe usar un sistema G2P. G2P significa “grafema a fonema”. Algunos sistemas se mencionan aquí.
Una vez que tenga pronunciaciones, puede usar un algoritmo de edición de distancia para determinar la similitud fonética. Una medida popular es ALINE de Greg Kondrak, que incluye un método para evaluar la similitud de dos fonemas. El documento de Kondrak sobre ALINE, y varias implementaciones gratuitas en diferentes idiomas, se encuentran fácilmente con Google.
- ¿Qué algoritmo de consenso de blockchain podría utilizar para crear una base de datos descentralizada de resultados de partidos de fútbol?
- ¿Son 2 horas de entrenamiento de rompecabezas de algoritmos por día durante un año suficiente para prepararse para la entrevista de Google?
- Cómo generar todas las permutaciones de fila de una matriz 2D dada de forma recursiva
- ¿Qué harías? ¿Cuál hubiera sido tu estrategia si hubieras tenido la oportunidad de volver a comenzar la programación de aprendizaje?
- ¿Las estructuras de datos y los algoritmos son universales en todos los idiomas?
Este documento sobre la detección de nombres de medicamentos de sonido similar puede ser un buen punto de partida para usted: https://webdocs.cs.ualberta.ca/~…