Este documento revisa la mayoría de los detalles de lo que necesitaría hacer:
Zhou, Yingjie y col. “Estrategias para limpiar los correos electrónicos de la organización con una aplicación para el conjunto de datos de correo electrónico de Enron”. 5th Conf. de la Asociación Norteamericana de Ciencias Computacionales, Sociales y Organizacionales . 2007. http://www.cs.rpi.edu/~goldberg/…
En resumen, no existe una respuesta simple y automática. La distancia de edición mínima (distancia de Levenshtein) se puede usar para agrupar direcciones similares. Los autores también discuten el uso de reglas personalizadas y anotaciones manuales. Los encabezados X a menudo contienen los nombres de las personas correspondientes a las direcciones de correo electrónico, pero necesitaría hacer alguna coincidencia de patrón (subcadena) para encontrar las direcciones de correo electrónico y los alias correspondientes.
- Según Wikipedia, las redes neuronales artificiales actuales tienen la complejidad del cerebro de un gusano. ¿Es eso cierto?
- ¿Cuáles son las aplicaciones del tensor en estadística y aprendizaje automático?
- ¿Cuál es el mejor código comercial de reconocimiento facial?
- ¿La máquina está aprendiendo la 'versión del hombre tonto' de intentar recrear la inteligencia?
- En el aprendizaje profundo, ¿son el "aprendizaje incremental" y el "aprendizaje de transferencia" el mismo enfoque?