Esto se ha hecho mucho: tómese el tiempo para buscar en Google algunas palabras clave y verá que hay varias soluciones existentes.
En mi opinión, en realidad no es un problema tan interesante de resolver como parece, por un par de razones:
- No existe una regla con respecto al género y los nombres: y muchos nombres (particularmente formas abreviadas de nombres) son neutrales al género.
- Hay bases de datos exhaustivas sobre si un nombre es típicamente masculino / femenino / ambos, lo cual es excelente para proporcionarle datos de entrenamiento, pero en realidad no hay tantos nombres: por lo que su modelo también puede memorizar los datos de entrenamiento y buscar la respuesta cuando quieras.
Podría tener una puñalada en este problema con un LSTM. Tendría que pensar un poco cuidadosamente sobre sus etiquetas, por la primera razón que mencioné anteriormente, un resultado simple 0 = masculino, 1 = femenino (logístico) puede ser demasiado simple: quizás sería mejor tratar el problema como un problema múltiple problema de clasificación de etiquetas (su red tendría dos salidas que no son excluyentes: probabilidad de ser un nombre masculino “aceptable” y probabilidad de ser un nombre femenino “aceptable”).
- ¿Cómo funciona la detección de rostros?
- ¿Qué significan las hipótesis finita e infinita en el aprendizaje automático? Cuáles son las diferencias entre ellos?
- ¿Qué industria utiliza una máquina de granallado?
- ¿Se pueden usar las redes neuronales para resolver problemas de aprendizaje no supervisados?
- ¿Cuáles son las principales debilidades de la estadística de brecha para evaluar el número de clústeres presentes en un conjunto de datos?