1. Los ejemplos que planteó: ‘astrólogo’ y ‘ortodoncista’ no son realmente tan raros. ‘Astrologer’ en la lista de 9K de Paul Nation.
2. El problema con la construcción de su propio FreqDist es la lematización (o, a veces, desearía que las palabras se redujeran y agruparan aún más agresivamente). El mismo problema con Wiktionary: listas de frecuencias o conjuntos similares.
Encuentro las listas de la nación realmente buenas. Tom Cobb también los cura. La frecuencia y la clasificación detallada se han omitido de estas listas. Pero creo que la granularidad rara vez es útil o lógica.
- ¿Qué piensa Andrew Ng sobre Deep Learning?
- Para evaluar qué tan bueno es un hiperparámetro de red (por ejemplo, la tasa de deserción), ¿debo esperar a la convergencia?
- ¿Qué son las redes neuronales progresivas?
- ¿Cuáles son algunos ejemplos del mundo real de cómo y / o dónde se utilizan los algoritmos?
- ¿Cuál es una buena referencia para aprender cómo implementar y usar la búsqueda de línea para la optimización?
Por ejemplo, esto se basa en las listas de Nation:
3. Recuerdo vagamente que incluso Davies tiene algunos obsequios gratuitos para regalar, es decir, listas más pequeñas o parciales, especialmente si las usa para la investigación.
4. Me sorprendería si NLTK no tuviera esa función. O incluso algunos mejores conjuntos de datos, como datos históricos (como Google N-grams o Wolfram Alpha).