Para los datos de corrección ortográfica en inglés, puede beneficiarse de investigar el corpus de errores ortográficos Birkbeck de Roger Mitton, disponible en el Oxford Text Archive. Mitton recopiló y produjo este trabajo mientras estaba en el Birkbeck College de la Universidad de Londres, por lo que no es sorprendente que las convenciones de ortografía británicas sean patentes en los datos.
Este corpus digital organiza las faltas de ortografía de las palabras de acuerdo a si fueron producidas por usuarios nativos o no nativos. Los datos se presentan en pares donde el primer elemento es la forma correcta de escribir la palabra en inglés y el segundo elemento es un error ortográfico observado. Para obtener más información, consulte el artículo de Mitton de 1987 “Correctores ortográficos, correctores ortográficos y errores ortográficos de los correctores ortográficos pobres”, Procesamiento y gestión de la información ( 23: 5) págs. 495-505.
- ¿Cómo determinar el refuerzo lateral en la pila? ¿Cuáles son las especificaciones simplificadas?
- ¿Qué está sucediendo en este gráfico de pérdida de precisión de la red?
- ¿Qué debo buscar al comprar una computadora para ejecutar experimentos de Machine Learning?
- ¿Dónde puedo encontrar un conjunto de datos satelitales espaciales?
- ¿Cuál es el análisis de opinión en el caso de TripAdvisor? ¿Como funciona?