¿Cuál es el mejor modelo de predicción de la siguiente palabra en R?

Ahora, para comenzar a predecir la siguiente palabra en el contexto de una oración, podemos usar n-gramas. Los N-gramos son una secuencia de oraciones correctas en el idioma designado que consta de exactamente n palabras. Ahora, si encuentra un conjunto de datos con n-gramos junto con una probabilidad para cada n-gramo, entonces básicamente resolvió el problema. Sin embargo, encontrar ese conjunto de datos es engorroso por decir lo menos, también solo le da una respuesta en el contexto de una oración, no de un párrafo completo.

Ahora, para resolver el problema, se aplican más comúnmente redes neuronales que pueden aprender de todo el contexto del texto. Sin embargo, R no tiene una implementación realmente eficiente de RNN-s y NN-s en general, por lo tanto, debemos utilizar otros métodos.

Las redes bayesianas y los modelos de Markov también parecen ser populares para este problema. También tienen implementaciones bastante decentes en R, así que diría que vaya con redes bayesianas.

More Interesting

¿Cómo se explica el algoritmo de propagación de creencias en las redes bayesianas?

¿Cómo se realiza el aprendizaje automático supervisado cuando sus datos no caben en una sola máquina? ¿Los clasificadores de libros de texto como los clasificadores SVM o Naive Bayes siguen siendo tan importantes o incluso factibles a medida que aumenta el tamaño de sus datos o los algoritmos diferentes se vuelven más populares?

¿Cuáles son algunas bibliotecas de software para el aprendizaje a gran escala?

¿Cuál es más eficiente para los algoritmos de reconocimiento facial, PCA o LDA?

¿Cuál es la diferencia entre SVM y ANN?

¿Será factible dentro de los próximos 5 años que una API de aprendizaje automático maneje la construcción de representaciones significativas a partir de datos sin procesar?

¿Qué tan fuerte es la Universidad de Washington en Machine Learning?

¿Por qué es tan popular Tensorflow?

¿Cómo puede ser posible la IA si las máquinas se limitan a la lógica y el lenguaje?

¿Qué tan importante es entender el cerebro para el aprendizaje profundo y viceversa?

¿Qué haces como programador de Machine Learning y qué hace que lo que haces sea interesante?

¿A qué grupo de clasificadores pertenece el MulticlassClassifier que se usa en Weka?

¿Cómo debo elegir una función de activación adecuada para la red neuronal?

¿Cuáles son algunos usos prácticos o aplicaciones del conjunto de datos de YouTube 8M?

¿Cuál es el mayor problema no resuelto para los sistemas de recomendación?