Lo sentimos, no estoy seguro de qué es exactamente lo que está buscando, tal vez pueda aclarar en la sección de comentarios si esta respuesta no responde a su pregunta
- Si lo que está buscando es la fuente del modelo word2vec, que esencialmente predice palabras en una ventana de palabras, para generar vectores de palabras, está disponible aquí Github -C código para word2vec
- Si planea predecir la siguiente palabra en una secuencia de palabras como en una oración, entonces word2vec no haría lo que deseamos, porque el modelo word2vec no tiene en cuenta el orden de las palabras, está capacitado en palabras que aparecen en una ventana de palabras .
- En su lugar, podemos usar un modelo de secuencia como RNN, construir un modelo de lenguaje y luego usarlo para predecir la siguiente palabra en una secuencia de palabras. Código C para construir un modelo de lenguaje usando un RNN – yandex / rapid-rnnlm.
- Todo lo que necesitamos hacer es generar un modelo de lenguaje al alimentarlo con un corpus de interés.
- Hay un binario que viene con el enlace de arriba con opciones para
- puntuar una oración dado un modelo de lenguaje o
- predecir la siguiente palabra dado un conjunto inicial de palabras