Cómo comenzar mi investigación sobre el aprendizaje por refuerzo si no soy bueno en Python

No creo que sea realmente cierto. A excepción de los documentos en bibliotecas de software o algo por el estilo, ningún documento RL requiere ningún lenguaje específico. El documento debe describir un algoritmo y conceptos matemáticos sobre cómo implementar un algoritmo. Si desea construir sobre ese papel, puede implementarlo en el idioma que desee.

Quizás lo que siente es que quiere hacer algo con el aprendizaje de refuerzo profundo, y para hacer ese trabajo preferiría construir en una biblioteca de aprendizaje profundo existente, como Tensorflow, y la mayoría de las bibliotecas de aprendizaje profundo tienden a centrarse en Python.

Si ese es el problema real al que se enfrenta, simplemente busque una biblioteca DL que cubra un idioma con el que esté más familiarizado. Muchos de ellos, además de Python, también son compatibles con C ++. Para Java, es posible que desee probar DL4J. Mxnet admite varios lenguajes además de Python y C ++, como Scala, R y Julia. La antorcha está diseñada para Lua.

Dicho todo esto, si no te sientes cómodo con nada fuera de Matlab y eres un estudiante de doctorado de CS, entonces realmente te debes a ti mismo diversificarte y aprender otros idiomas. Como investigador, su objetivo no debe ser ser tan fácil con varios idiomas y sus características clave como ingeniero de software, sino que como científico de la computación debe comprender la base de los estilos de los lenguajes de programación lo suficientemente bien como para poder aprender usa un nuevo idioma sin mucho esfuerzo. Si no puede hacer eso, entonces vale la pena su tiempo para comenzar a mejorar en una variedad de idiomas y Python no podría ser un lugar más fácil para comenzar.

Python realmente no es un lenguaje difícil de dominar. La mayoría de las veces la sintaxis es similar a matlab. No sé qué tan ocupado estás, pero no tengas miedo de aprender Python. Es probablemente uno de los idiomas más fáciles de usar para el aprendizaje automático.

More Interesting

¿Cuál es la diferencia entre SVD y factorización matricial en el contexto del motor de recomendación?

¿Por qué el método de Newton solo es apropiado cuando el hessiano es positivo definido?

¿Qué significa el siguiente pasaje de un documento de aprendizaje profundo sobre aprendizaje automático sobre representaciones distribuidas frente a representaciones no distribuidas?

¿Cuál es la principal diferencia entre el aprendizaje profundo y los viejos enfoques de aprendizaje?

¿Cómo utiliza Foursquare el aprendizaje automático para mejorar el producto?

¿Qué es la discretización de características?

¿Cuál es el mejor algoritmo para implementar un reconocimiento de voz robusto en entornos ruidosos?

¿Cuál es la próxima gran cosa en el aprendizaje automático después de que hayamos terminado con el aprendizaje profundo?

¿Puede un ingeniero eléctrico seguir una carrera en aprendizaje automático en el futuro?

Dado que los modelos pueden ser entrenados en datos sintéticos, ¿podemos usar el Entrenamiento Adversario para hacer que las imágenes de prueba sean más sintéticas?

¿Qué hacen los ingenieros de aprendizaje automático diariamente?

¿Cuáles son algunos de los mejores algoritmos de aprendizaje automático, considerando la eficiencia, la facilidad de implementación, etc.?

¿Por qué se congelan los pesos en el discriminador de GAN durante el entrenamiento?

¿Cuáles son los problemas interesantes en la 'automatización de big data'?

¿Qué elementos de los sistemas operativos generales de una organización deben ser compatibles y reforzarse mutuamente?