Es una pregunta bastante difícil de responder ya que creo que realmente depende del método de entrenamiento que se utilice.
En mi maestría. Tesis (https://www.researchgate.net/pub…) Propongo un nuevo algoritmo de aprendizaje supervisado que tiene como objetivo aproximar lo más posible la función de evaluación de Stockfish, uno de los motores de ajedrez más fuertes existentes (Open Source Chess Engine). Demuestro que si se conservan las propiedades geométricas de la representación de la placa (es decir, sin utilizar técnicas como la agrupación), los CNN pueden ser tan potentes como los Perceptrones multicapa (MLP). Además, tienen el beneficio principal que permite apilar diferentes capas de características que representan un tablero de ajedrez una tras otra, creando n tensores dimensionales que compensan fácilmente la conectividad completa de las entradas que caracteriza a los MLP.
Otro trabajo que muestra el uso potencial de las CNN en el ajedrez en una tarea de aprendizaje supervisado es propuesto por (https: //pdfs.semanticscholar.org…) donde los autores informan cómo se pueden usar las CNN para replicar los movimientos de los Grandes Maestros humanos. ¡También obtuvieron resultados bastante decentes!
- ¿Cuál es la diferencia entre el aprendizaje de refuerzo profundo y el aprendizaje de refuerzo?
- ¿Cómo deciden las personas en aprendizaje profundo qué artículos no leer?
- ¿Cuál es la mejor manera de encontrar análisis de sentimientos?
- Al predecir un resultado binario, ¿cómo toman en cuenta las personas el orden en que ocurren las entradas?
- ¿Cuál es la mejor manera para que un estudiante de CS en una universidad india obtenga una pasantía / trabajo en una compañía en el sector de Big Data y / o Machine Learning en los Estados Unidos?
No sé si las mismas arquitecturas funcionarían tan bien al utilizar algoritmos de aprendizaje de refuerzo profundo, pero parece que el programa AlphaZero de DeepMind logró hacerlo (https://arxiv.org/pdf/1712.01815…). Sin embargo, para saber más sobre la estructura de la ANN que han utilizado, tendremos que esperar al documento oficial.