¿Alan Turing inventó el aprendizaje por refuerzo?

Si continúa leyendo ese documento [1] encontrará la oración

“El uso de castigos y recompensas puede, en el mejor de los casos, ser parte del proceso de enseñanza. Hablando en términos generales, si el maestro no tiene otros medios para comunicarse con el alumno, la cantidad de información que puede llegar a él no excede el número total de recompensas y castigos aplicados. Cuando un niño haya aprendido a repetir “Casabianca”, probablemente se sentirá muy dolorido ”

Entonces pensó en tener recompensas y castigos como una forma de proporcionar información, pero casi de inmediato notó las limitaciones de la misma. La supervisión también podría ser necesaria. Lo más sorprendente es que ya se imaginaba que enseñar computadoras debería ser como enseñar a un niño, algo que no es corriente incluso hoy en día.

Las raíces del aprendizaje reforzado en términos computacionales estarán en la programación dinámica de Richard Bellman un par de años después, y mucho más tarde con el aprendizaje TD.

Notas al pie

[1] https://oup.silverchair-cdn.com/…

Alan TuringAprendizaje por refuerzoinvención e inventos

Related Content

Si tienes la oportunidad de eliminar un invento, ¿cuál elegirás?

Si inventamos una máquina del tiempo, ¿a qué hora volverías?

¿Quién fue el padre Ernetti? ¿Realmente inventó una máquina del tiempo?

¿Se roban los inventos modernos de los Vedas?

¿Quién inventó el lápiz?

¿Cuál es la marca de corte para CS en NIT Rourkela en 2017?

¿Cuál es la mejor cámara para comprar por debajo de 1000 TL ($ 280 aprox.) Para usuarios de cámaras intermedias?

More Interesting

¿Cuáles son los últimos inventos en química?

¿Quién inventó los despertadores? ¿Cómo se crearon por primera vez?

¿Por qué Alan Turing, la primera persona en inventar la computadora, no es tan prominente como Steve Jobs y Bill Gates?

¿Cuáles son los mejores inventos tecnológicos y gadgets de 2016?

¿Quién inventó gmail y el correo electrónico?

¿La invención de una computadora cuántica amenaza la criptografía?

¿Cuán valioso es el invento más nuevo de Vladimir Tatarenko de la 'cabina de avión desmontable'?

¿Todos los logros e inventos humanos están inspirados en la naturaleza?

Si no se hubiera inventado el alcohol, ¿qué impacto tendría en la forma en que socializamos?

¿Qué es una máquina expendedora?

¿Quién inventó / descubrió el vasto?

¿Alguien puede nombrar un invento / descubrimiento que no fue útil en ese momento pero que resultó un hito más tarde?

Invenciones e inventores Quiero regalar una invención y no puedo permitirme patentarla. ¿Alguien tiene una sugerencia sobre cómo hacerlo? Gracias.

¿Por qué no hay más inventos si hay más personas autistas?

Ley de propiedad intelectual: si los derechos se mantienen con el creador de acuerdo con IP ACT, ¿quién es el PROPIETARIO? ¿El desarrollador creativo o el desarrollador original del producto?

Web Analytics