¿Pueden las máquinas enseñar a otras máquinas?

Si considera el aprendizaje como un mapeo entre un conjunto de entrada y un conjunto de símbolos de salida designado. Este proceso de mapeo está usando efectivamente una muestra y mapeo a una respuesta aceptable. Puede configurar una máquina para alimentar pares de valores en ese proceso en otra máquina (ninguna máquina tiene ningún tipo de plan por qué) ambas máquinas simplemente están ejecutando una secuencia de ejemplos con un proceso numérico para asignar rutas incorporadas en la máquina receptora. Esto se considera como para aprender en términos de aprendizaje automático.

Si enseñas a los jóvenes a utilizar esta forma de aprendizaje “encantamiento”, serás despedido. Sin una razón o propósito, el aprendizaje es tan mecánico como copiar.

Copiar bloques de código o texto en un sistema informático nunca ha constituido un aprendizaje.

Pero copiar código o conjuntos de datos a una máquina que luego los ejecuta y luego parece hacer cosas que antes no podía hacer parece ser el resultado del aprendizaje.

Así que permitamos aprender a incluir otro ingrediente … la razón es decir, por qué

el aprendizaje requiere experiencias planificadas que mejorarán la viabilidad del sistema que se somete a la matrícula. (Esto cubre la enseñanza ya que toda la educación se financia para mejorar las capacidades de los alumnos con respecto a la sociedad (que es una extensión de nuestro entorno)

(La viabilidad expresa el por qué para todos los seres vivos. A menudo preguntamos cuál es el propósito de la vida; para todas las especies, esto se reduce a la supervivencia e incluye la procreación. Cuando las personas dicen cuál es el propósito de la vida, desean más, pero las interacciones como ¡perfectamente como sea posible, con nuestro entorno complejo pero esencialmente consistente, en la medida en que nuestra especie lo haya logrado, es un logro bastante significativo!)

En MMARL hace muchos años, instalé máquinas (máquinas Symbolics Lisp) servidas por un entorno submarino simulado. Luego desafié a los demás en el grupo a construir un sistema subacuático viable (pseudo-biológico) que pudiera perecer fácilmente al tratar de cumplir con los objetivos correctos (los objetivos a menudo fueron establecidos por el programador). (Esto se llamaba escenario de mundo snark). La mayoría de las personas programaron respuestas autónomas para el snark, lo que significaba que hicieron el aprendizaje y lo transfirieron al snark. Construí algo basado en tablas de decisión que podía detectar (en términos de control, subimpulso y sobreimpulso y modificaciones de retroalimentación a los algoritmos de control de snark (es decir, las tablas). En efecto, el entorno estaba haciendo la programación retroalimentando las condiciones de falla (disparos de más / menos) y el sistema estaba haciendo una modificación similar a un hebb de los estados establecidos y desencadenó respuestas. Fue difícil hacerlo funcionar y la mayor parte del esfuerzo terminó en las herramientas de la tabla de decisiones. Pero aprender de un entorno simulado por una máquina permitió que otra máquina mejorar su rendimiento y, por lo tanto, mejorar la viabilidad. Lo considero como aprendizaje. Es sutil: la clave es que el objetivo debe ser considerado en términos de una acción de alto nivel como no morir. Las tablas de decisión parecían un conjunto de estados diagramas, que están lo más cerca posible de las redes neuronales, pero evite las técnicas numéricas (p. ej., gradiente de descenso, etc.).

Esto solo implica que las máquinas se enseñan entre sí, una mejor manera de pensarlo es que el entorno hace la enseñanza inicial, las personas están construidas para interactuar con él y así aprender. Para adquirir conocimiento, necesita una fuente constante de información del sensor, eso es lo que proporciona el entorno. Es por eso que la IA se trata de cibernética en lugar de computadoras.

Las máquinas no solo pueden enseñarse entre sí, sino que también pueden enseñarse a sí mismas.

Se llama: aprendizaje no supervisado