¿Cómo le enseñas a un robot que ha cometido un error?

Lo que has descrito se llama aprendizaje de refuerzo. Dado que el modelo es probabilístico, es probable que los métodos bayesianos sean lo que está buscando.

En resumen: antes de la manipulación, o antes de la medición, la probabilidad es del 70%. Después, o después de la medición, la probabilidad es del 0% porque la evidencia del manipulador no mostró una copa, y la probabilidad de que el manipulador sea correcto es del 100%. Lea más en http://en.wikipedia.org/wiki/Bay…

En términos más generales, actualizar dicho modelo en función de nueva información … depende del modelo. Podría ser tan simple como eliminar la copa del modelo mundial. Pero es posible que no pueda (o desee) cambiar el modelo; en su lugar, es posible que desee considerar la información del modelo y del manipulador por separado, y combinarlos de diferentes maneras.

No es posible afirmar categóricamente que es más fácil o más difícil enseñarle al robot lo que está bien o lo que está mal. Depende de muchas cosas: entre ellas, el problema de clasificación (“copa” frente a “no copa” es un problema diferente a “copa” o “gato” o “cactus”), el tipo de enseñanza (retroalimentación positiva / negativa, y el tipo, tamaño y orden del conjunto de entrenamiento), y el tipo de aprendizaje involucrado (red neuronal, SVM, …)

Si está interesado en aprender más sobre el aprendizaje automático, hay varios recursos en línea excelentes. Puede probar las conferencias de Yaser Abu-Mostafa en http://work.caltech.edu/telecour…

El método más simple es volver a calcular el árbol de probabilidad dadas las cualidades conocidas del objeto y si era o no una copa. No importa si el robot “sabe” que estaba mal, lo único que importa es que este error informe mejor su comportamiento futuro. Supongo que podría tener un par de líneas de código más que le dicen que estaba “equivocado” y que “if (incorrecto == verdadero) {feel (vergüenza)}. Esto, por supuesto, supone que creó una función llamada” feel “y Tu robot puede sentir emociones.

More Interesting

¿Qué te emociona del futuro del aprendizaje automático?

Si alguien sin experiencia en programación quisiera aprender algoritmos y aprendizaje automático, ¿cuáles serían las mejores fases de estudio e investigación? ¿Sería mejor comenzar con el aprendizaje de la codificación? ¿Con qué idioma es mejor comenzar?

¿Cómo es ser aconsejado por Sunita Sarawagi?

¿Cómo genera fastText un vector para una palabra que no está en el modelo pre-entrenado?

¿Puedo usar la agrupación (k-means, etc.) en un gran conjunto de datos para automatizar el proceso de búsqueda de similitudes y hacer recomendaciones?

En R, ¿qué significa elegir lambda por validación cruzada (cresta, lazo)?

¿Qué es mejor, el algoritmo de vecinos más cercanos a k (k-NN) o el clasificador de máquina de vectores de soporte (SVM)? ¿Qué algoritmo se usa principalmente en la práctica? ¿Qué algoritmo garantiza una detección confiable en situaciones impredecibles?

¿Podrían las entradas del algoritmo de entrenamiento Perceptron tener diferentes tipos?

Andrew Ng: ¿Cuáles son los requisitos previos para iniciar el aprendizaje automático?

¿Qué lenguaje es mejor para hacer big data y machine learning (en términos de rendimiento) Java o Python?

¿Por qué los tamaños de mini lotes grandes afectan negativamente la precisión de la validación?

RNN para modelado de idiomas en Tensorflow. ¿Cómo puedo rellenar las secuencias si mi entrada está constituida por la incorporación de palabras?

Cómo estudiar el aprendizaje automático mientras se construye una cartera

¿Qué se sabe sobre la eficiencia de la agrupación espectral en caso de que los datos no estén completamente conectados?

¿Cómo podemos estimar múltiples parámetros de un clasificador?