¿Qué usos novedosos hay para el aprendizaje de refuerzo profundo?

Aunque a menudo no es la mejor idea comenzar con una solución y encontrar un problema, aquí hay un proceso generalizable para hacerlo:

  1. Enumere las fortalezas de su solución
  2. Enumere los requisitos de su solución.
  3. Encuentre aplicaciones que aprovechen las fortalezas y proporcionen los requisitos
  4. Priorizar esas aplicaciones

Fortalezas (estas son algunas, siéntase libre de sugerir cosas que no he pensado):

  • No requiere un conjunto de datos bien estructurado
  • En efecto, la reducción de dimensionalidad automatizada, por lo que puede trabajar en sistemas con muchas acciones para elegir
  • El aprendizaje de refuerzo profundo es bueno en sistemas no lineales
  • Se puede adaptar a los sistemas cambiantes, incluso si cambian de manera compleja o imprevista
  • Puede operar en entradas y salidas del mundo real o puede operar desde un modelo (más rápido pero requiere un modelo preciso)

Requisitos (nuevamente, siéntase libre de hacer sugerencias)

  • Suficientes acciones posibles para hacer un enfoque de aprendizaje profundo óptimo
  • Un retraso lo suficientemente corto entre la acción y la evaluación para recolectar suficientes muestras para alimentar un modelo de aprendizaje profundo
  • Requiere comentarios para las acciones
  • Las fallas son necesarias, por lo que debe capacitarse en un modelo muy preciso o en un sistema del mundo real donde las fallas no sean costosas

Busquemos sistemas caóticos con alta, si no infinita, complejidad, donde hay innumerables medios de interacción, donde hay mucho que ganar pero poco que perder, que cambian con el tiempo y que responden extremadamente rápido o pueden reaccionar a muchas diferentes acciones a la vez (escalables horizontalmente).

Evitemos también los sistemas de control convencionales (mecánicos, eléctricos o de otro tipo) ya que no son realmente “novedosos” en este momento.

Las cosas que implican manipular o planificar el comportamiento humano parecen una buena combinación. Puede probar acciones en muchas personas en paralelo para obtener respuestas cuantificables. Ventas y servicio al cliente y satisfacción, gestión de multitudes y tráfico, precios y promociones, comercio de alta frecuencia, cocina (por ejemplo, recetas), entretenimiento (por ejemplo, creación o edición de medios sintéticos), diseño de productos o arquitectura con representaciones 3D precisas, enfoques educativos y Las tácticas deportivas competitivas vienen a la mente.

Ha habido trabajo en algunas de esas áreas (enfoques educativos y comercio seguro). La aplicación de la ley, la respuesta de emergencia, las tácticas militares y la medicina también podrían funcionar, pero son bastante sensibles a las fallas.

Otros sistemas naturales complejos se pueden encontrar en farmacología, agricultura, ciencia de materiales. Tal vez hay ideas en esos reinos también.

No me inspira nada que pueda modelarse con precisión, porque es demasiado fácil construir una solución no novedosa que produzca resultados perfectamente buenos dada la potencia de cálculo suficiente. Si estás buscando algo realmente único y valioso, influir en el caos del mundo real me parece muy prometedor.

Hm.

Podrías hacer una entrevista de inteligencia artificial o una mímica de inteligencia artificial que responda al tono de positividad de la persona con la que percibe hablar, en términos de análisis al hablar con otros.

Podría ser engañado por la falta de sinceridad de la persona, pero luego se podría derivar en términos de contabilidad para el seguimiento y factorial extrapulado en términos de contabilidad de la pertenencia del conjunto en términos de acompañamiento designativo de la acción en un asunto reforzado positivo.

Similar a la idea de que nosotros, tomamos la perspectiva de eso, “La persona suena positiva sobre X cosa”

O nosotros, deducitivamente lo llevamos a eso

Y luego, verifique que se realice el seguimiento de la acción.

Modelo de interactividad modelado, al que podemos derivar extrapulación de patrones de comportamiento y exploratorio en términos de comportamiento humano.

Podría modelarse después de Roleplaying en términos de procesos de entrevistas y exposición de comportamiento de candidatos en términos de procesamiento.

Elimina la mayoría del diferencial de personas para quienes necesitamos un gradiente de juicio.

Fascinante, de verdad.

More Interesting

¿El éxito de un algoritmo particular causa una lentitud de progreso en el desarrollo de mejores algoritmos?

¿Cuál es una buena definición de Generalización wrt Deep Learning?

¿Cómo deberías comenzar una carrera en aprendizaje profundo?

¿Las redes neuronales convolucionales construyen simetrías locales o globales?

¿Es el enlace neuronal una tecnología que podría funcionar?

¿Existe alguna comparación entre las técnicas SLAM monoculares recientes, especialmente aquellas basadas en un aprendizaje profundo?

Si quiero comenzar con el aprendizaje profundo, ¿debería comprar una GPU de gama baja o aprovechar una solución en la nube? ¿Cuál es más barato / mejor?

¿Es el aprendizaje automático una mejor forma o técnica para comprender los datos y hacer pronósticos que las estadísticas?

Antes de elegir y aplicar incluso el modelo de aprendizaje automático lineal más simple, ¿qué aspectos estadísticos de los datos debo considerar?

¿Con qué facilidad pueden los actuarios cambiar a carreras relacionadas con TI como la ciencia de datos, el aprendizaje automático y el desarrollo de software?

Cómo obtener colores 'visualmente distinguibles' de las imágenes

¿Se puede utilizar el aprendizaje automático para generar mapas de forma orgánica con solo usar datos de satélite de Google?

¿Cuál es la mejor manera de crear un conjunto de capacitación para el aprendizaje automático?

¿Python es más lento que MATLAB para la ciencia de datos y el aprendizaje automático?

¿Cuáles son algunos problemas o preguntas de la vida real que el aprendizaje automático ha resuelto y que no se pueden resolver adecuadamente por otros medios?