Si hoy existiera una computadora cuántica, ¿qué pasaría con la IA / aprendizaje automático / aprendizaje profundo? ¿En qué se traduciría esto para las empresas / industrias?

Las computadoras cuánticas existen hoy en día.

Sin embargo, en realidad, la mayoría de las IA se quedan sin GPU (unidades de procesamiento gráfico), que son CPU altamente especializadas diseñadas para ejecutar cálculos específicos de la mayoría de los cálculos gráficos. Como resultado, esos sistemas también son muy efectivos en el procesamiento de los tipos de algoritmos que necesitan las IA.

Lo que realmente cambia el juego de IA son los ASIC (circuitos integrados de aplicación específica) y los FPGA (matrices de puertas programables de campo). Todas estas cosas están disponibles ahora, pero son increíblemente caras. El cambio más grande ahora es que AWS en realidad acaba de anunciar FPGA para la gente común, presentando una nueva clase de instancia que se puede utilizar para ejecutar cálculos masivos en la nube a través de FPGA. Esto significa que se podría crear un FPGA muy específico específicamente para ejecutar una IA, lo que podría aumentar enormemente la productividad.

En este momento, un gran problema con la IA es que devolver la respuesta “correcta” a menudo lleva mucho tiempo para calcular. Tomemos, por ejemplo, el juego de ajedrez. Calcular cada movimiento posible que podría hacer la computadora, y luego cada movimiento posible que el humano podría hacer a continuación, y así hasta que se juegue el juego, es un problema casi infinito e irresoluble. El tiempo que tomaría calcular el primer movimiento sería tan grande que uno pensaría que estaba roto. En cambio, la IA hace una “mejor suposición” de qué movimiento conduciría al resultado más deseable. Con FPGA, o incluso QC en masa, podríamos calcular cálculos mucho más complejos en fracciones de tiempo, lo que permite un cálculo mucho más preciso.

Aún así, eso solo resuelve el problema de la velocidad. Si podemos llegar más rápido a la respuesta, pero es la respuesta incorrecta, hacer que regrese más rápido no lo hace correcto. Todavía tenemos que hacer que más tareas de inteligencia artificial estén mejor disponibles para desarrolladores comunes, y encontrar mejores soluciones para Machine Learning y luego “construir su propio sistema muy complejo”. AWS está trabajando mucho en eso con Machine Learning, Lex (lo que impulsa a Alexa) e Image Rekognition.

El hardware más rápido no es el problema en este momento, nuestros sistemas son lo suficientemente rápidos. En este momento tenemos un problema de software de no poder encontrar un algoritmo que imite el pensamiento humano.

More Interesting

Desde un punto de vista práctico, ¿por qué es tan importante saber programar en Machine Learning?

En la curva ROC, cualquier punto es resultado del modelo en un parámetro particular. No estoy claro por qué el adivinador aleatorio está en x = y y no siempre (0.5, 0.5). ¿También cómo interpretar el área bajo la curva?

¿Cuál es la diferencia entre los diferentes tipos de funciones de activación para redes neuronales y por qué es importante elegir una sobre otra?

¿Qué métodos de conjunto / aprendizaje automático pueden incorporar covariables que varían con el tiempo?

¿Cómo se usan los árboles BSP (partición de espacio binario) en los algoritmos de aprendizaje automático?

¿Son las redes neuronales artificiales la única forma de establecer un aprendizaje profundo?

¿Cuáles son los requisitos previos para aprender Machine Learning?

¿Es legal el raspado web para hacer aprendizaje automático?

¿Es posible asegurar trabajos solo en base a la experiencia en aprendizaje automático sin ser un ingeniero de software adecuado?

¿Las máquinas y los bots respetan la confidencialidad?

¿Cuál es el punto de ejecutar un modelo de regresión logística antes de un árbol de decisión?

¿Cuál es la diferencia entre una curva ROC y una curva de recuperación de precisión? ¿Cuándo debo usar cada uno?

¿Cuándo las funciones coercitivas tienen un minimizador?

¿Cómo es el curso de aprendizaje automático NPTEL?

¿Qué herramientas estadísticas se necesitan para la extracción de características y el reconocimiento de patrones en el procesamiento de imágenes?