¿Dónde estará (o podría) estar el Aprendizaje Profundo si la Ley de Moore continúa por otros 10-20 años?

La ley de Moore está muerta. Ya ha comenzado a estabilizarse, y continuará haciéndolo hasta un fuerte avance tecnológico en computación general , que no será la computación cuántica. … aunque, dicho eso, la computación cuántica en realidad puede ser muy relevante para el aprendizaje profundo.

El poder de procesamiento no es realmente muy importante para el aprendizaje profundo, según tengo entendido. Las cosas que son importantes para el aprendizaje profundo son el recuerdo de la memoria y la densidad de la red. Se trata más de “cuántos pensamientos puedo tener simultáneamente sobre cuántas cosas y de qué manera productiva puedo seleccionar el pensamiento correcto” y menos sobre “qué tan rápido puedo pensar un pensamiento dado”.

Esperaría que los estados cuánticos tengan un gran impacto en esto, ya que permite que los bits individuales almacenen mucha más información.

Sin embargo, el gran motor será la eficiencia. Pregúntele a un científico sobre la computadora que venció a los humanos en peligro, y él responderá: “Hizo trampa”.

¿Por qué?

Porque esa computadora quemó mucha más energía que las personas con las que compitió. Fue enormemente ineficiente. Potenciar a ese monstruo es mucho más costoso que contratar a buenos jugadores de Jeopardy en masa.

Los procesadores en este momento no son eficientes. Las computadoras pueden pensar más rápido que los humanos, pero queman enormes cantidades de electricidad para hacerlo (esto no cambiará con la computación cuántica, para que funcionen en este momento debe mantener las partes ‘pensantes’ de la computadora completamente protegidas y tan cerca a 0 grados Kelvin como puedas manejar, lo cual es extremadamente difícil de hacer). Cuando las computadoras comienzan a quemar menos energía, también generarán menos calor, lo que permitirá que más de ellas funcionen más juntas durante períodos de tiempo más largos.

Lo cual, espero, generará una nueva y diferente “Ley de Moore 2.0”: la cantidad de procesadores que pueden funcionar simultáneamente con electricidad X en el espacio Y se duplicará cada año.

Gran parte del éxito de ML proviene de la capacitación en sistemas distribuidos masivamente con grandes cantidades de datos. Una gran preocupación (sobre la computación en la nube en general) es el consumo de energía; Probablemente sepa que AlphaGo consume mucho más para alcanzar su competencia que su oponente.

Por lo tanto, diría que una continuación de la Ley de Moore (que se suspendió recientemente) no necesariamente conduciría a un mejor IM, pero conduciría a un IM menos costoso, ya que la densidad de integración está altamente relacionada con el consumo de energía. Podría estar al alcance de su mano, es decir, ejecutarse en su teléfono, en su dispositivo, en pequeños sensores, aprender de datos que son tan privados que nunca compartiría con un proveedor de la nube y / o que se distribuyen en múltiples proveedores, donde no Uno tiene la imagen completa. Podría convertirse en tu MI verdaderamente personal.

More Interesting

¿Me puede recomendar algunos buenos libros, blogs, artículos y documentos dedicados a conjuntos de modelos y especialmente apilamiento de modelos, también conocidos como conjuntos de modelos híbridos?

¿Por qué Quora eligió a HackerRank como plataforma para organizar sus competiciones de ML en lugar de algún sitio más familiar como Kaggle?

Además de experimentar emoción, ¿qué cosas puede hacer un niño humano que una computadora no puede hacer?

¿Qué piensa Andrew Ng sobre Deep Learning?

Si quiero desarrollar una carrera en aprendizaje automático e inteligencia artificial, ¿debería comenzar con chatbots?

¿Cómo tratan SVM y ANN los valores atípicos?

Cómo hacer una clasificación en tiempo real con CNN

¿Qué significa el término de procesamiento del lenguaje natural 'modelo de lenguaje' en términos simples?

¿Cómo puedo comparar diferentes arquitecturas de redes neuronales sin entrenarlas durante semanas? ¿Hay alguna forma práctica de verificar si las redes merecen la capacitación completa o no?

En forma de estudios de caso, ¿cómo utilizan las empresas financieras el aprendizaje automático?

¿Cómo se conecta la regresión lineal a los filtros de Kalman?

¿Cuáles son las mejores prácticas para elegir el tamaño de estado oculto en RNN?

¿Es posible una batalla de humanos contra máquinas en el futuro previsible?

Visión por computadora: ¿cómo es la detección de objetos usando los puntos clave SIFT escala / rotacionalmente invariante?

¿Podemos aplicar el aprendizaje automático a los problemas de NP Complete?