¿Qué hace que los chips basados ​​en ARM sean relativamente eficientes en cuanto al consumo de energía y cuál es la compensación para el consumo de energía?

Hay cuatro características de diseño que brindan a los procesadores ARM la mayor parte de su rendimiento por vatio sobre los procesadores x86: son más lentos, más pequeños, pasan más tiempo durmiendo y no tienen un montón de legacy cruft para soportar (alrededor de 1970). La conclusión es que hay menos hardware para generar calor, pero los binarios son más grandes.

  1. Son más lentos: dado que la operación de baja potencia suele ser más importante que el rendimiento bruto, se pueden usar transistores de baja velocidad, que ofrecen una fuga de corriente mejorada y un voltaje mínimo más bajo. El resultado es una parte significativamente de menor potencia, a pesar de usar tecnología de fabricación que va a la zaga del x86 moderno en una generación o dos.
  2. Son más pequeños: se usan menos transistores, en parte porque ARM es una arquitectura de Computación de conjunto de instrucciones reducidas (RISC). Esto significa que las operaciones grandes se procesan en fragmentos pequeños y simples, a expensas de más código de máquina (esto no dificulta la vida de los programadores, a menos que no usen un compilador). Esto significa que ARM tiene menos piezas de un solo uso que absorben energía mientras no se usan, y son más pequeñas / menos costosas.
  3. Pueden ir a dormir: algunos procesadores ARM modernos tienen un diseño central sin reloj; el procesador ahorra energía al detener el núcleo hasta que recibe instrucciones para hacer algo (interrupción, desde el exterior). X86, actualmente, solo es compatible con la reducción de la frecuencia del núcleo para operar a un voltaje más bajo, y apaga las partes periféricas del procesador.
  4. Legado mínimo: el conjunto de instrucciones es simple, versátil, mínimamente esotérico y probablemente seguirá siendo así; La extensión del conjunto de instrucciones se realiza a través de coprocesadores que interactúan con la misma memoria.

Para ser justos, los diseñadores de x86 se han dado cuenta de enormes ganancias de eficiencia en los últimos 10 años al impulsar el desarrollo de nuevas técnicas para fabricar transistores de baja potencia y al adoptar un diseño de núcleo tipo RISC. Los procesadores x86 modernos son esencialmente un núcleo RISC en un contenedor de CISC (Complex Instruction Set Computing). El consumo de energía para las generaciones futuras de procesadores x86 y ARM comenzará a diferir cada vez menos; El soporte heredado x86 requiere muy poco espacio en este momento; A medida que se empuja ARM para competir directamente con x86, los niveles de voltaje / potencia pueden migrar para aumentar el rendimiento del transistor.

En algún momento, obtener un mayor rendimiento de un chip es una especie de rendimiento decreciente. Digamos que tiene un chip que tiene 1 × 1 unidades de tamaño. Para duplicar el rendimiento del chip a través del truco ‘gate’ (formas más inteligentes de dividir y conquistar el trabajo que ocurre durante un ciclo), una regla general súper aproximada es que necesita un chip de tamaño de unidad 2 × 2. Es decir, tienes 2 veces el rendimiento de 4 veces el tamaño del dado.

La Ley de Moore ha mantenido eso bajo control, porque casualmente los tamaños de las características también caen 2 veces cada 18 meses (a un primer orden).

Pero este director también va en la otra dirección. Ahora toma ese dado de 2 × 2 y divídelo en 4 dados de 1 × 1. Recordemos que cada dado tiene .5 veces el rendimiento. Entonces, obtienes una ganancia neta de 4 * 0.5x = 2x de tener 4 núcleos ‘lentos’ versus 1 núcleo ‘rápido’ en el mismo tamaño de dado. Tienes la idea. Es por eso que cosas como GPU (toneladas de núcleos súper simples) y chips de alto conteo de núcleos han sido interesantes.

Estoy seguro de por qué ARM en su segmento es tan exitoso. Si bien ahora hay algunos núcleos ARM fuera de servicio, ciertamente son más de la variedad ‘núcleo simple’. La pregunta para Intel es, entonces, ¿pueden hacer un convincente chip x86 ‘simple’ para competir? Atom parece ser un intento.

Y, de hecho, estoy seguro de que Intel podría hacerlo. El problema es que el chip resultante más simple que compite con ARM podría no ser muy diferente a un chip ARM. Solo hay muchas maneras de ser inteligente con las operaciones matemáticas, y la velocidad de la electricidad no cambia. Un chip básico se parece mucho a otro.

Hacer coincidir ARM, al menos en este punto, no es suficiente. Hay demasiado impulso en ARM. Tienen que tener diferenciadores. En ese sentido, pueden pensar que es más seguro quedarse en una zona donde no son tan eficientes en términos de energía, pero tienen un rendimiento superior, y eso parece ser exactamente lo que están haciendo ahora.

La arquitectura del procesador ARM identificó correctamente su aplicación final y construyó inteligentemente sus categorías. Por ejemplo, la serie A consume energía [para teléfonos inteligentes] mientras que M / R [pequeña / profundamente incrustada] está muy optimizada.