Historial de referencia de la CPU
Este gráfico dice que Pentium-100 sin mmx completa un trabajo en 15 segundos, mientras que Pentium-166 con mmx completa el mismo trabajo en menos de 7 segundos, lo que significa más del 100% de aceleración. También http://www.cpu-world.com/Compare… dice que el rendimiento multimedia es 8x con solo un 66% más de frecuencia central.
Las instrucciones AVX son una versión actualizada de SSE y SSE es el siguiente paso de MMX. MMX es un grupo de instrucciones del acelerador de transmisión de datos multimedia y comenzó con la serie MMX de Intel. Las instrucciones MMX pueden realizar dos operaciones de punto flotante de 32 bits con una sola instrucción. SSE puede hacer 4, AVX puede ejecutar 8 operaciones de FP de 32 bits en una sola instrucción.
- Estoy empezando a jugar en una PC. ¿Qué juegos sugerirías en Steam?
- No puedo establecer una conexión entre mis 2 PC con Cable (Win 10), no sé por qué no funciona, ¿qué puedo hacer?
- ¿Puedo SSH -X desde una computadora con Windows a una computadora con Linux?
- ¿Ha aumentado significativamente el rendimiento de la CPU en los últimos 6 años?
- ¿Puedo recibir un fax en mi PC si estoy usando un Samsung Express m267? Si no, ¿por qué?
Menos instrucciones por operación deja más ancho de banda para los datos que provienen del mismo chip de memoria donde se obtienen las instrucciones.
Hacer 8 operaciones con 1 instrucción vs 8 instrucciones tiene algunas ventajas:
- Más espacio en la tubería para seguir las instrucciones conduce a un mayor paralelismo de nivel de instrucción (que usa más área / transistores de CPU a la vez)
- Se logran más operaciones por segundo con solo usar el hardware SIMD
- El acceso a la memoria alineado implícitamente da un buen impulso al rendimiento de la transmisión de datos (como ver videos, calcular la física) ya que los controladores de memoria se usan de manera más eficiente.
- el almacenamiento en chip mucho más temporal también lo hace rápido
Hay demasiadas instrucciones para saber en esta categoría y para superar eso, los compiladores y algunas API convierten automáticamente los códigos de desarrollador a versiones AVX, lo que ahorra mucho tiempo de desarrollo y ofrece una optimización decente para programar antes de lanzarlo.
Por ejemplo, si usa OpenCL, genera automáticamente códigos AVX para la CPU, ya sea AMD o INTEL.
No sé el estado actual, pero en el pasado Windows solo podía usar la mitad de esos registros compatibles con AVX en la CPU, mientras que Linux los usaba todos, lo que es bueno para algunos códigos críticos de rendimiento.
El cálculo de a = b + c resultó en una ejecución 30 veces más rápida con AVX en comparación con el código que no es AVX para mi PC con FX8150. Esto ayuda más cuando el tipo de datos es más pequeño como un solo byte. La instrucción AVX simple puede procesar valores de 32 bytes que deben ser más que suficientes para codificar-decodificar video de 1080p a 30 fps, incluso con un solo núcleo de una CPU de 3–4 GHz.
Los dispositivos de cómputo de factor de forma pci-e de la serie xeon-phi de Intel pueden usar versiones de 512 bits de instrucciones AVX que pueden funcionar en 16 variables a la vez.