En épocas anteriores había más variedad en la longitud de las palabras de máquina.
Independientemente de la longitud, era necesario trabajar con texto, almacenando múltiples caracteres por palabra.
Hubo diferentes representaciones para los caracteres de texto. Algunos mainframes usaban 6 bits, por lo que un carácter era mayúscula A..Z o uno de un rango patentado de caracteres de puntuación. Eso estaba bien cuando la gente usaba impresoras de línea rápida para generar tablas monoespaciadas e informes de datos financieros o matemáticos, pero no era bueno para la poesía (aunque he visto la producción de poesía en tales impresoras).
A medida que el procesamiento de texto se hizo más importante, 8 bits se consideraron más apropiados, ya que felizmente contenía ASCII de EE. UU. (Caracteres imprimibles con códigos decimales 32..126) más un grupo de caracteres de control (códigos decimales 0..31 y 127). En cuanto al octavo bit, a menudo se usaba como un bit de paridad cuando se comunicaba con el equipo, y una gran cantidad de hardware de comunicación, por lo tanto, solo podía comunicar datos en unidades de 7 bits como máximo. En ese momento, la informática se consideraba prácticamente un mundo inglés, con otros idiomas que tenían que abandonar el uso de los acentos, buscar ortografías alternativas o tener sus propios conjuntos de caracteres personalizados (por ejemplo, cirílico, fonético japonés, etc.).
Pero la PC de IBM (y otras máquinas antes de eso) comenzó a usar los 128 códigos superiores, es decir, 128..255, para caracteres especiales útiles para dibujar gráficos de barras y jugar juegos, así como para admitir algunos caracteres acentuados para idiomas importantes además del inglés. En ese momento, los canales de comunicación podían manejar datos de 8 bits, de una forma u otra. La elección de los caracteres para los códigos 128..255 variaba según el país en el que se vendía el hardware de la pantalla, y cada variante diferente se conocía como una página de códigos, de la cual hay muchas, y la traducción entre ellas era una molestia, aliviaba poco por el desarrollo de Unicode.
El conjunto de caracteres ISO 8859.1 (que incorpora ASCII de EE. UU. Y una especie de página de códigos popular de consenso llamada Latin1) se incorpora como códigos 0..255 en Unicode, con los códigos restantes 256..65535 restantes para el soporte de otros idiomas y símbolos, etc. que la mayor parte están ocupados con chino y otros idiomas con símbolos ideográficos). Entonces, Unicode requería 16 bits, que podían mantenerse en un par de bytes de 8 bits. (Más tarde, sin embargo, Unicode se extendió a 11 veces el tamaño original, con códigos especiales utilizados para indicar cuándo un carácter está más allá del rango 0..65535).
Durante mucho tiempo, Windows ha admitido Unicode de 16 bits. No estoy seguro acerca de la extensión. En cuanto a la codificación de texto Unicode, el espacio se ahorra utilizando 8 bits por carácter ASCII de EE. UU., Si se utiliza la codificación UTF-8, en la que los códigos más allá de 127 están representados por grupos de bytes. (Obviamente, esto funciona mejor en el mundo de habla inglesa y en Europa occidental. Y si te apegas al mundo de ASCII de EE. UU., No hay que codificarlo).
El procesamiento de texto es una actividad muy fundamental en las computadoras de hoy en día, por lo que el soporte para cantidades de 8 bits y 16 bits (y 32 bits para manejar la extensión de Unicode) es esencial, y también sirve para cantidades numéricas, por supuesto, donde hay efectivamente una elección de precisión. Más recientemente, con el cambio a CPU de 64 bits, las cantidades admitidas también incluyen palabras de 64 bits, lo que es ideal para las matemáticas de punto flotante, porque hay un estándar IEEE para la representación de punto flotante de 64 bits, que tienen Intel y AMD usado por décadas.
Mientras que un BYTE en los primeros días no era necesariamente de 8 bits, se supone universalmente que es de 8 bits en estos días, y se conoce de manera más inequívoca como OCTET, que es lo que se conocía en francés, dado que los franceses tienden a querer Palabras francesas correspondientes a las inglesas importantes (p. Ej. Le pâté de boeuf).
El término PALABRA también ha tenido diferentes significados dependiendo de las arquitecturas. Durante mucho tiempo podría ser cualquiera que fuera la longitud de palabra de la máquina, luego en el mundo de la PC fue durante mucho tiempo 16 bits, pero los desarrolladores de software han aprendido a su costo que son imprecisos o hacen suposiciones sobre las longitudes de bytes y palabras puede conducir a un desastre futuro al tratar de portar software a nuevas arquitecturas (incluso de X86 a X64), por lo que los lenguajes de programación modernos que permiten el control a dichos niveles tienden a proporcionar nombres de tipos definidos sin ambigüedad, o los estándares de codificación requieren el uso de nombres simbólicos como como UINT64 o INT32 o UINT8 (es decir, un byte sin signo adecuado para ASCII de EE. UU., etc.) que son intencionalmente explícitos.
Entonces, si sugiere que un byte hoy podría ser algo más que 8 bits, tardaría aproximadamente medio siglo demasiado tarde.