¿Cuántos bytes de información hay en una cadena de ADN?

Eso depende de la cadena de ADN.

El ADN es un polímero compuesto de 4 bases de nucleótidos, por lo que cada nucleótido representa un máximo de 2 bits de información. El único límite físico para la longitud de una cadena de ADN es la disponibilidad de nucleótidos para extenderlo, aunque hay algunos límites físicos establecidos por el tamaño de la célula (si los cromosomas son demasiado largos, puede arruinar la división celular). En los humanos, la cadena de ADN más larga es el cromosoma 1, y eso es aproximadamente 247 millones de bases de largo. En el extremo más corto, la cadena de ADN más corta es un dímero (dos bases).

Entonces, hay una cantidad máxima posible de información de 2 bits por base. Para un dímero, serían 4 bits, y para el cromosoma humano 1, serían 494499438 bits.

Sin embargo, cuando hablamos de información, no estamos hablando del número de bits utilizados para representar la secuencia, sino del número promedio de bits necesarios para reproducir la secuencia. Por ejemplo, si quisiera representar una secuencia que tenía 4 mil millones de bases de timina, necesitaría 32 bits para representar 4 mil millones, más 2 bits para representar la T. Una secuencia sin variación tiene muy poca información. Es la entropía de la secuencia que describe la cantidad de información que contiene; También es la entropía que define el límite al cual los datos pueden ser comprimidos sin pérdidas por un algoritmo.

Por suerte, la entropía del ADN en el cromosoma 1 humano no es de 2 bits por base, sino de 1.7722 bits por base. Entonces, hay aproximadamente 218 millones de bits de información en el cromosoma 1 humano.

Los 2.900 millones de pares de bases del genoma humano haploide corresponden a un máximo de aproximadamente 725 megabytes de datos, ya que cada par de bases puede codificarse por 2 bits. Dado que los genomas individuales varían en menos del 1% entre sí, pueden comprimirse sin pérdidas hasta aproximadamente 4 megabytes.

Genoma humano