Cómo traducir datos binarios al formato de ADN

Binary usa un conjunto de dos valores, cero y uno, y sigue las reglas algebraicas exploradas por George Boole (1815-64).

El ADN codifica la información genética con “codones” que especifican una secuencia de aminoácidos necesaria para construir una proteína particular. Cada codón consta de tres “pares de bases”, cada uno de los cuales es una purina (adenina o guanina) unida por hidrógeno a una pirimidina (timina o citosina, respectivamente). Como hay cuatro combinaciones posibles para cada par de bases (AT, TA, GC, CG), esto proporciona 64 posibles diferentes para cada codón; sin embargo, muchos de estos son redundantes, y cada codón selecciona entre solo unos veinte aminoácidos diferentes. Además, algunas de estas combinaciones actúan como señales de “inicio” y “detención” (para activar y desactivar la expresión génica) y gran parte del ADN no se utiliza y se considera sin sentido y vestigial.

Cada codón de ADN codifica una de las 64 combinaciones posibles, por lo que podría representarse con seis bits binarios.

Es muy fácil traducir datos de ADN en una cadena de bits binarios (utilizando cualquier formato y esquema de representación que desee emplear), y viceversa. Más allá de eso, no estoy seguro de lo que significa “traducir datos binarios al formato de ADN”.

Esto ya está hecho. Vea Hacer realidad el almacenamiento de datos de ADN

La parte difícil no es el almacenamiento binario, sino una opción de formato y códigos de corrección de errores para hacer posible la recuperación de los datos a través de la secuenciación de ADN.