Fácil. Puede determinar la frecuencia del sitio en general multiplicando la frecuencia de las bases componentes. Esto le da la frecuencia del sitio de restricción. Una vez que conozca la frecuencia, puede multiplicar eso por el tamaño del genoma para obtener una estimación del número esperado de sitios allí.
Sitio de ejemplo: CAGGCCTG
Si las bases mismas están distribuidas uniformemente (el genoma consiste en cantidades iguales de A, T, G, C), entonces la frecuencia de un nucleótido dado en una posición dada será 1/4. Esto significa que la frecuencia general del sitio de restricción es 1/4 * 1/4 * 1/4 * 1/4 * 1/4 * 1/4 * 1/4 * 1/4, o [matemáticas] 1 / (4 ^ 8) [/ math] – uno cada 65,536 bases, o ~ 0.0000153 por base del genoma. Si el genoma es de mil millones de bases (1 gigabase), esperará encontrar ~ 0.0000153 * 1,000,000,000 = 15,300 instancias de ese sitio de restricción exacto en el genoma.
- ¿Cuál es la mejor manera de extraer datos de múltiples sitios web?
- Propiedad intelectual: ¿cómo se permite el funcionamiento de sitios web falsos como http://nikeairmax.com.au?
- Cómo hacer un sitio web antiguo
- Cómo hacer que mi sitio web sea más intermutual
- ¿Qué tipo de contenido en hindi le gusta leer a la mayoría de las personas en sitios web y blogs?
Tenga en cuenta que las frecuencias de nucleótidos casi nunca se distribuyen de manera uniforme, por lo que en su cálculo de frecuencia, ajustará sus números para reflejar la composición genómica medida. Pero si está haciendo esto sin un conocimiento previo de la composición de nucleótidos, asumir una distribución uniforme de las bases suele ser una estimación segura.