¿Cuáles son algunos algoritmos de alineación de secuencia?

En la alineación de secuencia, hay dos categorías amplias: alineación local, global y semi-global. Local está buscando la mejor coincidencia de subsecuencia, global la mejor coincidencia de ambas secuencias en su totalidad, y semi-global encuentra la mejor coincidencia sin penalizar los huecos en los extremos de la alineación.

Para la alineación global, siempre puede usar un algoritmo de fuerza bruta, aunque tendrá un tiempo de ejecución exponencial. En cambio, se recomienda la programación dinámica. DP se basa en una fórmula recurrente y requiere un problema para tener la ‘subestructura óptima’, que es donde puede construir la solución a un problema si tiene la solución a sus subproblemas. Volviendo a la alineación global, hay un algoritmo DP para la alineación global llamado ‘algoritmo Needleman-Wunsch’, que ahora tiene O (nm) complejidad de tiempo y espacio para dos secuencias de longitud ny m.

Para la alineación local, un método comúnmente utilizado es el algoritmo Smith-Waterman. Las implementaciones de los algoritmos Needleman-Wunsch y Smith-Waterman son casi idénticas.

Como nota, estos algoritmos también se pueden usar para la alineación de la secuencia de proteínas si usa una matriz de sustitución diferente (es decir, BLOSUM o PAM250 para proteínas).

ps: El problema de alineación global puede acelerarse para tener una complejidad de tiempo sub-cuadrática, O (n ^ 2 / logn), usando la ‘Aceleración de cuatro rusos’.

pps: El problema de alineación global se puede hacer en espacio lineal utilizando el algoritmo de Hirschberg. Esto es divertido de implementar y solo requiere pensar qué valores en una tabla DP son necesarios para el próximo cálculo.

Fuente: https://www.cs.duke.edu/courses/…

Algoritmos basados ​​en tablas de hash

  • EXPLOSIÓN
  • Elando
  • JABÓN
  • RMAP
  • SeqMap
  • MAQ
  • ENFOCAR
  • Camarón
  • RaserS

Algoritmos basados ​​en árboles de sufijo

– basado en árboles de sufijos:

  • Máscara
  • OASIS

– basado en árboles de sufijo mejorados:

  • Vmatch
  • Segemehl

– basado en el índice FM:

  • Corbata de moño
  • BWA
  • JABÓN2
  • BWT-SW
  • BWA-SW

Referencia: Li & Homer, Una encuesta de algoritmos de alineación de secuencias para la secuenciación de próxima generación , Brief Bioinform (2010) 11 (5): 473-483. http://bib.oxfordjournals.org/co

More Interesting

A partir de mayo de 2014, ¿qué tan madura es la investigación en aprendizaje profundo?

¿Es factible para mí ingresar al programa de maestría de Stanford CS (o cualquier escuela de las 10 mejores) sin investigación de CS en pregrado?

¿Por qué no enseñan la prueba de fizzbuzz en ciencias de la computación de pregrado?

¿Cuál es la diferencia entre 'datos', 'información' y 'evidencia' en la investigación científica?

Soy un estudiante de la universidad comunitaria, ¿cómo puedo ingresar a los programas de investigación de verano en un área de ciencias de la computación si no tengo experiencia en investigación?

¿Qué tipo de proyectos ganan el primer premio en los concursos de investigación científica de la escuela secundaria?

¿Las publicaciones de investigación realmente importan en las admisiones a la escuela de posgrado?

¿Qué es una metaclase?

¿Cuáles son algunos avances recientes en la teoría de juegos?

¿El campo de los sistemas informáticos ya está saturado?

¿A qué conferencias / talleres de informática vale la pena asistir y tomar conocimiento?

¿Qué temas en algoritmos debería un estudiante con el objetivo de especializarse en la teoría de la complejidad computacional maestra?

He oído afirmar que la financiación de la investigación en informática solo está disponible para la investigación aplicada ahora. ¿Es este el caso, y si no, hay ejemplos de áreas de investigación "pura" que se están financiando?

¿Cuál es la investigación más emocionante en informática en 2010? ¿Por qué es emocionante?

¿Los algoritmos tienen aplicaciones fuera de la informática?