Introducción a la Biología Computacional
Autor: Michael S. Waterman; publicado por Chapman & Hall, 1995. ISBN: 0-412-99391-0
Reseña por: Randolph Chung
Traducción al Español por: Jorge L. Valenzuela
La Biología y la Ciencia Computacional han sido dos campos distintos. Sin embargo, con los recientes y rápidos desarrollos en Biología Molecular especialmente los relacionados con secuencias de DNA, mapeo restringido y el estudio de estructuras proteicas los biólogos han recurrido a científicos de la computación en busca de métodos eficientes para analizar las vastas cantidades de datos de los cuales se va disponiendo. Un nuevo y exitante campo conocido como Biología Computacional se ha desarrollado subsequentemente.
El libro de Wareman, Introducción a la Biología Computacional, ofrece un tratamiento de las estructuras matemáticas de muchos de los problemas que los biólogos estan tratando de resolver. Después de delinear estas caracterizaciones matemáticas, Waterman presenta algunos algoritmos usados actualmente en el análisis de datos biológicos.
Para ejemplificar los problemas tratados en el libro, considere el inmenso esfuerzo que se esta poniendo en establecer las secuencias de genomas de las bacterias, viruses, levaduras, seres humanos y animales. (Por ejemplo, consulte el proyecto Genoma Humano [1] http://www.ornl.gov/techResources/Human_Genome/home.html y también el artículo que aparece en Crossroads 4.1, "Mapeo y Secuencia de Genomas Humanos" en http://www.acm.org/crossroads/xrds4-1/genome.html).
Un aspecto en el que los biólogos están interesados, es la similitud entre genomas de los organismos. Entre otras cosas, el grado de similitud da información sobre la relación de los organismos y sus ancestros. También permite deducir la función de un gen, basado en la similitud con otro gen cuya función se conoce.
Muchas aplicaciones comerciales pueden hacer este tipo de busqueda de homologías y comparaciones. De entre ellos, el sistema BLAST [2] es probablemente el mejor conocido. Waterman presenta un manejo matemático detallado de los problemas, seguido por un algoritmo programable para resolverlo. El tratamiento matemático permite organizar el problema de forma tal que es posible solucionarlo eficientemente.
Otra aplicación que es discutida en el texto es la secuencia escopeta [3]. Secuencia escopeta es un método para escribir la secuencia del DNA por donde algunas copias del genoma de un organismo primer es roto en pequeñas partes (ver figura). Cada parte es puesta en secuencia individualmente. El problema entonces se convierte en: ¿Cómo una parte se junta con los fragmentos secuenciados con el fin de dejar al descubierto toda la secuencia genoma?
ATCCTGGAGGTACCG TTGCCAAAAACCTGCCGGG AAGGTTAACCAT GAGGTACCGAAAGC GGTTTGCCAACGGGAATTGGCC GTTAAC TTATCCTGGAG AGCGGGGTT AAAACCTGCCGG GCCCGGAAGGTT CCATTC
FIGURA 1
Secuencia escopeta
Esto puede ser parafraseado como el problema de la subcadena mas corta (SSP por sus siglas en Inglés): Dada una colección C de cadenas sobre un alfabeto, ¿Cuál es la subcadena mas corta S, tal que cada cadena en C sea una subcadena de S?
SSP es conocido omo el problema NP-completo, lo cual significa que no existe un algoritmo eficiente (grado polinomial) para resolver el SSP. Después de mostrar este hecho, Waterman presenta una aproximación algorítmica, la cual, siempre encuentra una secuencia que, a lo mas, es el doble de larga que la cadena óptima en el grado polinomial. Estas aproximaciones algorítmicas son frecuentemente muy útiles en situaciones de la vida real donde el volumen de los datos a ser analizados, no permite el uso de algorítmos exponenciales.
Aunque su título, como texto de introducción, sea Introducción a la Biología Computacional, se asume que se poseen una razonable cantidad de conocimientos en estadística, cálculo, algoritmos y sus complejidades (exponentes). A pesar que el autor inicia con un capítulo introduccioón a la Biolgoía Molecular, conocimientos previos adicionales en esta área son útiles si se desea aprovechar al máximo este texto.
Recomiendo este libro a cualquiera interesado en aprender cómo las ciencias computacionales pueden aplicarse a la solución de importatnes problemas en el campo de la Biología Computacional.