| Artículos | 01 FEB 2003

Sistemas de software en bioinformática

Ángeles y Martín Grado-Caffaro.
La biología se ha convertido en una ciencia cuyo motor radica en el análisis de enormes volúmenes de datos y en la que la privacidad y la seguridad es esencial. Hoy, la aparición de tecnologías evolucionadas de adquisición de datos para investigar fenómenos biológicos, así como el desarrollo de nuevas técnicas para simplificar su catalogación y organización, están sentando las bases de la bioinformática.

El campo de acción de la bioinformática –punto de encuentro entre la biología y la informática– comprende diversas áreas, como la captura de datos biológicos y su almacenamiento, análisis y recuperación, así como la elaboración de modelos y simulación computacional y la integración de la información con significado biológico. Tampoco hay que olvidar el proceso de refinamiento de datos (mining) y el procesamiento de imágenes y visualización.
Extraídos a partir de la experimentación, la bioinformática trata multitud de datos en forma de tablas numéricas, imágenes y gráficos, así como datos en forma secuencial, recogidos en una gran variedad de bases de datos online. Pero cualquier conjunto significativo de datos experimentales, por su propia naturaleza, presenta errores, que pueden ser sistemáticos o aleatorios. Por ello, la obtención de datos que tengan sentido estadísticamente requiere un cuidadoso diseño experimental y la posibilidad de reproducción de los resultados. Además, como los experimentos son caros en términos de trabajo profesional, tiempo y equipamiento, los datos biológicos son siempre incompletos.
Por ejemplo, las investigaciones sobre el ADN, tan importante en el contexto de la biología molecular, suponen un reto de almacenamiento de información. De hecho, los algoritmos que pueden agrupar fragmentos de ADN para dar lugar a secuencias de genes están ayudando a los investigadores en la elaboración de las bases de datos de genomas completos. Así, el software de bioinformática se concibe como un software especializado que combina ingeniería de elevado nivel de prestaciones con una acusada sofisticación en materia de algoritmos para el tratamiento de cantidades de datos extremadamente grandes. Ello está relacionado con el hecho de que la arquitectura de informática distribuida facilita la compartición del contenido de las bases de datos entre muchos investigadores.

Algoritmos, modelización y técnicas de computación
Biología y ciencias de la computación comparten una afinidad que se puede calificar de natural. No obstante, la información de carácter biológico nunca se ha adaptado satisfactoriamente al análisis matemático clásico: la estructura organizativa de la vida no es ni completamente regular ni completamente caótica. Del mismo modo, los cálculos informáticos combinan algoritmos avanzados con cálculos rutinarios, lo que se aproxima razonablemente a la estructura organizativa de la vida.
En este marco de referencia cabe preguntarse hasta qué punto una estructura biológica se puede comportar como una máquina de computación. Examinando cómo los organismos resuelven problemas impuestos por el entorno, es posible la elaboración de nuevos esquemas de computación y de desarrollo de algoritmos. La codificación genética relacionada con el ADN, el genoma y otros temas asociados configuran la problemática de un posible ordenador biológico.
L. Adleman sugirió por primera vez la posibilidad de emplear el ADN para computación utilizando moléculas de ADN (mediante procesos cuya complejidad excede los objetivos de este artículo) para resolver el problema de encontrar un camino hamiltoniano en un grafo dirigido. Un camino de este tipo se define como una ruta que empieza en un vértice dado del grafo y pasa completamente por los demás vértices exactamente una sola vez antes de finalizar en un segundo vértice predeterminado del grafo. Los caminos hamiltonianos tienen especial importancia en teoría de grafos, ya que se utilizan en diferentes campos de la ciencia para resolver problemas de notable relevancia difíciles de abordar por métodos más convencionales.
No obstante, cabe adoptar una actitud escéptica respecto de la posible utilización práctica de ordenadores basados en ADN, a pesar de que la idea subyacente ha abierto nuevas vías de investigación en nanotecnología y modelos de computación. Entre sus inconvenientes, cabe mencionar el hecho de que, incluso para resolver problemas relativamente simples, hay que invertir varios días entre que se codifica el problema en cuestión y se lee la salida. La aparición de errores de computación inherentes al sistema y el hecho de que es necesaria una gran cantidad de ADN para resolver problemas prácticos complejos constituyen además claras desventajas frente a los sistemas convencionales de computación.
De todos modos, es necesario insistir en el hecho citado anteriormente de que el concepto subyacente a los computadores basadas en ADN ha dado lugar a una nueva y excitante línea de investigación en el campo dela nanotecnología y de los modelos de computación. Nada sorprendente, puesto que la nanotecnología trata de la manipulación de la materia a escala molecular. Se puede decir, por tanto, que la computación basada en ADN podría ser un punto de convergencia entre informática, biología molecular, física molecular, electrónica molecular y, quizás, computación cuántica.
El hecho de trabajar a escala molecular refuerza la idea de esta convergencia. En particular, la electrónica molecular presenta algunos aspectos afines a los sistemas de computación basados en ADN, dado que trata de los dispositivos electrónicos a escala molecular en lo que se refiere a moléculas orgánicas.
Es sabido que los modelos clásicos de computación más representativos son los de Von Neumann y Turing; concretamente, el modelo de Turing está basado en un cierto tipo de autómatas finitos. Cabría preguntarse si el concepto de computación con ADN conlleva un cierto tipo de autómata que esté relacionado con el de Turing. Otras cuestiones estarían relacionadas con la posibilidad de idear computadoras capaces de resolver problemas complejos de modo adaptativo. Esto constituye un campo del mayor interés en el tratamiento de algoritmos genéticos con respecto del comportamiento –y su evolución- de organismos reales frente a sus entornos.

Privacidad genética
Al igual que sucede con las huellas digitales, que se emplean con fines de identificación, el empleo del ADN puede servir también como medio de identificación personal, lo que conlleva toda la problemática asociada a la privacidad genética. Potencialmente, la utilización del ADN puede tener fines que atenten contra la libertad y privacidad de las personas. Y, como los datos genéticos se almacenan en bases de datos, es evidente que la bioinformática puede suponer una seria amenaza para la privacidad: la información genética contenida en los ordenadores se puede emplear con propósitos discriminatorios o de explotación comercial.
La limitación de la privacidad a la que podría dar lugar la información genética es aún mayor ahora con el desarrollo progresivo del software bioinformático, proclive, por naturaleza, a las técnicas de interca

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información