You are here

Un artículo científico con revisión paritaria estudia el «lenguaje de programación» del ribosoma

Casey Luskin, Licenciado en Derecho y Graduado en Ciencias (BS y MS)

Un nuevo artículo científico adopta el método del diseño inteligente para la medición de información funcional en sistemas biológicos.

Titulado «Dichotomy in the definition of prescriptive information suggests both prescribed data and prescribed algorithms: biosemiotics applications in genomic systems [Una dicotomía en la definición de la información prescriptiva sugiere a la vez datos prescritos y algoritmos prescritos: aplicaciones de la biosemiótica en sistemas genómicos]»: el artículo aparece en la revista Theoretical Biology and Medical Modelling.

El concepto de «Información de Shannon» no distingue entre información funcional e información no funcional y, por dicha razón, no es siempre útil como criterio de información biológica. Como resultado, muchos teóricos del diseño inteligente (D.I.) han sugerido el desarrollo de métodos para medir la información biológica que tengan en cuenta la función de la secuencia. Los teóricos del D.I. emplean una variedad de términos para medir la información biológica funcional — información compleja y especificada (ICE), información prescriptiva (IP), o Complejidad de Secuencia Funcional (CSF). El artículo dice:

La información biológica manifiesta con frecuencia su «significado» mediante instrucciones o una producción efectiva de una biofunción formal. Esta información se conoce como Información Prescriptiva (IP). Los programas de IP organizan y ejecutan un conjunto prescrito de decisiones. Un examen más estrecho de este término en los sistemas celulares ha llevado a una dicotomía en su definición, que sugiere tanto los datos prescritos como los algoritmos prescritos son constituyentes de la IP. Este artículo contempla esta dicotomía como expresada tanto en el código genético como en el dogma central de la síntesis de proteínas. Se procede a modelar un ejemplo de un algoritmo según el ribosoma, y se usa un examen del proceso de síntesis de proteínas para diferenciar los datos de la IP respecto de los algoritmos de la IP.1

Pero los proponentes del D.I. no son los únicos en reconocer la necesidad de medir la información biológica en términos de su función. En 2003, el premio Nobel e investigador sobre el origen de la vida Jack Szostak escribió un artículo de reseña en Nature lamentando que el problema con «la teoría clásica de la información» es que «no considera el significado de un mensaje» y en lugar de ello define la información «como simplemente aquello necesario para especificar, almacenar o transmitir la cadena». Según Szostak, «se precisa de una nueva medida de la información —información funcional» para poder tener en cuenta la capacidad de una determinada secuencia proteínica para realizar una determinada función.

En 2007 Szostak fue coautor de un artículo en Proceedings of the National Academy of Sciences, con Robert Hazen y otros científicos, potenciando estos argumentos. En una crítica a aquellos que insisten en medir la complejidad biológica usando las desfasadas herramientas de la información de Shannon, los autores escribían:

«Una métrica compleja sirve de poco a no ser que su marco conceptual y su capacidad predictiva resulten en una comprensión más profunda del comportamiento de los sistemas complejos». Así, ellos «proponen medir la complejidad de un sistema en términos de información funcional, la información necesaria para codificar una función específica».

Ejemplo de algoritmo expresado en un diagrama de flujo, para calcular la raíz cuadrada de un número x. Este y cualquier otro algoritmo pueden ser codificados con todo tipo de lenguajes, incluyendo el binario y el genético, y sus instrucciones traducidas por el entorno para ser ejecutadas y conseguir los resultados buscados.

Este nuevo artículo en Theoretical Biology and Medical Modelling sugiere que se adopte una forma muy semejante de abordar la cuestión, examinar de manera específica cómo el ribosoma maneja la información. Según el artículo:

Desde nuestro punto de vista el ribosoma es una máquina que ejecuta una secuencia de instrucciones específicas operando en base a un conjunto de paquetes de codones específicos arbitrarios (datos IP) que producen un producto proteínico como resultado. La máquina puede producir cualquier variación de productos proteínicos simplemente cambiando la sintaxis tanto del ARNt (mapa anticodones/aminoácidos) como de los codones ADN.

Los autores argumentan que el ribosoma usa un «algoritmo» para crear proteínas:

Un análisis operativo del ribosoma ha revelado que esta máquina molecular con todos sus componentes sigue un orden de operaciones para producir un producto proteínico. Este orden de operaciones ha sido detallado en un proceso paso a paso que se ha observado que es autoejecutable. Se ha propuesto que la operación del ribosoma es algorítmica (Ralgoritmo) porque se ha demostrado que contiene un flujo de proceso por pasos que permite un control de decisiones, ramificaciones iterativas, control de ramas y condicional. Todas lastas características cumplen como mínimo la definición de un algoritmo, y cuando se combinan con los datos procedentes del ARNm satisfacen la regla de que Algoritmo = datos + control. Recordando que las meras restricciones no pueden servir como controles formales auténticos, concluimos por ello que el ribosoma es una instanciación física de un algoritmo.

Este algoritmo se aplica mediante un «programa de lenguaje»:

Hay una sinergía entre la maquinaria del ribosoma y su coherencia con el contexto de lenguaje del entorno del ADN/ARN, lo que refuerza las operaciones algorítmicas prescritas del ribosoma. No hay ninguna causa fisicodinámica conocida para el esquema de traducción de codón a ARNt. Por cuanto todos los genes se pueden modelar usando reglas (sean gramaticales o lógicas) en lugar de un determinismo fisicodinámico, afirmamos inductivamente que la operación y la organización del genoma operan bajo la influencia de un lenguaje de programación. El genoma se puede considerar como un conjunto colectivo de instrucciones y datos. Porciones de las secuencias de ADN son instanciaciones algorítmicas. Esto queda patente, por ejemplo, en las regiones de preiniciación, potenciadoras y promotoras, lincRNAs, siRNAs y una multitud de otras secuencias instruccionales, que colectivamente instruyen la funcionalidad directa como la regulación génica. Además de los constructos de instrucciones, el genoma está también compuesto de datos en forma de codones. Esto resulta en unos ARNm que son manejados como datos por otros procesadores (ribosomas) que están ejecutando sus propios algoritmos. En otras palabras, hay «múltiples lenguajes de programación» en la célula.

¿Y qué es lo que, en nuestra experiencia, genera los lenguajes de programación?

Referencias : 
  1. (David J. D'Onofrio, David L. Abel y Donald E. Johnson, «Dichotomy in the definition of prescriptive information suggests both prescribed data and prescribed algorithms: biosemiotics applications in genomic systems»,Theoretical Biology and Medical Modelling, Vol. 9:8 [2012].)
Publicación Original: 
Agradecimientos: 

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer