Investigadores del Centro de Investigación Príncipe Felipe han diseñado un programa bioinformático llamado “Variant”, destinado a analizar las variantes que aparecen en la secuenciación de genomas. Concretamente, el programa analiza la parte del genoma que codifica proteínas e identifica las variables y mutaciones conocidas. A partir de dicha información, realiza un informe de estimación de las potenciales asociaciones de estas variantes a distintas patologías.
CIPF.-El programa bioinformático “Variant”, realizado por investigadores del Centro de Investigación Príncipe Felipe (CIPF), analiza la parte del genoma que codifica proteínas, el exoma, e identifica las variables y mutaciones conocidas, cruza la información y realiza un informe de estimación o predicción de las potenciales patologías asociadas.
El análisis del exoma es de gran importancia, ya que la mayor parte de los datos que se conocen en la actualidad sobre enfermedades humanas de origen genético está incluido en él.
Como apunta Joaquín Dopazo, director científico del CIPF, “este programa tiene capacidad para analizar de forma muy rápida las variantes, asesorar al investigador sobre las que son conocidas, y establecer una predicción sobre aquellas variantes asociadas potencialmente a distintas enfermedades".
Las particularidades del programa, descritas en la revista Nucleic Acid Research (NAR), son la rapidez y actualización de los resultados y el buen funcionamiento del mismo. El artículo revela que se trata de un programa de gran potencia y velocidad, que acorta de forma muy representativa los tiempos de procesamiento.
“La aplicación es capaz de procesar alrededor de 40.000 variantes, que es lo que se suele encontrar como promedio en un exoma humano, en menos de un minuto”, explica Dopazo. Otro de los aspectos que destaca el artículo es que se trata de un programa que combina las ventajas de los programas remotos (instalados en un ordenador remoto), y las de los programas locales.
Como expone Dopazo, “se trata de un programa que no necesita instalación ni ordenadores muy potentes, ya que físicamente reside en un ordenador potente situado en el CIPF; pero funciona como uno local, ya que la respuesta es muy rápida y eficiente”. Asimismo, el programa, al ser remoto, utiliza bases de datos que siempre están actualizadas de acuerdo con los nuevos descubrimientos y asociaciones.
La importancia del análisis de las mutaciones
En el genoma humano se han identificado miles de regiones de ADN asociadas con distintas enfermedades. Para poder estudiar estas asociaciones patogénicas, las herramientas de análisis de datos de nueva generación son un factor clave en el avance de los estudios científicos. Estas herramientas para automatizar el análisis de las variantes del genoma son necesarias e imprescindibles para un estudio adecuado del genoma, ya que sin ellas no se pueden obtener conclusiones sobre los datos secuenciados. La mayoría de estas variantes detectadas e identificadas se encuentran en bases de datos públicas.
De esta forma, el programa “Variant” ha recopilado esta información disponible de todas las bases de datos que contienen información de variantes y mutaciones y la ha puesto a disposición de la comunidad científica. “Este programa contribuye y apoya el estudio de enfermedades, porque facilita el estudio de las variaciones genéticas en relación con el riesgo de desarrollar cualquier enfermedad, con la predisposición o incluso con la resistencia a tratamientos”, apunta Dopazo.
Sin embargo, existen todavía lagunas y datos que han de ser completados antes de confirmar asociaciones de riesgo. Por ello, el programa Variant pone a disposición del investigador una predicción de estas variantes desconocidas.
Una tecnología muy sofisticada
El nuevo programa hace uso del concepto de nube o “cloud computing”, que ofrece servicios de computación a través de la red, sin necesidad de que los usuarios sean expertos en los recursos que usan. “Esta forma de funcionamiento, unida a la velocidad de los resultados del análisis logrado por la secuenciación de nueva generación, es una apuesta por ser más rápidos en el análisis que en la producción de datos”, explica el investigador.
Hoy en día, el vertiginoso avance de las tecnologías de alto rendimiento, de la supercomputación y su aplicación a la genómica está provocando que la capacidad de producir datos sea mucho mayor que la capacidad tecnológica que existe para analizarlos y extraer conclusiones, por lo que se hacen necesarias herramientas eficaces en el análisis de los datos obtenidos.
Variant se une a otras potentes herramientas bioinformáticas diseñadas por el CIPF, capacitadas para analizar datos con distintas técnicas de alto rendimiento. Todas ellas son de uso abierto a través de su página web y se utilizan diariamente para analizar experimentos en centros de investigación de todo el mundo.