Serratus es un nuevo software informático que permite buscar secuencias virales en millones de muestras biológicas recolectadas y la cual descubrió más de 130,000 virus con ácido ribonucleico (ARN) desconocidos.
De acuerdo con el Comité Internacional de Taxonomía de Virus, se tienen identificados en el mundo más de 9,000 virus, pero esta nueva tecnología se encargó de analizar millones de muestras recolectadas por la comunidad biológica mundial. Los datos abarcan los últimos 13 años de todos los continentes, océanos y reinos de la vida.
¿CÓMO FUNCIONA ESTA TECNOLOGÍA?
El equipo de científicos detrás de Serratus publicó sus resultados en un artículo para la revista Nature en donde explican que el software se encargó de examinar 10 millones de gigabytes de información genética.
Con sus pruebas se habría descubierto 10 veces más el número de especies virales de ARN descritas hasta ahora. Gracias al análisis detallado de ciertas familias virales se descubrió más de 30 nuevas especies de coronavirus, incluidos algunos de vertebrados acuáticos como peces o anfibios.
Para hacerlo, la herramienta funciona en la nube al utilizar un grupo de 22,500 procesadores de computadora, lo que permitió la búsqueda masiva de secuencias virales en los millones de gigabytes de datos de secuenciación disponibles.
Este programa es capaz de concentrarse en fragmentos específicos de la secuencia de virus. Al respecto, cuentan con la búsqueda NT, que consiste en la búsqueda de nucleótidos de alta sensibilidad de genomas completos conocidos de todos los virus vertebrados RefSeq, excluyendo los retrovirus, y secuencias GenBank Coronaviridae.
Las secuencias están enmascaras para regiones de complejidad y contaminantes de plásmidos. Señalan que 3.8 millones de bibliotecas de secuenciación SRA se alinearon con cov3ma usando bowtie2.
Por otra parte, se encuentra la búsqueda RdRP, que es la utilizada para ubicar los nuevos virus de ARN al centrarse en el gen distintivo ARN polimerasa dependiente de ARN. Para ello, se tomaron todas las secuencias de RdRP de longitud completa y disponibles públicamente para agruparse con una identidad de aminoácidos del 90 por ciento para producir rdrp1.
LOS OBJETIVOS DE ESTE SOFTWARE
Los científicos detrás de Serratus señalaron que apenas el 0.001 por ciento de los virus en la Tierra son conocidos, por lo que, para prepararse para la siguiente pandemia, existe una necesidad urgente de caracterizar la gran diversidad planetaria de virus.
Ya algunos organismos como el Instituto de Biología Molecular y Celular de Plantas de Valencia (IBMCP) utilizó el software Serratus para analizar el virus que causa la hepatitis D en humanos, que es un agente viral llamado Delta, el cual cuenta con un genoma de tamaño mínimo y de origen desconocido.
Gracias al software se pudo describir la presencia de virus similares en muchos otros animales, incluidos los invertebrados. Junto a los investigadores del IBMCP, han participado en el proyecto científicos de Alemania, Francia y de la Universidad de California de Estados Unidos.
“La identificación del viroma de la Tierra es un paso fundamental en la preparación para la próxima pandemia. Sentamos las bases para futuras investigaciones al permitir el acceso directo a 883,502 secuencias que contienen ARN polimerasa dependiente de ARN (RdRP) que incluyen el RdRP de 131,957 nuevos virus de ARN, incluidos los 9 nuevos coronavirus”, explica el estudio.
La plataforma de descubrimiento viral se encuentra abierta para quien busque aprender de ella como descubrir sus resultados y puede explorarse en el sitio serratus.io