Please use this identifier to cite or link to this item: http://cibnor.repositorioinstitucional.mx/jspui/handle/1001/1564
Evaluación de la influencia de los recursos computacionales en la variabilidad y calidad de ensamblaje de novo de transcriptoma
PATRICIA CARVAJAL LOPEZ
Fernando Daniel Von Borstel Luna
Joaquín Gutiérrez Jaguey
CLAUDIO HUMBERTO MEJIA RUIZ
Gabriella Rustici
Eduardo Romero Vivas
Acceso Abierto
Atribución-NoComercial-SinDerivadas
URL: http://www.cys.cic.ipn.mx/ojs/index.php/CyS/article/view/2883/2534
ISSN: 2007-9737
DOI: 10.13053/CyS-22-4-2883
ARN, secuenciación NGS, RNA-Seq, efecto de memoria en ensamblaje, HPC, optimización de ensamblaje
"El contenido de ARN se descifra con fragmentación aleatoria, lo que genera millones de secuencias, que en ausencia de referencias se reconstruyen basándose en algoritmos que usan intensivamente recursos computacionales. Diversos factores afectan el resultado de dicho proceso. Este estudio considera por primera vez cómo la asignación de memoria/núcleos influye sobre la calidad y variabilidad del ensamblaje. Se realizaron múltiples ensamblajes para 2 organismos modelo, en una plataforma monolítica y dos de cómputo de alto desempeño. Se encontraron mayores variabilidades de contigs en equipos monolíticos con poca memoria (1.98 y 2.10 veces más que HPC); sin embargo, gran parte de estos (99.16% y 75.79%) mapearon al transcriptoma de referencia demostrando ser de calidad. Por tanto, contrariamente a lo esperado, se observó que una estrategia de ensamblajes múltiples en un equipo de bajos recursos supera el uso de plataformas de alto rendimiento para el descubrimiento de ARNs."
"In lack of references these sequences are reconstructed relying on algorithms that require intensive use of computational resources. Numerous factors affect this process. This study explores for the first time how memory/core allocation on reconstruction processes influences assembly quality and variability. Multiple de novo assemblies for two model organisms were obtained from one monolithic platform and two High Performance Computers. Low memory monolithic platforms observed greater variability (1.98 & 2.10 times greater than HPC); however, most of the obtained contigs (99.16% & 75.79%) mapped to the reference transcriptome, thus proving good quality. Therefore, contrary to what was expected, using low-resource equipment when applying assembly strategies that unify numerous assemblies outperforms HPCs on RNA discovery."
Instituto Politécnico Nacional
2018
Artículo
Computación y Sistemas
Español
LENGUAJES ALGORÍTMICOS
Versión publicada
publishedVersion - Versión publicada
Appears in Collections:Artículos

Upload archives


File SizeFormat 
PUB-ARTICULO-4175.PDF1.14 MBAdobe PDFView/Open