震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!
合肥冉想营销策划 时间:2025-05-15 05:14:46
2017年5月 ,19岁的拥有世界 围棋第对一柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败 ,由此是其他物种顶尖高手与这台机器关系 的到到最后到最后四次较量 ,同年10月 《Nature》杂志发表了未超过它一切如果版本的AlphaGo Zero。在一成绩向拥有世界 展示了初步建立系统提供来于 学无法完成 复杂任务完成 的如果会性 ,而其背后所代表行业内值得注意运算能力方面 ,是计算机科学的分支技术领域--高性能计算(High Performance Computing) ,显然际应用到最后方面代表行业内的部分国家 综合真实实力的体现 ,更给多数人 的日常到到最后到最后生活将给了彻底新的内容变化 ,目前已该技术一已在航空航天、核试验模拟、天气预报、生命延续科学、高新制造(汽车、微电子)等技术领域成绩了广泛应用。
以生命延续科学技术领域举例 ,日益生命延续遗传密码(基因组)的日益破解 ,人的生老病死在一复杂事是也可以以用数字化的以此具体地呈现 ,以期无法完成 疾病的精准分析得出、诊断和治疗中 ,让多数人 远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病 ,得到得到提高人均预期寿命 ,并大幅度得到得到提高当代社会 卫生总负担。
近二十年来 ,对一全基因组测序的成本以“超摩尔定律”的其速度下降 ,而高性能计算在测序数据全面分析得出方向调整的应用也发生过了翻天覆地的彻底新的内容变化 。目前已拥有世界 主流的基因组测序数据全面分析得出工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit) ,该项生命延续科学技术领域公认的最佳或者工作流程无法完成 两对一的全基因组(Whole Genome Sequencing ,WGS)30X数据全面分析得出也可以1800分钟。深耕于基因组学20多年的华大基因在基因组高性能计算技术领域相继成绩突破性进展 ,于近日成功了无法完成 6分钟无法完成 30X WGS全流程的分析得出任务完成 ,相较于GATK标准中计算时长提速300倍。
依照NIH公布的最新资料 ,日益测序技术一的发展进步 ,测序成本以超摩尔定律下
https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data
6分钟无法完成 30X WGS任务完成 是由华大基因自主研发的LUSH工具集无法完成 的 ,打破了该各类软件在2020年1月创造的15分钟极限其速度。除了的黑科技恰是选用了新的内容的内容底层架构选用造型 ,提供完整了此基础中央后续处理器和图形后续处理器相运用以此基因数据全面分析得出的高性能其速度方案 ,在得到得到提高集群计算资源消耗、得到得到提高检出其速度的到最后方面 ,无法完成 了全程自动化、信息内容化 ,有记录可回溯 ,也可以以更佳地用于精准医学的应用场景。
LUSH工具集其速度的新的内容底层架构逻辑
LUSH工具集提供完整在有一种“CPU+GPU”的高并行软硬件完美解决方案 ,此基础经典流程中所各类软件模块BWA、SAMTOOLS和GATK ,以此GPU的通用运算技术一 ,以此计算引擎和其速度引擎的新的内容架构选用造型 ,无法完成 算法优化和并行化后续处理 ,并运用华大自主研发的超高通量测序仪 ,无法完成 碱基数据全面流的超高速分析得出 ,到到最后到最后相继成绩准确的分析得出到到最后到最后。
LUSH工具集其速度流程示意图
恰是显然生命延续数字化进程也可以严谨的科学精神高度 ,而其应用场景再就 体除了精准医疗、健康管理等与其他物种健康都有息息有关的技术领域 ,如果会不一样于或者高性能计算技术领域 ,基因组数据全面分析得出对精度有极高的其要求。而显然高性能和准确性事实上要到最后兼得 ,数据全面范畴 、分布和浮点精度、峰值性能和内存经常会 影响很大算法的去选择 ,其次涉及到唯二最优解和近似解的算法如果会大相径庭。LUSH工具集恰是以此在经典流程算法的此基础上以此了其新的内容选用造型 的底层架构初步减轻 了左边到到最后到最后的读写 ,并以此CPU无法完成 基因分析得出任务完成 的智能分发 ,以此GPU数千计算核心无法完成 百万任务完成 的极速并行后续处理 ,到最后方面完美解决了经典流程计算密度较高、频繁地存储器访问等完美解决 ,利用它测试其标准中品的准确性到到最后到最后与经典流程一致 ,未超过99.86% ,如果其也可以以在计算到到最后到最后的准确性与极速性上得以平衡。
更优越的性能、更低的成本和更高效的检出是一切高性能计算应用技术领域的研发追求短期目标。对其速度组件的持续性研发来于 对其速度无止境的追求 ,正如手机中芯片行业内的发展进步是日益移动端更多需求的旺盛 ,技术一才得以日益地迭代和进步。从基因组学此基础系统研究到临床系统研究及应用 ,无法完成 测序工具的自主可控的到最后方面也也可以无法完成 数学方式多上和自主研发 ,而不显然追求芯片的底层下潜开发。对后者是无止境的追求 ,而必须前者的到最后可控可以无法完成 从跟随模仿到必须超越的如果会 ,从核心算法的研发上助力目前我国精准医疗自主可控的发展进步进程。
版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如果有侵权请立即联系:123456789@qq.com,我们立即下架或删除。