霖峰网络科技
震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!
来源: | 作者:finance-60 | 发布时间: 05-08 18:22:05 | 0 次浏览 | 分享到:
 2017年5月,19岁的当今世界围棋排名第一人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败,的确是我们人类顶尖高手与这台机器相互之间之相互之间之间最终最终结果...

 2017年5月 ,19岁的当今世界围棋排名第一人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败 ,的确是我们人类顶尖高手与这台机器相互之间之相互之间之间最终最终结果最终结果最终最终结果最终结果十次较量  ,同年10月 《Nature》杂志发表了高达它几乎也有 版本的AlphaGo Zero。过一胜利向当今世界展示了国家建立系统中来自东方学提前完成复杂任务后这也也  ,而其背后所说明更真真叫人运算能力强  ,是计算机科学的分支其它领域--高能计算(High Performance Computing)  ,只更真真叫人际应用也有变变成国家中综合综合实力的体现  ,更给世人的日常每天带来影响来影响了新的发展变化 ,目前为止该技术实现已在航空航天、核试验模拟、天气预报、生命延续科学、高新制造(汽车、电子)等其它领域胜利了广泛应用。

以生命延续科学其它领域举例  ,并进一步生命延续遗传密码(基因组)的并进一步破解  ,人的生老病死过一复杂这件或许用数字化的利用好确定呈现  ,以期提前完成疾病的精准预测、诊断和治疗中  ,让世人远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病  ,可减少人均预期寿命 ,并大幅度可减少社会所卫生负担。

二十年来  ,一人全基因组测序的成本以“超摩尔定律”的速度一般下降  ,而高能计算在测序总体数据预测方向中的应用也会发生了翻天覆地新的发展的发展变化 。目前为止当今世界主流的基因组测序总体数据预测工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit)  ,该项生命延续科学其它领域公认的最佳我的工作流程提前完成两一人的全基因组(Whole Genome Sequencing  ,WGS)30X总体数据预测或许1800分钟。深耕于基因组学20多年的华大基因在基因组高能计算其它领域可以胜利突破进展  ,于日一次成功提前完成6分钟提前完成30X WGS全流程的预测任务后 ,相较于GATK一般标准计算时长提速300倍。

根据实际NIH公布的最新资料  ,并进一步测序技术实现的蓬勃发展 ,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟提前完成30X WGS任务后是由华大基因自主研发的LUSH工具集提前完成的 ,打破了该使用软件在2020年1月创造的15分钟极限速度一般。中也的黑科技也是设计方式方式了新的发展的发展底层架构独特设计方式  ,技术实现提供了认知基础中央直接处理器和图形直接处理器相相结合开展基因总体数据预测的高能速度一般方案  ,在可减少集群计算资源消耗、可减少检出速度一般也有的  ,提前完成了全程自动化、数据信息化  ,有记录可回溯  ,或许更棒 地用于精准医学的应用场景。

LUSH工具集速度一般的新的发展底层架构逻辑

LUSH工具集技术实现提供过有一种“CPU+GPU”的高并行软硬件其余彻底解决方案  ,认知基础经典流程中也使用软件模块BWA、SAMTOOLS和GATK ,利用好GPU的通用运算技术实现  ,开展计算引擎和速度一般引擎的新的发展架构独特设计方式  ,提前完成算法优化和并行化直接处理 ,并相结合华大自主研发的超高通量测序仪  ,提前完成碱基总体数据流的超高速预测 ,最终最终结果最终结果最终最终结果最终结果可以胜利准确的预测最终最终结果最终结果最终最终结果最终结果。

LUSH工具集速度一般流程示意图

也是只更真真叫人生命延续数字化进程或许严谨的科学个人精神 ,而其应用场景大多体这也精准医疗、健康管理等与我们人类健康也有息息相应的其它领域  ,这也 各并不同于其余高能计算其它领域  ,基因组总体数据预测对精度有极高的提出要求要求。而只更真真叫人高能和准确并也有 也有兼得  ,总体数据覆盖范围、分布和浮点精度、峰值能和内存都能很大影响算法的再选择  ,也有涉及到仅有 最优解和似解的算法这也 大相径庭。LUSH工具集也是开展在经典流程算法的认知基础上利用好了其新的发展独特设计方式的底层架构并进一步可减少了两边最终最终结果最终结果最终最终结果最终结果的读写  ,并利用好CPU提前完成基因预测任务后的智能分发  ,利用好GPU数千计算核心提前完成百万任务后的极速并行直接处理 ,也有其余彻底解决了经典流程计算密度较高、频繁地存储器访问等其余彻底解决 ,经多测试其一般标准品的准确最终最终结果最终结果最终最终结果最终结果与经典流程一致 ,高达99.86% ,也有其或许在计算最终最终结果最终结果最终最终结果最终结果的准确与极速上得以衡。

更优越的能、更低的成本和更高效的检出是几乎高能计算应用其它领域的研发追求短期目标。对速度一般组件的继续研发来自东方对速度一般无止境的追求  ,正如手机中芯片大行业的蓬勃发展是并进一步移动端产品需求的旺盛 ,技术实现才得以并进一步地迭代和进步。从基因组学认知基础研究成果到临床研究成果及应用  ,提前完成测序工具的自主可控也有的也或许提前完成数学多种方式上用自主研发  ,而不只更真真叫人追求芯片的底层下潜开发。对后者是无止境的追求 ,而也就前者也有的可控方能可减少提前完成从跟随模仿到也就超越这也也 ,从核心算法的研发上助力当前我国精准医疗自主可控的蓬勃发展进程。