• 版本: v2.0.1
  • 类型: 镜像
  • 适用于: Linux
  • 发布日期: 2018-12-28


随着第二代测序技术的广泛使用以及与基因有关的人类疾病不断被发现,基因组数据在医学领域中的可用性和重要性与日俱增。

基因组数据必须先完成包括纠正测序错误和识别变异处理流程,才能应用于临床或研究,而处理的速度和成本,现在越已成为其应用于临床或科学研究的瓶颈。当前已经有了一些不同的尝试,来加速处理流程,克服这一瓶颈,取得了一定的成功,但仍然缺乏与标准生物信息学分析工具〔例如基因组分析工具包 (GATK)〕的兼容性。

峰科加速基因解决方案使用基于FPGA平台对GATK Best Practices进行加速,同时保持使用方法和结果与标准GATK完全一致。

目前镜像中对如下生物信息分析软件进行加速:

Original Tool

Original Version

Command

BWA

0.7.13

mem

samtools

1.3

view, sort

picard

1.141

MarkDuplicates

GATK

3.8

BaseRecalibrator

PrintReads

HaplotypeCaller

Mutect2

IndelRealigner

UnifiedGenotyper

CombinedGVCFs


GenotypeGVCFs

GATK

4.0.6

BaseRecalibrator


ApplyBQSR


HaplotypeCaller


Mutect2

另外镜像中还包含原始版本的BWA, Samtools, Picard和GATK软件,版本如上表所列。

本镜像使用OCL类型AEI,请在申请FPGA实例时选择正确类型。FPGA镜像加载已自动配置,无需用户加载

产品特点

峰科基因解决方案是适用于基因组学的所有功能于一身的计算解决方案。它使用华为云上FP1示例中的高端Xilinx FPGA 加速器,以及来自峰科的软件增强功能,可以为大多数计算密集型基因组学算法优化 FPGA 加速流程。通过保持与原始GATK使用方法一直,提供一种简单、直观的用户接口,其结果是获得一个强大和用户友好的基因组分析解决方案。

解决方案速览:
• 单样本方案的处理时间缩短超过 70%
• 包括所有熟悉基因组学工具的标准版 CPU版本
• 还包括为 FPGA 运算专门定制的峰科增强版 GATK 和 BWA 软件
• 预设工作流程,可以减少管理负担



应用指南

峰科基因镜像包括如下组件:

• 峰科基因分析软件fcs-genome,安装在/usr/local/falcon
• 峰科软件所需系统组件,以及FPGA调用所需系统配置。

准备工作

1. 申请一台FP1云服务器
2. 建议使用超高IO本地系统盘存储输入输出和临时文件以最大化分析性能。
3. 确认临时文件存储目录,并确保临时目录有足够可用空间,一般情况下,峰科加速软件运行过程中会产生临时文件,大小为输入FASTQ.GZ文件的3到5倍。
用户可以通过修改/usr/local/falcon/fcs-genome.conf调整软件设置