StrandNGS高通量测序分析工具

∙ ∙

文库构建包括：SingleEnd, Paired End, Mate Paired以及 Directional Layouts.

可以支持的仪器平台包括：Illumina，Ion Torrent，ABI SOLiD等等。

∙ ∙ ∙

对小RNA，DNA-Seq，ChIP-Seq以及RNA-Seq原始数据进行比对

对于特定的重测序的应用进行目标区域比对。

可处理各种长度的读长，任意的Gap数、错配数、以及配对读长。提供多个选项：修剪接头,低质量的碱基，以及过滤的数据库。 ∙

在内存64GM的机器上针对hg19每小时每个CPU可以比对大约8百万个100bp的Reads

∙ ∙ ∙

多项质量控制内容包括比对前QC，比对后QC，illumina 测序平台QC，建库QC 对每例样本自动生成QC文件以PDF格式导出QC报告

∙ ∙

通过Reads的质量分值进行过滤保留感兴趣的序列区段

设置一定标准过滤重复、比对到多个位置的 reads.

数据导入以及质量控制

∙ ∙ ∙ ∙

允许导入Bismark软件比对结果（BAM/SAM）

对比对前后，目标区段富集以及建库进行质量控制

对甲基化水平，CpG位点的覆盖度进行统计

∙ ∙ 从甲基化检测和差异甲基化结果中确定基因组中甲基化或差异甲基化的胞嘧啶对于检测到的甲基化鉴定其效应

∙ ∙ ∙ 可变剪切与新的基因

可以处理各种长度以及各种文库构建的reads 可以对gap和错配的个数进行自定义

对截掉接头、低质量、设置过滤库来过滤reads进行参数设定

∙ ∙

合理地处理部分重叠的读取以及多重mapping的读取

用DESeq,TMM, Quantile,RPKM等方法进行归一化处理 Whitney,n-wayANOVA的方法找差异表达的基因 ∙

用BenjaminiHochberg等方法进行多重校正测试 ∙

P-Value,校正p-Value以及Fold Change计算和可视化

找到差异剪切的基因可视化基因视图

∙ ∙

接点

新基因的差异表达分析以及新的外显子对差异剪接的贡献的分析

用保守打分对新的区域排序

用dbSNP数据库注释来识别已知的新的突变预测转录本上类似非同义编码区等等区域的效应

通过直观的操作见面进行SNP显著性分析

∙ ∙ ∙ ∙

通过单端或者配对端数据检测“Read through”转录本

通过旁系同源注释基因融合以及通过假基因来过滤掉假阳性

∙

通路分析

Single Experiment Analysis (SEA)单实验分析 Multi-Omic Pathway Analysis (MOA)多实验多组学分析

应用wiki pathways,Biocyc pathways,或者BioPax pathways,或者用自然语言处理从Pubmed的摘要里得到的相互作用数据库，并可以进行相互作用网络分析。

找到发现的基因参与的重要Pathways

∙ ∙ ∙

可变剪切与新的基因

可以处理各种长度以及各种文库构建的reads 可以对gap和错配的个数进行自定义

对截掉接头、低质量、设置过滤库来过滤reads进行参数设定

∙ ∙ ∙

域

用PICS检测转录调控位点的Peaks 找到那些被转录结合位点调节的基因用MACS来检测组蛋白调控位点

∙ ∙ ∙ ∙

用GADEM找到在检测到的Peak区域的导入peak 区域用以检测motifs 导入JASPAR格式的motifs

筛选整个基因组或者在感兴趣的区域的motifs

工作流执行

∙ ∙ ∙ ∙ 工作流在后台运行

分析的工作流包含过滤和峰的寻找

工作流支持原始的比对以及直接导入第三方产生的比对后结果工作流可以定制

通路分析

∙ ∙ ∙

Single Experiment Analysis (SEA)单实验分析 Multi-Omic Pathway Analysis (MOA)多实验多组学分析

应用wiki pathways,Biocyc pathways,或者BioPax pathways,或者用自然语言处理从Pubmed的摘要里得到的相互作用数据库，并可以进行相互作用网络分析。 ∙

找到发现的基因参与的重要Pathways

∙ ∙ ∙

评价目标重测序区段的有效性

找到那些几个样本里覆盖率低的目标区域在目标区段中检测SNP以及其他变异

质量控制管理: Library QC

∙ ∙ ∙

多项质量控制内容包括比对前QC，比对后QC，illumina测序平台QC，建库QC 对每例样本自动生成QC文件以PDF格式导出QC报告

∙

质量控制管理: 目标序列捕获测序QC

∙ ∙ ∙

有效的分析靶向序列捕获测序实验数据目标区段范围内的质量控制

评估各个测序样本在目标区段的reads覆盖情况

的全基因组分析

通用的台式电脑就可以进行分析，推荐的基本配置为4GB RAM，4核，2TB的硬盘空间

∙ ∙ ∙

reads的碱基质量值进行重新校正，降低错误率和系统误差

通过每个测序循环的数据以及按错配类型来校准质量分数

使reads中碱基的质量值能够更加接近真实的与参考基因组之间错配的概率

小的InDels

看几个样本的变异统计数据

在每个样本上可视化变异的详细信息以及dnSNP的注释

支持VCF以及VAL导入

∙ ∙ ∙

∙

可以可视化SNPs，MNPs以及InDels以及覆盖度，reads以及其他的注释

∙

稀有变异，以及体细胞变异

通过直观的操作见面进行SNP的过滤

∙ ∙ ∙ ∙

引导式的可视化以验证查看每个单独的SNPs 根据碱基质量或者mapping的质量显示不同的颜色

对reads进行聚类以使强化变异的位置用链的信息注释聚类的结果

∙ ∙ ∙ ∙

分析各种不同的效应，包括非同义编码，剪切位点，终止子获得等可视化转录的氨基酸序列可以过滤感兴趣的效应

用HGMD，COSMIC等数据库对变异进行注释

变异基

于

SIFT,Polyphen,LRT,以及

Mutation

∙ ∙ ∙

Taster的预测分数找到有害的变异

基于phyloP以及GERP++_RS的保守打分过滤

基于千人基因组的等位基因频率过滤

找出大的结构变异包括大的插入，缺失，倒置，以及易位

用基因组浏览器进行结果确认

∙ ∙ ∙ ∙

Single Experiment Analysis (SEA)单实验分析

Multi-Omic Pathway Analysis (MOA)多实验多组学分析

应用wiki pathways,Biocyc pathways,或者BioPax pathways,或者用自然语言处理从Pubmed的摘要里得到的相互作用数据库，并可以进行相互作用网络分析。找到发现的基因参与的重要Pathways

∙

∙ ∙

用StrandNGS比对器进行原始序列比对在比对过程中可以截掉3端接头

reads在各个基因区域和小RNA种间的分布

∙

∙ ∙

计算已知基因，新的基因以及成熟的miRNA的表达值

可以提取与成熟的miRNAs的5’端完全匹配

的Reads

计算时考虑Padding以及多重mapping的读取

DESeq，TMM，Quantile，以及基于样本记数的归一化方法

用小RNA基因视图来可视化定量结果

∙

利用TargetScan,PicTar, TarBase,

microRNA.org, 以及PITA数据库进行靶标富集分析 ∙ ∙

找到多个数据库共同的靶标

对一系列靶标的mRNA基因进行下游分析（GO，GSEA，Pathway分析） ∙ ∙

通过置信打分和保守打法找到高可信度的预测结果.

∙ 通过合适的距离标准找到重叠以及非重叠的目标区域

∙ ∙

运用公式对已有的列表创建新的列表对列可以进行过滤操作

∙

寻找检测区域（如SNPs，SVs，Peaks）受到影响的基因

∙ ∙

可以导入外来的基因进行比较.

可以把单个的区域存为新的列表进行分析

∙

∙ ∙ ∙

Single Experiment Analysis (SEA)单实验分析 Multi-Omic Pathway Analysis (MOA)多实验多组学分析

应用wiki pathways,Biocyc pathways,或者BioPax pathways,或者用自然语言处理从Pubmed的摘要里得到的相互作用数据库，并可以进行相互作用网络分析。 ∙

找到发现的基因参与的重要Pathways

∙ ∙

文库构建包括：SingleEnd, Paired End, Mate Paired以及 Directional Layouts.

可以支持的仪器平台包括：Illumina，Ion Torrent，ABI SOLiD等等。

∙ ∙ ∙

对小RNA，DNA-Seq，ChIP-Seq以及RNA-Seq原始数据进行比对

对于特定的重测序的应用进行目标区域比对。

可处理各种长度的读长，任意的Gap数、错配数、以及配对读长。提供多个选项：修剪接头,低质量的碱基，以及过滤的数据库。 ∙

在内存64GM的机器上针对hg19每小时每个CPU可以比对大约8百万个100bp的Reads

∙ ∙ ∙

多项质量控制内容包括比对前QC，比对后QC，illumina 测序平台QC，建库QC 对每例样本自动生成QC文件以PDF格式导出QC报告

∙ ∙

通过Reads的质量分值进行过滤保留感兴趣的序列区段

设置一定标准过滤重复、比对到多个位置的 reads.

数据导入以及质量控制

∙ ∙ ∙ ∙

允许导入Bismark软件比对结果（BAM/SAM）

对比对前后，目标区段富集以及建库进行质量控制

对甲基化水平，CpG位点的覆盖度进行统计

∙ ∙ 从甲基化检测和差异甲基化结果中确定基因组中甲基化或差异甲基化的胞嘧啶对于检测到的甲基化鉴定其效应

∙ ∙ ∙ 可变剪切与新的基因

可以处理各种长度以及各种文库构建的reads 可以对gap和错配的个数进行自定义

对截掉接头、低质量、设置过滤库来过滤reads进行参数设定

∙ ∙

合理地处理部分重叠的读取以及多重mapping的读取

用DESeq,TMM, Quantile,RPKM等方法进行归一化处理 Whitney,n-wayANOVA的方法找差异表达的基因 ∙

用BenjaminiHochberg等方法进行多重校正测试 ∙

P-Value,校正p-Value以及Fold Change计算和可视化

找到差异剪切的基因可视化基因视图

∙ ∙

接点

新基因的差异表达分析以及新的外显子对差异剪接的贡献的分析

用保守打分对新的区域排序

用dbSNP数据库注释来识别已知的新的突变预测转录本上类似非同义编码区等等区域的效应

通过直观的操作见面进行SNP显著性分析

∙ ∙ ∙ ∙

通过单端或者配对端数据检测“Read through”转录本

通过旁系同源注释基因融合以及通过假基因来过滤掉假阳性

∙

通路分析

Single Experiment Analysis (SEA)单实验分析 Multi-Omic Pathway Analysis (MOA)多实验多组学分析

应用wiki pathways,Biocyc pathways,或者BioPax pathways,或者用自然语言处理从Pubmed的摘要里得到的相互作用数据库，并可以进行相互作用网络分析。

找到发现的基因参与的重要Pathways

∙ ∙ ∙

可变剪切与新的基因

可以处理各种长度以及各种文库构建的reads 可以对gap和错配的个数进行自定义

对截掉接头、低质量、设置过滤库来过滤reads进行参数设定

∙ ∙ ∙

域

用PICS检测转录调控位点的Peaks 找到那些被转录结合位点调节的基因用MACS来检测组蛋白调控位点

∙ ∙ ∙ ∙

用GADEM找到在检测到的Peak区域的导入peak 区域用以检测motifs 导入JASPAR格式的motifs

筛选整个基因组或者在感兴趣的区域的motifs

工作流执行

∙ ∙ ∙ ∙ 工作流在后台运行

分析的工作流包含过滤和峰的寻找

工作流支持原始的比对以及直接导入第三方产生的比对后结果工作流可以定制

通路分析

∙ ∙ ∙

Single Experiment Analysis (SEA)单实验分析 Multi-Omic Pathway Analysis (MOA)多实验多组学分析

应用wiki pathways,Biocyc pathways,或者BioPax pathways,或者用自然语言处理从Pubmed的摘要里得到的相互作用数据库，并可以进行相互作用网络分析。 ∙

找到发现的基因参与的重要Pathways

∙ ∙ ∙

评价目标重测序区段的有效性

找到那些几个样本里覆盖率低的目标区域在目标区段中检测SNP以及其他变异

质量控制管理: Library QC

∙ ∙ ∙

多项质量控制内容包括比对前QC，比对后QC，illumina测序平台QC，建库QC 对每例样本自动生成QC文件以PDF格式导出QC报告

∙

质量控制管理: 目标序列捕获测序QC

∙ ∙ ∙

有效的分析靶向序列捕获测序实验数据目标区段范围内的质量控制

评估各个测序样本在目标区段的reads覆盖情况

的全基因组分析

通用的台式电脑就可以进行分析，推荐的基本配置为4GB RAM，4核，2TB的硬盘空间

∙ ∙ ∙

reads的碱基质量值进行重新校正，降低错误率和系统误差

通过每个测序循环的数据以及按错配类型来校准质量分数

使reads中碱基的质量值能够更加接近真实的与参考基因组之间错配的概率

小的InDels

看几个样本的变异统计数据

在每个样本上可视化变异的详细信息以及dnSNP的注释

支持VCF以及VAL导入

∙ ∙ ∙

∙

可以可视化SNPs，MNPs以及InDels以及覆盖度，reads以及其他的注释

∙

稀有变异，以及体细胞变异

通过直观的操作见面进行SNP的过滤

∙ ∙ ∙ ∙

引导式的可视化以验证查看每个单独的SNPs 根据碱基质量或者mapping的质量显示不同的颜色

对reads进行聚类以使强化变异的位置用链的信息注释聚类的结果

∙ ∙ ∙ ∙

分析各种不同的效应，包括非同义编码，剪切位点，终止子获得等可视化转录的氨基酸序列可以过滤感兴趣的效应

用HGMD，COSMIC等数据库对变异进行注释

变异基

于

SIFT,Polyphen,LRT,以及

Mutation

∙ ∙ ∙

Taster的预测分数找到有害的变异

基于phyloP以及GERP++_RS的保守打分过滤

基于千人基因组的等位基因频率过滤

找出大的结构变异包括大的插入，缺失，倒置，以及易位

用基因组浏览器进行结果确认

∙ ∙ ∙ ∙

Single Experiment Analysis (SEA)单实验分析

Multi-Omic Pathway Analysis (MOA)多实验多组学分析

∙

∙ ∙

用StrandNGS比对器进行原始序列比对在比对过程中可以截掉3端接头

reads在各个基因区域和小RNA种间的分布

∙

∙ ∙

计算已知基因，新的基因以及成熟的miRNA的表达值

可以提取与成熟的miRNAs的5’端完全匹配

的Reads

计算时考虑Padding以及多重mapping的读取

DESeq，TMM，Quantile，以及基于样本记数的归一化方法

用小RNA基因视图来可视化定量结果

∙

利用TargetScan,PicTar, TarBase,

microRNA.org, 以及PITA数据库进行靶标富集分析 ∙ ∙

找到多个数据库共同的靶标

对一系列靶标的mRNA基因进行下游分析（GO，GSEA，Pathway分析） ∙ ∙

通过置信打分和保守打法找到高可信度的预测结果.

∙ 通过合适的距离标准找到重叠以及非重叠的目标区域

∙ ∙

运用公式对已有的列表创建新的列表对列可以进行过滤操作

∙

寻找检测区域（如SNPs，SVs，Peaks）受到影响的基因

∙ ∙

可以导入外来的基因进行比较.

可以把单个的区域存为新的列表进行分析

∙

∙ ∙ ∙

Single Experiment Analysis (SEA)单实验分析 Multi-Omic Pathway Analysis (MOA)多实验多组学分析

应用wiki pathways,Biocyc pathways,或者BioPax pathways,或者用自然语言处理从Pubmed的摘要里得到的相互作用数据库，并可以进行相互作用网络分析。 ∙

找到发现的基因参与的重要Pathways

StrandNGS高通量测序分析工具

相关文章