miRNA测序基本数据分析结果展示
1.测序数据统计
Sample Name | Clean Reads* | Adaptor Trimmed** | microRNA Reads*** |
Z381-FCort | 7,237,456 | 7,000,106 | 5,906,193 |
Z381-PCort | 7,483,217 | 7,199,637 | 5,743,606 |
* 图释 :*: 通过Illumina质控的高质量read的数目;**:去掉接头序列后长度大于或等于15nt的read数目;***:能够与最新版miRBase数据库中的pre-microRNA序列匹配(最多允许一个碱基的错配)的read数目
2.microRNA表达谱数据
microRNA测序最常见的用途就是对不同样品中microRNA的表达进行定量分析和比较。但是由于原始read数与测序数据量相关,直接用原始read值衡量特定microRNA的表达是不合适的。因此,我们对microRNA的表达量进行了标准化:将原始的read值转化为TPM(在每兆可与miRBase数据库中的pre-microRNA匹配的reads中,特定microRNA转录本所占的read数目)。TPM值可以用于衡量特定microRNA在样品中的表达丰度,以及对不同样品间差异表达的microRNA的分析。
* 图释 :microRNA表达谱数据示例
3.microRNA差异表达数据
根据标准化后的microRNA表达值(TPM),我们会计算出每个microRNA在不同样品间(如处理组 vs 对照组)的表达变化(fold change),并通过ttest计算样品间microRNA表达量变化的统计学显著性。那些表达变化倍数在1.5倍以上,p值小于0.05的microRNA被挑选出来,并定义为显著性差异表达的microRNA。针对多重比较,p值被校正为FDR。客户可以根据倍数变化,p值,FDR等参数对差异表达的microRNA进行排序和筛选。
* 图释 :样品间差异表达的microRNA数据示例
4.差异表达microRNA的聚类图
层次聚类是一种最常见的用于分析表达数据的聚类方法。它可以根据样品中基因的表达水平将样品自动的分组,可以让客户从整体上评估样品间的基因表达差异,以及样品间的关系。左侧的树状图可以反映样品间基因表达模式的关系。
* 图释 : 不同样品组之间差异表达microRNA的聚类示例
5.差异表达microRNA的火山图
火山图可以对不同样品组之间差异表达的microRNA进行图形化的展示。横轴代表处理组和对照组之间microRNA表达倍数的变化(log2转化),纵轴代表相应的p值(-log10转化)。火山图可以直观的展示microRNA在样品组间的倍数变化与相应的统计学显著性之间的关系(图5)。纵向的绿线分别对应1.5倍的上调(右侧)和下调(左侧),绿色平行线对应0.05的p值。下面火山图中的红色点代表在不同样品组中具有统计学显著性的差异microRNA。
* 图释 : 火山图示例
6.新的microRNA预测
通过microRNA测序可以预测新的microRNA。新microRNA能通过miRDeep软件进行预测。根据microRNA成熟过程中,dicer酶对microRNA前体的加工原理,miRDeep构建了一种简单的预测模型。通过这个模型,它可以根据高通量测序结果准确的预测样品中的新microRNA。
7.差异表达microRNA的靶基因预测及功能富集分析
它们通过诱导mRNA降解或转录抑制在基因表达调控中起着一种重要的作用。每个microRNA通过部分序列互补的方式结合到基因的3'UTR,平均靶向几百个基因。Aksomics整合了最权威的microRNA靶基因预测算法,研究top10差异miRNA(上下调各10个)的靶基因,并构建microRNA-靶基因调控网络,以推断这些microRNA的功能。
* 图释 : 上图:通过靶基因预测构建的差异表达microRNA-靶基因网络(红色矩形:microRNA;蓝色圆形:靶基因);下图:预测得到的靶基因的GO富集结果。根据排名前10条的GO-term来展示结果,点颜色代表P-value,点大小代表靶基因和该GO条目中均存在的基因个数。