衔接上一篇数据比对后的结果,使用R包DSS进行处理。
我们先来复习一下上一节课得到的数据结果: *. 文件
这里我们使用的R包为DSS,使用 Bioconductor 进行安装。 这个包可以对甲基化数据做两件事:
DSS包对差异甲基化的检测基于β负二项分布的严格沃尔德检验。
输入数据的格式如下:
DML是甲基化差异位点,DMR为甲基化差异区域。 使用DSS包自带的数据进行演示
1. 载入两个包DSS和bsseq(需要该包构建obj对象)
2. 利用DMLtest函数call DML,分为一下几个步骤:
根据甲基化水平进行loci的差异分析
3. 根据dmlTest来call DML
当然,用户也可以指定差异的阈值,只有差异大于阈值的才会被call出来。
4. 根据dmlTest Call DMR
我们可以发现,smoothing前后得到的结果差异还是很大,所以针对不同的实验类型我们需要注意是否使用smoothing。 同理,也可以使用的delta参数以及调整得到合适的结果。
5. 可视化 DSS包提供了一个不是很美观的可视化函数,用户其实可以使用coverage结果在R里面作图。
分析到此就告一段落了,随后就是自行对差异甲基化区域的注释以及可视化文献作图。
后续在处理数据的时候,发现有一个情况,多核跑DMLtest会报错,详情解决方案可见 以下为简单解决方案