批量miRNA的靶基因预测,不用代码怎么实现?

2018-07-12阅读
http://5b0988e595225.cdn.sohucs.com/images/20180712/85e81500bb3640b690ce08ad1496ca40.jpeg

今天我们不介绍文章了,回答一个问题:批量miRNA的靶基因预测,不用代码怎么实现?

具体来说是这样的:有同学说在做数据分析的时候通过GEO的芯片分析找到了几十条显著差异的miRNA,想对这些miRNA进行靶基因预测,下面是22条举例的miRNA:

我们可以看到这里出现了miRNA的名字,但是出现了星号*等标记,我们前面在和中说过,对于大多数miRNA来说,如果编号一样但3p和5p不同,其功能及调控的靶基因可能都是不同的,如miR-223-3p和miR-223-5p(通过mirbase查询):

我们看到miR-223-3p和miR-223-5p的序列是不同的,而两条miRNA的previous ID分别是hsa-miR-223和hsa-miR-223*,而平时我们在文章里面经常见到的很多时候都是只出现hsa-miR-223或者hsa-miR-223*,

而不出现具体的3p还是5p信息,因此当我们看到这样信息的时候就可以通过mirbase(http://www.mirbase.org/)查询了。

下面我们回到问题,当我们拿到22条miRNA后,我们可以通过以前介绍过的一个工具进行靶基因预测(我好像发现了一个miRNA各种软件的大本营……),

工具:DIANA Tools,网址:http://diana.imis.athena-innovation.gr/DianaTools/index.php?r=site/page&view=software

我们用microT-CDS这个软件:

在搜索框中直接输入22条miRNA的名字后回车:

我们看到一个名字匹配到了多条miRNA,我们需要确定是哪一条,如果数量少的情况下,我们通过mirbase查询即可:

通过查询结果我们知道hsa-mir-96指的是hsa-mir-96-5p:

这样我们在界面选择hsa-mir-96-5p前面的箭头就可以了:

同样的道理,如果数量少我们可以一个个查,然后选择。

如果数量比较多的情况下,我们可以用mirbase的注释文件,需要进入FTP site:

然后选择aliases.txt.zip文件下载后打开:

我们看到hsa-mir-96*与hsa-mir-96-3p对应的是一个ID,这样我们就可以在Excel里面批量操作了。具体的操作方法大家可以通过Vlookup函数等实现,比较简单(不懂的同学可看这篇教程:(工具篇):S4E07: 用Excel就能实现的几个逆天功能!)

好了,当我们选好以后在新的页面里面就出现了靶基因的情况:

每个预测的通过箭头可以打开:

右上角的红框里面可以下载:

简单筛选一下就可以了:

Powered by 搜狐快站