GEO数据挖掘

33次阅读
没有评论

共计 762 个字符,预计需要花费 2 分钟才能阅读完成。

作者:解螺旋. 老谈如需转载请注明来源:解螺旋·医生科研助手

·导语·

在大数据的时代背景下,高通量测序技术及基因芯片技术的快速发展,使得基因数据呈井喷之势。而 GEO 作为世界上最大的免费的储存基因表达的数据库,包含了大约 16 亿个测量值,这些输入的数据很多还没有被破解,只是以原始资料存在,研究者可进一步挖掘其中包含的生物信息。

今天老谈以“肠癌”为例,带大家走上寻宝之路,教教大家如何在 GEO 数据库上找到宝贝。(回复“热图”,可查看基因芯片数据分析的文章)

1、 打开 NCBI 官网:www.ncbi.nlm.nih.gov。

2、 搜索 GEO 的数据库,找到  GEO DataSets

GEO 数据挖掘

3、 搜索肠癌“Colorectal Cancer”,即可获得所有肠癌的芯片数据。

GEO 数据挖掘

4、 选择需要研究的芯片点击进入,例如我们搜索了一个 II 期肠癌的芯片数据库。

GEO 数据挖掘

5、 直接点击进入后,会获得该基因芯片的结果,并进入分析工具的页面。

GEO 数据挖掘

6、 在 Data AnalysisTools 中可以进行进一步的数据分析,例如将原有样本群按照自己需要的分类再进行细分,并可筛选需要了解的某基因的表达谱。例如,如果要找耐药相关的基因,P-gp 可介导肠癌多药耐药,那我们就要从 P -gp 入手,搜索该芯片中 P -gp 的表达谱。

GEO 数据挖掘

7、 获得表达谱信息之后,在链接中可以发现 Profile neighbors,即表达谱相近的基因,这就是我们需要寻找的与 P -gp 相关的有可能共表达的基因了。同样,通过 GEO Profiles 的搜索,也同样可以得到所有芯片数据中该基因的表达谱情况,并根据需求进行查找可能的共表达基因。

GEO 数据挖掘

8、 对所有该基因的表达谱分析后,同样可以获得可能的信号通路。

GEO 数据挖掘

9、 点击后,可直接转入 Flink 显示可能的通路,使用极方便。

GEO 数据挖掘

正文完
 0