TCGA、GEO及SEER公共数据库挖掘与应用学习会 2018年3月23-24日(周末两天)上海

赛尔号 学习力
赛尔号 学习力

2018年3月23-24日(周末两天)  上海

【课程背景】

随着大数据时代的到来,各种生物类公共数据库井喷,其中就包括癌症领域熟为人知的癌症基因图谱The Cancer Genome Atlas (TCGA)数据库和GeneExpression Omnibus (GEO)基因表达数据库和(SEER)数据库,临床科研人员有没有一种方法可以不做实验不查病史,直接调用现有数据发表SCI论文呢?癌症公共数据库即提供了这样的可能。本次学习班讲授癌症领域熟为人知的癌症基因图谱The Cancer Genome Atlas(TCGA)数据库和基因表达数据库及癌症监测、流行病学和结果(SEER)数据库。TCGA由NCI牵头,作为美国攻克癌计划的一个大项目,系统提供了癌症多组学测序和芯片数据,包括Gene expression, DNA methylation, Copy Number Variation, Mutation等结果,同时也附有相应各测序样本的完整临床资料。TCGA为肿瘤基础医学和转化医学研究者提供了海量的基因组数据和与其关联的临床数据,这为挖掘有意义的基因组变化和发现影响肿瘤起始、发展、分化、转移等生物学机制提供了海量数据基础。GEO数据库是当今最大、最全面的公共基因表达数据资源。不仅可以上传自己的数据,而且还可以免费下载数据库中和自己研究方向类似甚至相同的数据来进行分析,为自己的研究提供一些启示或者验证。而美国的SEER数据库由美国国立癌症研究所(National Cancer Institute,NCI)于1973 年所建立,其后每年定期更新,是北美最具代表性的大型临床肿瘤登记注册数据库之一,收集了各个癌种的临床病理信息和预后数据,并向全世界开放,为临床医师的循证实践及临床肿瘤学研究提供了宝贵的第一手资料。

然而传统的基础医学和临床医学研究者缺乏信息学基础来处理这些大规模癌症数据,因而在面对这些极其有价值的公共数据时,往往心有余而力不足。作为医学信息领域研究者,我们需要将信息学和统计学知识运用到癌症公共数据分析的研究当中,作为连接大数据与肿瘤研究者之间的一个纽带,帮助研究者去更好地挖掘利用这些数据。


【课程内容、目标与特色】

本次提供了一次系统了解TCGA、GEO和SEER数据产生,糅合、分析及挖掘的课程,使基础医学和临床医学研究者能更好地挖掘这些公共数据,以便为自身科研项目服务。本次涵盖拟解决的问题包括:

1、免费获取并安装R语言、genespring及cytoscape软件;

2、将系统了解芯片分析相关知识,轻松完成GEO数据库中各种芯片类型数据的分析;

3、结合文章实例和实战经验,熟悉数据挖掘文章等的高级分析思路,详细学习数据挖掘下游关键技能,例如掌握GSEA富集分析方法和构建WGCNA共表达网络等;

4、了解TCGA数据库,掌握高通量测序的基本原理和使用各类测序数据(mRNA, miRNA, 蛋白, 甲基化,拷贝数等);

5、SEER数据库的基本情况、获取方式、数据库结构及基本统计方法。6、近年来国内外基于TCGA和SEER数据挖掘的经典案例,重点对基于TCGA和SEER数据库的数据挖掘和课题设计进行讨论。


【授课老师】

本次邀请两位主讲老师。一位来自浙大医学院生物信息老师,另一位是三甲医院临床医生。两位授课老师将分别从数据挖掘下游高级分析和SCI文章思路对这些数据进行分析,并从临床角度出发,把测序数据与临床资料整合,为临床医生提供科研思路,为自身科研服务。


【课程安排】

第一天上午:数据挖掘在医学科研中的应用以及R语言的快速入门

1.TCGA、GEO和SEER数据库在医学科研中的应用;

2.R语言简介、安装、及快速入门方法和操作;

3.利用R语言提取以上数据库的信息;

4.使用R语言进行绘图:火山图、柱状图、聚类图、热图、气泡图和KM生存曲线等常见科研图表。

 

第一天下午:数据挖掘下游高级分析方法的介绍和使用

1.测序的基本原理、数据格式、分析流程的介绍

2.Genespring软件和R语言的基因差异分析比较

3.常见富集分析方法的介绍及高级GSEA算法的使用

4.Cytoscape软件构建分子调控网络及高级WGCNA共表达分析的使用

 

第二天上午:SEER数据库的介绍及应用

1. SEER数据库入门(软件安装、数据获取、数据检索)

2. 基于SEER数据库发表文章的思路解析

3. 上机操作实战:SEER数据库注册、数据获得、处理和分析

4  还原一篇基于SEER数据库发表文章的统计分析流程

第二天下午:基于TCGA和SEER数据的转化医学课题探索

1. 如何利用TCGA进行数据挖掘及临床转化课题设计

2. 基于TCGA数据挖掘文章的深度解析(偏向临床)

3. 整合TCGA和SEER数据进行数据挖掘及临床转化

4. 上机操作实战:基于发表文章的TCGA数据分析作图实例

 

时间地点

时间:2019年3月23-24日周六 周日

地点:田林宾馆 上海市徐汇区田林路1号

【住宿说明】

上海:田林宾馆单间或标间为380元/间或450元/间 (现场根据实际情况安排) 

说明:酒店非强行指定,您可自订酒店,

【注册费用】

3200元/人。授课期间发放纸质邀请函(盖章)和发票。按交费先后顺序确定座位号。会务期间提供午餐,晚餐自理。


报名邮箱 exosomewy@163.com

回执表

单位名称


邮编


单位地址


姓  名

性  别

学员邮箱

手  机

研究方向

导师邮箱































发票抬头

(务必填写正确、不清楚为空)

 注册费

大写:    万    千    百    十    元整

小写:        (不含住宿费)

住宿说明请标红或打√

£  否£

住宿要求

单人住□  和本单位人拼房合住□   和其他单位学员拼房合住□

备注



标签
推荐