|
一、课程概况(Course Brief ) 二、内容简介(Intruduction) 三、教学大纲(Syllabus) 1、课堂讲授部分的教学内容与要求(Teaching
Plan and Contents) 1、教学目的与课程性质、任务 七、生物类相关软件 Bio-Softwares 如 WinClone 十、eBook: Bioinformatics: Sequence and Genome Analysis (pdf format) |
|
|
课程编号: 课程总学时:54 (其中理论:36, 上机:18) 课程学分:3 课程分类:生科院硕士研究生必修课 开设学期:秋季 开课单位:生科院 适用专业:生科院 生物化学及分子生物学 专业 所需先修课:生物化学,分子生物学 课程主讲人:李劲 |
|
|
生物信息学是一门交叉学科,是现代生物学研究的重要工具。本课程系统地概括了该学科的核心内容,包括生物学数据的获得与处理,数据库的内容、结构及数据的检索方式,序列比对的概念,基因组序列的注释,系统发生学,结构生物信息学,芯片及蛋白质组的数据分析以及生物信息学中的计算机环境等主要内容。 |
|
|
1、课堂讲授部分教学内容与要求(20学时)(Teaching Plan and Contents) 第一章 绪论 (2学时) 生物信息学的概念、发展简史及其研究的范围。生物信息学与Internet的关系以及WWW上的生物信息学的门户站点。
第二章 数据的获取 (2学时) 讲述DNA、RNA及蛋白质的测序方法与原理;蛋白质结构的解析;基因及蛋白质的表达数据的获取以及蛋白质互作数据的获取。
第三章 数据库的内容、结构及注释 (2学时) 文件格式、注释序列数据库、基因组数据库及特定生物数据库、其他类型数据库。
第四章 生物数据的检索 (2学时) 利用Entrez及SRS工具检索数据。
讲述序列的相似性比对原则,氨基酸替换矩阵,数据库搜索工具FASTA及BLAST,序列过滤(序列屏蔽)及多序列比对。 第六章 RNA的二级结构预测(2学时) 讲述RNA的二级结构特征,RNA的二级结构的预测方法和局限性.
第七章 系统发生学(2学时) 讲述多序列比对与家族关系,蛋白质家族及模式数据库(pattern database),蛋白质结构域家族(domain families);系统发育学,遗传分类学及存在论(phylogenetics, cladistics and ontology),系统发育树的建立,生物大分子序列的进化 第八章 蛋白质结构生物学(1) (2)(4学时) 讲述蛋白质三维结构与功能之间的关系,蛋白质结构与功能的进化,蛋白质结构的预测
第九章 芯片数据分析 (2学时) 微阵列数据的分析方法,微阵列数据的分析工具及数据来源,序列样品及SAGE(基因表达系列分析)。
第十章 蛋白质组数据分析 (2学时) 分析由二维凝胶电泳产生的数据,蛋白质质谱数据分析。
第十一章 高阶模型 分子途径的建模与重建,蛋白质互作生物信息学,高阶模型。
第十二章 制药业的生物信息学 生物信息学与药物发现,药物信息学资源。
第十三章 生物信息学中的基本计算机技术及生物类软件的使用 (4学时) |
|
|
|
|
|
2、上机实验、实习部分的教学内容与要求(共18学时)(Experiments) 实验报告发送email至 jinli62@126.com
,主题栏标明"XXX-实验报告". (一) A. 国际与国内的生物信息中心(3学时) 目的:了解生物信息学的各大门户网站以及其中的主要资源。 内容:国际NCBI、EBI、ExPASy,EMBL、SIB、TIGR以及国内CBI、BioSino网站的熟悉及内容的了解。
人类着丝粒通常含有长度为170bp被称为阿尔法卫星序列的重复序列(X07685),一共长达几千个碱基对。 首先在核酸数据库中查询阿尔法卫星序列(X07685);再对非冗余数据库进行blastn搜索,观察结果; 然后,在“Entrez Query”项下键入“satellite NOT human [organism]”,将搜索对象限制为非人类, 并在结果的“Alignments” 栏中点击“Distance tree of results”,得到距离进化树。结果贴入Word 文档并作说明。 (二) 数据库内容、结构与注释的浏览(3学时) 目的:了解主要数据库的内容及结构,理解各数据库注释的含义。 内容:在NCBI的ENTREZ、EBI的SRS、SWISS-PROT及PIR上查询HBA1(human hemoglobin, alpha 1)的DNA(Genebank注释内容)和蛋白质序列(注释内容及三维结构图),以及相关序列(mRNA)的多重比对结果和进化树(注释内容、blast和进化树),熟悉数据库记录的结构,学会看懂其中的注释。下载Cn3D-4.1.msi(官方)并安装,在NCBI数据库下载HBA1结构文件(val格式)并演示.用"Alt + PrintScreen"截图并贴入WORD文档. 要求:实验报告,解释查出的给定序列或基因组数据,及多重比对结果和进化树的含义。 存储相关网页及中文说明文档,用WinRar打包,email递交.
(三)多序列比对和进化树的构建(3学时) 目的:掌握NCBI Entrez、EBI SRS两种数据库检索工具。学习序列比对工具BLAST、FASTA以及ClustalW等的使用,能够对序列数据进行初步的分析并绘制进化树。 内容:利用 对象的gb/gi信息进行直接序列查询,并学会如何根据需要保存结果并进行文件格式的转换。用Clustal-X进行多序列比对和进化树的构建,并对结果 进行解释与分析。 要求:实验报告,根据给定对象的gb/gi信息进行序列查找,保存/转换记录为GeneBank和FASTA格式。多序列比对结果(2页)和进化树的PDF截图,并对结果 进行解释与分析。具体说明。
(四)利用PrimerPremier5软件设计HPV-16 E6 E7基因的扩增引物(3学时) 目的:学习引物设计软件PrimerPremier5的基本使用方法。 内容:1.从NCBI的数据库 查出HPV-16的E6 E7基因并存为plain text记事本格式。 2.下载并安装PrimerPremier5,导入Key,激活软件. 3.打开E6 E7基因序列,显示双链格式.翻译为蛋白序列.找出motif和酶切位点. 4.进行primer search,找出"sense"、"antisense"及"pairs"最合适的引物(对). 5. 下载并安装Oligo 6,载入破解文件,评价设计的引物。具体说明。 6.选出的primer序列针对人的全基因组进行BLAST同源比对搜索,以剔除非特异结合 的引物序列:www.ncbi.nlm.nih.gov/sutils/genom_table.cgi?organism=euk 要求:实验报告,将查出的DNA及蛋白序列(及gb/gi号)、motif、酶切位点、 primer search结果、Oligo 6评价引物的结果和最合适的引物(对),贴入WORD文档
(五)运用DNAMAN-5软件分析APV核酸序列,预测其结构基因、RNA二级结构和编码蛋白并 作其环型基因组图(3学时) 目的:学会运用DNAMAN-5软件进行核酸序列 及编码蛋白预测分析和全基因组图的绘制。 内容: 1.下载并安装DNAMAN-5软件和其破解文件(patch). 2.利用NCBI搜寻并下载APV-1(avain polyomavirus 1)基因组序列和线性基因组图. 3.用DNAMAN-5的"File"之"Open"APV-1的基因序列(APV-1.txt)并全选其序列, 用"Edit"之"Format"下"Sequence"改DNA序列格式为 7column及10characters/column. 4.根据APV-1线性基因组图的Intron-1,Intron-2a和Intron-4的位置标示,除去相应的DNA 序列并重做第3步格式化.全选其序列. 5.用"Sequence"之"Load Sequence"下"From Selection"载入新拼接后的APV DNA序列. 6.选取264-974 DNA序列并复制,"Sequence"之"Secondary Structure"下 "Current Sequence" ,并贴入264-974 DNA序列.结果存为emf格式. 7.全选序列条件下,"Protein"之"Translation Overview";新窗口左上角"Options"之 "Minimum length"为150. 点击各蛋白,可见其序列。从上至下分别为VP1,VP2/3, Agno 1a和T-Ag.结果存为emf格式. 8."Restriction"之"Restriction Analysis".除左侧4和6项外,点选各项,5项为"1".下一步 全选各限制性内切酶. 9.连击新窗口左上角空白处."General"之"Map Name"为APV-1; "Elements"之4组数分 别用"Change"键改"Name"为Agno 1a, VP2/3, VP1和T-Ag.对应"Start"和"end"分别为 290-818, 837-1860, 1759-2788和4415-2849. "Type"点击为箭头形式. 10."Site"中"Remove" Hind III和在图上过于拥挤的酶."Sequence View"中调整字体大小 和颜色.在图上可用鼠标调整图文位置.结果存为emf格式. 要求:实验报告,全部结果用WORD文档记录/插入并对结果 作必要说明。 (六)人基因组的基因分析(3学时) 目的:了解人基因组相关数据库的 组成和结构,并学会运用人基因组相关数据库构进行 人类基因的分析。 内容: WT1是人类Wilms癌症的抑制基因并且对肾的发育也很重要。在这个基因中是否有 一些SNPs? 并且它们是否对蛋白序列有选择性? WT1编码蛋白突变区的分布是怎样的? 要求:实验报告,记录并回答全部问题,用WORD文档提交。
SNP介绍:
|
|
|
3、教材及主要参考书(Text Book and References) 教材:D.R.Westhead, J.H.Parish & R.M.Twyman 《Bioinformatics》影印本,科学出版社,2004年第1版。 主要参考书: 黄韧等 《生物信息学网络资源与应用》中山大学出版社,2003 郝柏林等编 《生物信息学手册》第2版,上海科学技术出版社,2002 蒋彦等编 《基础生物信息学及应用》清华大学出版社,2003 罗静初等译 《生物信息学概论》北京大学出版社,2002 赵国屏等编 《生物信息学》科学出版社,2002 袁建刚等主译 《基因组》 科学出版社,2002 孙超等译 《生物信息学中的计算机技术》中国电力出版社,2002 David
W.Mount 《Bioinformatics
:sequence and genome analysis》影印本,科学出版社,2002. |
|
|
在教材各章讲述时及时安排实验,完成实验报告,并留若干思考题,在教师的督导下进行小组间的交流。教师对学生出现的普遍性问题及时给予辅导、解答。 |
|
|
四、教学大纲说明(Syllabus Explanation) 生物信息学是一门新兴的交叉学科,是现代生物学研究的重要工具。即便是实验生物学家,也非常有必要了解一些生物信息学的知识。本门课程的开设正是为了使学生了解目前生物信息学学科的研究内容和发展方向,培养学生具有生物信息学方面的理论基础和基本技能,并且能够运用所掌握的生物信息学理论、方法和技术初步解决科研和实际工作中生物信息的存储、检索、分析和利用的问题。本课程是生科院本科生的选修课程。
本课程全面系统地概括了生物信息学这一学科的核心内容,主要包括了生物学数据的获得与处理,数据库的内容、结构及数据的检索方式,序列比对的概念,基因组序列的注释,系统发生学,结构生物信息学,芯片及蛋白质组的数据分析以及生物信息学中的计算机环境等内容,将学生的相关知识系统化。课程的重点主要在实际应用上,包括各种对数据库的查询检索方法、数据库记录内容的理解,网上数据分析预测工具的使用等。由于生物信息学涉及的很多技术方法后面都会有相当复杂的数学、统计学或计算机技术做支持,因此如何理解不同种类的专用术语以基本概念是教学中的一大难点。本课程要求在本科生能够理解的前题下进行原理及基本概念的讲述,强调动手能力,在实验中激发学生的求知欲。
在课堂讲授方式上,力求深入浅出、形象生动,贯穿分析、综合的方法,并尽可能综合采用幻灯、图表和网上实例以达到简明扼要、直观明了、易于理解的目的。 实验是本课程的主要教学环节。本着理论与实践相结合,学以致用的原则,在实验教学中,一般提供思考题,将各个基本分析环节串在一起,以提高学生综合分析问题和解决实际问题的能力。 |
|