当前位置:文档之家› 生物信息学常用基本词汇表

生物信息学常用基本词汇表

生物信息学常用基本词汇表
生物信息学常用基本词汇表

生物信息学常用基本词汇表

C

D

E

G

H

I

K

L

M

P

附录1常用基本词汇表

附录1 常用基本词汇表 英文名词中文名词解释 A(Adenine)腺嘌呤作为碱基的两种嘌呤中的一种。 active site活化位点蛋白质三维表面催化作用发生的区域。 alignment比对为了确定两个同源核酸或蛋白质序列的累计差 异而进行的配对称为比对。 alignment of alignments比对的比对即比对的对象不是简单的序列,而是序列的比 对。 alleles等位基因一个基因的不同版本。 alpha carbonα碳在氨基酸中与侧链(R-基团)相连的中心碳原子。 alternative splicing可变剪接从一个单独的hnRNA生成两个或多个mRNA 分子的过程。 amino terminus (N-terminal)氨基端(N端)在一个多肽中,具有自由氨基的分子端,对应 于基因的5’-端。 anti-parallel反向平行表示相反的方向;在双链DNA中,这意味着如果 一条链是5' 到3'的,则其互补链方向是3' 到 5'的。 backbone (of an amino acid) (氨基酸的)骨架包含一个氨基,一个α碳和一个羧酸或羧基。base pair 碱基对(1)在双链DNA中嘌呤和嘧啶之间的相互作用 (特别指A和T之间,G和C之间);(2)双链 DNA序列长度的基本单位。 beta turnsβ转角在反向平行的β折叠片中,当β链反转方向的时 候蛋白质内部形成的U型结构。 Bioinformatics 生物信息学应用信息科学的理论、方法和技术,管理、分析 和利用生物分子数据。 Biocomputing生物计算本书中特指用计算机技术分析和处理生物分子 数据。

生物信息学软件及使用概述

生物信息学软件及使 刘吉平 liujiping@https://www.doczj.com/doc/7c17694615.html, 用概述 生 物秀-专心做生物! w w w .b b i o o .c o m

生物信息学是一门新兴的交叉学生物信息学的概念: 科,它将数学和计算机知识应用于生物学,以获取、加工、存储、分类、检索与分析生物大分子的信息,从而理解这些信息的生物学意义。 生 物秀-专心做生物! w w w .b b i o o .c o m

分析和处理实验数据和公共数据,生物信息学软件主要功能 1.2.提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验 3.实验数据的自动化管理 4.寻找、预测新基因及其结构、功能 5.蛋白质高级结构及功能预测(三维建模,目前研究的焦点和难点) 生 物秀-专心做生物! w w w .b b i o o .c o m

功能1. 分析和处理实验数据和公共数据,加快研究进度,缩短科研时间 ?核酸:序列同源性比较,分子进化树构建,结构信息分析,包括基元(Motif)、酶切点、重复片断、碱基组成和分布、开放阅读框(ORF ),蛋白编码区(CDS )及外显子预测、RNA 二级结构预测、DNA 片段的拼接; ?蛋白:序列同源性比较,结构信息分析(包括Motif ,限制酶切点,内部重复序列的查找,氨基酸残基组成及其亲水性及疏水性分析),等电点及二级结构预测等等; ?本地序列与公共序列的联接,成果扩大。 生 物秀-专心做生物! w w w .b b i o o .c o m

Antheprot 5.0 Dot Plot 点阵图 Dot plot 点阵图能够揭示多个局部相似性的复杂关系 生 物秀-专心做生物! w w w .b b i o o .c o m

计算机英语常用词汇

计算机英语常用词汇(计算机科学版)2009-04-18 10:16:24 分类: (一个进程的)激活activation(of a procedure) 活动服务器界面Active Server Pages,ASP 角色Actors 实参actual parameter Ada(一种基于pascal的程序设计语言) 自适应词典编码adaptive dictionary encoding 适配器模式adaptor pattern (存储单元的)地址address(of memory cell) 地址多项式address polynomial Adleman,Leonard 管理员administrator Adobe系统Adobe Systems 代理agent Alexander,Christopher 代数编码理论Algebraic coding theory 算法algorithm 算法的发现discovery of 算法的有效性/正确性complexity / efficiency of 算法的表示representation of 算法的检验verification of 算法分析algorithm analysis 反网络域名抢注消费者保护法案the Anticybersquatting Consumer Protection Act 防病毒软件antivirus software APL A Programming Language的缩写,是用于远程终端的一种程序语言 苹果计算机公司Apple Computer,Inc. Applet(Java程序) 应用层(因特网)application layer 应用编程接口(API)Application Programmer Interface 应用软件Application software 谓词的变元argument(of a predicate) 亚里斯多德(Aristotle) 移位Arithmetic shift 数组Array 异构数组heterogeneous 同构数组homogeneous 人工智能Artificial intelligence 人工神经网络Artificial neural network ASCII.参见美国信息交换标准码 Asimo机器人 ASP见活动服务器界面 汇编程序Assembler 汇编语言Assembly language

生物信息学简介范文

1、简介 生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。 具体而言,生物信息学作为一门新的学科领域,它是把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。基因组信息学,蛋白质空间结构模拟以及药物设计构成了生物信息学的3个重要组成部分。从生物信息学研究的具体内容上看,生物信息学应包括这3个主要部分:(1)新算法和统计学方法研究;(2)各类数据的分析和解释;(3)研制有效利用和管理数据新工具。 生物信息学是一门利用计算机技术研究生物系统之规律的学科。 目前的生物信息学基本上只是分子生物学与信息技术(尤其是因特网技术)的结合体。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。 1990年代以来,伴随着各种基因组测序计划的展开和分子结构测定技术的突破和Internet的普及,数以百计的生物学数据库如雨后春笋般迅速出现和成长。对生物信息学工作者提出了严峻的挑战:数以亿计的ACGT序列中包涵着什么信息?基因组中的这些信息怎样控制有机体的发育?基因组本身又是怎样进化的? 生物信息学的另一个挑战是从蛋白质的氨基酸序列预测蛋白质结构。这个难题已困扰理论生物学家达半个多世纪,如今找到问题答案要求正变得日益迫切。诺贝尔奖获得者W. Gilbert在1991年曾经指出:“传统生物学解决问题的方式是实验的。现在,基于全部基因都将知晓,并以电子可操作的方式驻留在数据库中,新的生物学研究模式的出发点应是理论的。一个科学家将从理论推测出发,然后再回到实验中去,追踪或验证这些理论假设”。 生物信息学的主要研究方向:基因组学- 蛋白质组学- 系统生物学- 比较基因组学,1989年在美国举办生物化学系统论与生物数学的计算机模型国际会议,生物信息学发展到了计算生物学、计算系统生物学的时代。 姑且不去引用生物信息学冗长的定义,以通俗的语言阐述其核心应用即是:随着包括人类基因组计划在内的生物基因组测序工程的里程碑式的进展,由此产生的包括生物体生老病死的生物数据以前所未有的速度递增,目前已达到每14个月翻一番的速度。同时随着互联网的普及,数以百计的生物学数据库如雨后春笋般迅速出现和成长。然而这些仅仅是原始生物信息的获取,是生物信息学产业发展的初组阶段,这一阶段的生物信息学企业大都以出售生物数据库为生。以人类基因组测序而闻名的塞莱拉公司即是这一阶段的成功代表。 原始的生物信息资源挖掘出来后,生命科学工作者面临着严峻的挑战:数以亿计的ACGT序列中包涵着什么信息?基因组中的这些信息怎样控制有机体的发育?基因组本身又是怎样进化的?生物信息学产业的高级阶段体现于此,人类从此进入了以生物信息学为中心的后基因组时代。结合生物信息学的新药创新工程即是这一阶段的典型应用。 2、发展简介 生物信息学是建立在分子生物学的基础上的,因此,要了解生物信息学,就必须先对分子生物学的发展有一个简单的了解。研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:基因是以生物成分存在,1871年Miescher从死的白细胞核中分离出脱氧核糖核酸(DNA),在Avery和McCarty于1944年证明了DNA是生命器官的遗传物质以前,人们仍然认为染色体蛋白质携带基因,而DNA是一个次要的角色。1944年Chargaff发现了著名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧定的量总是相等,腺嘌呤与胸腺嘧啶的量相等。与此同时,Wilkins与Franklin用X射线衍射技术测

高通量测序基础知识

高通量测序基础知识简介 陆桂 什么是高通量测序? 高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变,一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又被称为深度测序(Deep sequencing)。 什么是Sanger法测序(一代测序) Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。 什么是基因组重测序(Genome Re-sequencing) 全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。 什么是de novo测序 de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。获得一个物种的全基因组序列是加快对此物种了解的重要捷径。随着新一代测序技术的飞速发展,基因组测序所需的成本和时间较传统技术都大大降低,大规模基因组测序渐入佳境,基因组学研究也迎来新的发展契机和革命性突破。利用新一代高通量、高效率测序技术以及强大的生物信息分析能力,可以高效、低成本地测定并分析所有生物的基因组序列。 什么是外显子测序(whole exon sequencing) 外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大的优势,但无法研究基因组结构变异如染色体断裂重组等。

生物信息学英语词汇表

生物信息学常用词语英汉对照表 核酸nucleic acid 核苷酸nucleotide 碱基对base pair 蛋白质protein 酶enzyme 糖sugar 脂类lipid 配体ligand 器官organ 组织tissue 细胞cells 亚细胞subcellular 细胞壁cell wall 细胞膜cell membrane 细胞质cytoplasm 细胞核nucleus 细胞器cell organelle 叶绿体chloroplasts 线粒体mitochondrion 液泡vacuole 染色体chromosome 肽peptide 序列sequence 结构structure α-螺旋alpha helix β-折叠片beta sheet β-转角beta turn 无规卷曲random coil 结构域domain 亚基subunit 二硫键disulfide bond 功能function 数据data 数据库database 链接link 基因gene 基因组genome 转录transcription 翻译translation 逆转录reverse transcription 生物信息学bioinformatics 亲水hydrophilic

疏水hydrophobic 氨基酸amino acids 极性氨基酸polar amino acids 碱性氨基酸basic amino acids 酸性氨基酸acidic amino acids 信号肽signal peptide 酶切enzyme digestion 限制性内切 酶 restriction enzyme 密码子codon 启动子promoter 外显子exon 内含子intron 预测predict 提交submit 对齐alignment 文件file 保存save 编辑edit 另存为save as 复制copy 粘贴paste 剪切cut 删除delete 插入insert 替换replace 查找search 反向互补链reverse complementary chain 单链single strand 双链double strand 分子量molecular weight 植物plant 真菌fungus 病毒viruses 细菌bacteria 哺乳动物mammal 脊椎动物vertebrate 无脊椎动物invertebrate 昆虫insect 双子叶植物dicot 单子叶植物monocot 编码区codon sequence/cds 非翻译区untranslation region/utr 注释annotation 保守区组块block

医学信息学基本概念与定义-医学信息学基本概念(精)

医学信息学基本概念 J C Wyatt, J L Y Liu. 文研究生周琴译导师许培扬审 摘要:本文是关于医学信息学,这门年轻的学科的术语的定义汇编。希望它对行业内的初学者与职业工作者能有所益处。 关键词:医学信息学词汇表 医学信息学主要研究与应用方法去改善对病人信息、临床知识、人口信息和其它与病人康复与公共卫生有关的信息的管理。它是一门伴随19世纪40年代数字计算机的出现而产生的年轻学科。用于医学的机械性计算起源于更早的年代,在19世纪,赫尔曼霍列瑞斯的“打卡数字处理系统”即开始用于美国人口普查,随后又被用于公共卫生与流行病学调查1。此例反应了医学信息学的多学科性,它与各个不同的领域都有相关性,包含临床医学、公共卫生学(如流行病学与卫生服务研究)、认知科学、计算和信息学。 由于医学信息学工作者的领域多样,新来者很容易混淆行业的专业术语。因此,对想更多了解医学信息学的人做一个医学信息学的基本概念的介绍是有用的。近几年,关于此学科的各种不同分支开始出现,包括公共卫生信息学、用户卫生信息学与临床信息学。对于医学信息学与它的分支学科是否是不同的学科的讨论,Shortliffe 和Ozbolt认为:“信息学的基础是一系列可重复利用与广泛应用的方法,它对所有的卫生学学科都适用,并且‘医学信息学’对于一个综合性核心学科是一个有用的概念,所有的学生都应该学习,不管这些学生的医学专业方向。”2 3以下对医学信息学的分支学科的定义反应了这一理念。 挑选医学信息学术语的标准,在挑选某术语时采用了以下一条或者多条原则: ●对流行病学家和公共卫生专家而言是新出现的词语。 ●一个有众所周知含义的术语,被用于医学信息学领域的具体方面。 ●与流行病学或公共卫生相关的概念。 ●对理解医学信息学必不可少的概念。 ●一个存在时间较长,而不是过渡性的专业术语。 ●在对此术语的意义与使用上有普遍的共识。

AP生物学词汇

AP生物学词汇 Unit 1 The Chemistry of Life 生命中的化学 ionic bonding 离子键covalent bonding 共价键hydrogen bonding 氢键 polar, (non polar)molecule 极性(非极性)分子monomer 单体polymer 多聚物functional group (有机化学中的)功能团 carbohydrate 糖类,碳水化合物protein 蛋白质 lipid 脂类nucleic acid 核酸 DNA 脱氧核糖核酸RNA 核糖核酸enzyme 生物酶 activation energy 反应起始需要的能量 Enzymes 酶metabolism 新陈代谢Hydrophobic 疏水的Hydrophilic 亲水的Vinegar 血浆miscible 互溶的 Biome 群落isomers 同分异构 Cis-trans isomers顺反异构体enantiomers 对映异构体Calorimeter 热量计monosaccharides 果糖Disaccharides 二糖polysaccharide 多糖Glucose 葡萄galactose半乳糖 Fructose 果maltose 麦芽 Lactose 乳sucrose 蔗 Cellulose 纤维素starch 淀粉 Chitin几丁质, 壳质,角素; glycogen 糖原 Glycerol 甘油carboxyl 烃基Testosterone 雄激素estradiol 雌激素Cholesterol 胆固醇phospholipids 磷脂Polymers 聚合物polypeptides 多肽Fibrous 纤维chaperone 伴侣

高中英语单词表(外研社)

GLOSSARY OF BOOK 5 Module 1 1. have …in common 有相同的特点 2. linguist [?li?gwist] n. 语言学家 3. make a difference 有影响,使不相同 4. accent [??ks?nt] n. 口音 5. obvious [??bvi?s] adj. 显然的;显而易见的 6. motorway [?m?ut??wei] n.(英)高速公路 7. underground [??nd?ɡraund] n.(英)地铁 8. subway [?s?bwei] n.(美)地铁 9. get around 四处走动(旅行) 10. flashlight [?fl???lait] n.(美)手电筒;火把 11. queue [kju:] vi.(英)排队(等候) 12. confusing [k?n?fju:zi?] adj. 令人困惑的;难懂的 13. preposition [?prep??zi??n] n. 介词 14. compare [k?m?p??] vt. 比较 15. omit [?u?mit] vt. 省略 16. variety [v??rai?ti] n. 种类 17. differ [?dif?] vi. 不同;有区别 18. settler [?setl?] n. 移民;定居者 19. be similar to 与……相似 20. remark [ri?mɑ:k] n. 评论;讲话 21. variation [?ve?ri?ei?(?)n] n. 变化 22. have difficulty (in) doing sth. 做某事有困难 23. steadily [?stedili] adv. 不断地;持续地 24. satellite [?s?t?lait] n. 卫星 25. flick [flik] n. 轻打;轻弹;抖动 26. switch [swit?] n. 开关 27. lead to 引起;导致 28. structure [?str?kt??] n. 结构;体系 29. rapidly [?r?pidli] adv. 迅速地 30. announcement [??naunsm?nt] n. 声明;宣告 31. linguistics [li??gwistiks] n. 语言学 32. edition [i?di??n] n.(广播、电视节目的)期;版33. cute [kju:t] adj. 逗人喜爱的 34. add [?d] vt. 加;增加 35. in favour of 同意;支持 36. present [?prez?nt] vt. 陈述;提出(观点、计划等) 37. refer to ... as …称……为…… 38. attempt [??tempt] n. 努力;尝试 39. simplify [?simplifai] vt. 简化 40. combination [?k?mbi?nei??n] n. 组合;结合 41. thanks to 幸亏,多亏 42. distinctive [dis?ti?ktiv] adj. 与众不同的 43. look [luk] n. 外观;外表;样子 44. criticize [?kritisaiz] vt. 批评 45. standard [?st?nd?d] adj. 标准的 46. reference [?refr?ns] n. 参考;查阅 Module 2 47. intellectual [?inti?lektju?l] adj. 脑力的;思维的,需用才智的 48. satisfying [?s?tisfaii?] adj. 令人满意的

生物信息学名词解释

1.计算生物信息学(Computational Bioinformatics)是生命科学与计算机科学、数理科学、化学等领域相互交叉而形成的一门新兴学科,以生物数据作为研究对象,研究理论模型和计算方法,开发分析工具,进而达到揭示这些数据蕴含的生物学意义的目的。 2.油包水PCR (Emulsion PCR) : 1) DNA片段和捕获磁珠混合; 2) 矿物油和水相的剧烈震荡产生油包水环境; 3) DNA片段在油包水环境中扩增;4) 破油并富集有效扩增磁珠。 3.双碱基编码技术:在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能。代表测序方法:solid 测序。 4.焦磷酸测序法:焦磷酸测序技术是由4种酶催化的同一反应体系中的酶级联化学发光反应,适于对已知的短序列的测序分析,其可重复性和精确性能与SangerDNA测序法相媲美,而速度却大大的提高。焦磷酸测序技术不需要凝胶电泳,也不需要对DNA样品进行任何特殊形式的标记和染色,具备同时对大量样品进行测序分析的能力。在单核苷酸多态性、病原微生物快速鉴定、病因学和法医鉴定研究等方面有着越来越广泛的应用。例如:454测序仪 :用蛋白质序列查找核苷酸序列。 :STS是序列标记位点(sequence-tagged site)的缩写,是指染色体上位置已定的、核苷酸序列已知的、且在基因组中只有一份拷贝的DNA短片断,一般长200bp -500bp。它可用PCR方法加以验证。将不同的STS依照它们在染色体上的位置依次排列构建的图为STS图。在基因组作图和测序研究时,当各个实验室发表其DNA测序数据或构建成的物理图时,可用STS来加以鉴定和验证,并确定这些测序的DNA片段在染色体上的位置;还有利于汇集分析各实验室发表的数据和资料,保证作图和测序的准确性。 :表达序列标签技术(EST,Expressed Sequence Tags)EST技术直接起源于人类基因组计划。 :生物信息学数据库。UniGene试图通过计算机程序对GeneBank中的序列数据进行适当处理,剔除冗余部分,将同一基因的序列,包括EST序列片段搜集到一起,以便研究基因的转录图谱。UniGene除了包括人的基因外,也包括小鼠、大鼠等其它模式生物的基因。 :开放阅读框(ORF,open reading frame )是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。编码一个蛋白质的外显子连接成为一个连续的ORF。 10.分子钟检验:只有分子钟的,没听过分子钟检验。一种关于分子进化的假说,认为两个物种的同源基因之间的差异程度与它们的共同祖先的存在时间(即两者的分歧时间)有一定的数量关系

CADD药物信息学基本知识

药物信息学初步 1药物信息学: a药物信息学是有关药物研究和开发过程中所涉及的大量小分子、大分子及其相互作用信息的学科。 b药物信息学,简单说来就是化学信息学和生物信息学的加和。 c也包括类药性、药物代谢动力学性质和毒性预测、药靶预测、高内涵筛选及代谢模型等综合信息在新药发现和发展中的整合、分析和应用。 2化学信息学与生物信息学 ?化学信息学(Chemoinformatics,Chemical Informatics),简而言之,一切与小分子化合物有关的计算机操作和运算都属于化学信息学的研究范畴,包括小分子的结构、构象、能量、性质等,也包括小分子与大分子的相互作用,还包括小分子的设计。 ?化学信息学的研究已有较长的历史,比如1960年代出现的QSAR,但作为学科名词1998年才首次出现。 ?与之相对的是生物信息学(Bioinformatics或Biological Informatics)。生物信息学是随着人类基因组计划的实施而出现的,最初仅是指对基因组序列的比较分析。但现在已发展到既对生物大分子的序列、也对生物大分子的结构、构象进行研究。针对生物大分子结构、功能等的计算研究,叫做计算生物学(Computational Biology)。 3 化学信息学在药物设计中的主要应用 ●虚拟组合化学库的设计; ●化合物数据库的相似性分析与多样性分析; ●化合物数据库的类药性分析、ADMET性质预测; ●化合物数据库的虚拟筛选; ●。。。 4 为什么要进行ADMET预测 ●ADMET是候选药物临床研究失败的主要原因(占60%)。 ●ADMET评估已成药物研发的关键,需尽早进行。 ●由于ADMET涉及药物体内过程,因此评估非常困难。 ●实验评价ADMET缺点:代价大、周期长,一般在临床前研究阶段才开始进行,且动物数据与人体数据并 不完全一致。 ●计算机预测ADMET优点:代价低、速度快,可以在化合物合成之前进行,也可以与先导物优化一起进行, 这样可将理论上具有不良ADMET性质的分子尽早排除,从而降低失败率。 5 ADMET预测的基本要求 ●要有大量可靠的实验数据供使用; ●要有合适的方式对分子结构进行表达; ●要有合适的建模方法及评价指标。 6 常规ADMET预测方法 ●分子结构采用分子描述符进行表达;分子描述符与性质之间采用统计回归分析方法建立预测模型。 ●存在的问题:分子描述符是间接描述分子,具有计算繁杂、数据可能不准确,数量众多而难以取舍,模型 可解释性差等问题。 7 基于子结构模式识别的ADMET预测方法 ●新方法:分子结构采用分子指纹进行表达;分子指纹与性质之间采用机器学习方法建立预测模型。 ●优点:跳过分子描述符而直接从分子结构出发来预测分子性质,提高了预测精度;采用信息增益技术识别 关键子结构,建立的模型具有可解释性;等等。 8生物信息学在药物设计中的应用 ●药物作用新靶标的发现与确证: ?人体内靶标 ?病原体内靶标 ●蛋白质序列比较、分析;蛋白质结构相似性比较、同源蛋白的识别。 ●蛋白质二级结构与三维结构的预测。 9 序列比对(sequence alignment) ●序列比对指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短横线“-”表示)。

生物免疫学英文词汇汇总学习---

医学免疫学英中文词汇 A accessibility易接近性 acetylcholine,Ach 乙酰胆碱 acquired immune deficiency syndrome,AIDS获得性免疫缺陷综合征(艾滋病) acquired tolerance 获得性免疫耐受 activation-induced cell death,AICD,活化诱导的细胞凋亡 active immunotherapy主动免疫疗法 acute phase protein,APP急性期蛋白 acute rejection急性排斥反应 acute vascular rejection,AVR急性血管性排斥 adaptive immune system适应性免疫系统 adaptive immunity 适应性免疫 adenosine deaminase,ADA腺苷脱氨酶 adhesion molecule, AM黏附分子 adjuvant佐剂 adoptive immunity 过继免疫 adult thymectomy, AT成年胸腺切除术 affinity亲和力 affinity maturation(抗体)亲 和力成熟 agglutination凝集 反应 alkaline phosphatase,AP碱 性磷酸酶 allergen变应原 allergic inflammation,AI变 态反应炎症 alloantigen同种异 型抗原 allograft同种异基 因移植 allotype同种异型 alpha-fetoprotein, √廿P甲胎球蛋白 alternative pathway 旁路(替代)途径 anaphylatoxin过敏 毒素 anaphylaxis过敏反 应 ankylosing spondylitis,AS强直 性脊柱炎 antibody dependent cell-mediated cytotoxicity,ADCC 抗体依赖性细胞介 导的细胞毒作用 antibody,Ab抗体, antigen presentation抗原提 呈 antigen presenting cell,APC抗原提呈 细胞, antigen,Ag抗原 ,antigen-binding fragment,Fab抗原 结合片段, antigen-binding site 抗原结合部位, antigenic determinant,AD抗 原决定簇 antigenic valence抗 原结合价, antigenicity抗原 性,anti-idiotype,Aid 抗独特型 anti—infection immunity抗感染免 疫 antiserum抗血清 antitoxin抗毒素 apoptosis细胞凋亡 artificial active immunization人工 主动免疫 artificial antigen人 工抗原 artificial passive immunization人工 被动免疫 ataxia telangiectasia, AT 毛细血管扩张 性共济失调综合征 atopy特应性 attenuated vaccine 减毒活疫苗 autoantigen 自身 抗原 autograft 自体移 植 autoimmune disease 自身免疫 病 autoimmunity自身 免疫 avidin亲和素(抗生 物素蛋白) avidity亲合力

美联英语:高科技类新词汇汇总

美联英语提供:美联英语:高科技类新词汇汇总 小编给你一个美联英语官方试听课申请链接:https://www.doczj.com/doc/7c17694615.html,/?tid=16-73374-0 3C 融合(3c fusion) 3G(3rd Generation) 3R技术(3R techniques) 4A(Anyone Anytime Anywhere Anything) CG(Computer Graphics ) DVD(Digital Versatile Disk,多功能数码光盘) EVD (Enhanced Versatile Disk,增强型多媒体盘片系统) Open Access SOI材料(Silicon on Insulator Materials) Wi-Fi技术(Wireless Fidelity)

阿尔法客车”(AlphaBus) 爱普(APIEL:Advanced Placement International English Language)按需计算(On-Demand Computing) 白色农业(white agriculture) 办公自动化(OA:Office Automation) 半导体材料(semiconductor material) 比较医学(Comparative Medicine) 并行工程(Concurrent Engineering) 博客(Blog/Blogger) 超级网站(Super Website) 城市垃圾管理的三C原则(Clean Cycle Control)

创新决策权(Authority innovation-decisions) 磁悬浮列车(Magnetically Levitated Train) 大规模杀伤性武器(Weapons of mass destruction)(陶子)中微子(Tau neutrino ) 大科学(Big Science) 地球模拟器(Earth Simulator) 地球资料卫星(earth resources satellite) 地震矩规模(moment magnitude scale) 电子现金(Electronic Cash) 电子支票(Electronic Check) 动漫(Comic and Animation)

最新生物信息学名词解释(个人整理)

一、名词解释: 1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。 2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。 3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。 4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。 5.Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。 6.BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。P94 7.查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。P98 8.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。P29 9.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。P29 10.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表真正的进化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。P37 11.E值:衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越接近零,越不可能找到其他匹配序列,E 值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义。P95 12.低复杂度区域:BLAST搜索的过滤选项。指序列中包含的重复度高的区域,如poly(A)。 13.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。 14.多序列比对:通过序列的相似性检索得到许多相似性序列,将这些序列做一个总体的比对,以观察它们在结构上的异同,来回答大量的生物学问题。 15.分子钟:认为分子进化速率是恒定的或者几乎恒定的假说,从而可以通过分子进化推断出物种起源的时间。 16.系统发育分析:通过一组相关的基因或者蛋白质的多序列比对或其他性状,可以研究推断不同物种或基因之间的进化关系。 17.进化树的二歧分叉结构:指在进化树上任何一个分支节点,一个父分支都只能被分成两个子分支。 系统发育图:用枝长表示进化时间的系统树称为系统发育图,是引入时间概念的支序图。 18.直系同源:指由于物种形成事件来自一个共同祖先的不同物种中的同源序列,具有相似或不同的功能。(书:在缺乏任何基因复制证据的情况下,具有共同祖先和相同功能的同源基因。)

天津专用外研版英语必修五单词表

必修五 模块1 ave…incommon 有相同的特点 linguist n.语言学家 make difference有影响,使不相同 accent n.口音obvious adj.显然的,显而易见的motorway n.(英)高速公路 underground n.(英)地铁subway n.(美)地铁g et around 四处走动(旅行) flashlight n.(美)手电筒;火把 queue vi.(英)排队(等候) confusing adj.令人困惑的;难懂的 preposition n.介词 compare vt.比较 omit vi.省略 variety vt.种类 differ vi.不同,有区别 settler n.移民;定居者与……相似 remark n.评论;讲话 variation n.变化 have difficulty doingsth. 做某事有困难steadily adv.不断地;持续地

satellite n.卫星 flick n.轻打;轻弹;抖动 switch n.开关 lead 引起;导致 structure n.结构;体系 rapidly adv.迅速地 announcement n.声明;宣告 linguistics n.语言学 edition n.(广播、电视节目的)期;版 cute adj.逗人喜爱的 add vt.加;增加同意;支持 present vt.陈述;提出(观点、计划等) refer attemptn.努力;尝试 simplify vt.简化 combination n.组合;结合 thanks 幸亏,多亏 distinctive adj.与众不同的 look n.外观;外表;样子 criticise vt.批评 standard adj.标准的 reference n.参考;查阅Module2 intellectualadj.脑力的;思维的,需要才智的

生物信息学课程论文

生物信息学的发展和前景 摘要:生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。本文对生物信息学的产生背景及其研究现状等方面进行了综述,并展望生物信息学的发展前景。生物信息学的发展在国内、外基本上都处在起步阶段。因此,这是我国生物学赶超世界先进水平的一个百年一遇的极好机会。 关键字:生物信息学、产生、发展、前景

生物信息学的发展和前景 随着生物科学技术的迅猛发展,生物信息数据资源的增长呈现爆炸之势,同时计算机运算能力的提高和国际互联网络的发展使得对大规模数据的贮存、处理和传输成为可能,为了快捷方便地对已知生物学信息进行科学的组织、有效的管理和进一步分析利用,一门由生命科学和信息科学等多学科相结合特别是由分子生物学与计算机信息处理技术紧密结合而形成的交叉学科——生物信息学(Bioinformatics))应运而生,并大大推动了相关研究的开展,被誉为“解读生命天书的慧眼”。 生物信息学的产生 生物信息学是80年代未随着人类基因组计划(Human genome project)的启动而兴起的一门新的交叉学科。它通过对生物学实验数据的获取、加工、存储、检索与分析,进而达到揭示数据所蕴含的生物学意义的目的。由于当前生物信息学发展的主要推动力来自分子生物学,生物信息学的研究主要集中于核苷酸和氨基酸序列的存储、分类、检索和分析等方面,所以目前生物信息学可以狭义地定义为:将计算机科学和数学应用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的交叉学科。事实上,它是一门理论概念与实践应用并重的学科。 生物信息学的产生发展仅有10年左右的时间---bioinformatics这一名词在1991年左右才在文献中出现,还只是出现在电子出版物的文本中。事实上,生物信息学的存在已有30多年,只不过最初常被称为基因组信息学。美国人类基因组计划中给基因组信息学的定义:它是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。 自1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作,人基因组约

生物信息学基础知识

分子生物学基础知识太仓生命信息研究所 2011-7

前言 本文仅适用于对非生物专业的员工进行基础知识普及。如有深入学习的要求,请选用正规权威教材。 本教材以蛋白质、DNA、RNA、复制、转录和翻译为主要讲解内容,目的是帮助员工理解在工作中会遇到的常见生物学概念及术语 目录 前言 (2) 目录 (2) 蛋白质 (3) 1. 什么是蛋白质 (3) 2. 蛋白质的3D结构 (5) DNA (7) 1. DNA的组成—4种碱基 (7) 2. DNA的复制 (8) 3. DNA转录为RNA (9) 4. mRNA翻译成氨基酸序列 (11)

蛋白质 1.什么是蛋白质 蛋白质是由20中基本氨基酸链接而成的,生物体的大部分是有蛋白质构成的。每种氨基酸由4部分组成:碳原子C,羧基coo-,氨基H3N和R group。 20中氨基酸按照不同的排列和不同的长度,就形成了蛋白质。不同的R group把氨基酸分为5类: 无极性脂肪类R Group:

芳香类R Group 有极性,无电荷R Group

正电荷R Group 负电荷R Group 2.蛋白质的3D结构 氨基酸链在三维空间里呈现出一定的结构。各个氨基酸分子于相邻的氨基酸之间有氢键连接。 一级结构:氨基酸的排列顺序,可以用氨基酸的缩写在书面上表达。 氨基和羧基之间的氢键使得单个的氨基酸分子能够链接起来。

二级结构:单条氨基酸链所形成的2D形态。常见的有Alpha helix Beta sheet。 Alpha helix:氨基酸分子按顺时针或逆时针的方向螺旋上升。 Beta sheet:多条氨基酸分子链并列在一起。 三级结构:氨基酸链在各个方向的形态综合在一起。

相关主题
文本预览
相关文档 最新文档