126,104
次編輯
變更
生物信息学
,無編輯摘要
生物学技术往往生成大量的嘈杂数据。与数据挖掘类似,生物信息学利用数学工具从大量数据中提取有用的生物学信息。生物信息学所要处理的典型问题包括:重新组装在 [[ 霰弹枪 ]] 定序法测序过程中被打散的DNA序列,从蛋白质的 [[ 氨基酸 ]] 序列预测蛋白质结构,利用mRNA微阵列或 [[ 质谱仪 ]] 的数据检验基因调控的假说。
某些人将计算生物学作为生物信息学的同义词处理;但是另外一些人认为 [[ 计算生物学 ]] 和生物信息学应当被当作不同的条目处理,因为生物信息学更侧重于生物学领域中计算方法的使用和发展,而计算生物学强调应用 [[ 信息学 ]] 技术对生物学领域中的假说进行检验,并尝试发展新的理论。
==定义==
生物信息学可以定义为对 [[ 分子生物学 ]] 中两类信息流的研究:
第一类信息流源于分子生物学的中心法则:DNA序列被转录为mRNA序列,后者被翻译为蛋白质序列。蛋白质序列继而折叠为具功能的三维结构。按照 [[ 达尔文 ]] 演化理论,这些功能被生物体的环境所选择,从而驱动群体中DNA序列的进化。因此,第一类的生物信息学应用关注于中心法则中任一阶段的信息传递,包括DNA序列中基因的组织与控制、确定DNA中的转录单位、从序列预测蛋白质结构以及分子功能分析。
第二类信息流是基于 [[ 科学 ]] 方法:提出关于生物学活动的假设,设计实验以验证这些假设,评估结果与假设的兼容性,然后根据实验数据对原假设作扩展或修正。第二类的生物信息学应用关注于这一流程中的 [[ 信息传 ]] 递,包括产生假设、设计实验、通过数据库将实验结果组织起来、检验数据与模型的兼容性以及修正假设的各个系统。