基因表达分析方法及其研究进展

生物技术通报

・技术与方法・         BIOTECHNOLOGY BULLETIN

        2002年第6

基因表达分析方法及其研究进展

常青山 余增亮

(中国科学院等离子体物理研究所离子束生物工程研究室,合肥230031)

摘 要: 近几年来,随着功能基因组学研究的兴起,基因表达研究的分析方法也在不断发展,主要有:差减杂交、差异显示、表达序列标签、基因表达的序列分析、微阵列杂交等。简要评述这五种方法的原理、优缺点等。

关键词: 基因表达 差减杂交 差异显示 表达序列标签 基因表达序列分析 微阵列杂交

OverviewofMethodsfortheStudyofGeneExpression

ChangQingshan YuZengliang

(IonBeamBioengineeringLabInstituteofPlasmaPhysicsChineseAcademyofScience,Hefei230031)

Abstract: Withthedevelopmentofgenomics,avarietyofmethodstoidentifydifferencesingeneexpressionexist,includingsubtactivehybridization,differentialdisplay,serialanalysisofgeneexpression,andmicroarrayhybridization.Theobjectivesofthisreviewaretoprovideageneralprincipleoverviewofthemethods,advantageKeywords: Geneexpression Subtractivehybridizationsequencetag Serialanalysisofgeneexpression Microarrayhybridization

  随着DNA,,以及在生物体发育过程中的作用;了解基因在病原侵染、环境胁迫等生物、非生物应答过程中的作用。建立这样一个基因表达轮廓,就可以了解生物体为什么、怎么、何时通过调节基因组和单个基因的协同作用,来调节整个生命体的复杂过程。

常规的基因表达分析方法,如:Northern,Slot,Dot杂交,RT2PCR,核糖核酸酶保护实验等,一次只能分析少数几个基因。而最近几年发展起来的方法(如:差减杂交,差异显示,表达序列标签,基因表达序列分析,cDNA微阵列等),可以同时在两个或多个实验样品之间对所有的差异表达的基因进行分析。

,而仅在tester中表达的基因则以cDNA单链分子形式存在。双链和单链分子通过羟

基磷灰石层析分开。水相中的单链cDNA分子则代表了仅在tester中表达的基因。差异表达的cDNA可用以构建差减文库,或者直接标记用作探针,进行文库筛选[1]。

差减杂交法有两个明显的缺点:1)需要mRNA的量较大;2)不易于分离到表达丰度低的转录本。为了减少mRNA的需要量,提高特异转录本的克隆效率,Hara等将PCR扩增引入了差减杂交中[2]。另外,为了减少差减杂交中不易于克隆稀有转录本的不足,1996年又发展了差减抑制杂交技术(Sup2pressionSubtractiveHybridization,SSH)[3](图1)。

SSH技术能够有选择地扩增差异表达的转录

1 差减杂交(Subtraetirehybvidization)

差减杂交分析,始于20世纪80年代初,用于构建cDNA文库和制备差异表达探针。差异表达基因的分离是通过一个样品(tester)的cDNA与另一个样品(driver)的过量的mRNA杂交来实现的。在tester和driver中都表达了转录本形成的mRNA/

本,同时抑制共有的转录本的扩增。另外,SSH将待扩增的转录本进行均一化,使一些稀有的转录本都能得到扩增。尽管,SSH技术克服了最初的差减杂交的一些不足,但是SSH仍存在一定的局限性。SSH一次只能比较两个样品之中仅在tester中表达

的基因,另外,SSH仅能分离在tester中表达,而在driver中不表达的基因。不能反映两个样品之间基因在表达量上的差异。

2002年第6期生物技术通报Biotechnology Bulletin       2           8

因表达的差异性。最后,测定差异表达基因的序列,

验证差异表达基因的真伪。

同差减杂交相比,mRNA差异显示同时可在多个材料之间或不同处理材料之间进行比较。另外,DD方法不仅可以鉴定材料间基因表达的有或无的

差异,而且还可以反映材料间基因表达量的差异。同SSH一样,DD同样存在不能定量的缺点,而且DD方法还存在假阳性率较高的问题。

图1 差减抑制杂交(SSH)[4]

说明:从对照样品(driver)和实验样品(tester)中提取mR2

NA,Driver和testermRNA反转录成,将cDNA分成两部分,(adapterl和2分

cDNA进行第一次杂交,a,b,c,d四种分子存在。将两杂交产物混合,重新加入变性后的drivercD2

NA,杂交。此时,杂交液中除含有a,b,c,d,四种分

子外,还含有分子,e,即含有接头1和接头2的双链分子。加入与接头1和接头2互补的PCR引物,

进行PCR扩增。此时,仅分子e呈旨数级扩增。PCR产物中主要含有均一化的,仅在tester中表达,而在

driver中不表达的分子e。

2 差异显示(DifferentialDisplay,DD)

差异显示技术(图2)是1992年发展起来的,该技术的基础是基于两个或多个mRNA样品的任意

基因片段的PCR扩增。该技术首先用锚定引物将mRNA反转录成cDNA。一般的锚定引物由polyT加上1~2个碱基组成(如:T12AC)。然后,反转录出的cDNA片段用多个PCR引物对其进行扩增。一般,正向引物为10个碱基的随机引物,反向引物为锚定引物。据估计用240个引物对组合(即20个随机引物,12个锚定引物),就能覆盖所有转

录本[5]。通过比较聚丙烯酰胺凝胶电泳图,不同样品在同一位置上条带的有无以及条带的强弱来确定基

图2 差异显示(DD)

说明:从材料1,2中提取RNA,用锚定引物将mRNA

反转录成cDNA,用不同的正、反向引物组合进行PCR扩增,PCR产物的评价,确定在样品1

),中表达,而在样品2中不表达的基因片段(ⅲ

或者在2中表达,在1中不表达的基因片段

(ⅱ);或者在1,2中存在表达强度差异的基因)。片段(ⅰ

3 表达序列标签(ExpressedSequenceTag,

EST)

随着DNA高通量测序技术的发展,在上个世纪90年代,提出了EST文库的概念[6,7]。从cDNA

求高通量的测序能力,但是测定同样数量的SAGE

序列所代表的基因数量是测定同样数量的EST序列的20倍

文库中随机挑选克隆,进行单向测序,产生300~500bp大小的基因片段,即为EST序列。基因表达的差异分析,可以通过计算某一基因片段在EST文库中出现频率的多少来确定。然而,EST标签常常是由均一化的cDNA文库而来的[8]。而来自均一化的cDNA文库的EST序列,仅能用来比较cDNA文库间基因表达的有或无的差异。若想比较基因表达量上的差异,必须用未均一化的cDNA文库。尽管EST分析存在一定的局限性,但是,随着拟南芥和水稻全基因组测序的完成以及小麦、大豆、高粱等重要农作物EST计划的实施,Genbank中EST序列的数量迅速增加[9]。用EST序列分析来研究基因表达越来越显示出强大的生命力。目前通过对公共数据库中人类EST的分析,来鉴定cDNA文库间基因差异表达的一些网络资源已经发展起来了[10]。

4 基因表达序列分析(SerialAnalysisof

GeneExpression,SAGE)

SAGE(SAGE)[4]

说明:一个实验样品的mRNA用生物素标记的PolyT引

物反转录成cDNA。cDNA被识别4碱基的内切酶消化(NlaIII)。cDNA的3′末端DNA片段用链霉亲和素蛋白包被的磁珠纯化。纯化的cDNA片段分成两部分,分别加上接头A和接头B。接头包含

PCR引物的互补序列和TypeIIS内切酶(ForkI)的

法。SAGE技术,置上,,[11]。SAGE标签来自片段。一般地说,一个SAGE标签包含cDNA末端最后一个内切酶酶切位点下游的9个碱基。多个SAGE标签联结在一起,连到克隆载体上,测序。一个测序反应一般测300~500个碱基,理论上可以产生20~30个SAGE标签。因为每个SAGE标签理论上代表一个转录本。基因表达差异可以通过比较特定SAGE标签在不同文库间表达丰度的差异来表示。SAGE所代表的基因或EST序列可以通过与Genbank中的基因或EST序列的比较来确定。SAGE分析的相关程序可以参考文献[12]。

SAGE方法的主要优点是SAGE的数据是定量的,累积的。只要足够的测序工作的完成,SAGE就可以精确地定量地分析整个细胞或组织的基因表达的变化。另外,SAGE数据具有可比性。SAGE数据可以和现有的和将来按类似的方式建立的SAGE文库中的数据进行比较[13]。随着SAGE数据库中数据的增多,该法的优势越来越显现出来。SAGE另一特点是,它的数据可以和由均一化的EST文库或差减文库的EST数据相互补充。虽然,SAGE要

识别位点。内切酶ForkI切除生物素标记的引物。该内切酶识别接头内的酶切位点,并在识别位点下游9个碱基出切开DNA。酶切产物纯化,连接,进行PCR扩增。内切酶NlaIII切除接头,产生双标签

(ditag)的连接子。多个ditag连接在一起,克隆,测

序,以便生成SAGE数据库。

SAGE的一个局限性就是用SAGE标签来代表

一个基因。这个过程首先局限于数据库中EST序列的数量。不过随着EST数据库中数据的增加,以及对其功能了解的增加,这个问题已不难解决。另一个潜在的问题是标签鉴定错误。这个问题可能是由于测序出现错误造成的,或者是由于SAGE标签位置鉴定错误造成的。另外,由于一些用于构建SAGE文库的内切酶的局限性,某些转录本不能被SAGE标签所代表;再就是,由于存在单核苷酸多态性和剪切位点的可选择性,一个转录本可能由多个SAGE标签所表示。以上这些问题尽管只占SAGE

标签所代表的基因的很小部分,但在进行数据分析

时,却不可不加以考虑。

5 微阵列杂交(MicroarrayHybridization

MH)

用微阵列技术(图4)评价基因表达开始于1995年[14 ]。微阵列技术是在基因组尺度上分析基因的表达变化[15,16]

的基因数目不是太多,且所有的基因都是已知的,那么代表所有开放阅读框的序列可以全部点阵到玻片上,这样可以同时分析所有转录本的表达方式。

尽管现有公共数据库中的DNA序列,对研究相关基因的表达是非常有用的,但是要鉴定未知基因,最好选择cDNA文库制备微阵列。为了鉴定新的基因,重要的一点,就是要认识到大部分转录本都是低丰度表达的。例如,人类细胞中大约包括2000~35000个转录本,其中300个表达丰富的基因的表达量占整个mRNA总量的50%[17]。这种分布频率,就需要用富集的文库制备微阵列,以避免在所点阵的克隆中含有很高的冗余克隆。对于特定的细胞,组织或发育特定阶段的转录本,可以先通过差减杂交来富集cDNA片段,然后,再制备微阵列。5.3 探针的标记和杂交

。荧光的选择,。目:荧光花色素(Cy3,Cy5)、、若丹明等。

微阵列杂交的杂交条件(样品浓度、离子强度、温度等)大体上依靠点阵到玻片上的DNA片段的长度的不同而定,一些重要参数(检测水平、表达的灵敏度、杂交动力学范围、转录本的浓度与杂交信号的关系等),可以通过总的转录本中对照RNA杂交

图4 cDNA微阵列杂交(MH)[4]。

说明:样品1,2的mRNA反转录成cDNA,且进行标记;

标记的cDNA同微阵列杂交;图像采集;数据分析。

微阵列杂交的主要步骤包括:DNA微阵列加

工,实验设计,探针制备和杂交,数据采集,数据分析,数据和信息管理,数据验证等。5.1 DNA微阵列加工

根据加工方式不同,可以分为3种。(1)寡核苷酸芯片,即寡核苷酸直接在玻片上的原位合成。(2)寡核苷酸阵列,即首先合成寡核苷酸,然后在点阵到玻片或尼龙膜上。(3)cDNA阵列,首先将cDNA克隆进行PCR扩增,然后将cDNA片段点阵到玻片或尼龙膜上。5.2 实验设计

主要是根据要研究的问题而定。如果一种生物

信号的强度来确定。Lemieux等人的研究表明,只有阵列上目的DNA的量至少是标记探针量的10倍时,RNA的表达水平上才与杂交信号的强弱成线性关系。另外,不同的实验设计,检测的范围也不同。已报道的检测范围在1/100000~1/300000之间,即100000到300000个转录本中的一个转录本,就可以检测到。这就意味着1~10个细胞中含有一个转录本,就可以通过微阵列杂交检测出来[18,19]。另外,据估计,微阵列杂交可以检测2~3倍的差异表达的基因[19]。5.4 数据采集

微阵列杂交信号可以被专门的扫描仪所收集。该扫描仪是一个计算机控制的倒置的扫描荧光显微镜,多数型号还配有一个共聚焦成像仪。该扫描仪输出的是16位的标签图像文件(TIFF)。该文件将数据的动态范围限定在5个数量级之内。TIFF文

2002年第6期

         常青山等:基因表达分析方法及其研究进展       31

加有效的分析方法。

参考文献

1 SargentTD,IBDawid.Science,1983,222:135~139.

2 HaraETKato,SNakada,etal.NuclAcidsRes,1991,19:7097~7104.

3 DiatchenkoL,YFCLau,APChenchik,etal.ProcNatlAcadSci

USA,1996,95:14863~14868.

4 DEMoody.JAnimSci,2001,79:E128~E135.5 LiangP,ABPardee.Science,1992,257:967~971.

6 AdamsMD,JMKelly,JDGocayne,etal.Science,1991,252:1651~

1669.

7 OkuboKN,HoriRMatoba,etal.NatGenet,1992,2:173~179.8 SoaresMB,MFBonaldo,PJelene,etal.ProcNatlAcadSci,1994,

91:9228~9232.

9 ToddRichmond,ShaunaSomerville.CurrentOpinioninPlantBiolo2gy,2000,3:108~116.

10 BortoluzziSFdAlessi,Cal.GenomeRes,2000,10:

~VE,,270:484~487.

AE,CMTolstoshev,LWagner,etal.GenomeRes,2000,10:

1051~1060.

13 MatsumuraH,NirasawaS,TerauchiR.PlantJ,1999,20(6):719

件通过图像分析软件加工处理,来测量微阵列上每

个DNA样品的杂交信号的强度。理想的图像分析软件能够自动检测玻片上的每一个有效的点,标记无效的点,去掉局部的杂交背景,输出背景信号强度以上的,每一个点的平均信号强度[20]。5.5 数据分析

微阵列杂交实验的真正的中心部分是数据分析。数据分析的第一步就是数据的均一化。为了比较单个的荧光信号的强度,原始数据必须转化成均一化的值。数据均一化可以采用几种不同的方法[20]。

聚类分析,基于具有相关功能的基因是协同调节的这样一个假设,微阵列数据的聚类分析成为一个有效的推测未知基因功能的方法。5.6 数据和信息管理

微阵列数据分析软件的最终目标就是为研究者提供一个简单的鉴定候选基因的方法,并提供这些基因的详细信息。为了这个目的,当与多个外部数据库相连,、据库、个统一的,数据连结起来的,。5.7 数据验证

一旦鉴定出感兴趣的候选基因,首先应对该克隆进行测序验证,另外还要进行Northern杂交,定量或竞争PCR,定量核酸保护实验等方法,确认基因的差异表达。

基因表达分析方法,包括从单个基因到基因组水平来研究基因的表达。但没有哪一种方法适合于所有要研究的问题。最佳的策略是根据所要研究问题的特点,选择不同的方法。另外,可以创造性地将几种方法结合使用。随着基因组学以及相关的生物信息学研究的不断发展,将为基因表达研究提供更

~726.

14 WWalterLorenz,JeffreyFDDean.TreePhysiology,2002,22:301

~310.

15 SchenaMD,DShalon,RWDavis,etal.Science,1995,270:467~

470.

16 BrownPO,BotsteinD.NatGenet,1999,21:33~37.

17 DugganDJ,BittnerM,ChenY,etal.NatGenet,1999,21:10~

14.

18 WanJS,SharpSJ,PoirierGM

,etal.NatBiotechnol,1996,14:

1685~1691.

19 SchenaM,ShalonD,HellerR,etal.ProcNatlAcadSci,1996,93:

10614~10619.

20 SwidzinskiJA,SweetloveLJ,LeaverCJ.PlantJ,2002,30(4):431

~446.

生物技术通报

・技术与方法・         BIOTECHNOLOGY BULLETIN

        2002年第6

基因表达分析方法及其研究进展

常青山 余增亮

(中国科学院等离子体物理研究所离子束生物工程研究室,合肥230031)

摘 要: 近几年来,随着功能基因组学研究的兴起,基因表达研究的分析方法也在不断发展,主要有:差减杂交、差异显示、表达序列标签、基因表达的序列分析、微阵列杂交等。简要评述这五种方法的原理、优缺点等。

关键词: 基因表达 差减杂交 差异显示 表达序列标签 基因表达序列分析 微阵列杂交

OverviewofMethodsfortheStudyofGeneExpression

ChangQingshan YuZengliang

(IonBeamBioengineeringLabInstituteofPlasmaPhysicsChineseAcademyofScience,Hefei230031)

Abstract: Withthedevelopmentofgenomics,avarietyofmethodstoidentifydifferencesingeneexpressionexist,includingsubtactivehybridization,differentialdisplay,serialanalysisofgeneexpression,andmicroarrayhybridization.Theobjectivesofthisreviewaretoprovideageneralprincipleoverviewofthemethods,advantageKeywords: Geneexpression Subtractivehybridizationsequencetag Serialanalysisofgeneexpression Microarrayhybridization

  随着DNA,,以及在生物体发育过程中的作用;了解基因在病原侵染、环境胁迫等生物、非生物应答过程中的作用。建立这样一个基因表达轮廓,就可以了解生物体为什么、怎么、何时通过调节基因组和单个基因的协同作用,来调节整个生命体的复杂过程。

常规的基因表达分析方法,如:Northern,Slot,Dot杂交,RT2PCR,核糖核酸酶保护实验等,一次只能分析少数几个基因。而最近几年发展起来的方法(如:差减杂交,差异显示,表达序列标签,基因表达序列分析,cDNA微阵列等),可以同时在两个或多个实验样品之间对所有的差异表达的基因进行分析。

,而仅在tester中表达的基因则以cDNA单链分子形式存在。双链和单链分子通过羟

基磷灰石层析分开。水相中的单链cDNA分子则代表了仅在tester中表达的基因。差异表达的cDNA可用以构建差减文库,或者直接标记用作探针,进行文库筛选[1]。

差减杂交法有两个明显的缺点:1)需要mRNA的量较大;2)不易于分离到表达丰度低的转录本。为了减少mRNA的需要量,提高特异转录本的克隆效率,Hara等将PCR扩增引入了差减杂交中[2]。另外,为了减少差减杂交中不易于克隆稀有转录本的不足,1996年又发展了差减抑制杂交技术(Sup2pressionSubtractiveHybridization,SSH)[3](图1)。

SSH技术能够有选择地扩增差异表达的转录

1 差减杂交(Subtraetirehybvidization)

差减杂交分析,始于20世纪80年代初,用于构建cDNA文库和制备差异表达探针。差异表达基因的分离是通过一个样品(tester)的cDNA与另一个样品(driver)的过量的mRNA杂交来实现的。在tester和driver中都表达了转录本形成的mRNA/

本,同时抑制共有的转录本的扩增。另外,SSH将待扩增的转录本进行均一化,使一些稀有的转录本都能得到扩增。尽管,SSH技术克服了最初的差减杂交的一些不足,但是SSH仍存在一定的局限性。SSH一次只能比较两个样品之中仅在tester中表达

的基因,另外,SSH仅能分离在tester中表达,而在driver中不表达的基因。不能反映两个样品之间基因在表达量上的差异。

2002年第6期生物技术通报Biotechnology Bulletin       2           8

因表达的差异性。最后,测定差异表达基因的序列,

验证差异表达基因的真伪。

同差减杂交相比,mRNA差异显示同时可在多个材料之间或不同处理材料之间进行比较。另外,DD方法不仅可以鉴定材料间基因表达的有或无的

差异,而且还可以反映材料间基因表达量的差异。同SSH一样,DD同样存在不能定量的缺点,而且DD方法还存在假阳性率较高的问题。

图1 差减抑制杂交(SSH)[4]

说明:从对照样品(driver)和实验样品(tester)中提取mR2

NA,Driver和testermRNA反转录成,将cDNA分成两部分,(adapterl和2分

cDNA进行第一次杂交,a,b,c,d四种分子存在。将两杂交产物混合,重新加入变性后的drivercD2

NA,杂交。此时,杂交液中除含有a,b,c,d,四种分

子外,还含有分子,e,即含有接头1和接头2的双链分子。加入与接头1和接头2互补的PCR引物,

进行PCR扩增。此时,仅分子e呈旨数级扩增。PCR产物中主要含有均一化的,仅在tester中表达,而在

driver中不表达的分子e。

2 差异显示(DifferentialDisplay,DD)

差异显示技术(图2)是1992年发展起来的,该技术的基础是基于两个或多个mRNA样品的任意

基因片段的PCR扩增。该技术首先用锚定引物将mRNA反转录成cDNA。一般的锚定引物由polyT加上1~2个碱基组成(如:T12AC)。然后,反转录出的cDNA片段用多个PCR引物对其进行扩增。一般,正向引物为10个碱基的随机引物,反向引物为锚定引物。据估计用240个引物对组合(即20个随机引物,12个锚定引物),就能覆盖所有转

录本[5]。通过比较聚丙烯酰胺凝胶电泳图,不同样品在同一位置上条带的有无以及条带的强弱来确定基

图2 差异显示(DD)

说明:从材料1,2中提取RNA,用锚定引物将mRNA

反转录成cDNA,用不同的正、反向引物组合进行PCR扩增,PCR产物的评价,确定在样品1

),中表达,而在样品2中不表达的基因片段(ⅲ

或者在2中表达,在1中不表达的基因片段

(ⅱ);或者在1,2中存在表达强度差异的基因)。片段(ⅰ

3 表达序列标签(ExpressedSequenceTag,

EST)

随着DNA高通量测序技术的发展,在上个世纪90年代,提出了EST文库的概念[6,7]。从cDNA

求高通量的测序能力,但是测定同样数量的SAGE

序列所代表的基因数量是测定同样数量的EST序列的20倍

文库中随机挑选克隆,进行单向测序,产生300~500bp大小的基因片段,即为EST序列。基因表达的差异分析,可以通过计算某一基因片段在EST文库中出现频率的多少来确定。然而,EST标签常常是由均一化的cDNA文库而来的[8]。而来自均一化的cDNA文库的EST序列,仅能用来比较cDNA文库间基因表达的有或无的差异。若想比较基因表达量上的差异,必须用未均一化的cDNA文库。尽管EST分析存在一定的局限性,但是,随着拟南芥和水稻全基因组测序的完成以及小麦、大豆、高粱等重要农作物EST计划的实施,Genbank中EST序列的数量迅速增加[9]。用EST序列分析来研究基因表达越来越显示出强大的生命力。目前通过对公共数据库中人类EST的分析,来鉴定cDNA文库间基因差异表达的一些网络资源已经发展起来了[10]。

4 基因表达序列分析(SerialAnalysisof

GeneExpression,SAGE)

SAGE(SAGE)[4]

说明:一个实验样品的mRNA用生物素标记的PolyT引

物反转录成cDNA。cDNA被识别4碱基的内切酶消化(NlaIII)。cDNA的3′末端DNA片段用链霉亲和素蛋白包被的磁珠纯化。纯化的cDNA片段分成两部分,分别加上接头A和接头B。接头包含

PCR引物的互补序列和TypeIIS内切酶(ForkI)的

法。SAGE技术,置上,,[11]。SAGE标签来自片段。一般地说,一个SAGE标签包含cDNA末端最后一个内切酶酶切位点下游的9个碱基。多个SAGE标签联结在一起,连到克隆载体上,测序。一个测序反应一般测300~500个碱基,理论上可以产生20~30个SAGE标签。因为每个SAGE标签理论上代表一个转录本。基因表达差异可以通过比较特定SAGE标签在不同文库间表达丰度的差异来表示。SAGE所代表的基因或EST序列可以通过与Genbank中的基因或EST序列的比较来确定。SAGE分析的相关程序可以参考文献[12]。

SAGE方法的主要优点是SAGE的数据是定量的,累积的。只要足够的测序工作的完成,SAGE就可以精确地定量地分析整个细胞或组织的基因表达的变化。另外,SAGE数据具有可比性。SAGE数据可以和现有的和将来按类似的方式建立的SAGE文库中的数据进行比较[13]。随着SAGE数据库中数据的增多,该法的优势越来越显现出来。SAGE另一特点是,它的数据可以和由均一化的EST文库或差减文库的EST数据相互补充。虽然,SAGE要

识别位点。内切酶ForkI切除生物素标记的引物。该内切酶识别接头内的酶切位点,并在识别位点下游9个碱基出切开DNA。酶切产物纯化,连接,进行PCR扩增。内切酶NlaIII切除接头,产生双标签

(ditag)的连接子。多个ditag连接在一起,克隆,测

序,以便生成SAGE数据库。

SAGE的一个局限性就是用SAGE标签来代表

一个基因。这个过程首先局限于数据库中EST序列的数量。不过随着EST数据库中数据的增加,以及对其功能了解的增加,这个问题已不难解决。另一个潜在的问题是标签鉴定错误。这个问题可能是由于测序出现错误造成的,或者是由于SAGE标签位置鉴定错误造成的。另外,由于一些用于构建SAGE文库的内切酶的局限性,某些转录本不能被SAGE标签所代表;再就是,由于存在单核苷酸多态性和剪切位点的可选择性,一个转录本可能由多个SAGE标签所表示。以上这些问题尽管只占SAGE

标签所代表的基因的很小部分,但在进行数据分析

时,却不可不加以考虑。

5 微阵列杂交(MicroarrayHybridization

MH)

用微阵列技术(图4)评价基因表达开始于1995年[14 ]。微阵列技术是在基因组尺度上分析基因的表达变化[15,16]

的基因数目不是太多,且所有的基因都是已知的,那么代表所有开放阅读框的序列可以全部点阵到玻片上,这样可以同时分析所有转录本的表达方式。

尽管现有公共数据库中的DNA序列,对研究相关基因的表达是非常有用的,但是要鉴定未知基因,最好选择cDNA文库制备微阵列。为了鉴定新的基因,重要的一点,就是要认识到大部分转录本都是低丰度表达的。例如,人类细胞中大约包括2000~35000个转录本,其中300个表达丰富的基因的表达量占整个mRNA总量的50%[17]。这种分布频率,就需要用富集的文库制备微阵列,以避免在所点阵的克隆中含有很高的冗余克隆。对于特定的细胞,组织或发育特定阶段的转录本,可以先通过差减杂交来富集cDNA片段,然后,再制备微阵列。5.3 探针的标记和杂交

。荧光的选择,。目:荧光花色素(Cy3,Cy5)、、若丹明等。

微阵列杂交的杂交条件(样品浓度、离子强度、温度等)大体上依靠点阵到玻片上的DNA片段的长度的不同而定,一些重要参数(检测水平、表达的灵敏度、杂交动力学范围、转录本的浓度与杂交信号的关系等),可以通过总的转录本中对照RNA杂交

图4 cDNA微阵列杂交(MH)[4]。

说明:样品1,2的mRNA反转录成cDNA,且进行标记;

标记的cDNA同微阵列杂交;图像采集;数据分析。

微阵列杂交的主要步骤包括:DNA微阵列加

工,实验设计,探针制备和杂交,数据采集,数据分析,数据和信息管理,数据验证等。5.1 DNA微阵列加工

根据加工方式不同,可以分为3种。(1)寡核苷酸芯片,即寡核苷酸直接在玻片上的原位合成。(2)寡核苷酸阵列,即首先合成寡核苷酸,然后在点阵到玻片或尼龙膜上。(3)cDNA阵列,首先将cDNA克隆进行PCR扩增,然后将cDNA片段点阵到玻片或尼龙膜上。5.2 实验设计

主要是根据要研究的问题而定。如果一种生物

信号的强度来确定。Lemieux等人的研究表明,只有阵列上目的DNA的量至少是标记探针量的10倍时,RNA的表达水平上才与杂交信号的强弱成线性关系。另外,不同的实验设计,检测的范围也不同。已报道的检测范围在1/100000~1/300000之间,即100000到300000个转录本中的一个转录本,就可以检测到。这就意味着1~10个细胞中含有一个转录本,就可以通过微阵列杂交检测出来[18,19]。另外,据估计,微阵列杂交可以检测2~3倍的差异表达的基因[19]。5.4 数据采集

微阵列杂交信号可以被专门的扫描仪所收集。该扫描仪是一个计算机控制的倒置的扫描荧光显微镜,多数型号还配有一个共聚焦成像仪。该扫描仪输出的是16位的标签图像文件(TIFF)。该文件将数据的动态范围限定在5个数量级之内。TIFF文

2002年第6期

         常青山等:基因表达分析方法及其研究进展       31

加有效的分析方法。

参考文献

1 SargentTD,IBDawid.Science,1983,222:135~139.

2 HaraETKato,SNakada,etal.NuclAcidsRes,1991,19:7097~7104.

3 DiatchenkoL,YFCLau,APChenchik,etal.ProcNatlAcadSci

USA,1996,95:14863~14868.

4 DEMoody.JAnimSci,2001,79:E128~E135.5 LiangP,ABPardee.Science,1992,257:967~971.

6 AdamsMD,JMKelly,JDGocayne,etal.Science,1991,252:1651~

1669.

7 OkuboKN,HoriRMatoba,etal.NatGenet,1992,2:173~179.8 SoaresMB,MFBonaldo,PJelene,etal.ProcNatlAcadSci,1994,

91:9228~9232.

9 ToddRichmond,ShaunaSomerville.CurrentOpinioninPlantBiolo2gy,2000,3:108~116.

10 BortoluzziSFdAlessi,Cal.GenomeRes,2000,10:

~VE,,270:484~487.

AE,CMTolstoshev,LWagner,etal.GenomeRes,2000,10:

1051~1060.

13 MatsumuraH,NirasawaS,TerauchiR.PlantJ,1999,20(6):719

件通过图像分析软件加工处理,来测量微阵列上每

个DNA样品的杂交信号的强度。理想的图像分析软件能够自动检测玻片上的每一个有效的点,标记无效的点,去掉局部的杂交背景,输出背景信号强度以上的,每一个点的平均信号强度[20]。5.5 数据分析

微阵列杂交实验的真正的中心部分是数据分析。数据分析的第一步就是数据的均一化。为了比较单个的荧光信号的强度,原始数据必须转化成均一化的值。数据均一化可以采用几种不同的方法[20]。

聚类分析,基于具有相关功能的基因是协同调节的这样一个假设,微阵列数据的聚类分析成为一个有效的推测未知基因功能的方法。5.6 数据和信息管理

微阵列数据分析软件的最终目标就是为研究者提供一个简单的鉴定候选基因的方法,并提供这些基因的详细信息。为了这个目的,当与多个外部数据库相连,、据库、个统一的,数据连结起来的,。5.7 数据验证

一旦鉴定出感兴趣的候选基因,首先应对该克隆进行测序验证,另外还要进行Northern杂交,定量或竞争PCR,定量核酸保护实验等方法,确认基因的差异表达。

基因表达分析方法,包括从单个基因到基因组水平来研究基因的表达。但没有哪一种方法适合于所有要研究的问题。最佳的策略是根据所要研究问题的特点,选择不同的方法。另外,可以创造性地将几种方法结合使用。随着基因组学以及相关的生物信息学研究的不断发展,将为基因表达研究提供更

~726.

14 WWalterLorenz,JeffreyFDDean.TreePhysiology,2002,22:301

~310.

15 SchenaMD,DShalon,RWDavis,etal.Science,1995,270:467~

470.

16 BrownPO,BotsteinD.NatGenet,1999,21:33~37.

17 DugganDJ,BittnerM,ChenY,etal.NatGenet,1999,21:10~

14.

18 WanJS,SharpSJ,PoirierGM

,etal.NatBiotechnol,1996,14:

1685~1691.

19 SchenaM,ShalonD,HellerR,etal.ProcNatlAcadSci,1996,93:

10614~10619.

20 SwidzinskiJA,SweetloveLJ,LeaverCJ.PlantJ,2002,30(4):431

~446.


相关文章

  • 蛋白质组学
  • :() 生物化学与生物物理进展 ・ ・ 世纪的生物学 蛋白质组学的进展 李林 (中国科学院上海生命研究院,上海生物化学研究所,分子生物学国家重点实验室,上海 ) 摘要关键词 蛋白质组学是在细胞的整体蛋白质水平上进行研究.从蛋白质整体活动的角 ...查看


  • 2电子克隆技术及其在植物基因工程中的应用
  • 电子克隆技术及其在植物基因工程中的应用 王冬冬 朱延明 李勇 李杰 柏锡 ( 东北农业大学生命科学学院,黑龙江哈尔滨150030) 摘要:电子克隆是随着基因组计划和EST 计划的实施而发展起来的, 是利用生物信息学手段进行基因克隆的新方法. ...查看


  • 动脉粥样硬化发病机制及其诊治与干预的基础研究
  • 项目名称: 动脉粥样硬化发病机制及其诊治与干预 起止年限:依托部门:的基础研究 刘德培 中国医学科学院基础医学研究 所 2011.1至2015.8 卫生部 首席科学家: 二.预期目标 总体目标: 本项目旨在从我国AS 人群特有的遗传背景及分 ...查看


  • 现代生物信息学及其主要研究领域
  • 第26卷第6期 2000年12月 湖南农业大学学报(自然科学版) JournalofHunanAgriculturalUniversity(NaturalSciences) Vol.26No.6 Dec.2000 文章编号:10072103 ...查看


  • 一种促进植物根系生长的极细链格孢菌蛋白质分离.纯化和生物功能
  • 中国生物防治ChineseJournalofBiologicalControl2007年5月 一种促进植物根系生长的极细链格孢菌 蛋白质分离.纯化和生物功能 赵明治1,杨秀芬2*,张明1,袁京京2,邱德文2 (1.安徽农业大学生命科学学院, ...查看


  • 基因工程复习题
  • 基因工程复习题 基因工程绪论 1.基因工程的定义与特征. 定义:在体外把核酸分子(DNA 的分离.合成)插入载体分子,构成遗传物质的新组合(重 组DNA ),引入原先没有这类分子的受体细胞内,稳定地复制表达繁殖,培育符合人们需要 的新品种( ...查看


  • 枇杷DXR基因的克隆及其在果实成熟过程中的表达分析
  • 摘 要:[目的]为了解枇杷(Eriobotrya japonica Lindl.)1-脱氧木酮糖-5-磷酸(DXP)还原异构酶基因(DXR)的序列特点及其在果实成熟过程的表达特性,[方法]以不同类型枇杷品种'早钟6号' (红肉) 和'白玉' ...查看


  • 广西民族大学专业目录
  • 广 西 民 族 大 学 2012年招收攻读硕士学位研究生专业目录 2 广 西 民 族 大 学 2012年招收攻读硕士学位研究生专业目录 1 2 3 广 西 民 族 大 学 2012年招收攻读硕士学位研究生专业目录 4 5 6 7 8 考试科 ...查看


  • 第五版医学遗传
  • <医学遗传学>教学大纲 (供临床专业使用) 辽宁医学院·教务处 二○○七年六月 <医学遗传学>教学大纲 适用专业:临床医学专业 总学时:28 其中理论学时:20 实践学时:8 一.课程的性质和任务 医学遗传学课程是横 ...查看


热门内容