癌症基因组学研究最全综述

全国治白癜风最好医院 https://m-mip.39.net/baidianfeng/mipso_4186538.html

来源

碱基矿工

编辑

yat

编者:这篇文章不是我的原创,而是来自Illumina的一个英文癌症综述:《CancerResearchReview》

本文1.9万字,这篇综述涵盖了癌症研究的各个方面。

癌症,一种慢性的基因病。

简介

在癌症研究中,每个癌症样品呈现在研究人员眼前的已经是一个发生了改变的基因组,其中包含着独特且难以预测的诸多点突变、序列的插入缺失、易位、融合以及其他畸变。并且,这些发生的变异中,许多往往都是之前所未观察到的(Novelmutations),它们也不会只存在于基因组的编码区域中,因而为了能够真正做到全面研究癌症基因组本身所发生的所有突变事件,全基因组测序已被视为肿瘤基因变异研究中唯一严谨的方法。

然而,在所有这些变异中,却只有少数的几个主导着癌症这一疾病的发展和演变。要有效揭示这一演变和发展的过程,就需要监控基因表达水平上的变化,那么RNA-Seq便是用以确定这些遗传改变是否会影响疾病发展有用技术。但遗传改变有可能影响所有的细胞过程,包括染色质结构、DNA甲基化、RNA剪接异构体、RNA编辑和microRNA(miRNA)等。这就意味着,只有对所有这些独立的过程都进行检测和综合分析,才能在癌症研究中取得真正的突破。这些内容我们都将在下文一一展开。

当前基因组测序技术的一大特点是在于能够在很短的时间内并行测得数十亿(甚至数百亿)的独立序列片段——read,而每个read来源于单个的DNA分子。由此产生的数据我们可将其视为是对DNA分子的随机抽样,这反过来代表肿瘤样品中每个细胞的基因组的情况。这是我们解开癌症的原因和机制的一种强大工具。

肿瘤异质性

癌症基因组的突变是复杂的。

每个人都携带一套独特的来自父母遗传的胚系突变(germlinemutations)信息。但随着癌症的发展,体细胞突变(Somaticmutations)和基因组重排(genomicsrearrangements)会逐渐增加。这些改变往往会引发耐药性以及转移。越来越多的研究证据表明,这些过程竟然可以是有意的!——它们其实可以认为是癌细胞面临药物刺激的过程中不断进化的结果。我们想要全面地理解这一复发和耐药性的原因,就有必要进行纵向实验,按照癌症的发展过程,分阶段采集样品来进行研究。

如上图,这是处于正常组织背景下的多克隆肿瘤(polyclonetumor)。大多数的肿瘤样品都会同时包含肿瘤细胞和正常细胞,如基质细胞、血管和免疫细胞。并且肿瘤本身也常常包含几种不同的克隆亚型(clonetypes),每一种都有着不同的治疗反应和复发可能。

根据传统病理学的估计,大部分研究的结果其实都只集中在那些肿瘤细胞比例60%的区域中。并且为了确定哪些突变是肿瘤特异的,通常都要包含来自同一个体的正常组织样本作为参考。

然而,肿瘤本身也往往是异质性的。在癌症发展的过程中,个别细胞会发生新的突变,包含这些新突变的细胞会继续增殖,形成克隆亚型。因此,对于晚期癌症我们通常检测到的都是一个多克隆肿瘤,其中每一个克隆有一套独特的突变信息、独特的病理学和药物反应机制。这其实也正是癌症难以完全治疗的原因,而它的这种异质性其实正是肿瘤基因组复杂性导致的一种表型性质。目前的深度测序可以检测样本中含量低至1%的克隆。

肿瘤内的异质性。体细胞突变的逐步累积产生了一个异质的多克隆肿瘤,其中不同克隆可能对治疗的反应不同。

而且,异质性一般还可以分两种情况讨论,第一种情况指的是:同一个病人的肿瘤细胞具有异质性。处于肿瘤发生的不同时期的肿瘤细胞的基因突变情况不同,造就了每一个肿瘤细胞群体内还有许多亚群(subclones),肿瘤细胞在通过转移时,就会有属于不同亚群的肿瘤细胞去侵入新的地方,形成新的肿瘤;第二种情况指的是:除了同一病人的不同肿瘤细胞会造成肿瘤的异质性外,肿瘤的异质性还体现在不同病人可能得了相同的肿瘤,但是那个『相同』未必真是相同——仅仅是表型相同,不代表着基因型也相同。

在某些基因中,突变频繁发生在同一个位置,这应该有特定的机制在起作用,这些有规律性的情况都会稍微容易对付。然而遗憾的是,对于大多数的基因,突变显然是随机出现在整个基因中的,这其实说明了DNA的复制和修复机制失灵了。

图中为两个假定的基因,他们有着两种不同的突变模式。深灰色框代表外显子组,而红色柱子代表存在突变的位置。A:特定位置的频发突变可能表示有产生突变的生物学机制的参与。B:散发突变存在于整个基因中,如P53,可能是由于复制和修复机制的失效。我们可以通过测序检测这两种情况下的突变。

参考文献

年DingLi等人发表在Natrue上的一项研究弄清了急性髓细胞白血病(AML)的复发原因。他们发现了两个一般机理:(1)原发肿瘤中的始发克隆(foundingclone)获得突变,进化成复发克隆;(2)始发克隆的一个亚克隆挺过了初次治疗,获得了更多突变并在复发时增殖。在一个病例中,原发肿瘤里原本仅占5.1%的亚克隆在复发后却成长为主要的克隆。而且对于所有的病例,化疗并不能够根除这些始发克隆。这项研究直接表明了在诊断后和初次治疗后检测并根除掉那些原本不起眼的小细胞群体有多么的重要!

DingL.,LeyT.J.,LarsonD.E.,MillerC.A.,KoboldtD.C.,etal.()Clonalevolutioninrelapsedacutemyeloidleukaemiarevealedbywhole-genomesequencing.Nature:-

同样是年,同样是DingLi这波人,同样是研究AML,他们这次发现大约三分之一的骨髓增生异常综合征患者会发展成继发性急性髓细胞白血病(AML)。这个研究的目的是为了确定骨髓增生异常综合征中的突变,它们有可能预测AML的进展。他们对七名继发性AML患者的七组皮肤和骨髓样品以及先前的骨髓增生异常综合征的配对骨髓样品一并做了全基因组测序。结果发现,在所有病例中,占主导地位的继发性AML克隆都是来自一个骨髓增生异常综合征的始发克隆。这其实就是说,骨髓增生异常综合征样品包含了对预后很重要的突变,针对这些突变的治疗方案是可能改善预后的。

WalterM.J.,ShenD.,DingL.,ShaoJ.,KoboldtD.C.,etal.()Clonalarchitectureofsecondaryacutemyeloidleukemia.NEnglJMed:-

继续肿瘤治疗和预后的话题,GerlingerM这一波人发起了一项研究,利用全外显子组测序来研究多个样品,这些样品不仅来自两名患者体内的原发肾癌,还包括了患者相关转移部位的空间分隔区域。最后,他们在原发肿瘤中看到了广泛存在的异质性现象!而且还特别指出了在每个肿瘤区域内有63%-69%的体细胞突变是无法检测到的。同时,还检测了同一肿瘤不同区域内预后良好和不良的基因表达特征。这其实还是突出了在突变积累之前早期诊断的重要性,以及对较大肿瘤需要进行多个部位的活检。利用同一名患者的多个样本得到的信息,他们能够重建疾病的发展进程!这是一种极为强大的方法,不仅能检测引发事件,还能检测表现出平行进化的基因。平行进化通常是基因在进化压力下的一种表现,其实也表示那些基因可能成为有效的治疗靶点。

GerlingerM.,RowanA.J.,HorswellS.,LarkinJ.,EndesfelderD.,etal.()Intratumorheterogeneityandbranchedevolutionrevealedbymultiregionsequencing.NEnglJMed:-。

转移

肿瘤的转移是一个复杂的过程,其中癌细胞脱离原发肿瘤,通过血液或者淋巴系统循环到身体的其他部位。在新部位,细胞继续繁殖,最终形成更多肿瘤,这些肿瘤包含了反映其组织来源的细胞。肿瘤(胰腺癌和葡萄膜肿瘤)转移的能力大大增加了它们的致死性。关于转移肿瘤的克隆结构、转移酶之间的系统发育关系、转移和原发部位的平行进化规模,肿瘤如何扩散,以及肿瘤微环境在转移部位决定中的作用如何等,许多这些基本问题目前仍然没有很好地解决。

转移瘤可能来源于原发肿瘤中一个主要克隆(如上图:Metastasis1),也可能来源于次要克隆(Metastasis2)。转移瘤也会经历克隆进化(如Metastasis1所示)

参考文献

HsiehA.C.,LiuY.,EdlindM.P.,IngoliaN.T.,JanesM.R.,etal.()ThetranslationallandscapeofmTORsignallingsteerscancerinitiationandmetastasis.Nature:55-61

这篇文章证明了前列腺癌基因组经由致癌mTOR通路的特殊翻译机制,这其中产生了一个特定的基因群,它们参与了细胞增殖、代谢和侵袭。随后作者对一类翻译控制前侵袭信使RNA进行了功能鉴定,并指出了这些mRNA主导了癌症侵袭和转移。

基因组突变

所有的肿瘤在其发展的过程中都会不断积累体细胞突变(somaticmutations)。大多数常见的肿瘤与不同的癌基因相关联,这些癌基因以低频率发生突变。从大型癌症数据库中观察到的一个最令人惊讶的现象是癌症间甚至各个癌症类型内的显著遗传异质性。然而,似乎只有有限的细胞通路对肿瘤的细胞生物学很重要。目前很多人正在编辑收录各种癌症类型的体细胞突变综合列表,这对于更好地了解这种疾病背后的机制将有很大的指引作用。

研究参考

Nik-ZainalS.,AlexandrovL.B.,WedgeD.C.,VanLooP.,GreenmanC.D.,etal.Mutationalprocessesmoldingthegenomesof21breastcancers.Cell:-

这篇文章中研究了21个乳腺癌基因组,并给出了它的一个体细胞突变列表。发现带BRCA1或者BRCA2突变的癌症会有一种特别的替换突变特征和与众不同的缺失图谱。文章中还描述了一种局部的超突变现象,这称为『kataegis』(kataegis,希腊语中『雷雨』的意思,文中指的是在一个小区域中出现大量突变的机制(如下图),并且这些区域中的碱基替换几乎都发生在TpC二核苷酸的胞嘧啶上。

这是Kataegis图像。纵轴是突变间距(对数刻度)。这个图中基因组内大部分的突变都有着1Mbp左右的突变距离。其中超突变区即是表现为突变间距较低的簇。

GovindanR.,DingL.,GriffithM.,SubramanianJ.,DeesN.D.,etal.Genomiclandscapeofnon-smallcelllungcancerinsmokersandnever-smokers.Cell:-

这是另一篇文章,主要是对17个非小细胞肺癌(NSCLC)患者的肺癌及癌旁正常组织样本进行了全基因组和转录组测序。值得注意的是吸烟者中所观察到的突变频率比不吸烟者高10倍!这是通过深度测序揭示出的这些群体间所不同的克隆模式。而且其中所有经过验证的EGFR和KRAS突变都存在于原始克隆中,这其实也就表明了它们在癌症启动中可能发挥非常重要的作用。

镶嵌性

对于这个现象我们也同样通过实际的研究来说明。AML(急性髓细胞白血病)基因组中发现的大多数突变实际上是随机事件,在造血干细胞/祖细胞(HSPC)获得原始突变之前就存在了;但是随着克隆的扩增,细胞的突变历史被『捕获』了。如何理解这里的『捕获』?其实说的就是,原本那些突变都没什么鸟用,就摆在那无所事事,但是,在许多情况下,偏偏只需要再来一个或者两个额外的突变来协助就能共同作用,最后产生恶性的原始肿瘤克隆!

原发肿瘤和转移的镶嵌性。非同义点突变和插入缺失(绿色块)的区域分布的假设热图。行代表来自七个原发肿瘤区域和六个转移区域的样品。

研究参考

AbyzovA.,MarianiJ.,PalejevD.,ZhangY.,HaneyM.S.,etal.()Somaticcopynumbermosaicisminhumanskinrevealedbyinducedpluripotentstemcells.Nature:-

这里作者发现了一个现象:平均而言,iPSC细胞系表现出2个拷贝数变异(CNV),而这些CNV在iPSC来源的成纤维细胞中不明显。他们发现,至少50%的CNV以低频体细胞变异存在于亲本的成纤维细胞中。根据这一观察,他们估计大约30%的成纤维细胞的基因组中携带体细胞CNV,这表明体细胞镶嵌性广泛存在于人体中。

基因融合

基因融合是非常普遍的,也是癌症的一个重要特征。现在的研究发现,一个强启动子与一个下游功能基因(比如:原癌基因)的融合在某些癌症中很普遍。据估计,半数的前列腺癌含有TMPRSS2和ETS转录因子家族成员之间的融合。基因融合是由两个原本分开的基因或位点融合形成的。他们可能形成一种基因产物,很多时候表现出来的功能都是全新的,与两个融合的基因个体都不同。这种阴差阳错的情况可能引起致癌机制的激活,就像费城染色体阳性急性淋巴细胞白血病一样。这种基因融合导致BCR-ABL酪氨酸激酶表达,从而激活细胞增殖。有几种机制会导致基因融合的发生,这个现象是一些癌症类型的特点。胰腺癌的特点便是染色体重排的频繁断裂-融合-桥循环。目前有几种方法可以通过测序研究融合事件,如对肿瘤的全基因组测序和mRNA-Seq。

mRNA-Seq与全基因组测序组合的方法对于发现基因融合及其机制特别高效。原因就是mRNA-Seq可以提供直接的证据,来支持观察到的融合是否发生,并同时为融合基因是否表达提供了证据。而全基因组测序可以发现那些mRNA-Seq所发现不了的区域的信息,如基因间区和UTR。

由折回倒位所引起的融合事件可捕获基因组中遥远区域的片段,如着丝粒重复或参与体细胞重排的区域。在这个例子中,6号染色体上的片段被插入到19号染色体上的重复区域之间。注意19号染色体的第二个拷贝是倒置的,这是折回倒位的特点。

MED1(红色)与几个伙伴基因(蓝色):ACSF2,USP32和STXBP4形成基因融合。

实验上的设计参考

以Pair-end进行全基因组测序是目前检测基因融合最准确、最全面的工具,这些融合包括重复、倒位、通读和单碱基插入缺失。可以说Pair-end是检测融合基因成功与否的一个关键因素。另外就是高深度测序结合更长的读长可以分辨融合连接中微同源的单碱基。而且这种能力是测序独有的。

研究参考

RobinsonD.R.,WuY.M.,Kalyana-SundaramS.,CaoX.,LonigroR.J.,etal.IdentificationofrecurrentNAB2-STAT6genefusionsinsolitaryfibroustumorbyintegrativesequencing.NatGenet45:-

文章主要是利用了全外显子组和转录组测序发现了转录抑制因子NAB2与转录激活因子STAT6的基因融合现象。其中27个独立性纤维性肿瘤(SFT)的转录组测序发现所有肿瘤中存在NAB2-STAT6基因融合。NAB2-STAT6基因融合的过表达诱导了培养细胞的增殖,并激活了EGR应答基因的表达,最后导致了肿瘤。

SeshagiriS.,StawiskiE.W.,DurinckS.,ModrusanZ.,StormE.E.,etal.RecurrentR-spondinfusionsincoloncancer.Nature:-

这一篇文章则主要分析了70个原发性人结肠癌的外显子组、转录组和拷贝数变异。拷贝数和RNA-Seq的数据分析确定了在一部分结直肠癌中存在IGF2的扩增和相应过表达。他们还利用RNA-Seq,在10%的结直肠癌中发现了与R-脊椎蛋白家族成员(RSPO2和RSPO3)相关的基因融合。这项研究表明了综合多项技术去了解复杂的癌症基因组很重要。

Thompson-WickingK.,FrancisR.W.,StirnweissA.,FerrariE.,WelchM.D.,etal.()NovelBRD4-NUTfusionisoformsincreasethepathogenic


转载请注明:http://www.naomoliua.com/lxnml/8071.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了