第492期【齐悦读—线上共读—透视新科技】“齐悦读”[线上共读] 《解码蛋白质》
讲座题目:透视新科技——解码蛋白质
主 持 人:胜 春
做客嘉宾:叶 盛,北京航空航天大学教授。
谭敏佳,中国科学院上海药物研究所研究员。
讲座时间:2023年9月18日~9月24日
(备注:讲座视频可循环播放)
透视新科技——解码蛋白质
讲座内容:
各位好,欢迎收看我们今天的《透视新科技》节目,我是主持人胜春。肺癌是影响人类健康的恶性肿瘤之一,而肺腺癌又占了肺癌当中50%的比例,最近我国科学家研究出了肺腺癌的蛋白质图谱。这个图谱对防治和治疗肺腺癌到底有什么作用呢?我们通过短片去了解一下。据世界卫生组织国际癌症研究机构统计,2020年全球新发癌症1930万例,死亡近1000万例。为了抗击癌症这种威胁人类的疾病,全球科学家们做了大量的工作。2014年,我国科学家开始了“中国人蛋白质组计划”,该计划的目的是构建人类蛋白质组的“百科全书”,全景式揭示生命奥秘。那么,中国肺腺癌的完整图谱与这个计划有何关系?蛋白质与癌症之间又有什么关系呢?今天请来的两位嘉宾,北京航空航天大学的叶盛教授,接下来一位,是中国科学院上海药物研究所的谭敏佳研究员。刚才短片当中提到了蛋白质图谱,这个图谱到底是什么样的?
我们所说的分子图谱,它实际上是一个资源的集,它记录的是整个蛋白质的像序列的信息,表达的信息,是一个相对来说比较抽象的概念,记录了整个这样的一个疾病状态或者生理状态的生命的分子特征。蛋白质我们这概念应该不陌生,我们平时吃的食物当中,肉类,蛋类,咱们都有蛋白质,但是在科学界怎么来定义蛋白质?一说起蛋白质,首先想的这是个营养品,但实际上呢,蛋白质应该说它是生命最基本的一种组成物质。比如说以咱们人类来说吧,咱们人的身体大部分是水,水分子可能占了60%到70%。那么刨除掉水之后,剩下的这些物质中,其实蛋白质是占了最主要的成分的,蛋白质可能占我们的体重能占到将近20%这样一个比例,也就是体重的1/5都是蛋白质。那要从科学上来定义呢?说蛋白质它就是一种分子,这种分子是由氨基酸所构成的,准确来说是氨基酸缩水之后构成的,那最有意思的是什么呢?
地球上所有的生物,无论是人、动物、植物还是细菌,我们都共用了20种氨基酸来构成蛋白质这样一个大分子。蛋白质在人体当中到底有什么功能,起到什么作用?蛋白质的功能应该说是非常非常庞杂的,几乎可以说我们能够想的到的这样各种各样的生物学的功能,都是由蛋白质来执行的。它首先是构筑我们身体的砖和瓦,像细胞里面很多这样的组件,我们可以说它其实是由蛋白质拼接而成的。那么另外一方面呢,我们总说人的身体就像机器一样,那我们说其实细胞就像一个工厂一样,这个工厂里全是分子级别的机器,那这些机器是什么呢?就是蛋白质,所以说这些分子机器,它驱动了我们身体的运动,和我们身体里边种种的生物化学的反应,比如说咱们吃饭吃进去的这个能量物质像葡萄糖,那葡萄糖它怎么样把这部分能量去释放出来呢?这里面经过了一系列的化学反应,那么这些化学反应全都是由蛋白质去催化的,那么也就是说离开蛋白质之后,我们的生命就不存在了。说到蛋白质呢,我们通过短片去了解一下。
蛋白质是组成人体一切细胞、组织的重要成分,是所必需的生命物质,我们纷繁复杂的生命活动需要大量的不同种类的蛋白质来完成。如有催化功能的蛋白质称酶,完成着人体的新陈代谢。血红蛋白运送着氧气和二氧化碳,抗体也是一种蛋白质,维持着人体的免疫和防御。奇妙的是,生命体中的蛋白质仅仅由20种氨基酸组成。但是这些氨基酸经过不同长度及排列组合,组成了数量庞大、性质、功能各异的蛋白质种类,在体内不断进行代谢与更新。那您给我们解释一下,蛋白质是怎么产生出来的?蛋白质实际上从生命的角度,主要的三种生物的大分子是核酸、DNA、RNA到最后是蛋白,事实上DNA相当于是所有编码遗传信息的这样一个生命信息的源头,然后经过到RNA,它相当于是连接了基因跟蛋白这样的一个桥梁。最后是产生蛋白来执行,刚才叶盛说到的各种生物学的功能,基因事实上是记录了所有生命的遗传的信息,蛋白描述的是现在正在发生什么样的生物学的功能。有人说蛋白是可以后天补充的,这个补充的蛋白跟我们机体内自身产生的蛋白质是一样的吗?
应该说肯定不是一样的,为什么这么说呢?刚才谭老师也介绍到了,蛋白质怎么生产出来的?它是从DNA里边编码,然后一步一步最后生产成蛋白质的,所以说人类这种生物,我们身体里的所有的蛋白质的编码,是由我们的基因去决定的,但是你吃进来的蛋白质可不是人的蛋白质。你吃的是大豆的蛋白质,你吃的是鱼的蛋白质,植物的牛羊的蛋白质,那么这些蛋白质进到我们的消化系统之后,它首先会被拆解成氨基酸。我们的细胞其实是利用这些氨基酸,然后把它按照我们的基因编码,重新生产成人自己的蛋白质,所以说这个蛋白质摄入的过程,不是说像我们很多人想象的,吃进来我们就有了这个蛋白质,其实不是这样的。它就像一个拼接玩具一样,你把一整件玩具吃进来,但是在我们的肚子里把它拆散了,先让它变成氨基酸。按照我们设计图,重新来生产我们自己的蛋白质,那回过头来我们再说。我们为什么要绘制这个蛋白质的图谱?这个图谱到底有什么作用?
蛋白是所有功能的执行者,实际上我们希望能够通过这个(蛋白质图谱)对某个疾病或者生理现象整个蛋白层面的蛋白质(进行)系统的分析,从而能够获得对某个特定细胞或者组织的蛋白质组的所有的特征,也就是所谓的它的生理性质,或者是在疾病发生发展中的蛋白质特征,也叫病理机制,从而能够更好地理解生命现象和疾病的这个机理。通过这样的策略,我们可以进一步地来发现这个疾病的诊断也好治疗新的策略。我举个例子吧,就是咱们很多人可能对计算机比较了解,你看这个计算机有操作系统,操作系统是由几十万几百万行代码所构成的,但是你有没有想过一个问题,其实在我们使用一台计算机的这几年,甚至十几年里边,很多代码可能从来就没有执行过。因为你在使用中没有去涉及到那些功能,所以咱们的基因组其实有个类似的特点,就是不是说我们知道了基因组中所有的基因之后,那我们的这个细胞在此刻,就有它们每个基因对应的蛋白质。其实我们细胞在不同的状态下,不同的时间点,不同的身体中的部位,那么不同的细胞,它里面的蛋白质组成都是不一样的。所以,我们只有真正了解了细胞的这个蛋白质的谱图之后,我们才知道到底在此时此刻,这个细胞里边是哪些基因对应的蛋白质真正被生产出来了。
那您研究的这个蛋白质图谱,它跟这个肺腺癌之间到底是一个什么样的关系呢?对于肺腺癌来说,目前在我们这研究之前,实际上主要的认知是在它的基因组的层面。对它蛋白质组的层面的特征,在这之前并不是很清楚,通过我们这样的分析呢,我们与正常的肺的这样的组织来进行比较,我们发现了肺腺癌相关的这些异常的蛋白质。从而可以了解到它相应的这个病理的机制,以及发现了一些潜在的药物的作用靶标,这样可以为肺腺癌更精准的诊断和治疗提供线索。您能给我们解释得再通俗一点吗?就是可能接着我刚才那个例子说,我们每个时刻,每个不同的细胞,其实里面蛋白质可能是不同的,那如果是正常的细胞,可能大体是差不多的。但是这个细胞不一样,它是一个癌细胞。病变的细胞。我们以前说到癌细胞,咱们总知道致癌基因,但其实我们不知道的是什么呢?这个癌细胞里,它真正表现出来的区别是里边的蛋白质发生变化了。跟这个正常细胞里的蛋白质的种类,甚至是里面的这个同样的蛋白质,它的序列都发生了变化,我们就需要把它的蛋白质全都研究出来,把正常细胞的研究出来,然后去做比较,你可能就能找到说,这个癌细胞里边可能多了某种蛋白质,或者少了某种蛋白质,或者某个蛋白质发生变化了,这就是导致疾病的原因。
蛋白质图谱这概念很多人还是很陌生的,我们来看一看相关的短片。基因记录的遗传信息需要转换为蛋白质发挥功能,蛋白质是生命功能的直接执行者。因此研究DNA能告诉我们生命体会发生什么,而研究蛋白质则能告诉我们生命体正在发生什么。蛋白质组学即是从蛋白质分子水平上给生命体内全部蛋白质进行精准“画像”,系统描绘生命体内蛋白质的表达、翻译后修饰、相互作用及其动态变化等精细“相貌”。如果我们得到了某种疾病患者的蛋白质组,相当于我们已经拿到了疾病患者蛋白质分子层面的“画像”,通过对该“画像”的解读,就可以看出患者体内蛋白质表达相互作用等“相貌”特征。通过与正常生理状态下,蛋白质组“画像”相对比二者的差别,就能揭示疾病的发生发展机理。目前我们对于这个蛋白质密码的揭示,能够看到疾病的这个机制,可以通过这些来治疗这个疾病吗?
是的,当然可以。实际上目前绝大多数的药物的作用靶点都是蛋白。举个例子来说吧,就是表皮生长因子的受体,或者英文叫做EGFR的抑制剂的研发。它在正常的这个生理的过程中,它实际上是细胞上的一个膜的蛋白,它可以感受到细胞外的信号,从而激活它,然后行使一系列的生理学的功能来维持细胞的正常的生理状态。但事实上在相当的比例的一些肺腺癌的病人中,我们中国的这个病人中,他的EGFR这个蛋白,实际上它是有激活的突变,一旦突变以后,它就不需要外面的信号,它自己持续地活化,导致(癌)细胞一直生长,也就是恶性肿瘤。通过对这个发病机理的了解,我们来设计特定的药物来抑制这个突变的EGFR的功能活性,就可以达到精准治疗,这样EGFR突变的这样的肺癌的病人的一个效果。但是这里边可能有这么一个现象,就是说以前我们有的时候研究药物是属于,我们首先找到了药物,然后我们再去研究它到底作用在哪个蛋白质上,我们去研究它的机理。后来呢,我们属于在某些科研工作中发现,这个蛋白质很重要,然后我们找一个药去治疗它,而谭老师他们现在做的工作呢,是说我们能够通过对癌细胞和正常细胞比较,我直接把那个罪魁祸首抓出来,我找到那个蛋白质之后,针对它去进行药物的这样一个研发。这就是谭先生提到这个靶向。哎,对,对,对。
那就刚才谭先生谈到的,对中国的现有这个肺腺癌的图谱它的研究,我们看到已经起到了一定的作用,并且给我们带来了很多重要的信息,这些重要的信息的意义是什么?这就是实际上我们前面谈到的,我们在精准医疗这步上迈出了重要一步。那我们知道了更多的这样疾病细胞的对应的这样一个蛋白质组也好,或者说蛋白质图谱也好,这样一个综合的信息,这样一个数据库,那么就能够使我们相应的疾病的诊治,疾病的药物的研发,就能够有一个新的契机。那么实际上直到今天我们很多疾病,特别是癌症还是缺乏特效药。所以我们药物研发的重任仍旧是非常重的,那么像这样的一个计划呢,其实是能够帮助我们在相应的药物研发上能够迈出新的一步。那中国的这个蛋白质图谱的研究,目前我们已经可做到对肺腺癌的治疗,起到非常好的一个效果和作用。事实上我们还没有到这一步。还没到这一步。我们做的像肺腺癌这样的研究工作,它还是一个偏向应用技术的研究,事实上是对这个中国的肺腺癌的蛋白质组,这个人群临床和预后相关的特征的这样的一个分析。主要是建立了这样的一个资源的数据集,或者叫全景,为它的发病的机理、诊断的标志物提供了重要的线索。但是事实上从基础研究,到最后做成一个药物,其中里面还有很多很多的其他的重要的关键环节,还需要进一步地探索和研究。
当我们对这个图谱越来越了解,研究越来越深入的时候,是不是可以像我们想象的那样,做到说这个人身上有没有病,来我们列个图谱吧,于是在这个图谱上就可以发现你哪里有病,哪里没有问题,是这个道理吗?主持人说的这个提得非常地好,事实上这就是我们现在所谓的精准医疗,精准医学的概念,就是大概是这么来的。就是针对每个特定的人,来绘制他的分子的图谱,从而找出他的致病的机理,根据这个机理来选择相应的药物进行治疗。但这方面的确已经有一些成功的案例,而且我觉得在我们这个生物学界和医学界,还算是比较著名的案例。像有一个病人就是这样,一个美国的癌症病人,他得的是白血病、血癌,那么在这个研究过程中呢,结果就发现他的这个癌细胞的基因组和他的正常细胞基因组,没找到任何显著的差异,然后最后就是在蛋白质组的层面上,发现他的癌细胞里边有一种蛋白质,名字叫FLT3。这种蛋白质在他的癌细胞里特别地多,那么这种异常就导致了这个细胞变成了一个癌细胞,然后就使用了针对这样一个蛋白质的一个靶向的药物,就把他的这个癌症给治好了。
目前也是刚刚起步吧,对绝大多数的情况下,事实上还做不到这么精准的治疗,只是针对一些个别的肿瘤疾病。而且相对基因组学来说,在这方面做得更加地成熟。从蛋白质层面的精准治疗,实际上刚刚开始在基础研究的这样的阶段,到临床的诊断和应用可能还是需要有一段时间的。人类这个对于DNA图谱的这个研究,已经得到了很长足的进展。那既然在这方面已经取得那么大的进展,我们为什么还要下大力气去研究蛋白质的图谱?因为像DNA,它只是记录了遗传的信息。而真正执行功能蛋白,它所表现出来的各种的性质,实际上远远要比基因组记录的这个信息要丰富多彩。仅仅来研究这个基因组的信息,它不能够有效地来预测蛋白质在生命现象中的各种的功能。因此呢,仅仅基因组的研究对这个生命现象也好,疾病这样的认识是有局限的,不完整的,只有系统地来对蛋白质的这个各种特征来进行阐述的话,才能更好地来了解生理现象,和疾病的这个病理的机制。举个例子来说,就是有一些疾病的发生,在基因组水平它是没有变化,但是它事实上最终的功能的执行是发生了变化,蛋白发生了变化。对于这样的情况,系统地来研究其蛋白这样的变化,是对疾病的这个发生发展的认识和发现相应的这个治疗的新的手段是有重要的作用的。
实际上我们一直在这么做,就是蛋白质的研究始终都是生物学研究中非常非常重要的一个组成部分。实际上我们知道人类基因组计划现在告诉我们人类,大概有不到两万个基因,但是这不到两万个基因却能产生多少种蛋白质呢?数百万甚至更多。对不同的人有不同的说法,但至少在百万种这种量级上。但这一百万种蛋白质或者数百万种蛋白质,它不是同时存在于一个细胞里边,可能我们在生命的某些阶段,比如胚胎阶段,可能只生产了其中某一部分,长成成人之后,又生产了其中一部分。肌肉细胞里有某些蛋白质,神经细胞里又有一些不同的蛋白质,所以你可以看到这是一个非常丰富动态变化的图景,所以研究起来就非常非常地困难。借此机会,您也可以给我们介绍一下我们中国人类蛋白质组计划,现在的进展情况是什么样的?我们中国人类蛋白质组计划,事实上是2014年是科技部启动了一个项目,主要围绕着就是建立蛋白质组学分析的新技术、新仪器,来系统地绘制人体的主要的器官的生理的和病理的这张谱图,从而来从全景的角度,来深度地相当于是绘制这个蛋白质相关的生命的密码。然后,希望能够更好地深入地来发现疾病相关的这个病理的机制,挖掘潜在的新的药物的治疗策略,实际上已经取得了多项的成果。
比如说2018年的时候,对糜烂性的胃癌进行了这个全景的蛋白质的解析。2019年的时候,对早期的肝细胞癌,进行了全景的解析,并发现了潜在的新的治疗的靶点,到2020年对肺腺癌进行了全景的谱图的解析,到了今年(2021年)事实上中国的人类蛋白质组学计划,到了2.0的版本,这是我们由中国科学家率先倡导的。它实际上是围绕着以蛋白质组学为核心,深入地和临床合作,希望能够在疾病的诊断和治疗上有更重要的一些突破。说到这个话题呢,我们来看一看相关的短片。“中国人类蛋白质组计划”是中国科学界,乃至世界生命科学领域一件具有里程碑意义的大事。该计划以中国重大疾病的防治需求为牵引,发展蛋白质组研究相关设备及关键技术,绘制人类蛋白质组图谱,揭示疾病的发病机制和病理过程。发现系列新型诊断标志物、治疗靶点和创新药物,为全面提高疾病防诊治水平提供新策略、新手段。肺腺癌蛋白质图谱的绘制是“中国人蛋白质组计划”重点专项继肝癌、胃癌研究之后,取得的又一重大成果。该成果再次证明了蛋白质组学的成熟度,足以帮助解决认识一系列的重大医学问题。也再度证明了中国的蛋白质组研究不仅站在了全球的制高点,也站在了时代的制高点。未来,科学家还将对蛋白质组开展哪些方面的研究呢?
目前,我们人类对于这个蛋白质的研究,处于什么阶段?目前我们国家的研究,遇到了哪些问题和瓶颈?相对基因组来说,实际上(对)蛋白质组的认识,还是有相当大的认识上的差距的。实际上我们目前还是在数据积累和分析的这样的阶段,基因组相对来说它是个静态的有限的这样一个信息。而蛋白质组因为它是非常动态,从技术的角度来说,实际上有很多的可能是未来可以突破的,目前困扰的问题,比如说在单细胞层面的这个蛋白质组的绘制蛋白的结构,功能的分析。比如像这种时间和空间尺度的精细的蛋白动态行为变化的分析等等,都是期待突破的技术难题吧。从功能的角度,事实上仍然有相当多的蛋白,我们对它的功能认识,是非常非常有限的。虽然说绝大多数的药物的作用的靶标或者靶点是蛋白,但事实上仍然有相当相当多的蛋白,由于种种原因吧,目前还不能够成为药物治疗的作用靶标。这些科学性的问题,也是非常需要以后来解决和突破的。
未来我们对于这个蛋白质的研究,到底能够解决哪些问题?到底对我们的百姓生活,对社会会有什么影响?我觉得首先可能就是对于这个疾病的相关的研究,会有一个很大的推动作用,比如说咱们这一次新冠的疫情,我不知道大家有没有注意到,当我们鉴定出了新型冠状病毒之后,针对新冠的这样的一个研究,在整个2020年里边,是一个突飞猛进的发展。那为什么我们能有这么快的一个发展,就是因为我们很快地知道了新冠病毒的各个组成它的蛋白质,都是哪些蛋白质,序列是什么样子的,长得是什么样子?然后相应的我们就可以进一步深入地去做疫苗的研发,去做药物的研发,那么这些呢,都是基于我们对于这些蛋白质的具体的了解,而不是基于我们对于基因的这样的一个了解。所以说这可能就能回答您的问题,就是我们对于蛋白质有这些更加形象化,更加具体的认识之后,才能够使得我们对于疾病有一个更准确的认知。另外一个比较重要的方面,就除了药物的治疗以外,现在提到的精准治疗就是发现这个针对一个人的,某个特定的人某个特定的蛋白,表达的情况来进行分析,可以更好地获得这样的病人的一个精准的诊断,精准地设计治疗的方案。这也是我相信在蛋白质这个层面,会在精准医疗的方面,会起到越来越重要的作用。
我觉得就像我们的基因组计划走到今天,其实我们看到我们对基因组的测试已经变得越来越容易了,那么我幻想未来有一天,也许我们对于蛋白质组的研究,也可以变得更加快速,更加简便。比如当我们生病的时候,我们现在去取一滴指血,那么这个血液中的细胞,我们可以对它去进行一个蛋白质组层面的检测。或者我们在身上生病的部位,或者受伤的部位去取一些细胞,我们可以对它进行这种蛋白质组层面的这样的一个检测,然后我们就能够准确地知道我们该使用什么样的药物。我觉得那一天的话,我相信会到来的。今天呢,非常感谢两位嘉宾来到我们演播室当中,共同给我们解码蛋白质。在这儿,也感谢您收看我们今天的《透视新科技》节目。如果您想了解更多节目内容,可以下载央视频去收看其他节目。我是胜春,今天的节目就到这儿了,咱们下期节目再见。
(通讯员 邓辉)