第602期【齐悦读—线上共读—透视新科技】 “齐悦读”[线上共读] 《让无喉者开口说话》

您的当前位置：首页 > 活动中心 > 公益培训 > 内容

2024-10-14 16:43:51 来源: 点击量：

（通讯员邓辉）

讲座题目：透视新科技——让无喉者开口说话

主持人：胜春

做客嘉宾：牛海军，北京航空航天大学生物与医学工程学院教授。

陈晓红，首都医科大学附属北京同仁医院主任医师。

讲座时间：2024年10月7日～10月13日

（备注：讲座视频可循环播放）

https://article.xuexi.cn/articles/video/index.html?art_id=15432714745911966407&read_id=ebb0bb6a-1717-410b-b829-6bf01e1c84bd&ref_read_id=2fddebfb-9cd1-45a9-92ba-5c6200283951&reco_id=&mod_id=&cid=&source=share&study_style_id=video_default

透视新科技——让无喉者开口说话

讲座内容：

各位好，欢迎收看我们今天的《透视新科技》，我是主持人胜春。据统计，我国每年有十几万人，因伤病而失去喉咙，从而导致失去说话的能力。科学界一直在努力研发一项新技术，让这些失去咽喉的人重新开口说话，那这到底是一项什么样的技术呢？我们通过短片来进入今天的节目。家住北京的刘春荣，今年71岁，本来热情开朗、能言善道，但是突然确诊的喉癌，让她的生活彻底发生了改变。得了喉癌的患者不仅说话声音异常，还会出现呼吸困难、咳嗽等症状。以往治愈喉癌最常见的方法是切除咽喉，这也意味着患者永远失去了用来发声说话的声带。2018年2月，刘春荣通过手术摘除了咽喉。病痛虽然解除了，但是她的生活又陷入了另一种困境，因为不能说话，她无法与家人和朋友正常交流，刘春荣远离了热闹的朋友圈。更让刘春荣难以接受的是，她不仅失去了说话的能力，甚至连哭、笑、打喷嚏都发不出任何声音，家人更是无从知晓，无助、恐惧、自卑，种种情绪逐渐萌生，让她几度崩溃，甚至丧失了对生活的希望。就在这个时候，一个新型电子设备的诞生改变了她的人生，让她重新燃起了对生活的渴望。

首先，我们给大家介绍一下我们今天请来的两位嘉宾，一位是北京航空航天大学生物医学工程高精尖中心的牛海军教授，欢迎您！另外一位，是首都医科大学附属北京同仁医院的主任医师陈晓红，欢迎您！其实说到喉癌这样的病例的时候，很多人印象比较深的是当年的我们国家的一个著名的相声演员李文华老师。李文华老师他患喉癌的事情，应该很多人很多人都知道，他患喉癌以后，要把喉整个给它拿掉。拿掉以后，他实际上失去的不光是喉，他失去了声带，实际上声带是我们说话的源泉，声音的源泉。作为患者来讲，比如像我在手术以前，我是正常和周围同事和社会是通过语言来进行交流的，但是一旦做完手术以后没有喉了，他等于说和这个世界就阻断了，他想表达没法表达，尤其是不会写字的人，基本上他和世界就隔阂了。什么样的人会失去咽喉呢？如果是喉部长了有恶性肿瘤的话，在早期我们是可以保留喉，但是在晚期肿瘤的时候，或者对于复发性肿瘤，大部分情况下，我们是要把喉拿掉。

患了肝癌，可以肝脏移植，包括心脏都可以移植，都可以成功了，那喉可以移植吗？喉是可以移植的，喉最早的移植是1998年，为什么国内外专家再没有在这个领域去继续跟进呢？主要是我们心脏或肝脏，它是人体不可或缺的器官。但是喉来讲，我们做移植它的代价很大，因为我们要终身吃抗排斥（异）的药物，对于患者的生存质量影响是挺大的，所以后来医学努力的方向是放在，比如像我们电子喉的开发，我们临床技术的改进。电子喉研发的初衷一定是看到了很多失去喉咙的人的这种痛苦。我们在做这个项目的研究之前，我们也是没有想到喉癌病人有这么多，后来我们就通过查阅资料，在跟我们同仁医院等等的一些医院的医师、主任去交流，我们才发现原来我们每年发病率有这么高，在十几万个水平上，所以这也是激励我们就是来做这方面的研究，能不能为全喉切除术的患者，去给他们造福，让他们能不能恢复发声，所以这也是我们的一个出发点。语言在人类的交流当中非常的重要，我们编辑了短片，我们去看一下。人类的交流有多种方式，肢体语言往往误差较大，文字交流费时冗长，眼神交流则难以表达更丰富的内容。相比较而言，语言对话最直接和准确，也因此成为人类沟通交流的首选。因患病而丧失喉咙，就会陷入沟通交流不畅，被人误解的窘境。如何让罹患喉癌的患者回归正常的生活，享受幸福的人生呢？

让人开口说话的原理是什么？我们可以简单地理解成三个过程，第一个过程要提供动力，就是我们通过胸腔的挤压把肺脏的气流造成一个高压，这种高压的气流冲击声带。那第二步，我们借助这些气流造成声带振动，然后这个振动再传递到空气当中，它就能发出声。第三步要通过舌头软腭，包括我们的嘴唇，我们就发出音，从声能变成丰富的音，所以我们叫声音，我们通过这个咬字器官的变化就有很多不同的词、词汇就可以出来。原来我们在没有研究出电子喉的时候，我们失去喉咙的病人怎么来开口说话？一种方法，就是通过食道发声。还是发声的三个阶段，它把胃当成了肺，先深吸一口气，这个气流通过腹腔的扩张以后，膈肌的上提之后，把气流通过食道到达胃泡，到了胃泡以后再挤压，这个胃泡的气体通过口腔再出来，引起咽腔黏膜的振动，所以等于用胃来替代了肺，我们叫食道发声。我们知道娱乐节目有一个腹语，就是主持人到这上面来，我们只看到他（嘴巴不动），实际上声带是不发声的。第二个就是通过这个食道气管瘘，这种发声它的最大的优点，它是气量比较足。因为它是从肺里气量过来的，可以连续说话，现在演进的可以放一种单向阀门，把这个口给它摁住。我手可以不放打一个领带，可以连续唱歌。

这在国外有一个节目无喉患者，他在台上主持了半个小时。大家都不知道，那它的缺点就是声音比较机械，那食道的发声，它要人比较瘦，比较胖的人不行。因为他要中气非常足，他要腹肌或胸腔的配合特别到位，所以比较瘦的人，他比较合适练食道发声，而且需要一个训练的过程，但是它发出来的声音呢，它比较自如。如果他配合好，打一个领带，有时候你都不容易看出来。我记得当年李文华老师患了喉癌之后，接受采访的时候，他会谢谢观众朋友，（声音）会一断一断的，这是为什么？我不知道李文华老师在节目上表现，他是用食道发声，还是用人工喉发声。如果用食道发声，他一次是达不到这么大的一个气量的。他要把气引到胃泡里面，然后从胃里面再返出来，所以那个气量是不够的，所以你听他的声音是断续的。会断续。还有一个就是辅助发声，我们讲人工喉，现在是用在食道或气管之间打一个通道，然后摁住这个造瘘口，让肺的气流到达食道。然后再从口腔出来，这个气流经过口腔时候，引起口腔黏膜的一个振动，这个振动就相当于我们声带的振动，所以再配合口齿的变化，就能发出一个声音。所以像这种临床技术也很多，但是它是要求医学要多做一个手术，每年要更换这个人工喉，要进行更换，它的费用会比较贵。那个时候还不叫电子喉，叫人工喉。人工喉的研究其实在我们中国古代就有了，是非常有意思的一个事情。讲讲这段历史。

我们也是在查一些文献的时候，就发现大概在宋朝，沈括有一个《梦溪笔谈》一本书。那么在《梦溪笔谈》上就谈到过一个设备，过去人把它叫作颡叫子，其中还有这么一个故事，就是有一个人，因为不能发声了，当然那时候没有全喉切除了。但是，他没有声源了，可能照现在的情况来说，就他声带不会动了，那么他也就不会发声了，所以有人诬告他，他在大堂上又说不出来，那么后来官员就给了他一个设备，然后他就放到嘴里呢，就能发声。大概能听清楚了他的冤情，所以就得以伸冤，所以这是我们古代的这么一个故事，实际上这就是人工喉的一个原型。人工喉的雏形应该说。对对，雏形。实际上我们古代人是非常非常聪明的，已经有了这方面的一些理解了。但现在的人工喉呢，实际上我觉得就是从这个基础上来的，把喉整个给它拿掉。拿掉以后失去了声带，我们就想能不能给他补一个声带。当然现在从材料的角度来讲呢，想再造一个声带植入到人体里面去，我们跟陈主任他们已经交流过，这个还是比较困难的一件事情。因为声音的产生的过程呢，实际上非常复杂，它受着神经的控制。那么我们后来就想，能不能用一个外部的这么一个设备来代替声源，从外部给他一个声源，然后呢，让他再去恢复发声。因为随着电子技术的发展，人们就是用电子技术的方式，设计类似于古代的这种人工喉，给人一个再造声源，所以这也就是电子喉的这么一个叫法的一个来历，电子喉咙要涉及到高精尖那么高的程度吗？

实际上人呢，可以说是一个比航天器，比飞机要更精密的一个仪器。可以这么简单来说，声音的产生的过程呢，实际上非常复杂，是完全靠着发生器官的配合，我们的唇，我们的齿，我们的舌头，我们的鼻腔和上声道的整个的形状的变化来发声的，同时受着这个脑，就是我们思维，就是我们的神经的影响，我们想让它说什么样声音。然后，这个神经传导到声带上，声带会通过它的紧张程度，绷的紧张程度来变化它的频率，那同时，我们肺部的气流还要冲击，如果声带紧了，那么冲击的时候它的频率就高。声带松了，冲击的时候它频率就低，就像我跟主持人您在说话的时候呢，我们实际上发出来的声调是抑扬顿挫的，为什么会抑扬顿挫呢？就是我们的声带本身在随着我们的思维，在调节它的频率的变化。我们今天的电子喉是什么样的呢？它其实就是一个外置的声带，那么既然是外置的声带，也就是它本身就能发出声音，那它发出声音怎么发呢？实际上就是我们有一个电池里面的发声马达，马达做这种往复的运动，然后就可以产生一种声音。就是我们刚才讲发声的三个阶段，这个电子喉就取代了第一或第二个阶段，所以你只需要口齿做配合就行了。第一阶段是我能出来声音，然后用唇齿间的变化来说出字来。对，他只需要口型变化，就像你去拍哑剧，说哑剧我们有双簧，后面有人说，前面有人不是做口齿的动作吗，后面说话的那人相当于电子喉。就抵在这个上面，他就是做动作，这个声音就可以发出来，是这样。那说到这个话题，我们看看我们编辑的短片。

笛子发出声音的过程，与人类发声有些类似，人类吹气给予动力，笛膜如声带一样振动发出声音，按在不同笛孔的手指调节着笛声的声调韵律，就如同人类唇、齿、舌等器官，把声带发出的声音调节成语言。但是人类的语言要比笛声复杂得多，因为人的声音不仅受唇、齿、舌等器官的影响，还会根据人的情绪波动有所变化，紧张、愤怒、悲伤等情绪。通过神经信号传导给声带，就会影响声带的状态，声带或松或紧的变化都会让它发出的声音截然不同。所以，要仿生人类的声带，不仅仅要做出一个差不多的“笛膜”，还要抓住人不同的神经信号，这并不是一件容易的事情。电子人工喉能否完全替代人的声带呢？这个电子喉具体使用的方法是什么样的呢？实际上现在的电子喉，也有好多种类。其实最简单的，实际上它就类似于一个这么大一个手电筒的这么一个东西，是在身体外挂。对，在身体外，就是我可以拿一个咱们看一下，就是大概类似于这么小的一个手电筒一样的东西。直接就顶在这个喉切除患者的脖子上，然后它就可以产生一个声音，这个声音就可以传到患者的口腔内去，然后患者对口型就可以发出自己需要的语言来，所以它使用起来实际上是非常方便的，但是我使用不好，因为这个需要训练。

训练的是什么？因为他过去发声的时候，它是一个无意识的状态，他想说他就说了，因为声带从小就已经训练好了。但他现在没有声带了，他这个声源如何和他所要说的话来配合，就是口腔的运动来配合，这是一个非常关键的事情，有的人光顶在这儿，但他因为他喉切除了以后，他本来就发不出声音来了。他也不知道如何去对口型，他也不知道自己发出的声音到底怎么样，所以要经过一定程度的训练，如何使得电子喉的声源和他的发声的器官的协调更好。经过自体人机的长时间的配合之后，会让你的语言更精准。是的，电子喉它最早出现于美国，但是国外的电子喉，它一般没有频率变化，就是一个单一频率，也就是说它可以传递信息。但是情感就会弱化一些，它关键还不仅仅是情感，因为国外的英语，你比如咱们说语言，咱们说speech语音。它speech，它是靠s-p-e-e-c-h，speech你只要能听到这几个发音因素，就可以理解它的意思，但中国话语不是中国的语言呢，你像ma这四个声音是完全不一样的。你如果没有频率变化的话，你这四个声音，四个完全就都是ma，都是ma，都是一声，你就没有二声、三声和四声，所以国内对它的频率的变化有很大的要求。那这不是对我们的研发者提出了更高的要求，所以我们要做的就事情，就是如何使得这个电子人工喉，它的频率变化更丰富，能说出我们汉语普通话的这种声调来，否则我们听他讲话的时候就比较困难，再一个也就比较难以理解。

如果有了声调，那就非常丰富了，而且就像您说的，可以带上他个人的一些情感信息了。现在能做到了吗？现在能做到一部分。一部分是怎么理解？电子人工喉其实它的核心还是在仿我们的声带，声带的振动。那仿声带振动，实际上是仿两个方面的东西，第一仿声带振动的这个波形，第二仿振动的这个频率。那么振动的频率核心问题，还是就是我们的神经控制的问题，如果能把神经控制的问题解决好的话，那么这个仿声就能做得更好。因为电子喉的这个频率调控，就是它的声调的调控，是一个非常复杂的一个过程。如果完全要做到这种变频，我们就必须了解清楚它的发声的神经机制，我们把这个神经信号如果能拿到，然后用它来反过来再控制我们的电子喉的频率变化，那就能做到实时的变化了。但实际上这个是一个非常困难的事情，神经信号的获取和它的解码是非常困难的一个事情，所以现在还做不到这一点。那今天我们这个电子喉应用起来如何呢？

电子喉还是它容易（用）学的快，非常方便，在短时间内能给他提供一个重新开启或这个社会交流的这种渠道，对于他来讲这是非常意义重大的。电子喉到现在为止，我可以把它大概归结为三代产品。第一代，它没有频率变化的，比较适用于西方语言的那种，第二代呢，就有频率变化，但是频率变化并不是很丰富。像西方语言里面就西方的电子喉，它现在设计的有高低频两个频率变化，那完全就能满足他们的说话习惯了，但是就满足不了我们汉语普通话，所以第三代呢，我们已经做出来能产生四种不同声调的这种电子喉了。当然未来呢，我们可能要使得这个频率变化更丰富，甚至于广东话有七八个声调的这种话，我们也能给它说出来。用自己的方言讲话更舒服、更亲切，现在的电子喉的功能有可能升级到这样一个程度吗？实际上电子喉的这个发声呢？和方言关系不是特别地密切，因为某一个地方的方言，一方面当然跟我们的声源有一点关系，但是关系不是特别大，它主要的方言还是靠着我们上声道，就是靠着我们唇、齿、舌、鼻腔、口腔的配合来变化它的声调的。如果这个电子喉做好了，他用电子喉的时候，他照样能说出四川话来，照样能说出云南话来，照样能说出他的方言来。是这样的，取决于你的原始发声的，口唇之间的变化。我们的电子喉在临床应用上有没有副作用？这个产品基本上认为它没有什么副作用，非常安全。电子人工喉应用起来到底如何？我们通过短片去了解一下。

利用现代电子技术，新的电子人工喉实现了对声带频率上的仿制，也比以前的电子喉拥有更丰富的频率变化，让发出的声音更加贴近人声。但是要想让电子喉的声音真正地与人声一样，甚至做到每个人都找回自己原有的个性声音，还有一段很长的路要走。大家好！我是刘春荣，我可以说话了，我非常开心。那目前在电子喉研发的过程当中，限制我们发展的技术瓶颈出现在哪些方面？我觉得主要还是频率的变化的调制，就是如何使这个频率变化更丰富。我们想让这个频率变化更丰富，我们就要想很多很多的办法，实际上最根本的是要解码出来，我们的神经到底是如何调控这个声带的？神经信号跟声带的这个振动的频率的高低到底之间，有什么样的一个关系，当然这属于基础研究的一个范围了。我们只有把这基础研究神经信号的这解码做好了，我们可能才能更高一步地提高我们将来电子喉的这个质量。目前的技术不能够做到女生和男生的区别吗？目前做不到。这是为什么呢？因为这个声源是外置的一个声源，因为这个外置生源呢，要进到口腔里面，那首先要经过颈部组织的这个皮肤，然后进去和组织。而且人体的这个组织呢，用学名来说它是一个，对于声音来说，它是一个低通滤波器，就是低频的声音它容易通过，高频的声音就被滤除了，所以我就是给它一个高频的声音。它经过了这个组织以后呢，从嘴里出来的又变成一个低频的声音了，一般大概就是在八十到一百五十赫兹了等等，这个范围，而女声的一般都三、四百赫兹的这种高频声音。而恰恰我们这个组织呢？把那个高频给滤掉了，所以特别是女性用电子喉的时候，她说出的话有可能很粗、很低沉，所以就有点像男声。还有一个心理重建的过程，比如像以前你是个歌唱家或者是个老师，你的声音悦耳动听。但是机器出来的声音不是他自己原来的声音，很多人他不愿意说，他有一个心理重现的过程。

我们这个电子喉，除了帮助失去喉咙的人之外，会给普通人带来什么好处呢？我举一个最简单的例子，大家就能想象，我们可以看到在电视上有一个人插管了。在ICU插管了，插管了没法说话，他要去表达，这时候实际上他把这个电子喉往上放，他是可以说的。可以的。特别是做完气管切开的，他没法说这个手都是可以动的，所以这些场景都可以用到电子喉。那从未来的角度来讲，我们研发的未来电子喉这个技术，它的应用前景还有哪些？可以让我去畅想的，其实这个仿生技术在我们现在的科学研究里面，是无处不在，真的是无处不在。像我们北航在做的，好多飞行器等等这些，其实都是在仿一些昆虫或鸟等等，它的飞行方式，我们电子喉同样是仿声带的振动，实际上核心问题呢，还是我刚才所说的神经调控的问题。如果这个神经调控做得好，它就仿得好，那么它所涉及到这个相关技术呢，在其他的医疗领域都能应用到我们的人工器官，我们的人工肺，都跟神经有密切的关系，也靠着神经的这个调控的，还有一个就是我们叫讲话头技术。那么这个讲话头技术呢？实际上为将来的机器人的发展呢，会带来很多很多的方便之处。因为我们现在的机器人也是采用的是合成技术，它嘴一张一闭，一张一闭，它说的话和它的嘴型，和它整个的这个声道是没有关系的。我们讲如果能基于发声器官的，语音重建技术能做得更好的话，那么它就完全靠着自己嘴形或者是自己的这个口腔的变化就能发出声音来。

陈先生在临床有丰富的经验，比如说这种仿生的技术，会对我们临床未来的耳鼻喉，甚至其他的人体器官替代有启发吗？作为临床来讲，我们作为应用的终端，我希望未来可能有三个方面的变化。一个方面的变化就是刚才牛教授反复强调的，我们汉语它本身固有的特征，它是要四个语调，把语调能够在人工喉上再现，我觉得这一点未来可能要结合电生理，它是一个符合医学和医工结合的一个课题，可能要（有）漫长的一段路要走。第二个就是我们希望能再现个性化的声音，个性化的声音就是我是我的声音，你是你的，你的声音很悦耳主持人。但我们的声音可能是另外一种声音，歌唱家是歌唱家的声音，就还原你本真的声音，所以我们现在做的，和牛教授我们课题做了一个工作，每一个到我们科治疗的人，我们都要把他声带没有发病的，以前的声音录一段声音，生成指纹，作为指纹库，每个人指纹库做起来，未来牛教授他的技术发展了，我们可以直接模仿他的真身，所以这是未来我们提供通过个性化的一个服务。第三个我们知道现在人工智能非常多，有一种术语叫唇读，看嘴唇我就知道你要说什么话，如果未来通过我说话，我说一二三四五，我的嘴形提前录出来。如果解读好，然后再把我的嘴唇以后说话它会有，快速这种组合通过唇读的方式，可能通过类似于人工喉，把这个声音解码出来。我们希望这种可能是更高级的，这个声音后台就出来了。这是我们想未来从临床上，我们的医工提出很多这些要求，希望这个能够满足患者的要求。在临床您一定是看到很多患者的痛苦，才让您启发留有这些素材，当我们科技真正发达的那一天，还患者本来的声音，真实的声音。感谢您收看我们今天的《透视新科技》节目，如果您想了解我们更多的节目内容呢，可以下载央视频，收看我们过往的节目，我是胜春，咱们下期节目再见。

【责任编辑：网站运维】