学院新闻 - 窝窝视频网

2022年6月13日，窝窝视频网、IDG麦戈文脑科学研究所王茜助理研究员与首都医科大学附属北京天坛医院神经病学中心王群教授、北京市神经外科研究所胡文瀚副主任医师合作在国际期刊《Cerebral Cortex》在线发表题为“Two stages of speech envelope tracking in human auditory cortex modulated by speech intelligibility”的研究论文。研究发现言语可懂度调控听皮层两个阶段的包络追随反应：早期的high-γ（60-140 Hz）幅值和晚期的θ（4-8 Hz）相位。

语言感知和理解是一项精密复杂的大脑活动，其潜在的脑机制至今尚未破解。本研究利用的sEEG记录手段是癫痫评估手术中的“金标准”，是目前具有最高时空分辨率组合且直接记录人类大脑活动的技术。听皮层包络追随反应的强度是否可以表征对语言的理解，本研究引入噪声合成（noise-vocoding）的技术构建了具有一致言语包络信息但却完全不同可懂度的语句（图1A），聚焦high-γ和θ振荡对语句包络的追随，发现两者具有不同的追随特性（图1B-K）：high-γ表现出较短的追随延迟时间（< 100 ms），且偏好于噪声合成语句；而θ表现出较长的追随延迟时间（> 100 ms），且偏好于自然语句。

图1. （A）噪声合成语句的构建流程图；（B-K）听皮层high-γ幅值和θ相位的包络追随反应

进一步，引用支持向量机（support vector machines, SVM）的分类模型，我们分别以单试次反应的high-γ幅值、θ相位为模型特征，对自然语句和噪声合成语句进行解码（图2）。结果发现high-γ幅值的解码准确性在初级听皮层较高，这与其较短的追随延迟一致；θ相位的解码准确性表现出右半球偏侧化；并且θ相位的解码准确性显著高于high-γ幅值的。

图2 以high-γ幅值或θ相位为模型特征对自然语句和噪声合成语句进行解码

窝窝视频网、IDG麦戈文脑科学研究所王茜助理研究员与首都医科大学附属北京天坛医院神经病学中心王群教授、北京市神经外科研究所胡文瀚副主任医师为本文共同通讯作者。已毕业博士生徐娜为本文第一作者，首都医科大学附属北京天坛医院神经外科赵宝田博士和北京体育大学心理学院讲师罗路博士参与该研究并做重要贡献。该研究也受到了首都医科大学附属北京天坛医院神经外科张凯教授、神经病学中心邵晓秋教授，首都医科大学附属北京三博脑科医院神经外科栾国明教授的大力支持。该研究获得了国家重点研发计划（2017YFC1307500），科技创新2030-重大项目（2022ZD0204804, 2022ZD0204802），国家自然科学基金面上项目（81771399和32171039），首都卫生发展科研专项（2016-1-2011, 2020-1-2013），北京自然科学基金重点项目（Z200024）的资助。

Xu Na, Zhao Baotian, Luo Lu, Zhang Kai, Shao Xiaoqiu, Luan Guoming, Wang Qian*, Hu Wenhan*, Wang Qun*. Two stages of speech envelope tracking in human auditory cortex modulated by speech intelligibility, Cerebral Cortex, 2022, bhac203, https://doi.org/10.1093/cercor/bhac203

2022-06-16

窝窝视频网

王茜助理研究员在 Cerebral Cortex 发文揭示受言语可懂度调控的两阶段听皮层加工机制