多学科交叉推动语言学研究范式创新:神经语言学高峰论坛在中心举行

时间:2023-08-17浏览:39设置

神经语言学高峰论坛于202386-7日在语言能力省部共建协同创新中心顺利举行。本次论坛由教育部国际司(港澳台办公室)指导,王宽诚基金会资助,语言能力协同创新中心和中国语文现代化学会神经语言学研究分会主办。来自北京大学、清华大学、复旦大学、中国科学技术大学、江苏师范大学、香港理工大学、台湾师范大学和美国普林斯顿大学、德雷塞尔大学、弗吉尼亚大学以及瑞士苏黎世大学、西班牙巴斯克认知大脑和语言中心等40多所院校和科研机构的100多名海内外一流语言学、脑科学和人工智能的专家学者参加了本次论坛。

语言作为人类独特的能力,其脑机制被认为是脑科学研究皇冠中的明珠。语言脑机制的解析牵涉到语言学、心理学、医学、人工智能等不同领域的重大基础问题的解决。江苏师范大学党委书记方忠教授在致辞中指出,“上世纪90年代,由江苏师范大学率先开拓了国内的神经语言学方向。一直以来,神经语言学都坚持走学科交叉的发展道路”。近年来,人工智能技术、细胞生物学和分子生物学技术等前沿技术迅速融入语言脑机制的基础研究进程,推动了语言学研究范式的持续创新。

与会专家学者奉献了8场特邀报告。香港理工大学讲座教授、教育部长江学者讲座教授、中心李平教授以“Understanding neurocomputational mechanisms of language learning in a digital era”为题做了特邀报告。他们团队通过虚拟现实技术构建了模拟类同母语学习环境下的二语学习平台,并借助ChatGPT设计了个性化二语学习路径。香港理工大学Emmanuele Chersoni博士在题为“Semantic Representations in Chinese Transformer Models”的特邀报告中,展示了如何利用上下文词向量模型对中文词汇相似性表征进行建模。

台湾师范大学学习科学卓越研究所和学习科学课程讲座教授陈年兴教授在“Breaking language learning barriers: How generative AI and educational robots are changing the way we learn”的特邀报告中,展示了通过嵌入生成式AI来讲故事的机器人,以及分别扮演妈妈与幼儿角色的多机器人互动,展现出生成式AI技术在语言学习中的巨大应用前景。

美国德雷塞尔大学生物医学工程系梁化楼教授做了题为“Predicting dementia from speech using large language models”的特邀报告,他们发现利用ChatGPT技术能精确地识别阿尔茨海默症患者,为语言障碍患者的诊断和治疗提供了新的途径。

美国普林斯顿大学Samuel Nastase博士在题为“Learning a shared linguistic space for transmitting our thoughts to others”特邀报告中,通过语言大模型分析语言交流时的颅内记录脑电数据,展现了交流双方的大脑活动同步情况和跨被试的语言预测机制。

华南师范大学脑科学与康复医学研究院院长、脑认知与教育科学教育部重点实验室主任、国家杰出青年基金获得者翁旭初教授以“儿童文字学习与发展性阅读障碍”为题,报告了利用无创伤脑电技术锁定文字识别的特异性指标N170,并找到了随着文字经验增长的发展模式,并成功转化应用于早期发展性阅读障碍的诊断。

中国语文现代化学会神经语言学研究分会副理事长、复旦大学类脑智能科学与技术研究院兼职教授、《语言研究集刊》主编、复旦大学中文系陈忠敏教授在“语言发音和告知的音征多维性及其在语言交际中的作用”特邀报告中指出,语言中的音类音征具有多维性和变异性,充分认识并利用这一生物物理属性有助于提高复杂环境下语音识别率,扩大语音识别的应用场景。

学者们做了10场大会报告。浙江大学生物医学工程教育部重点实验室副主任、生物医学工程与仪器科学学院丁鼐研究员在“自然语篇的感知加工及其神经机制”的报告研究中对比了人类阅读过程中的注意力机制与AI大模型的注意力机制,发现融入阅读者自上而下的阅读策略开展的深度神经网络模拟比常规模型更有效。

上海科技大学计算认知与转化神经科学实验室主任李远宁研究员在“Neural coding and computations underlying natural speech perception across languages”研究中发现,自我监督的DNN网络融入语境信息是解码高阶听觉皮层信息的重要基础,相关研究为编码和解码人类高层次的感知过程提供了新路径。

复旦大学神经外科研究所脑功能实验室副主任、华山医院路俊锋副主任医师做了题为“Neural control of lexical tone production in human laryngeal motor cortex”的报告,介绍了他们利用运动皮层负责喉头运动脑区的电信号顺利解码汉语音节和音调的成果,为开发面向复杂语言的脑机接口技术提供参照。

中国科学技术大学人文与社会科学学院袁家宏教授“利用停顿和包含停顿编码的大语言模型识别阿尔茨海默病”的报告中,指出阿尔茨海默症患者的停顿使用与健康人有明显不同,由此在转写患者自发言语过程中通过大模型办法加入停顿编码,采用预训练方法有效提升了阿尔茨海默症患者的识别准确率。

清华大学语音与音频技术实验室负责人张卫强副研究员在“基于语音的阿尔茨海默病检测”报告中,提出了基于原始波形、预训练模型和跨语言训练的办法开展疾病检测,达到了良好的检测效果。

西班牙巴斯克认知、大脑和语言中心计算神经科学组徐启慧博士后研究员在题为“L1 acquisition and conceptual representation: Insights from behavior, computation, and large-scale data”的报告中,使用有限模态训练的大型语言模型尝试模拟人类的概念表征及感觉运动表征,从而助力语言学习。

声智科技创始人、国家高层次人才特殊支持计划领军人才陈孝良研究员在题为“大模型的技术进展与应用探讨”的大会报告中,指出了大模型开发和运行耗费资源巨大、对数据安全和隐私保护带来的挑战及训练数据中的偏见引发的公平性等诸多现实问题。

北京大学计算机学院常宝宝副教授做了题为“当大模型遇到小数据”的报告,介绍了通过综合多种子网络策略解决大规模预训练模型与小规模标注数据之间过度拟合、稳定性不强的问题,有效提升了多语训练模型跨语言迁移学习的性能。

南京师范大学心理学院院长、国家万人计划青年拔尖人才陈庆荣教授做了题为“羚羊挂角,无迹可寻?中国古代诗歌阅读的认知与神经机制”的报告,介绍了中国古代诗歌阅读中的韵律、句法加工的神经机制。

中心细胞分子语言学研究平台卢思瑶教授做了“miR-218-2通过补体系统调节小鼠海马体认知功能”的报告,通过基因敲除等技术,发现miR-218表达异常与神经系统疾病中认知功能障碍有着密切联系。

教育部长江学者特聘教授、中心主任杨亦鸣教授做了题为“语言文字应用与发展:从文化软实力到科技硬实力”的特邀报告。他指出,语言大模型等新一代人工智能技术赋能前沿科技的应用,为推动研究范式的创新提供了重要路径。语言的特征非常丰富,语言的理解和学习有复杂的跨多个水平的大脑机制,以ChatGPT为代表的语言大模型为语言研究从单变量走向多变量研究提供了重要技术支持;发挥语言大模型出色的生成能力,也助力推动数字化语言学习新路径的构建。同时也要看到,语言是人类独有的最高级认知功能,语言大模型虽然在特定语言处理任务中优于常人,但与人类语言能力仍存在根本性差异。传统语言学观关注语言在文化思想传承中的作用,亟需在本质、范围上有突破才能更好地回应人工智能发展的要求。他介绍了其原创的新型大语言学观,指出语言是思维的载体,是由人类遗传结构决定的、由大脑神经回路驱动并通过语言效应器来实现的人脑机能,将语言分为语言机能、语言系统、语言技能三个层面;人类由语言机能产生语言系统,通过语言技能学习掌握语言系统。这样形成了既关涉文化软实力,又关涉科技硬实力和国家语言安全的全新语言学架构,他指出,语言作为人类智能的核心,也是人工智能模仿的对象,对推动人工智能基础架构的革新具有重要意义。语言学、脑科学和人工智能多学科交叉融合,开展原创研究,才能真正助力构建具有中国特色的学术体系、学科体系和话语体系。当下应抓住人工智能技术、脑科学与语言学的契合点和机遇,进一步加强学科间的互动深化。

此次论坛期间还举办面向高中生、本科生、研究生等青年后备力量的科学体验营、夏令营和学术创新论坛,会后举办了语言脑机制与大模型工作坊、爱思唯尔论文投稿分享会等活动,不仅增进了青年学者对神经语言学和人工智能的理解,也将为中国神经语言学的基础科学研究埋下茁壮成长的种子。

方忠教授致辞

中心主任杨亦鸣教授致开幕辞

中心李平教授致辞

神经语言学高峰论坛主会场

同栏目信息

热点信息