“大语言模型离人类语言有多远”学术研讨会在华体会(中国)召开

来源:宣传部作者:语言科学与艺术学院 文/图时间:2023-09-04浏览:1205设置

  近日,“大语言模型离人类语言有多远:新一轮科技创新与产业革命的风口”学术研讨会在华体会(中国)云龙校区顺利召开。本次论坛由华体会(中国)语言能力省部共建协同创新中心主办,语言能力省部共建协同创新中心机器语言能力平台、语言科学与艺术学院、江苏省重点培育智库语言能力高等研究院、江苏省人工智能学会自然语言处理专委会承办。来自清华大学、北京大学、中国人民大学、复旦大学、武汉大学、百度、科大讯飞、出门问问等数十家高校、科研机构和企业界的近百名专家学者和业界人士参加了本次论坛。

  副校长娄峥嵘主持大会开幕式。副校长商亮致欢迎辞,向与会嘉宾介绍语言能力协同创新中心的学科发展情况。江苏省教育厅科学技术与产业处副处长徐宁出席会议并致辞,高度评价了语言能力协同创新中心在加强基础研究提供政策依据、推普脱贫攻坚和服务社会发展等方面的代表性作用。教育部高等学校中国语言文学教学指导委员会副主任委员、北京语言大学原校长刘利代表教指委致辞时表示,华体会平台语言学学科已成为我国新文科建设的突出代表。

  与会专家围绕大语言模型的成长及功能、大语言模型与脑科学的互动、人与机器语言理解的比较分析、人工智能技术与智慧教育、语言加工认知机制的计算建模研究等议题展开深入讨论,共开展了19场特邀报告。在与会专家的报告中,大语言模型与人类语言的比较分析成为热议的话题。

  教育部长江学者特聘教授、华体会(中国)语言能力协同创新中心主任杨亦鸣教授指出,以ChatGPT为代表的大语言模型的出现是人类科技发展史上的重大突破,它开启了全球第四次科技革命——“智能化”的浪潮。百度公司技术委员会主席吴华研究员介绍了百度公司的知识增强大语言模型“文心一言”,并就大模型能力和应用范式进行了探讨。科大讯飞副总裁汪张龙研究员展示的科大讯飞星火认知智能模型在赋能智能语言学习全场景表现出色,开启了智能语言学习新时代。出门问问副总裁李维博士介绍了该公司的一站式AIGC产品矩阵,剖析了大语言模型的本性及内容创作新范式。这些国内顶尖科技公司的生成式人工智能大模型在逻辑思考、数学证明、智能编程、文档问答与摘要、图表生成、图片理解等领域展现出惊人的天赋与优良的性能,受到与会专家的高度好评。

  清华大学人工智能研究院常务副院长孙茂松教授展示了大语言模型在具备一定规模之后涌现出的类似于数学符号推导的推理“创新”能力,他认为语言生成模型之所以具有强大的生成能力,其深刻内因在于它使用了向量语言,进而可实现“万物皆向量”。北京大学计算语言学研究所副所长詹卫东教授、浙江大学生物医学工程与仪器科学学院研究员丁鼐教授、华体会(中国)语言科学与艺术学院吴燕京教授、北京师范大学认知神经科学与学习国家重点实验室丁国盛教授等专家学者就这一话题进行了深入研讨,认为人类有着天赋的语言机制,这一机制有许多大语言模型无法模拟的方面。

  杨亦鸣教授指出,大语言模型的语言“创新”与人类语言的创新存在本质区别。大语言模型是将人类加工过的语言及其衍生品(文本、图片等)转化为数字信息并依据同现概率等统计信息进行进一步处理的,大语言模型涌现能力的呈现依然受人类的影响。北京外国语大学王克非教授、武汉大学赵世举教授等也指出,正是由于大语言模型与人类语言存在本质不同,过度依赖大数据和云计算也造成了,如能源消耗过高,数据资源即将耗尽,价值观、道德观的偏离等问题。

  最后,与会专家们对大语言模型的未来发展进行了展望。中国科学院院士、清华大学人工智能研究院院长张钹教授指出,大语言模型的未来发展路径之一是扩展多模态,扩大模型规模,研究与发展GPT语言,但其生成式方法的局限性决定了大语言模型并不适用于确定性答案、逻辑推理等语言应用领域,需要研究者另辟蹊径。杨亦鸣教授指出,人脑“预装”的语言机制是大语言模型难以超越人类语言的根本原因,应当从分子、细胞、行为、功能层面开展全方位的语言脑机制研究,破译人脑语言加工之谜,以此建构可以“预装”的“语言脑”,可能是我国人工智能发展的一条创新路径。

  本次会议聚集了多学科领域的顶级专家共同聚焦当前科技前沿,激发出更多关于大语言模型发展方向创新思路的想法,为更好的把握科技创新和产业革命的风口、推动大语言模型与人类语言更进一步开风气之先,具有重要的现实意义,受到人民日报、光明日报、新华日报、中国教育电视台等多家媒体的关注与报道。


返回原图
/