· 智源学者

北京大学教授,北京大学计算语言学教育部重点实验室主任。在语言知识库建构方面取得了突出的成果,负责开发了多粒度、多层次、大规模的综合型语言知识库,为以汉语为核心的多语言信息处理技术的发展提供了重要的基础设施和技术支持,曾获得国家科技进步二等奖、中国电子学会电子信息科学技术一等奖。


拟研究项目:基于中文深层语义分析的知识提取技术


互联网时代为知识获取研究提供了新的机遇,也提出了新的挑战。海量的Web资源中蕴含了比以往任何文本集合都更为丰富的知识。然而,自然语言具有歧义性、非规范性和个性化表达等特点,加之知识混杂在多源异构、杂乱、开放、不断更新的信息之中,传统的知识提取方法对自然语言的理解仅停留在文字表层,在理解的深度上还存在严重的不足,尤其是在面向真实应用时,往往难以挖掘出文本中的重要信息。因此,研制中文深层语义分析技术,并以此支撑文本内容的深度挖掘与知识推理,对于提升智能化应用的质量和精度具有至关重要的作用。本项目将研究基于中文深层语义分析技术的知识提取技术,具体包括:1)构建中文深层语义分析资源库,为中文深层语义分析提供可用的资源基石。从而推进中文语义分析技术向着更为深入的方向发展。2)基于中文深层语义分析技术,并结合深度学习技术,建立面向多源异构文本数据的知识自动获取框架,以此实现对自然语言文本的精准知识抽取。

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OK