· 智源学者

清华大学计算机系,长聘教授,IEEE Fellow,中国人工智能学会首批会士。主要研究领域为数据挖掘与互联网数据管理,研究内容涉及模式发现、流数据挖掘、个性化推荐系统、知识图谱和医疗数据挖掘等方向。担任多个国际国内期刊的编委;担任多个国际国内会议的程序委员会主席。

拟研究项目:基于多源异构数据的知识扩充、挖掘及其应用研究

近年来知识图谱在语义搜索、深度问答系统、机器阅读以及各种数据挖掘任务(如推荐系统、医疗数据挖掘等)得到了广泛的应用。为了提高现有知识图谱的覆盖率,对它们的扩充、更新和维护日益成为一项长期而重要的任务。关联数据融合技术作为知识图谱自动补全的重要手段,得到了学术界的广泛关注。然而,由于关联数据的非确定性、多源异构性、以及关联模式的开放性和长尾效应,为知识图谱的自动扩充带来了极大的挑战性。本项目旨在研究有关知识库扩展和数据融合的三类典型技术:实体链接、知识补全与核查、以及多本体对齐。项目的具体研究内容主要包括实体链接任务中实体时效性流行度的平滑算法、基于表示学习并融合多源异构信息的知识补全算法、以及本体对齐中多本体对齐的逻辑冲突修复算法。希望通过上述研究有效克服实体链接任务中有关实体时效性流行度的数据稀疏性问题、融合多源异构信息提升知识补全任务的准确率和召回率、以及解决多本体对齐所带来的逻辑冲突问题。此外,本项目还将探讨如何基于知识图谱自动补全技术并结合领域专家知识构建领域知识图谱并研究语义知识感知、具备高可解释性的数据挖掘模型。

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OK