融合互联网链接结构的预训练模型

EN

新闻

科研: 科研项目


研究中心
基础模型研究中心生命模拟研究中心自主医学检查系统研究中心健康计算研究中心千方智慧医疗研究中心

智源学者
人工智能的数理基础机器学习智能信息检索与挖掘智能体系架构与芯片自然语言处理人工智能的认知神经基础自由探索

产业

生态

关于我们

加入智源

2022年03月24日研究成果

融合互联网链接结构的预训练模型

窦志成团队

中国人民大学高瓴人工智能学院教授、智源学者窦志成等针对目前的大规模预训练语言模型仅仅依靠文本内容进行训练，忽略了互联网的结构信息，无法满足信息检索任务的需要等问题，提出融合互联网语料中大规模超链接与锚文本的预训练语言模型。实验表明利用互联网超链接中蕴含的结构和语义信息能够有效提升大模型的表达能力，提升信息检索排序任务的效果。

图片1窦.png

（图片来源：学者提供）

融合互联网链接结构的预训练模型

分享到：