EVA：大规模中文预训练对话模型

EN

新闻

科研: 科研项目


研究中心
基础模型研究中心生命模拟研究中心自主医学检查系统研究中心健康计算研究中心千方智慧医疗研究中心

智源学者
人工智能的数理基础机器学习智能信息检索与挖掘智能体系架构与芯片自然语言处理人工智能的认知神经基础自由探索

产业

生态

关于我们

加入智源

EVA：大规模中文预训练对话模型

大规模预训练方法已经在构建开放域对话系统方面展现出了非凡的性能。然而目前的工作主要集中在展示和评价现有对话模型的性能，忽视了构建一个更加强大的类人对话模型所要面临的关键问题，尤其是在中文领域。我们针对这些关键问题进行了广泛的实验，包括数据质量控制、模型结构设计、训练方法和解码策略等。基于上述研究，我们提出了一个包含28亿参数的大规模预训练语言模型EVA2.0，并将其开源。据我们所知，EVA是目前规模最大的开源中文对话模型。

文本正文

复制文本

媒体联络

media@baai.ac.cn