EN

自然语言处理

针对开放条件下基于深度学习的自然语言处理健壮性不高、推理能力弱以及可解释性差等核心挑战,探索从数据驱动到知识驱动的范式跃迁,联合北京地区高校、科研机构与企业的优秀学者联合攻关,围绕大数据和富知识驱动的自然语言处理理论、方法与系统开展研究,形成国际学术影响力

科研团队介绍

孙茂松
智源首席科学家
清华大学长聘教授

    清华大学长聘教授,清华大学人工智能研究院常务副院长,清华大学计算机学位评定分委员会主席,智源首席科学家。研究方向为自然语言理解、中文信息处理、Web智能、社会计算和计算教育学等。 作为项目负责人,主持973二级课题、863重大专项二级课题、国家自然科学基金重点项目、国家自然科学基金项目、863项目、国际合作项目等约20项,主持信息处理用分词国际标准2项。在国际刊物、国际会议、国内核心刊物上共发表论文130余篇,获得国家发明专利4项。多次担任相关领域国际会议和全国性学术会议大会主席或程序委员会主席。主要学术兼职为中国中文信息学会副理事长,国务院学位委员会第六届学科评议组计算机科学与技术组成员,国家自然科学基金委员会第十二届专家评审组成员,北京市语言文字工作委员会专家委员会副主任,中国计算机学会理事,全国术语标准化技术委员会委员,中关村开放实验室联盟副理事长,浙江省地税信息化建设专家顾问委员会委员,《中文信息学报》(计算机类全国核心期刊)主编,Journal of Computer Science and Technology、《中国计算机学会通讯》、《计算机科学与探索》、《计算机教育》、《语言文字应用》、《南开语言学刊》、《澳门语言学刊》等期刊编委,863重点项目“中文为核心的多语言处理技术”总体专家组组长等。

杨尔弘
智源项目经理
北京语言大学教授

    北京语言大学应用语言学研究所教授,智源科学研究工程项目经理(PM)。国家语言资源监测与研究中心平面媒体语言分中心主任,兼任《中文信息学报》副主编。1986年毕业于山西大学计算机应用专业,获学士学位;1989年毕业于山西大学计算机应用专业,获硕士学位;2005年毕业于北京语言大学语言学及应用语言学专业,获博士学位。研究方向为语言信息处理,研究内容包括面向内容计算的语篇信息结构分析与标注、语言资源建设与监测研究、媒体语言的使用状况调查以及媒体的话题发现与跟踪研究。近年来,参与国家语委组织的年度《中国语言生活状况报告》绿皮书的编撰工作,先后主持了国家社科基金、国家语委规划项目,参与了国家863、国家自然科学基金等项目的研究工作,并负责完成了2 项863 语料库加工任务。

李涓子
智源研究员
清华大学教授

    清华大学人工智能研究院知识智能研究中心主任,中国中文信息学会知识与语言计算专业委员会主任。在知识工程研究领域取得了突出成果,主持研发了基于语义链接的跨语言知识图谱XLORE,参与研发了研究者社会网络挖掘和服务系统AMiner,曾获北京市科技进步一等奖、人工智能学会科技创新一等奖、王选新闻科学技术进步一等奖等多个奖项。2020年被教育部、国家语委授予“中国语言资源保护奖”先进个人称号。

穗志方
智源研究员
北京大学教授

  北京大学计算语言学教育部重点实验室主任。在计算语言学及人工智能领域发表多篇学术论文,组织中文计算系列国际评测,制订中文语料库构建相关国家标准2项。作为课题负责人,承担并完成国家973计划课题、国家自然科学基金、国家哲学社会科学基金等多项国家级科研项目。作为技术负责人,构建了以中文为核心的大规模多层次语言知识库“综合型语言知识库”, 覆盖词、词组、句子、篇章各级语言单位和词法、句法、语义各个知识层面,从汉语向多语言辐射,该成果获得国家科技进步二等奖和中国电子学会电子信息科学技术奖一等奖。主持构建了开放中文医学知识图谱CMeKG(http://cmekg.pcl.ac.cn/),将语言知识库从通用领域深入到专业领域。

万小军
智源研究员
北京大学研究员

    北京大学研究员、智源研究员。专注于自然语言生成的理论、方法、应用研究,曾获得2017年“国际计算语言学协会年会(ACL)”杰出论文奖、2018年“国际人工智能联合会议(IJCAI)”杰出论文奖、IBM全球杰出学者奖、吴文俊人工智能技术发明奖、CCF NLPCC青年新锐奖等奖励。担任自然语言处理领域国际顶级会议“自然语言处理实证方法会议(EMNLP 2019)”程序委员会主席。担任国际计算语言学协会学报(TACL)、《计算语言学》(COMPUTATIONAL LINGUISTICS)等国际期刊的编委等职务。研制推出了多款AI写作机器人,如小明、小南、小柯等,应用于多家媒体单位。

刘洋
智源研究员
清华大学长聘教授

    清华大学计算机科学与技术系长聘教授,清华大学智能产业研究院副院长。担任中国人工智能学会组织工作委员会副秘书长、中国中文信息学会计算语言学专委会常务副主任。研究方向是自然语言处理,获得国家科技进步二等奖1项、省部级科技奖励4项、重要国际会议优秀论文奖2项。曾担任清华大学计算机科学与技术系智能技术与系统实验室主任、国际计算语言学学会亚太分会执委兼秘书长、Computational Linguistics编委、中国中文信息学会青年工作委员会主任。

何晓冬
智源研究员
京东集团技术副总裁

    京东集团技术副总裁,京东AI研究院常务副院长、智源研究员。国际电气和电子工程师协会会士(IEEE Fellow),研究主要集中在人工智能领域,包括深度学习,自然语言处理,语音识别,计算机视觉,信息检索和多模态智能。他是多个深度语义理解和多模态智能模型的发明者,担任多个国际电气和电子工程师协会(IEEE)和国际计算语言学协会年会(ACL)期刊的编委。

刘知远
智源青年科学家
清华大学副教授

    清华大学计算机系副教授、博士生导师。主要研究方向为表示学习、知识图谱和社会计算。曾获教育部自然科学一等奖(第2完成人)、中国中文信息学会钱伟长中文信息处理科学技术奖一等奖(第2完成人)、中国中文信息学会汉王青年创新奖,北京智源研究院青年科学家、2020年Elsevier中国高被引学者、中国科学青年人才托举工程。担任中文信息学会青年工作委员会主任,中文信息学会社会媒体处理专委会秘书长,ACL、EMNLP、WWW、CIKM、COLING领域主席。

张家俊
智源青年科学家
中国科学院自动化研究所研究员

中科院自动化所研究员、博士生导师,智源青年科学家,主要研究方向为机器翻译和自然语言处理。入选2015年中国科协首届青年人才托举工程,获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖、青年创新奖一等奖、2019年新疆维吾尔自治区科技进步奖二等奖以及2020年北京市科技进步奖一等奖。担任中国中文信息学会机器翻译专委会副主任、青年工作委员会副主任。担任领域最具影响力的国际会议ACL的资深领域主席。担任期刊《Machine Translation》、《自动化学报》和IJAC的编委。

孙栩
智源青年科学家
北京大学副教授

    北京大学副教授,智源青年科学家。在面向语言的机器学习、自然语言生成方面提出一系列新方法并获得突出效果。曾获得2018年“国际计算语言学会议(COLING)”最佳论文奖、2018年中国电子学会科学技术奖一等奖、2018年中国计算机学会自然语言与中文计算青年新锐奖、求是杰出青年学者奖。

韩先培
智源青年科学家
中国科学院软件研究所研究员

    中科院软件所研究员,智源青年科学家。在自然语言处理、知识图谱领域取得了突出成果。在国际信息检索大会(SIGIR)2011-2015五年高引论文中排名第二,入选中国科协青年人才托举工程、中科院软件所杰青人才计划,获“钱伟长中文信息处理科学技术奖—汉王青年创新奖”一等奖,求是杰出青年学者奖,担任国际计算语言学协会学报(TACL)国际期刊编委。

严睿
智源青年科学家
中国人民大学副教授

    中国人民大学高瓴人工智能学院副教授,智源青年科学家。在人机对话、文本生成等自然语言处理技术领域取得突出成果,曾在“国际计算语言学协会年会(ACL)”等国际顶级会议和期刊上发表高水平论文100余篇,跟据2016至2019年的全球计算机科学家(CS Ranking)排名统计,他在人工智能、自然语言处理方向在国内学者中名列前茅。