· 智源学者

1983年出生,博士毕业于清华大学计算机科学与技术系,现任清华大学计算机科学与技术系长聘教授、清华大学人工智能研究院院长助理。2001到2009年获清华大学计算机学士和博士学位,之后在卡内基梅隆大学做博士后,2011年回清华任教。主要从事机器学习、贝叶斯统计等基础理论、高效算法及相关应用研究,在国际重要期刊与会议发表学术论文80余篇。担任人工智能与模式识别顶级杂志IEEE PAMI的编委、《自动化学报》编委,担任机器学习国际大会ICML2014地区联合主席, ICML (2014-2016)、NIPS (2013, 2015)、UAI (2014-2016)、IJCAI2015、AAAI(2016, 2017)等国际会议的领域主席,中国计算机学会学术工委主任助理。获微软学者、CCF优秀博士论文奖、CCF青年科学家奖、国家优秀青年基金、中创软件人才奖等,入选国家“万人计划”青年拔尖人才、IEEE Intelligent Systems杂志评选的“AI’s 10 to Watch”(人工智能青年十杰)及清华大学221基础研究人才计划。

代表性成果:

 

基础理论方面,申请人研究了贝叶斯机器学习的基础理论和方法。主要成果包括:

  1. 提出正则化贝叶斯理论,跳出250多年历史的经典贝叶斯“非先验即似然”的框架,为贝叶斯推理提供了第三维自由度,即后验正则化,可直观方便地引用领域知识、模型属性等,为处理复杂数据提供了新的计算理论与方法;
  2. 提出贝叶斯模型的最大间隔学习理论与高效学习算法,将20多年来相互分离且取得显著成功的两大方向有机融合;一方面,通过判别式最大间隔学习,显著提高贝叶斯模型的预测性能;另一方面,通过非参数贝叶斯推理,自动确定最大间隔模型的复杂度;为大数据环境下构建灵活有效的统计模型提供了新思路和理论保证;
  3. 提出结构化最大熵判别式学习的PAC-Bayes学习理论与方法,融合结构化最大间隔学习和贝叶斯推理的优点,为结构化学习提供了新思路和理论依据。

基础应用方面,将贝叶斯机器学习理论与方法用于多个重要场景。主要成果包括:

  1. 将正则化贝叶斯理论用于大规模文本分类、社交网络链接分析、矩阵低秩分解、多模态数据融合等重要问题,提出有效的统计模型和高效算法,在天河二号超级计算机上取得了显著效果。相关成果成为领域的典型进展,相关算法免费提供给同行使用,包括最大间隔话题模型(MedLDA)、稀疏话题编码(STC)等;已公布算法软件被麻省理工学院、德州大学奥斯汀分校等单位的同行转成其他语言并被移植到多种操作系统平台,如Mac与Linux等;
  2. 将结构化最大熵判别式学习理论用于网络环境下信息抽取、实体关系抽取等重要问题,提出基于结构的网络数据抽取框架及包括StatSnowball在内的若干统计模型,相关成果成为领域的代表性工作,被多部专著引介;获3项美国发明专利,被雅虎、微软、NEC等著名公司的专利引用40多次;成果应用到微软的多个搜索引擎;
  3. 研发开源的“珠算”深度贝叶斯学习编程库,在多GPU平台上有效支持贝叶斯深度学习的研究和应用。

拟研究项目名称:贝叶斯深度学习理论、算法及编程库

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OK