· 智源学者

北京大学长聘副教授,主要研究领域是高能效计算机系统结构,发表论文100余篇,谷歌学术引用4500 余次、h-index 31,获最佳论文奖3次,最佳论文提名3次。担任ACM TECS和ACM JETC编委,以及多个国际国内会议的程序委员会主席、分会主席、委员等。

 

代表性成果

  1. 首次提出基于Roofline模型的卷积神经网络(CNN)加速器设计方法,将计算单元、片上存储、带宽等资源进行抽象来构造设计空间,并可以根据优化目标探索空间以寻找最优方案。基于该方法的FPGA卷积神经网络加速器达到当时最好水平,该成果获得FPGA2015最佳论文提名,被MIT、斯坦福大学、剑桥大学、谷歌(TPU论文)、三星、英伟达等科研机构和公司引用800余次。后续工作将该方法扩展到RNN/LSTM等模型、访存压缩、FPGA集群等不同场景。
  2. 为提高基于FPGA的神经网络加速器芯片设计效率,提出一系列自动化设计方法,可以将深度学习框架(如Caffe、TensorFlow)输出的网络模型自动化部署到FPGA上并达到同时期最好水平,其中发表于TCAD的成果获得2019 Donald O. Pederson最佳论文奖。
  3. 基于新型非易失存储器件(NVM)提出针对深度学习的体系架构,包括存内计算、行列对称访问等,可以显著提升处理能效,成果发表在HPCA、TC等顶级会议和期刊。

拟研究项目:边缘计算场景低功耗加速器设计

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OK