EN
2022年03月25日研究成果

多模态大规模基因预训练模型

兰艳艳团队

        清华大学智能产业研究院教授、智源青年科学家兰艳艳团队针对基因非编码区域计算难的问题,通过构造基因片段与调控因子的匹配矩阵构成与基因序列相互补的“图像”模态,提出基于多模态的大规模基因预训练模型GeneBert,在先天性巨结肠病的预测,结合位点预测和基因表达等任务上取得显著提升。该工作获得DeeCamp2021医疗赛道冠军和总冠军两个奖项。


兰艳艳.jpg


  Shentong Mo, Xi Fu, Chenyang Hong,Yizhen Chen, Yuxuan Zheng, Xiangru Tang, Zhiqiang Shen, Eric P Xing, Yanyan Lan,Multi-Modal Self-Supervised Pre-Training for Regulatory Genome Across Cell Types, arXiv:2110.05231.


分享到: