EN
2022年03月24日研究成果

基于强化学习的个性化CT扫描

董彬团队

北京大学长聘副教授、智源研究员董彬团队把CT采样过程建模成一个马尔可夫决策过程(MDP),在采样的每一步,策略网络都要根据现有的采样角度和计量来动态的决定下一个采样的角度和计量从而最大化CT图像重建的质量。用强化学习中的PPO算法来训练策略网络,并得到了明显优于现有采样方式得到的图像重建效果(见下表)。由训练好的策略网络选择出的采样角度和计量如下图所示。


4-2.jpg


(图表来源:学者提供)


分享到: