军事知识服务平台
基于CUDA的GPU加速迭代重建算法研究
X射线计算机断层扫描(CT)技术已广泛应用于临床和工业领域。其中CT重建算法作为CT技术的核心部分,一直是CT成像技术研究的热点。CT重建算法主要分为解析重建和迭代重建。解析重建为目前使用最为广泛的重建算法,其特点是重建速度快、成像质量好,但需要均匀分布在180°或360°范围内的足够投影数据。然而在实际应用中,常无法获得满足这样要求的投影数据,如剂量限制导致投影数据分布稀疏,或者射线无法穿过高密度区域导致投影数据的丢失。在有限角度投影数据情况下,采用解析法重建将导致严重伪影。这种情况下,为了获得较好的重建图像,通常采用迭代重建算法...
X射线计算机断层扫描(CT)技术已广泛应用于临床和工业领域。其中CT重建算法作为CT技术的核心部分,一直是CT成像技术研究的热点。CT重建算法主要分为解析重建和迭代重建。解析重建为目前使用最为广泛的重建算法,其特点是重建速度快、成像质量好,但需要均匀分布在180°或360°范围内的足够投影数据。然而在实际应用中,常无法获得满足这样要求的投影数据,如剂量限制导致投影数据分布稀疏,或者射线无法穿过高密度区域导致投影数据的丢失。在有限角度投影数据情况下,采用解析法重建将导致严重伪影。这种情况下,为了获得较好的重建图像,通常采用迭代重建算法。
  迭代重建算法适用于各种形式的采集数据,即使是有限角度投影数据的情况,也能重建出较好的图像,但是重建计算量大,重建时间长。目前,重建速度已成为制约其广泛应用的最大瓶颈。因此,研究如何提高迭代重建算法的效率,在理论和实际应用中都具有较高的价值。
  本文利用基于计算机统一设备架构(CUDA)的高性能并行计算图形处理器(GPU)对迭代重建算法加速进行了研究,主要研究内容如下:
  1)采用CUDA对经典的联合代数迭代重建算法(SART)进行了加速,根据其正投影和反投影的特点,采用了两种主要技术将SART融入CUDA架构:(1)正投影采用带有GPU三维纹理插值的射线驱动;(2)反投影采用带有共享存储器的体素驱动,可避免一些冗余计算。根据射线和体素的独立性我们采用以上两种技术设计CUDA内核,其中每个内核代表计算一条射线的投影值或计算一个体素的反投影值。因此,可以实现大量的并行化,显著提升计算性能。
  2)对TV算法进行了研究,将TV最小化算法与SART重建算法相结合,提出了TV-SART重建算法,并采用CUDA对其进行了加速。模拟和实际实验表明,TV-SART能很好的抑制噪声,获得十分平滑的重建图像。
  3)在单GPU基础上,本文提出了多GPU加速重建。
  利用了多个GPU内核的计算能力,在保证图像质量的情况下,进一步提高了重建速度;克服了工程中重建数据量较大,单GPU显存不足的问题引起的内存与显存之间数据的频繁传输,减少了数据传输时间。
展开
作者: 雷德川
学科专业: 核技术及应用
授予学位: 硕士
学位授予单位: 中国工程物理研究院
导师姓名: 许州 陈浩
学位年度: 2012
语 种: chi
分类号: TP391.5
在线出版日期: 2016年3月30日