当前位置: X-MOL 学术ETRI J. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Accurate and efficient GPU ray‐casting algorithm for volume rendering of unstructured grid data
ETRI Journal ( IF 1.3 ) Pub Date : 2020-02-26 , DOI: 10.4218/etrij.2019-0185
Gibeom Gu 1 , Duksu Kim 2
Affiliation  

We present a novel GPU‐based ray‐casting algorithm for volume rendering of unstructured grid data. Our volume rendering system uses a ray‐casting method that guarantees accurate rendering results. We also employ the per‐pixel intersection list concept in the Bunyk algorithm to guarantee an accurate result for non‐convex meshes. For efficient memory access for the lists on the GPU, we represent the intersection lists for all faces as an array with our novel construction algorithm. With the intersection lists, we perform ray‐casting on a GPU, and a GPU thread handles each ray. To increase ray‐coherency in a thread block and improve memory access efficiency, we extend a prior image‐tile‐based work distribution method to fit modern GPU architectures. We also show that a prior approach using a per‐thread local buffer to reduce redundant computation is not appropriate for modern GPU architectures. Instead, we take an on‐demand calculation strategy that achieves better performance even though it allows duplicate computations. We applied our method to three unstructured grid datasets with different characteristics. With a GPU, our method achieved up to 36.5 times higher performance for the ray‐casting process and 19.7 times higher performance for the whole volume rendering process compared with the Bunyk algorithm using a CPU core. Also, our approach showed up to 8.2 times higher performance than a GPU‐based cell projection method while generating more accurate rendering results. These results demonstrate the efficiency and accuracy of our method.

中文翻译:

准确高效的GPU射线投射算法,用于非结构化网格数据的体积渲染

我们提出了一种新颖的基于GPU的光线投射算法,用于非结构化网格数据的体积渲染。我们的体绘制系统使用射线投射方法,以确保准确的渲染结果。我们还在Bunyk算法中采用按像素的交点列表概念,以确保非凸网格的准确结果。为了高效地访问GPU上的列表,我们使用新颖的构造算法将所有面的相交列表表示为数组。使用相交列表,我们在GPU上执行光线投射,并且GPU线程处理每条光线。为了增加线程块中的射线相干性并提高内存访问效率,我们扩展了一种基于图像平铺的工作分配方法,以适应现代GPU架构。我们还表明,使用每线程本地缓冲区减少冗余计算的现有方法不适用于现代GPU架构。取而代之的是,我们采用了按需计算策略,即使它允许重复计算,该策略也可以实现更好的性能。我们将我们的方法应用于具有不同特征的三个非结构化网格数据集。与使用CPU内核的Bunyk算法相比,使用GPU,我们的方法在光线投射过程中的性能提高了36.5倍,在整个体积渲染过程中的性能提高了19.7倍。而且,我们的方法显示出比基于GPU的单元投影方法高出8.2倍的性能,同时生成更准确的渲染结果。这些结果证明了我们方法的效率和准确性。取而代之的是,我们采用了按需计算策略,即使它允许重复计算,该策略也可以实现更好的性能。我们将我们的方法应用于具有不同特征的三个非结构化网格数据集。与使用CPU内核的Bunyk算法相比,使用GPU,我们的方法在光线投射过程中的性能提高了36.5倍,在整个体积渲染过程中的性能提高了19.7倍。而且,我们的方法显示出比基于GPU的单元投影方法高出8.2倍的性能,同时生成更准确的渲染结果。这些结果证明了我们方法的有效性和准确性。取而代之的是,我们采用了按需计算策略,即使它允许重复计算,该策略也可以实现更好的性能。我们将我们的方法应用于具有不同特征的三个非结构化网格数据集。与使用CPU内核的Bunyk算法相比,使用GPU,我们的方法在光线投射过程中的性能提高了36.5倍,在整个体积渲染过程中的性能提高了19.7倍。而且,我们的方法显示出比基于GPU的单元投影方法高出8.2倍的性能,同时生成更准确的渲染结果。这些结果证明了我们方法的有效性和准确性。我们将我们的方法应用于具有不同特征的三个非结构化网格数据集。与使用CPU内核的Bunyk算法相比,使用GPU,我们的方法在光线投射过程中的性能提高了36.5倍,在整个体积渲染过程中的性能提高了19.7倍。而且,我们的方法显示出比基于GPU的单元投影方法高出8.2倍的性能,同时生成更准确的渲染结果。这些结果证明了我们方法的有效性和准确性。我们将我们的方法应用于具有不同特征的三个非结构化网格数据集。与使用CPU内核的Bunyk算法相比,使用GPU,我们的方法在光线投射过程中的性能提高了36.5倍,在整个体积渲染过程中的性能提高了19.7倍。而且,我们的方法显示出比基于GPU的单元投影方法高出8.2倍的性能,同时生成更准确的渲染结果。这些结果证明了我们方法的有效性和准确性。性能比基于GPU的单元投影方法高2倍,同时生成更准确的渲染结果。这些结果证明了我们方法的有效性和准确性。性能比基于GPU的单元投影方法高2倍,同时生成更准确的渲染结果。这些结果证明了我们方法的有效性和准确性。
更新日期:2020-02-26
down
wechat
bug