近日,董潇同学的一篇最新论文被国际期刊IEEE Transactions on Image Processing (TIP) 录用,具体论文信息如下:“Xiao Dong, Zhonggui Chen, Yong-Jin Liu, Junfeng Yao, Xiaohu Guo. GPU-based Supervoxel Generation with a Novel Anisotropic Metric”。TIP 是图像处理及计算机视觉领域顶级期刊之一,属于中国计算机学会推荐的计算机图形学与多媒体领域A类期刊,侧重图像处理的前沿理论与方法。该期刊影响因子7.067。
论文提出了一种基于GPU的各向异性的超体素生成方法。将视频分割为超体素是一项在很多计算机视觉任务中都会用到的预处理技术。由于视频的数据量较大,大多数现有的超体素分割方法需要的内存和时间都比较大,这也限制了该技术在后续视频处理任务中的应用。为了解决这个问题,我们提出了一种各向异性超体素生成方法,该方法需要的内存量较小,并且可以在GPU上快速地执行,在视频分割任务中能够达到质量和效率的平衡。本文的方法是基于种子点的聚类算法,为了更准确地分割视频中地运动物体,我们利用光流场设计了一种非欧式度量来计算种子点与体素之间的各向异性距离,并且改进了经典的Jump flooding算法(在GPU上并行执行)在颜色和时空的高维空间中实现各向异性Voronoi细分。与现有方法相比,我们的算法在分割质量、计算效率和内存使用等方面取得了较好的平衡,将超体素应用于后续的视频处理任务也体现了本方法解决实际问题的能力。
该论文由实验室董潇与陈中贵教授,清华大学人机交互与媒体集成研究所的刘永进教授,厦门大学数字媒体计算与软件工程研究中心的姚俊峰教授,以及得克萨斯大学达拉斯分校的郭小虎教授合作完成。
论文的代码已经开源,欢迎大家试用:https://github.com/dongxiao0401/anisotropic_supervoxel
论文DOI: 10.1109/TIP.2021.3120878