当前位置: X-MOL 学术Signal Process. Image Commun. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
CTU depth decision algorithms for HEVC: A survey
Signal Processing: Image Communication ( IF 3.5 ) Pub Date : 2021-08-20 , DOI: 10.1016/j.image.2021.116442
Ekrem Çetinkaya 1 , Hadi Amirpour 1 , Mohammad Ghanbari 1, 2 , Christian Timmerer 1
Affiliation  

High Efficiency Video Coding (HEVC) surpasses its predecessors in encoding efficiency by introducing new coding tools at the cost of an increased encoding time-complexity. The Coding Tree Unit (CTU) is the main building block used in HEVC. In the HEVC standard, frames are divided into CTUs with the predetermined size of up to 64 × 64 pixels. Each CTU is then divided recursively into a number of equally sized square areas, known as Coding Units (CUs). Although this diversity of frame partitioning increases encoding efficiency, it also causes an increase in the time complexity due to the increased number of ways to find the optimal partitioning. To address this complexity, numerous algorithms have been proposed to eliminate unnecessary searches during partitioning CTUs by exploiting the correlation in the video. In this paper, existing CTU depth decision algorithms for HEVC are surveyed. These algorithms are categorized into two groups, namely statistics and machine learning approaches. Statistics approaches are further subdivided into neighboring and inherent approaches. Neighboring approaches exploit the similarity between adjacent CTUs to limit the depth range of the current CTU, while inherent approaches use only the available information within the current CTU. Machine learning approaches try to extract and exploit similarities implicitly. Traditional methods like support vector machines or random forests use manually selected features, while recently proposed deep learning methods extract features during training. Finally, this paper discusses extending these methods to more recent video coding formats such as Versatile Video Coding (VVC) and AOMedia Video 1(AV1).



中文翻译:

HEVC 的 CTU 深度决策算法:调查

高效视频编码 (HEVC) 通过引入新的编码工具以增加编码时间复杂度为代价,在编码效率方面超越了其前辈。编码树单元 (CTU) 是 HEVC 中使用的主要构建块。在 HEVC 标准中,帧被划分为具有高达 64 × 64 像素的预定大小的 CTU。然后将每个 CTU 递归地划分为多个大小相等的正方形区域,称为编码单元 (CU)。虽然这种帧分割的多样性提高了编码效率,但由于找到最佳分割的方法数量增加,它也导致时间复杂度增加。为了解决这种复杂性,已经提出了许多算法来通过利用视频中的相关性来消除划分 CTU 期间不必要的搜索。在本文中,调查了现有的 HEVC 的 CTU 深度决策算法。这些算法分为两组,即统计方法和机器学习方法。统计方法进一步细分为相邻方法和固有方法。相邻方法利用相邻 CTU 之间的相似性来限制当前 CTU 的深度范围,而固有方法仅使用当前 CTU 内的可用信息。机器学习方法试图隐式地提取和利用相似性。支持向量机或随机森林等传统方法使用手动选择的特征,而最近提出的深度学习方法在训练期间提取特征。最后,本文讨论了将这些方法扩展到更新的视频编码格式,例如 这些算法分为两组,即统计方法和机器学习方法。统计方法进一步细分为相邻方法和固有方法。相邻方法利用相邻 CTU 之间的相似性来限制当前 CTU 的深度范围,而固有方法仅使用当前 CTU 内的可用信息。机器学习方法试图隐式地提取和利用相似性。支持向量机或随机森林等传统方法使用手动选择的特征,而最近提出的深度学习方法在训练期间提取特征。最后,本文讨论了将这些方法扩展到更新的视频编码格式,例如 这些算法分为两组,即统计方法和机器学习方法。统计方法进一步细分为相邻方法和固有方法。相邻方法利用相邻 CTU 之间的相似性来限制当前 CTU 的深度范围,而固有方法仅使用当前 CTU 内的可用信息。机器学习方法试图隐式地提取和利用相似性。支持向量机或随机森林等传统方法使用手动选择的特征,而最近提出的深度学习方法在训练期间提取特征。最后,本文讨论了将这些方法扩展到更新的视频编码格式,例如 统计方法进一步细分为相邻方法和固有方法。相邻方法利用相邻 CTU 之间的相似性来限制当前 CTU 的深度范围,而固有方法仅使用当前 CTU 内的可用信息。机器学习方法试图隐式地提取和利用相似性。支持向量机或随机森林等传统方法使用手动选择的特征,而最近提出的深度学习方法在训练期间提取特征。最后,本文讨论了将这些方法扩展到更新的视频编码格式,例如 统计方法进一步细分为相邻方法和固有方法。相邻方法利用相邻 CTU 之间的相似性来限制当前 CTU 的深度范围,而固有方法仅使用当前 CTU 内的可用信息。机器学习方法试图隐式地提取和利用相似性。支持向量机或随机森林等传统方法使用手动选择的特征,而最近提出的深度学习方法在训练期间提取特征。最后,本文讨论了将这些方法扩展到更新的视频编码格式,例如 而固有方法仅使用当前货运单元内的可用信息。机器学习方法试图隐式地提取和利用相似性。支持向量机或随机森林等传统方法使用手动选择的特征,而最近提出的深度学习方法在训练期间提取特征。最后,本文讨论了将这些方法扩展到更新的视频编码格式,例如 而固有方法仅使用当前货运单元内的可用信息。机器学习方法试图隐式地提取和利用相似性。支持向量机或随机森林等传统方法使用手动选择的特征,而最近提出的深度学习方法在训练期间提取特征。最后,本文讨论了将这些方法扩展到更新的视频编码格式,例如多功能视频编码( VVC ) 和AOMedia Video 1 (AV1)。

更新日期:2021-09-03
down
wechat
bug