近期,三级影片 鄢杰斌团队研究结果《Max360IQ: Blind Omnidirectional Image Quality Assessment with Multi-axis Attention》、《Subjective and Objective Quality Assessment of Non-Uniformly Distorted Omnidirectional Images》、《Multitask Auxiliary Network for Perceptual Quality Assessment of Non-Uniformly Distorted Omnidirectional Images》等发表在《Pattern Recognition》、《IEEE Transactions on Multimedia》、《IEEE Transactions on Circuits and Systems for Video Technology》(中科院一区)上。
针对当前模型难以同时兼顾全景图像中的均匀和非均匀失真,提出了基于多轴注意力机制的质量评估模型Max360IQ,通过采用混合架构的骨干网络,使模型能够同时对全局语义和局部细节进行感知建模,并通过设计层级尺度特征提取和深层语义指导模块,实现对于均匀与非均匀失真图像均有较高的评估性能,提升了质量评估方法的鲁棒性和应用性。
围绕非均匀失真问题构建大规模非均匀失真数据库基准,缓解了当前领域缺乏充分异构失真数据的紧迫性;通过自适应模拟用户的观看行为,提出了一个基于感知的非均匀失真全景图像质量评价模型,该模型通过考虑用户观看行为和人类视觉系统的近因效应进行建模,并融入多尺度特征聚合和失真自适应感知两个并行模块来捕获非均匀失真相关特征。该模型综合计算视口图像序列之间的关联性,模拟用户观看行为获得全景图像整体感知质量。
受多任务协同训练益于解决复杂问题的启发,提出了一种包含多任务辅助网络结构的质量评估模型,以解决全景图像质量评价领域非均匀失真建模的难点,并通过联合训练主任务和次级辅助任务优化模型参数。该论文提出自适应多任务特征选择策略以促进子网络的参数学习,有效增强模型在局部失真感知与全局质量建模方面的综合能力,提升了对非均匀失真的适应性与泛化性能。
上述研究工作得到了国家自然科学基金(编号:U24A20220、62461028、62311530101、62441203、62271237)的联合支持。