近日,信息学部计算机与信息学院水利大数据研究所的论文“Incremental Few-Shot Semantic Segmentation via Embedding Adaptive-Update and Hyper-class Representation”被CCF A类国际会议ACM Multimedia 2022(ACM International Conference on Multimedia)接受为长文,该论文由硕士研究生师广琛等人共同完成,巫义锐副教授是该论文通讯作者。这是我校作为第一单位首次在该会议发表长文,也是我校硕士研究生以一作身份发表的第一篇CCF A类国际会议论文。论文工作得到国家重点研发项目(2021YFB3900601),中央高校基础研究经费项目(B220202074)等项目资助。
该论文聚焦增量小样本条件下的图像语义分割问题,通过增量地学习不同类别的语义知识,在获得对新类图像像素级分割能力的同时,保持对旧类的分割能力。论文分析了在增量小样本学习模型中,易出现的旧类遗忘和新类过拟合问题。为此,论文提出了一种基于嵌入表示自适应更新和超类表示策略的深度神经网络模型(EHNet),前项策略用于避免旧类的特征漂移,解决旧类遗忘问题,后者基于已学习类别的语义知识,为新类别的超类嵌入表示提供构建指导,减轻对训练数据规模的依赖。与最优方法(PIFS)相比,EHNet在基准测试数据集上获得5.9个百分点的性能提升,是增量小样本图像语义分割的当前最佳方法。
图1. EHNet网络结构
ACM Multimedia是多媒体领域的首要国际会议,也是中国计算机学会(CCF)推荐的该领域唯一的A类国际学术会议,ACM Multimedia吸引着国内外多媒体领域知名厂商和学者的广泛参与。
图2. EHNet在PASCAL-5i基准测试集上的预测结果