融合多尺度特征及注意力機制的食品圖像識別
摘要: 針對食品圖像中類間差異小、類內(nèi)差異大以及結(jié)構(gòu)復(fù)雜導(dǎo)致識別難度大等問題,提出了一種融合多尺度特征及注意力機制的食品圖像識別方法。首先,采用特征提取能力更強的ConvNeXt模型作為主干網(wǎng)絡(luò),以更好地捕捉食品圖像的細節(jié)特征;其次,引入改進的ASPP模塊,擴展感受野并利用多尺度信息,增強模型對不同尺度特征的捕捉能力;最后,在每個卷積塊后加入注意力機制,提高特征表達和上下文信息捕捉能力... (共8頁)
開通會員,享受整站包年服務(wù)