基于ECA-Net的雙信息流圖像字幕生成方法研究
光電子·激光
頁(yè)數(shù): 9 2024-03-22
摘要: 針對(duì)圖像字幕生成中由于視覺信息不足使生成的描述語(yǔ)句與圖像內(nèi)容不匹配的問題,提出一種基于高效通道注意力(efficient channel attention network, ECA-Net)的雙信息流圖像字幕生成方法。首先,該方法將圖像分割特征作為另一個(gè)視覺信息源,采用迭代獨(dú)立層歸一化(iterative independent layer normalization, II... (共9頁(yè))
開通會(huì)員,享受整站包年服務(wù)