當(dāng)前位置:首頁(yè) > 科普 > 列表 > 正文

多商品重疊,人工智能如何計(jì)數(shù)?
2020-12-16

  

  該研究是基于復(fù)雜場(chǎng)景的多商品檢測(cè)任務(wù)

  在日常購(gòu)物時(shí),我們不妨?xí)诚胍幌挛磥?lái)的場(chǎng)景:無(wú)需結(jié)算臺(tái),因?yàn)橄M(fèi)者取下產(chǎn)品的過(guò)程中,就可以完成自動(dòng)結(jié)算;也無(wú)需貨架管理員,因?yàn)橹悄茇浖芄芾砑夹g(shù)可以實(shí)時(shí)動(dòng)態(tài)監(jiān)測(cè)商品數(shù)量變化,并完成數(shù)據(jù)分析。不過(guò),要實(shí)現(xiàn)這種智能化消費(fèi)方式變革的核心難點(diǎn)在于解決目標(biāo)檢測(cè)計(jì)數(shù)聯(lián)合任務(wù)領(lǐng)域中的遮擋問題。

  近日,中國(guó)科學(xué)院軟件研究所智能軟件研究中心發(fā)布了目前為止最大的零售場(chǎng)景目標(biāo)檢測(cè)計(jì)數(shù)聯(lián)合任務(wù)數(shù)據(jù)集——Locount,為解決零售場(chǎng)景下目標(biāo)檢測(cè)領(lǐng)域嚴(yán)重遮擋問題提供了重要基礎(chǔ)。相關(guān)論文在國(guó)際人工智能會(huì)議(AAAI2021)上發(fā)表。

  該研究發(fā)現(xiàn),現(xiàn)在的目標(biāo)檢測(cè)任務(wù)通常使用一個(gè)矩形框來(lái)預(yù)測(cè)單個(gè)目標(biāo)的位置,因?yàn)閭鹘y(tǒng)目標(biāo)檢測(cè)數(shù)據(jù)集的遮擋比例較少,尤其缺少多個(gè)目標(biāo)之間嚴(yán)重遮擋的情況(例如多個(gè)目標(biāo)重疊比例超過(guò)90%)?!翱善诹闶蹐?chǎng)中卻普遍存在這種情況,商超貨架內(nèi)的商品通常在上下和前后兩個(gè)方向上有所重疊。”論文通訊作者、中科院軟件所副研究員張立波告訴《中國(guó)科學(xué)報(bào)》,傳統(tǒng)的表示方法無(wú)法適用于商品零售場(chǎng)景,因?yàn)橥活悇e商品重疊擺放會(huì)存在嚴(yán)重遮擋的現(xiàn)象,在實(shí)際使用中也無(wú)需精確定位每一個(gè)實(shí)例目標(biāo)。

  于是,研究團(tuán)隊(duì)提出了一種同時(shí)進(jìn)行對(duì)象定位和計(jì)數(shù)的新任務(wù)?!熬唧w來(lái)說(shuō),如果多個(gè)目標(biāo)是相互嚴(yán)重遮擋且屬于同一個(gè)類別,新的任務(wù)為預(yù)測(cè)出該目標(biāo)簇中所有目標(biāo)框合并的最小包圍框及對(duì)應(yīng)的實(shí)例數(shù)量。”張力波解釋。

  

  傳統(tǒng)目標(biāo)計(jì)數(shù)(a)和目標(biāo)檢測(cè);(b)數(shù)據(jù)集中采樣的標(biāo)注圖片;(c)傳統(tǒng)的檢測(cè)標(biāo)注應(yīng)用到本項(xiàng)研究的數(shù)據(jù)集的呈現(xiàn)形式;(d)新的檢測(cè)標(biāo)注方式在本項(xiàng)研究的數(shù)據(jù)集上的呈現(xiàn)方式

  而為了實(shí)現(xiàn)這一新任務(wù),研究團(tuán)隊(duì)經(jīng)過(guò)近2年的廣泛收集及測(cè)試研究,設(shè)計(jì)出了迄今為止最大的零售場(chǎng)景目標(biāo)檢測(cè)計(jì)數(shù)聯(lián)合任務(wù)數(shù)據(jù)集——Locount,填補(bǔ)了現(xiàn)實(shí)場(chǎng)景中檢測(cè)和計(jì)數(shù)聯(lián)合訓(xùn)練問題的空白。

  張立波介紹,該數(shù)據(jù)集包含了190多萬(wàn)個(gè)商品實(shí)例標(biāo)注信息,涵蓋了140種商品類別。其中每個(gè)標(biāo)注框包含了同類商品實(shí)例及其數(shù)量,與其他商品類型數(shù)據(jù)集相比,具有明顯優(yōu)勢(shì)。

  

  Locount數(shù)據(jù)集中的商品分類

  此外,為了評(píng)估不同算法在該任務(wù)上的性能,研究團(tuán)隊(duì)還設(shè)計(jì)了一種新的評(píng)價(jià)標(biāo)準(zhǔn),以反映算法出現(xiàn)目標(biāo)丟失、對(duì)同一實(shí)例的重復(fù)檢測(cè)、錯(cuò)誤檢測(cè)、錯(cuò)誤計(jì)數(shù)等情況。

  這項(xiàng)研究認(rèn)為,傳統(tǒng)方法和常見的深度學(xué)習(xí)網(wǎng)絡(luò)還無(wú)法很好地解決Locount提出的新挑戰(zhàn)。為了能更好地研究復(fù)雜和密集場(chǎng)景下,尤其是目標(biāo)高度重疊時(shí)的檢測(cè)和計(jì)數(shù)問題,張立波希望更多開發(fā)人員能夠借助Locount數(shù)據(jù)集,探索出更準(zhǔn)確、高效的任務(wù)解決思路和方法。同時(shí),這一數(shù)據(jù)集也可以為現(xiàn)實(shí)場(chǎng)景中長(zhǎng)尾分布、少樣本學(xué)習(xí)等多個(gè)潛在的研究方向提供基礎(chǔ)支持。

  相關(guān)論文信息:

  https://isrc.iscas.ac.cn/gitlab/research/locount-dataset/-/blob/master/AAAI2021_CLCNet.pdf

  數(shù)據(jù)集下載地址及密碼:

  https://pan.baidu.com/s/13JJAHz2VXD0KewdcemfsXQ#list/path=%2F fyze

開通會(huì)員,享受整站包年服務(wù)立即開通 >