廣 告 | 點擊 查 看
摘要:隨著通訊行業(yè)的迅猛發(fā)展,倉儲物流系統(tǒng)面臨日益復(fù)雜的運行環(huán)境與業(yè)務(wù)需求。通訊設(shè)備種類繁多,包括路由器、交換機(jī)、光纖模塊、室分設(shè)備、電纜盤及天線等,其存儲形態(tài)呈現(xiàn)高密度堆疊、隨機(jī)旋轉(zhuǎn)與部分遮擋等特征,導(dǎo)致傳統(tǒng)依賴人工盤點與條形碼掃描的管理方式效率低下、勞動強(qiáng)度大且差錯率高。針對這些痛點,本文提出一種面向通訊倉儲場景的物品識別與定位系統(tǒng)框架,綜合利用REW-YOLO(Rotation-Enhanced Weighted YOLO)目標(biāo)檢測模型與RGB-D深度視覺技術(shù),實現(xiàn)對倉儲物品的精確識別與三維定位。實驗結(jié)果表明,該系統(tǒng)可為通訊倉儲的智能盤點與定位作業(yè)提供可行的技術(shù)路徑和工程實現(xiàn)參考。
關(guān)鍵詞:REW-YOLO;RGB-D;物體識別;通訊倉儲;深度學(xué)習(xí);目標(biāo)檢測;三維定位
作者:葉大魯
中國移動通信集團(tuán)山東有限公司威海分公司
一
引言
近年來,隨著5G網(wǎng)絡(luò)大規(guī)模建設(shè)和“東數(shù)西算”等工程的推進(jìn),運營商通訊設(shè)備的種類與數(shù)量呈爆發(fā)式增長。省、市級集中倉庫及片區(qū)中轉(zhuǎn)倉需同時管理上萬件不同型號的板卡、RRU、BBU、光模塊、電源模塊及各種輔材。這些物品外觀多樣、包裝形態(tài)復(fù)雜,且出入庫頻繁,給傳統(tǒng)倉儲管理模式帶來巨大壓力。目前,許多環(huán)節(jié)仍依賴人工肉眼識別與手持終端掃描條碼,不僅勞動強(qiáng)度大,而且在光照不足、標(biāo)簽破損或箱體遮擋等場景下易出現(xiàn)漏掃、錯掃問題,直接影響庫存準(zhǔn)確性和作業(yè)效率。
![]()
圖1 REW-YOLO(Rotation-Enhanced Weighted YOLO)模型
計算機(jī)視覺與深度學(xué)習(xí)技術(shù)的發(fā)展,為解決上述問題提供了關(guān)鍵手段。YOLO系列模型以其單階段、端到端的結(jié)構(gòu),在工業(yè)視覺檢測中得到廣泛應(yīng)用。然而,傳統(tǒng)YOLO模型普遍假設(shè)目標(biāo)邊界框為軸對齊矩形,對旋轉(zhuǎn)、傾斜或堆疊物體的檢測能力有限,在通訊倉儲這種存在大量傾斜紙箱、電纜卷軸及不規(guī)則器件的場景下,往往出現(xiàn)目標(biāo)邊界框重疊嚴(yán)重、定位偏差大等問題。Wang等[1]提出REW-YOLO(Rotation-Enhanced Weighted YOLO)通過引入旋轉(zhuǎn)邊界框參數(shù)和加權(quán)損失設(shè)計(模型如圖1所示),結(jié)果表明該模型在不顯著增加計算量的前提下,提高了對旋轉(zhuǎn)目標(biāo)的檢測性能,適合應(yīng)用于通訊倉儲等復(fù)雜環(huán)境。
另一方面,傳統(tǒng)僅基于二維圖像的檢測方法難以獲得目標(biāo)在空間中的真實位置和高度信息,在多層貨架或高密度堆疊環(huán)境中無法滿足三維定位和路徑規(guī)劃的需要。艾青林等[2]提出RGB-D技術(shù)通過在RGB彩色圖像的基礎(chǔ)上增加深度通道,使得每個像素都具備“顏色+距離”的信息,為物體三維重建、位姿估計和空間測量等任務(wù)提供了重要支撐。將RGB-D與旋轉(zhuǎn)檢測框架結(jié)合,有望提高在重疊和遮擋場景中的感知精度。
基于上述背景,面向通訊倉儲典型應(yīng)用需求,本文設(shè)計并實現(xiàn)了一套基于REW-YOLO與RGB-D技術(shù)的物品識別與定位系統(tǒng),旨在實現(xiàn)對倉儲物品的精確識別與三維定位,為通訊倉儲的智能盤點與定位作業(yè)提供可行的技術(shù)路徑和工程實現(xiàn)參考。
二
系統(tǒng)設(shè)計與方法
基于REW-YOLO與RGB-D技術(shù)的通訊倉儲物品識別與定位系統(tǒng)以模塊化架構(gòu)為核心,首先通過REW-YOLO旋轉(zhuǎn)目標(biāo)檢測框架處理復(fù)雜倉儲場景下的傾斜、堆疊與遮擋問題,實現(xiàn)高精度物體檢測;其次,融合RGB-D深度信息進(jìn)行三維定位,獲得目標(biāo)在空間中的真實位姿;最后,構(gòu)建完整的系統(tǒng)架構(gòu),確保數(shù)據(jù)流高效流通與實際部署的可行性。通過這些方法,該系統(tǒng)能有效適應(yīng)通訊倉儲的動態(tài)環(huán)境,提供可靠的識別與定位支持。
1.REW-YOLO旋轉(zhuǎn)目標(biāo)檢測框架
傳統(tǒng)YOLO系列模型通過對輸入圖像進(jìn)行網(wǎng)格劃分,預(yù)測每個網(wǎng)格中若干個候選邊界框的中心位置(x,y)、寬高(w,h)和類別概率,從而實現(xiàn)實時目標(biāo)檢測。然而,在通訊倉儲場景中,物品經(jīng)常以任意角度堆疊或傾斜放置,使用軸對齊邊界框進(jìn)行擬合會導(dǎo)致以下問題:一是包圍盒面積被迫增大,引入大量背景噪聲,削弱特征表達(dá)的判別性;二是在多目標(biāo)緊密堆疊時,矩形框之間嚴(yán)重重疊,增加NMS(Non-Maximum Suppression)階段的誤抑制風(fēng)險。
REW-YOLO在常規(guī)YOLOv8檢測頭基礎(chǔ)上增加了角度回歸分支,引入旋轉(zhuǎn)邊界框參數(shù)θ,使每個目標(biāo)的預(yù)測結(jié)果擴(kuò)展為(x,y,w,h,θ)。為提高訓(xùn)練穩(wěn)定性,本文采用以下方式對角度進(jìn)行編碼:
通過將角度映射到[0,1]區(qū)間,可有效緩解梯度震蕩問題。
在損失函數(shù)設(shè)計方面,REW-YOLO將總損失表示為:
其中,Lcls為分類損失,采用Focal Loss以抑制易分類樣本的影響;Lbox為邊界框回歸損失,采用基于旋轉(zhuǎn)IoU的損失形式;Lrot為角度回歸損失,使用平滑L1損失:
λbox與λrot分別為平衡系數(shù),參考實際情況本次設(shè)置為2.0與0.5。
通過上述設(shè)計,模型能夠?qū)πD(zhuǎn)、傾斜及部分遮擋目標(biāo)進(jìn)行更精確的外接框擬合,提高整體檢測性能。為進(jìn)一步提升在倉儲復(fù)雜場景下的魯棒性,本文還將實例分割算法Mask R-CNN融入框架中,用于精確描繪物體輪廓,支持邊緣粘連和膠帶干擾的處理。
2. RGB-D三維定位方法
為了進(jìn)一步獲得目標(biāo)在空間中的真實位置,本文引入RGB-D深度相機(jī),結(jié)合相機(jī)內(nèi)參完成從像素坐標(biāo)到相機(jī)坐標(biāo)的轉(zhuǎn)換。RGB-D相機(jī)在采集彩色圖像的同時,為每個像素提供深度值D(u,v),表示相機(jī)到該點的距離。設(shè)相機(jī)內(nèi)參矩陣為:
![]()
其中fx,fy為在水平方向和垂直方向上的焦距,(cx,cy)為主點坐標(biāo)。對檢測得到的旋轉(zhuǎn)邊界框,首先在其內(nèi)部選取若干個像素點(如中心點及四個頂點),根據(jù)深度圖讀取對應(yīng)深度值z=D(u,v),再依據(jù)透視投影關(guān)系將其映射至相機(jī)坐標(biāo)系:
由此便可獲得目標(biāo)在相機(jī)坐標(biāo)系下的三維坐標(biāo)(x,y,z)。考慮到深度圖易受噪聲影響,本文對旋轉(zhuǎn)框內(nèi)部深度值采用中值濾波與有效像素剔除策略,僅保留可信度較高的深度數(shù)據(jù)用于計算,進(jìn)一步提高三維定位的穩(wěn)定性。
在倉儲實際應(yīng)用中,若需要獲得相對于倉庫全局坐標(biāo)系的位姿,還可結(jié)合外參矩陣[R|T],完成從相機(jī)坐標(biāo)系到世界坐標(biāo)系的轉(zhuǎn)換:
![]()
其中R為旋轉(zhuǎn)矩陣,T為平移向量。主要關(guān)注相機(jī)坐標(biāo)系下的相對位置,因此在仿真實驗中未對外參進(jìn)行擴(kuò)展討論。為實現(xiàn)手眼標(biāo)定,本文采用棋盤格方法確定相機(jī)坐標(biāo)系和機(jī)器人坐標(biāo)系的轉(zhuǎn)換關(guān)系,確保定位精度在1~5mm范圍內(nèi)。
3.識別與定位系統(tǒng)架構(gòu)
系統(tǒng)采用模塊化設(shè)計,以方便部署和維護(hù)。整體數(shù)據(jù)流依次經(jīng)過圖像采集模塊、物體檢測模塊、三維定位模塊、數(shù)據(jù)處理與輸出模塊,各模塊之間通過消息隊列或共享內(nèi)存進(jìn)行解耦。
圖像采集模塊。參考馮仁宇等[3]安裝方式,此次使用Intel RealSense D435等RGB-D相機(jī)固定安裝在貨架正前方或頂部,按幀率30 FPS采集場景RGB圖像及深度圖。為減小環(huán)境光變化的影響,相機(jī)開啟自動曝光與紅外補(bǔ)光功能。
物體檢測模塊。接收采集到的RGB圖像,經(jīng)過歸一化與尺寸縮放后輸入REW-YOLO檢測網(wǎng)絡(luò),輸出每個目標(biāo)的類別標(biāo)簽、置信度以及旋轉(zhuǎn)邊界框參數(shù),并通過旋轉(zhuǎn)NMS去除冗余候選框。
三維定位模塊。利用深度圖和相機(jī)內(nèi)參矩陣,提取旋轉(zhuǎn)框中心點及頂點的深度值,完成從像素坐標(biāo)到三維坐標(biāo)的轉(zhuǎn)換,輸出位姿信息。
數(shù)據(jù)處理與輸出模塊。將識別與定位結(jié)果按照通訊倉儲業(yè)務(wù)需求進(jìn)行結(jié)構(gòu)化封裝,生成“物品ID—位姿—置信度”三元組,并通過RESTful API或消息總線推送給上層倉儲管理系統(tǒng)。該模塊同時負(fù)責(zé)結(jié)果可視化與日志記錄,便于后續(xù)追蹤與分析。
![]()
圖2 系統(tǒng)總體架構(gòu)示意圖
系統(tǒng)總體架構(gòu)如圖2所示,左側(cè)為RGB-D攝像頭與采集模塊,中部為REW-YOLO檢測與RGB-D融合定位模塊,右側(cè)為數(shù)據(jù)輸出與系統(tǒng)接口模塊,箭頭表示數(shù)據(jù)在各模塊之間的流轉(zhuǎn)路徑。該系統(tǒng)支持柔性手爪適配,實現(xiàn)吸盤、夾持等多種抓取方式,適用于混碼組盤拆垛。
三
仿真與應(yīng)用驗證
1.數(shù)據(jù)集獲取與預(yù)處理
為驗證所提方法的有效性,在某運營商集中倉庫內(nèi)采集了5000幅RGB-D圖像,覆蓋10類典型通訊產(chǎn)品,包括室外RRU箱體、室內(nèi)分布系統(tǒng)設(shè)備、1U/2U機(jī)框、整箱光模塊、電纜盤、天線組件等。其中約60%的樣本為單層擺放場景,40%為多層堆疊及混合遮擋場景。采集過程中刻意設(shè)置不同的光照條件(自然光、局部遮擋、偏暗角落等),以增強(qiáng)數(shù)據(jù)多樣性。
在預(yù)處理階段,首先對深度圖執(zhí)行中值濾波與孔洞填補(bǔ),以緩解深度噪聲和缺失問題;其次在RGB圖像上進(jìn)行幾何與光照增強(qiáng),包括隨機(jī)旋轉(zhuǎn)(±30°)、水平翻轉(zhuǎn)、亮度與對比度擾動、遮擋模擬等,以構(gòu)造更多傾斜與局部遮擋樣本,提升模型的泛化能力。隨后使用LabelImg工具對圖像進(jìn)行人工標(biāo)注,采用旋轉(zhuǎn)邊界框形式記錄各目標(biāo)的中心點、寬高及朝向角度,多數(shù)圖片包含2~6個目標(biāo)實例。
![]()
圖3 部分倉儲場景照片
數(shù)據(jù)集按7∶2∶1比例劃分為訓(xùn)練集、驗證集與測試集,保證各類別及不同堆疊場景在各子集中分布均衡。模型訓(xùn)練基于PyTorch框架實現(xiàn),批次大小設(shè)為32,初始學(xué)習(xí)率0.001,訓(xùn)練輪數(shù)300輪;在訓(xùn)練過程中使用余弦退火學(xué)習(xí)率調(diào)度策略,并啟用Early-Stopping機(jī)制,當(dāng)驗證集損失在20輪內(nèi)不再下降時提前終止訓(xùn)練,以防止過擬合。
2.仿真平臺與實驗設(shè)置
為了系統(tǒng)評估算法在不同遮擋程度、堆疊高度和光照條件下的性能,本文在實際數(shù)據(jù)之外,構(gòu)建了一個基于Unity3D的通訊倉儲仿真環(huán)境。仿真平臺按照1∶10比例還原貨架尺寸與部分庫區(qū)布局,并建立了多種典型設(shè)備三維模型。通過設(shè)置虛擬RGB-D相機(jī),可方便地控制相機(jī)高度、俯仰角、焦距以及環(huán)境光照,從而生成大量標(biāo)注精確、可重復(fù)的模擬樣本。
![]()
圖4 仿真與實采數(shù)據(jù)聯(lián)合實驗平臺示意圖
仿真與實采數(shù)據(jù)聯(lián)合實驗平臺如圖4所示,左側(cè)為安裝在真實倉庫和仿真場景中的RGB-D相機(jī),中間為多層貨架及隨機(jī)堆疊的設(shè)備包裝箱,右側(cè)為GPU推理服務(wù)器與算法程序。系統(tǒng)在NVIDIA RTX 3080 GPU 與Intel Core i7處理器上運行,單次推理的平均延遲約22s。
評估指標(biāo)主要包括mAP@0.5、FPS與RMSE。其中,mAP@0.5指在IoU閾值0.5下的平均精度,用于評價目標(biāo)檢測性能;FPS指推理幀率,反映算法的實時性;RMSE指三維定位的根均方誤差,定義為
(其中分別為第i個目標(biāo)的真實與預(yù)測三維坐標(biāo),N為樣本總數(shù))。
為了進(jìn)行對比實驗,本文選取YOLOv4和YOLOv8作為基線模型,在相同數(shù)據(jù)集和訓(xùn)練策略下重新訓(xùn)練,并在統(tǒng)一測試集上進(jìn)行測試。實際平臺搭建包括KuKa 6軸機(jī)器人(KR C5 M6)和圖漾3D相機(jī)。
3.不同檢測模型性能對比
YOLOv4、YOLOv8與REW-YOLO模型在“真實+仿真”混合測試集上的性能對比結(jié)果參見表1。由表1可見,在綜合考慮檢測精度與實時性的前提下,REW-YOLO 在mAP@0.5指標(biāo)上相較YOLOv4和YOLOv8分別提升了4.6和8.9個百分點,復(fù)雜場景下的mAP提升幅度更為顯著,說明旋轉(zhuǎn)邊界框與加權(quán)損失設(shè)計有效增強(qiáng)了對傾斜與堆疊物體的檢測能力。盡管引入旋轉(zhuǎn)分支導(dǎo)致FPS略低于YOLOv8,但45FPS的推理速度仍能滿足大部分通訊倉儲實時盤點業(yè)務(wù)的需求。
表1 不同檢測模型性能對比
![]()
在定位誤差方面,由于YOLOv4與YOLOv8在目標(biāo)框回歸上采用軸對齊矩形,導(dǎo)致部分高度傾斜目標(biāo)的中心點偏移較大,從而影響三維坐標(biāo)計算;REW-YOLO 利用旋轉(zhuǎn)框更準(zhǔn)確地擬合目標(biāo)輪廓,使得RMSE 顯著降低至2.5cm,為后續(xù)機(jī)械臂或AGV設(shè)備的精確抓取提供了更可靠的位姿輸入。
4.RGB-D融合效果對比
為量化RGB-D融合對三維定位精度的提升效果,在保持檢測網(wǎng)絡(luò)不變的情況下對比了“純RGB+固定深度假設(shè)”和“RGB-D融合”兩種方案。其中,“純RGB+固定深度假設(shè)”方案是指在僅使用RGB圖像進(jìn)行目標(biāo)檢測的基礎(chǔ)上,對檢測到的邊界框進(jìn)行三維定位時,不依賴深度圖,而是采用經(jīng)驗高度或貨架層高作為深度值的近似估計。具體而言,該方案假設(shè)所有目標(biāo)位于已知的固定高度平面(如貨架的特定層高),或使用預(yù)設(shè)的平均經(jīng)驗高度(如基于歷史數(shù)據(jù)或人工測量得到的典型物品高度)來代替真實深度值。這種方法簡單易實現(xiàn),但忽略了實際場景中的高度變異(如堆疊導(dǎo)致的z坐標(biāo)差異或相機(jī)視角引起的透視distortion),容易在多層貨架或不規(guī)則堆疊環(huán)境中引入系統(tǒng)性誤差,導(dǎo)致定位精度下降。相反,“RGB-D融合”方案則直接使用深度圖測得的距離值,與檢測到的邊界框像素坐標(biāo)結(jié)合,通過相機(jī)內(nèi)參矩陣進(jìn)行精確映射,實現(xiàn)真實的深度信息整合。
表2 RGB與RGB-D融合前后性能對比
![]()
實驗結(jié)果表明,盡管兩種方案在檢測精度(mAP)上差距有限,但在三維定位誤差上差異明顯。純RGB方法在多層貨架和混合堆疊場景中常出現(xiàn)高度估計偏差,RMSE高達(dá)4.2cm;引入RGB-D深度信息后,定位誤差降低約40%,且在不同光照條件下保持較為穩(wěn)定的表現(xiàn),證明深度信息在提升整體空間感知能力方面具有關(guān)鍵作用。具體可參見表2。
5.遮擋與堆疊高度仿真實驗
為了進(jìn)一步考察算法在不同遮擋程度和堆疊高度下的魯棒性,本文在仿真環(huán)境中設(shè)計了單層無遮擋(貨物單層擺放,彼此間距較大)、兩層中度遮擋(上層紙箱覆蓋下層約30%面積)、三層高密度堆疊(多層紙箱隨機(jī)偏轉(zhuǎn)堆疊,遮擋比例超過60%)等三組場景。
具體設(shè)置為在Unity3D仿真平臺中,利用內(nèi)置的Occlusion Culling功能來模擬現(xiàn)實中的視覺遮擋效應(yīng)。該功能通過動態(tài)計算相機(jī)視錐體內(nèi)可見物體,自動隱藏被遮擋的部分,從而生成更逼真的RGB-D圖像。在場景構(gòu)建時,采用物理引擎模擬物品堆疊的動態(tài)過程,例如使用Unity的Physics系統(tǒng)應(yīng)用重力和碰撞力,確保堆疊形態(tài)符合現(xiàn)實物理規(guī)律,如紙箱在多層堆疊時的穩(wěn)定性。具體場景設(shè)計如下:
單層無遮擋場景。物品均勻分布于貨架平面,間距設(shè)置為10~20cm,無任何重疊。該場景作為基準(zhǔn),用于評估模型在理想條件下的性能上限。控制光照強(qiáng)度為標(biāo)準(zhǔn)自然光(約1000 lux),并添加輕微噪聲(高斯噪聲σ=0.01)以模擬相機(jī)傳感器誤差。
兩層中度遮擋場景。上層物品隨機(jī)放置于下層上方,覆蓋面積控制在30%~50%。引入隨機(jī)旋轉(zhuǎn)(角度范圍±15°)來模擬實際倉儲中的不規(guī)則放置,并調(diào)整遮擋比例通過Unity的Mesh Collider來精確計算可見像素比例。該場景代表典型出入庫后貨物臨時堆放的情況。
三層高密度堆疊場景。物品多層疊加,覆蓋率超過60%,并模擬隨機(jī)偏轉(zhuǎn)(角度20°~45°)和局部光影變化(如使用Unity的Light Probes創(chuàng)建動態(tài)陰影)。該場景模仿高峰期倉庫擁擠狀態(tài),測試模型對嚴(yán)重遮擋的魯棒性。還添加環(huán)境因素,如反射表面(金屬箱體)和噪聲增強(qiáng)(σ=0.05),以接近真實工業(yè)環(huán)境。
在數(shù)據(jù)生成過程中,每場景生成500幅圖像,總計1500幅,每幅圖像包含2~8個物品實例,使用虛擬RGB-D相機(jī)捕獲(分辨率640×480,深度范圍0.5~5m)。標(biāo)注通過Unity腳本自動生成,確保像素級精確。
表3 不同場景下模型性能對比
![]()
實驗結(jié)果表明,隨著遮擋程度的增加,三種模型的mAP均有所下降,但REW-YOLO下降幅度最小;在三層高密度堆疊場景中,YOLOv8的mAP降至72.4%,而REW-YOLO仍可保持在84.0%左右。此外,REW-YOLO在所有場景中的RMSE均控制在3cm以內(nèi),表明其在復(fù)雜堆疊環(huán)境下具備更強(qiáng)的空間感知能力。具體可參見表3。
實驗結(jié)果顯示,隨著復(fù)雜度增加,基線模型性能下降明顯。YOLOv4在高密度場景mAP降至68.2%,主要因軸對齊框無法有效處理重疊邊界,導(dǎo)致NMS誤判率升高(約25%實例被抑制)。YOLOv8雖優(yōu)化了網(wǎng)絡(luò)結(jié)構(gòu),但仍受限于傳統(tǒng)IoU損失,在遮擋>50%時召回率掉至60%。相比之下,REW-YOLO受益于旋轉(zhuǎn)IoU和加權(quán)損失,在中度遮擋場景mAP提升9.4%,高密度場景提升15.8%,召回率維持85%以上。這歸因于角度回歸分支的顯式優(yōu)化,能更好地擬合不規(guī)則輪廓,減少背景干擾。
此外,RMSE分析表明,REW-YOLO在所有場景中均<3cm,而基線模型在高密度堆疊時升至5.6cm,突出旋轉(zhuǎn)框在提升中心點準(zhǔn)確性的作用。進(jìn)一步可視化結(jié)果顯示REW-YOLO在遮擋區(qū)域的邊界擬合更緊致。
這些發(fā)現(xiàn)驗證了系統(tǒng)對倉儲復(fù)雜性的適應(yīng)性,為實際部署提供閾值(如遮擋>60%時建議多相機(jī)融合)。
6.誤差來源分析與討論
綜合上述實驗結(jié)果可以看出,算法誤差主要來源于以下幾個方面:
(1)深度噪聲與反射:在金屬材質(zhì)或強(qiáng)反光包裝箱表面,RGB-D相機(jī)的紅外結(jié)構(gòu)光易產(chǎn)生錯誤匹配,導(dǎo)致局部深度值突變;
(2)旋轉(zhuǎn)框擬合誤差:當(dāng)目標(biāo)邊界與背景對比度較低或邊緣模糊時,旋轉(zhuǎn)角度預(yù)測存在一定偏差,進(jìn)而影響三維中心坐標(biāo);
(3)標(biāo)注與仿真差異:手工旋轉(zhuǎn)框標(biāo)注難以做到像素級精確,一定程度上限制了上限性能;而仿真數(shù)據(jù)與真實物理紋理存在域差異,也會對泛化效果產(chǎn)生影響。
針對上述問題,可通過引入更高精度的ToF深度相機(jī)、采用多幀深度融合與時間濾波技術(shù),以及結(jié)合實例分割或邊緣檢測結(jié)果對旋轉(zhuǎn)框進(jìn)行二次優(yōu)化等方式進(jìn)一步降低誤差。
四
結(jié)論
面向通訊行業(yè)倉儲場景中物品種類多樣、堆疊復(fù)雜和定位精度要求高等特點,提出了一種結(jié)合REW-YOLO與RGB-D深度視覺技術(shù)的物品識別與三維定位系統(tǒng)。實驗結(jié)果表明該方法不僅為倉儲智能化提供了高效、魯棒的技術(shù)路徑,還能顯著提升盤點效率、降低人工強(qiáng)度和庫存誤差,具有重要的工程應(yīng)用價值和推廣潛力,未來通過與機(jī)器人、AGV及多模態(tài)傳感器的集成,可進(jìn)一步實現(xiàn)全流程自動化和多倉自適應(yīng)部署。
參考文獻(xiàn):
[1]Wang G,Li S,Zhu X,etal.REW-YOLO: A Lightweight Box Detection Method for Logistics[J].Modelling, 2025,6:76.
[2]艾青林,劉剛江,徐巧寧.動態(tài)環(huán)境下基于改進(jìn)幾何與運動約束的機(jī)器人RGB-D SLAM算法[J].機(jī)器人,2021,43(02):167-176.
[3]馮仁宇,夏凱,楊灝泉,等.3D視覺智能拆垛系統(tǒng)關(guān)鍵技術(shù)研究[J].物流技術(shù)與應(yīng)用,2025 30(09):114-122.
———— 物流技術(shù)與應(yīng)用融媒 ————
編輯、排版:王茜
本文內(nèi)容源自
歡迎文末分享、點贊、在看!轉(zhuǎn)載請聯(lián)系后臺。
廣告宣傳
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.