基于REW-YOLO與RGB-D技術(shù)的通訊倉儲物品識別與定位系統(tǒng)

2026-04-22 17:46:34　來源: 物流技術(shù)與應(yīng)用

北京舉報

分享至

廣告 | 點擊查看

摘要：隨著通訊行業(yè)的迅猛發(fā)展，倉儲物流系統(tǒng)面臨日益復(fù)雜的運行環(huán)境與業(yè)務(wù)需求。通訊設(shè)備種類繁多，包括路由器、交換機(jī)、光纖模塊、室分設(shè)備、電纜盤及天線等，其存儲形態(tài)呈現(xiàn)高密度堆疊、隨機(jī)旋轉(zhuǎn)與部分遮擋等特征，導(dǎo)致傳統(tǒng)依賴人工盤點與條形碼掃描的管理方式效率低下、勞動強(qiáng)度大且差錯率高。針對這些痛點，本文提出一種面向通訊倉儲場景的物品識別與定位系統(tǒng)框架，綜合利用REW-YOLO（Rotation-Enhanced Weighted YOLO）目標(biāo)檢測模型與RGB-D深度視覺技術(shù)，實現(xiàn)對倉儲物品的精確識別與三維定位。實驗結(jié)果表明，該系統(tǒng)可為通訊倉儲的智能盤點與定位作業(yè)提供可行的技術(shù)路徑和工程實現(xiàn)參考。

關(guān)鍵詞：REW-YOLO；RGB-D；物體識別；通訊倉儲；深度學(xué)習(xí)；目標(biāo)檢測；三維定位

作者：葉大魯

中國移動通信集團(tuán)山東有限公司威海分公司

一

引言

近年來，隨著5G網(wǎng)絡(luò)大規(guī)模建設(shè)和“東數(shù)西算”等工程的推進(jìn)，運營商通訊設(shè)備的種類與數(shù)量呈爆發(fā)式增長。省、市級集中倉庫及片區(qū)中轉(zhuǎn)倉需同時管理上萬件不同型號的板卡、RRU、BBU、光模塊、電源模塊及各種輔材。這些物品外觀多樣、包裝形態(tài)復(fù)雜，且出入庫頻繁，給傳統(tǒng)倉儲管理模式帶來巨大壓力。目前，許多環(huán)節(jié)仍依賴人工肉眼識別與手持終端掃描條碼，不僅勞動強(qiáng)度大，而且在光照不足、標(biāo)簽破損或箱體遮擋等場景下易出現(xiàn)漏掃、錯掃問題，直接影響庫存準(zhǔn)確性和作業(yè)效率。

圖1 REW-YOLO（Rotation-Enhanced Weighted YOLO）模型

計算機(jī)視覺與深度學(xué)習(xí)技術(shù)的發(fā)展，為解決上述問題提供了關(guān)鍵手段。YOLO系列模型以其單階段、端到端的結(jié)構(gòu)，在工業(yè)視覺檢測中得到廣泛應(yīng)用。然而，傳統(tǒng)YOLO模型普遍假設(shè)目標(biāo)邊界框為軸對齊矩形，對旋轉(zhuǎn)、傾斜或堆疊物體的檢測能力有限，在通訊倉儲這種存在大量傾斜紙箱、電纜卷軸及不規(guī)則器件的場景下，往往出現(xiàn)目標(biāo)邊界框重疊嚴(yán)重、定位偏差大等問題。Wang等[1]提出REW-YOLO（Rotation-Enhanced Weighted YOLO）通過引入旋轉(zhuǎn)邊界框參數(shù)和加權(quán)損失設(shè)計（模型如圖1所示），結(jié)果表明該模型在不顯著增加計算量的前提下，提高了對旋轉(zhuǎn)目標(biāo)的檢測性能，適合應(yīng)用于通訊倉儲等復(fù)雜環(huán)境。

另一方面，傳統(tǒng)僅基于二維圖像的檢測方法難以獲得目標(biāo)在空間中的真實位置和高度信息，在多層貨架或高密度堆疊環(huán)境中無法滿足三維定位和路徑規(guī)劃的需要。艾青林等[2]提出RGB-D技術(shù)通過在RGB彩色圖像的基礎(chǔ)上增加深度通道，使得每個像素都具備“顏色+距離”的信息，為物體三維重建、位姿估計和空間測量等任務(wù)提供了重要支撐。將RGB-D與旋轉(zhuǎn)檢測框架結(jié)合，有望提高在重疊和遮擋場景中的感知精度。

基于上述背景，面向通訊倉儲典型應(yīng)用需求，本文設(shè)計并實現(xiàn)了一套基于REW-YOLO與RGB-D技術(shù)的物品識別與定位系統(tǒng)，旨在實現(xiàn)對倉儲物品的精確識別與三維定位，為通訊倉儲的智能盤點與定位作業(yè)提供可行的技術(shù)路徑和工程實現(xiàn)參考。

二

系統(tǒng)設(shè)計與方法

基于REW-YOLO與RGB-D技術(shù)的通訊倉儲物品識別與定位系統(tǒng)以模塊化架構(gòu)為核心，首先通過REW-YOLO旋轉(zhuǎn)目標(biāo)檢測框架處理復(fù)雜倉儲場景下的傾斜、堆疊與遮擋問題，實現(xiàn)高精度物體檢測；其次，融合RGB-D深度信息進(jìn)行三維定位，獲得目標(biāo)在空間中的真實位姿；最后，構(gòu)建完整的系統(tǒng)架構(gòu)，確保數(shù)據(jù)流高效流通與實際部署的可行性。通過這些方法，該系統(tǒng)能有效適應(yīng)通訊倉儲的動態(tài)環(huán)境，提供可靠的識別與定位支持。

1.REW-YOLO旋轉(zhuǎn)目標(biāo)檢測框架

傳統(tǒng)YOLO系列模型通過對輸入圖像進(jìn)行網(wǎng)格劃分，預(yù)測每個網(wǎng)格中若干個候選邊界框的中心位置(x,y)、寬高(w,h)和類別概率，從而實現(xiàn)實時目標(biāo)檢測。然而，在通訊倉儲場景中，物品經(jīng)常以任意角度堆疊或傾斜放置，使用軸對齊邊界框進(jìn)行擬合會導(dǎo)致以下問題：一是包圍盒面積被迫增大，引入大量背景噪聲，削弱特征表達(dá)的判別性；二是在多目標(biāo)緊密堆疊時，矩形框之間嚴(yán)重重疊，增加NMS（Non-Maximum Suppression）階段的誤抑制風(fēng)險。

REW-YOLO在常規(guī)YOLOv8檢測頭基礎(chǔ)上增加了角度回歸分支，引入旋轉(zhuǎn)邊界框參數(shù)θ，使每個目標(biāo)的預(yù)測結(jié)果擴(kuò)展為(x,y,w,h,θ)。為提高訓(xùn)練穩(wěn)定性，本文采用以下方式對角度進(jìn)行編碼：

通過將角度映射到[0,1]區(qū)間，可有效緩解梯度震蕩問題。

在損失函數(shù)設(shè)計方面，REW-YOLO將總損失表示為：

其中，Lcls為分類損失，采用Focal Loss以抑制易分類樣本的影響；Lbox為邊界框回歸損失，采用基于旋轉(zhuǎn)IoU的損失形式；Lrot為角度回歸損失，使用平滑L1損失：

λbox與λrot分別為平衡系數(shù)，參考實際情況本次設(shè)置為2.0與0.5。

通過上述設(shè)計，模型能夠?qū)πD(zhuǎn)、傾斜及部分遮擋目標(biāo)進(jìn)行更精確的外接框擬合，提高整體檢測性能。為進(jìn)一步提升在倉儲復(fù)雜場景下的魯棒性，本文還將實例分割算法Mask R-CNN融入框架中，用于精確描繪物體輪廓，支持邊緣粘連和膠帶干擾的處理。

2. RGB-D三維定位方法

為了進(jìn)一步獲得目標(biāo)在空間中的真實位置，本文引入RGB-D深度相機(jī)，結(jié)合相機(jī)內(nèi)參完成從像素坐標(biāo)到相機(jī)坐標(biāo)的轉(zhuǎn)換。RGB-D相機(jī)在采集彩色圖像的同時，為每個像素提供深度值D(u,v)，表示相機(jī)到該點的距離。設(shè)相機(jī)內(nèi)參矩陣為：

其中fx,fy為在水平方向和垂直方向上的焦距，(cx,cy)為主點坐標(biāo)。對檢測得到的旋轉(zhuǎn)邊界框，首先在其內(nèi)部選取若干個像素點（如中心點及四個頂點），根據(jù)深度圖讀取對應(yīng)深度值z=D(u,v)，再依據(jù)透視投影關(guān)系將其映射至相機(jī)坐標(biāo)系：

由此便可獲得目標(biāo)在相機(jī)坐標(biāo)系下的三維坐標(biāo)(x,y,z)。考慮到深度圖易受噪聲影響，本文對旋轉(zhuǎn)框內(nèi)部深度值采用中值濾波與有效像素剔除策略，僅保留可信度較高的深度數(shù)據(jù)用于計算，進(jìn)一步提高三維定位的穩(wěn)定性。

在倉儲實際應(yīng)用中，若需要獲得相對于倉庫全局坐標(biāo)系的位姿，還可結(jié)合外參矩陣[R|T]，完成從相機(jī)坐標(biāo)系到世界坐標(biāo)系的轉(zhuǎn)換：

其中R為旋轉(zhuǎn)矩陣，T為平移向量。主要關(guān)注相機(jī)坐標(biāo)系下的相對位置，因此在仿真實驗中未對外參進(jìn)行擴(kuò)展討論。為實現(xiàn)手眼標(biāo)定，本文采用棋盤格方法確定相機(jī)坐標(biāo)系和機(jī)器人坐標(biāo)系的轉(zhuǎn)換關(guān)系，確保定位精度在1～5mm范圍內(nèi)。

3.識別與定位系統(tǒng)架構(gòu)

系統(tǒng)采用模塊化設(shè)計，以方便部署和維護(hù)。整體數(shù)據(jù)流依次經(jīng)過圖像采集模塊、物體檢測模塊、三維定位模塊、數(shù)據(jù)處理與輸出模塊，各模塊之間通過消息隊列或共享內(nèi)存進(jìn)行解耦。

圖像采集模塊。參考馮仁宇等[3]安裝方式，此次使用Intel RealSense D435等RGB-D相機(jī)固定安裝在貨架正前方或頂部，按幀率30 FPS采集場景RGB圖像及深度圖。為減小環(huán)境光變化的影響，相機(jī)開啟自動曝光與紅外補(bǔ)光功能。

物體檢測模塊。接收采集到的RGB圖像，經(jīng)過歸一化與尺寸縮放后輸入REW-YOLO檢測網(wǎng)絡(luò)，輸出每個目標(biāo)的類別標(biāo)簽、置信度以及旋轉(zhuǎn)邊界框參數(shù)，并通過旋轉(zhuǎn)NMS去除冗余候選框。

三維定位模塊。利用深度圖和相機(jī)內(nèi)參矩陣，提取旋轉(zhuǎn)框中心點及頂點的深度值，完成從像素坐標(biāo)到三維坐標(biāo)的轉(zhuǎn)換，輸出位姿信息。

數(shù)據(jù)處理與輸出模塊。將識別與定位結(jié)果按照通訊倉儲業(yè)務(wù)需求進(jìn)行結(jié)構(gòu)化封裝，生成“物品ID—位姿—置信度”三元組，并通過RESTful API或消息總線推送給上層倉儲管理系統(tǒng)。該模塊同時負(fù)責(zé)結(jié)果可視化與日志記錄，便于后續(xù)追蹤與分析。

圖2 系統(tǒng)總體架構(gòu)示意圖

系統(tǒng)總體架構(gòu)如圖2所示，左側(cè)為RGB-D攝像頭與采集模塊，中部為REW-YOLO檢測與RGB-D融合定位模塊，右側(cè)為數(shù)據(jù)輸出與系統(tǒng)接口模塊，箭頭表示數(shù)據(jù)在各模塊之間的流轉(zhuǎn)路徑。該系統(tǒng)支持柔性手爪適配，實現(xiàn)吸盤、夾持等多種抓取方式，適用于混碼組盤拆垛。

三

仿真與應(yīng)用驗證

1.數(shù)據(jù)集獲取與預(yù)處理

為驗證所提方法的有效性，在某運營商集中倉庫內(nèi)采集了5000幅RGB-D圖像，覆蓋10類典型通訊產(chǎn)品，包括室外RRU箱體、室內(nèi)分布系統(tǒng)設(shè)備、1U/2U機(jī)框、整箱光模塊、電纜盤、天線組件等。其中約60%的樣本為單層擺放場景，40%為多層堆疊及混合遮擋場景。采集過程中刻意設(shè)置不同的光照條件（自然光、局部遮擋、偏暗角落等），以增強(qiáng)數(shù)據(jù)多樣性。

在預(yù)處理階段，首先對深度圖執(zhí)行中值濾波與孔洞填補(bǔ)，以緩解深度噪聲和缺失問題；其次在RGB圖像上進(jìn)行幾何與光照增強(qiáng)，包括隨機(jī)旋轉(zhuǎn)（±30°）、水平翻轉(zhuǎn)、亮度與對比度擾動、遮擋模擬等，以構(gòu)造更多傾斜與局部遮擋樣本，提升模型的泛化能力。隨后使用LabelImg工具對圖像進(jìn)行人工標(biāo)注，采用旋轉(zhuǎn)邊界框形式記錄各目標(biāo)的中心點、寬高及朝向角度，多數(shù)圖片包含2～6個目標(biāo)實例。

圖3 部分倉儲場景照片

數(shù)據(jù)集按7∶2∶1比例劃分為訓(xùn)練集、驗證集與測試集，保證各類別及不同堆疊場景在各子集中分布均衡。模型訓(xùn)練基于PyTorch框架實現(xiàn)，批次大小設(shè)為32，初始學(xué)習(xí)率0.001，訓(xùn)練輪數(shù)300輪；在訓(xùn)練過程中使用余弦退火學(xué)習(xí)率調(diào)度策略，并啟用Early-Stopping機(jī)制，當(dāng)驗證集損失在20輪內(nèi)不再下降時提前終止訓(xùn)練，以防止過擬合。

2.仿真平臺與實驗設(shè)置

為了系統(tǒng)評估算法在不同遮擋程度、堆疊高度和光照條件下的性能，本文在實際數(shù)據(jù)之外，構(gòu)建了一個基于Unity3D的通訊倉儲仿真環(huán)境。仿真平臺按照1∶10比例還原貨架尺寸與部分庫區(qū)布局，并建立了多種典型設(shè)備三維模型。通過設(shè)置虛擬RGB-D相機(jī)，可方便地控制相機(jī)高度、俯仰角、焦距以及環(huán)境光照，從而生成大量標(biāo)注精確、可重復(fù)的模擬樣本。

圖4 仿真與實采數(shù)據(jù)聯(lián)合實驗平臺示意圖

仿真與實采數(shù)據(jù)聯(lián)合實驗平臺如圖4所示，左側(cè)為安裝在真實倉庫和仿真場景中的RGB-D相機(jī)，中間為多層貨架及隨機(jī)堆疊的設(shè)備包裝箱，右側(cè)為GPU推理服務(wù)器與算法程序。系統(tǒng)在NVIDIA RTX 3080 GPU 與Intel Core i7處理器上運行，單次推理的平均延遲約22s。

評估指標(biāo)主要包括mAP@0.5、FPS與RMSE。其中，mAP@0.5指在IoU閾值0.5下的平均精度，用于評價目標(biāo)檢測性能；FPS指推理幀率，反映算法的實時性；RMSE指三維定位的根均方誤差，定義為

（其中分別為第i個目標(biāo)的真實與預(yù)測三維坐標(biāo)，N為樣本總數(shù)）。

為了進(jìn)行對比實驗，本文選取YOLOv4和YOLOv8作為基線模型，在相同數(shù)據(jù)集和訓(xùn)練策略下重新訓(xùn)練，并在統(tǒng)一測試集上進(jìn)行測試。實際平臺搭建包括KuKa 6軸機(jī)器人（KR C5 M6）和圖漾3D相機(jī)。

3.不同檢測模型性能對比

YOLOv4、YOLOv8與REW-YOLO模型在“真實+仿真”混合測試集上的性能對比結(jié)果參見表1。由表1可見，在綜合考慮檢測精度與實時性的前提下，REW-YOLO 在mAP@0.5指標(biāo)上相較YOLOv4和YOLOv8分別提升了4.6和8.9個百分點，復(fù)雜場景下的mAP提升幅度更為顯著，說明旋轉(zhuǎn)邊界框與加權(quán)損失設(shè)計有效增強(qiáng)了對傾斜與堆疊物體的檢測能力。盡管引入旋轉(zhuǎn)分支導(dǎo)致FPS略低于YOLOv8，但45FPS的推理速度仍能滿足大部分通訊倉儲實時盤點業(yè)務(wù)的需求。

表1 不同檢測模型性能對比

在定位誤差方面，由于YOLOv4與YOLOv8在目標(biāo)框回歸上采用軸對齊矩形，導(dǎo)致部分高度傾斜目標(biāo)的中心點偏移較大，從而影響三維坐標(biāo)計算；REW-YOLO 利用旋轉(zhuǎn)框更準(zhǔn)確地擬合目標(biāo)輪廓，使得RMSE 顯著降低至2.5cm，為后續(xù)機(jī)械臂或AGV設(shè)備的精確抓取提供了更可靠的位姿輸入。

4.RGB-D融合效果對比

為量化RGB-D融合對三維定位精度的提升效果，在保持檢測網(wǎng)絡(luò)不變的情況下對比了“純RGB+固定深度假設(shè)”和“RGB-D融合”兩種方案。其中，“純RGB+固定深度假設(shè)”方案是指在僅使用RGB圖像進(jìn)行目標(biāo)檢測的基礎(chǔ)上，對檢測到的邊界框進(jìn)行三維定位時，不依賴深度圖，而是采用經(jīng)驗高度或貨架層高作為深度值的近似估計。具體而言，該方案假設(shè)所有目標(biāo)位于已知的固定高度平面（如貨架的特定層高），或使用預(yù)設(shè)的平均經(jīng)驗高度（如基于歷史數(shù)據(jù)或人工測量得到的典型物品高度）來代替真實深度值。這種方法簡單易實現(xiàn)，但忽略了實際場景中的高度變異（如堆疊導(dǎo)致的z坐標(biāo)差異或相機(jī)視角引起的透視distortion），容易在多層貨架或不規(guī)則堆疊環(huán)境中引入系統(tǒng)性誤差，導(dǎo)致定位精度下降。相反，“RGB-D融合”方案則直接使用深度圖測得的距離值，與檢測到的邊界框像素坐標(biāo)結(jié)合，通過相機(jī)內(nèi)參矩陣進(jìn)行精確映射，實現(xiàn)真實的深度信息整合。

表2 RGB與RGB-D融合前后性能對比

實驗結(jié)果表明，盡管兩種方案在檢測精度（mAP）上差距有限，但在三維定位誤差上差異明顯。純RGB方法在多層貨架和混合堆疊場景中常出現(xiàn)高度估計偏差，RMSE高達(dá)4.2cm；引入RGB-D深度信息后，定位誤差降低約40%，且在不同光照條件下保持較為穩(wěn)定的表現(xiàn)，證明深度信息在提升整體空間感知能力方面具有關(guān)鍵作用。具體可參見表2。

5.遮擋與堆疊高度仿真實驗

為了進(jìn)一步考察算法在不同遮擋程度和堆疊高度下的魯棒性，本文在仿真環(huán)境中設(shè)計了單層無遮擋（貨物單層擺放，彼此間距較大）、兩層中度遮擋（上層紙箱覆蓋下層約30%面積）、三層高密度堆疊（多層紙箱隨機(jī)偏轉(zhuǎn)堆疊，遮擋比例超過60%）等三組場景。

具體設(shè)置為在Unity3D仿真平臺中，利用內(nèi)置的Occlusion Culling功能來模擬現(xiàn)實中的視覺遮擋效應(yīng)。該功能通過動態(tài)計算相機(jī)視錐體內(nèi)可見物體，自動隱藏被遮擋的部分，從而生成更逼真的RGB-D圖像。在場景構(gòu)建時，采用物理引擎模擬物品堆疊的動態(tài)過程，例如使用Unity的Physics系統(tǒng)應(yīng)用重力和碰撞力，確保堆疊形態(tài)符合現(xiàn)實物理規(guī)律，如紙箱在多層堆疊時的穩(wěn)定性。具體場景設(shè)計如下：

單層無遮擋場景。物品均勻分布于貨架平面，間距設(shè)置為10～20cm，無任何重疊。該場景作為基準(zhǔn)，用于評估模型在理想條件下的性能上限。控制光照強(qiáng)度為標(biāo)準(zhǔn)自然光（約1000 lux），并添加輕微噪聲（高斯噪聲σ=0.01）以模擬相機(jī)傳感器誤差。

兩層中度遮擋場景。上層物品隨機(jī)放置于下層上方，覆蓋面積控制在30%～50%。引入隨機(jī)旋轉(zhuǎn)（角度范圍±15°）來模擬實際倉儲中的不規(guī)則放置，并調(diào)整遮擋比例通過Unity的Mesh Collider來精確計算可見像素比例。該場景代表典型出入庫后貨物臨時堆放的情況。

三層高密度堆疊場景。物品多層疊加，覆蓋率超過60%，并模擬隨機(jī)偏轉(zhuǎn)（角度20°～45°）和局部光影變化（如使用Unity的Light Probes創(chuàng)建動態(tài)陰影）。該場景模仿高峰期倉庫擁擠狀態(tài)，測試模型對嚴(yán)重遮擋的魯棒性。還添加環(huán)境因素，如反射表面（金屬箱體）和噪聲增強(qiáng)（σ=0.05），以接近真實工業(yè)環(huán)境。

在數(shù)據(jù)生成過程中，每場景生成500幅圖像，總計1500幅，每幅圖像包含2～8個物品實例，使用虛擬RGB-D相機(jī)捕獲（分辨率640×480，深度范圍0.5～5m）。標(biāo)注通過Unity腳本自動生成，確保像素級精確。

表3 不同場景下模型性能對比

實驗結(jié)果表明，隨著遮擋程度的增加，三種模型的mAP均有所下降，但REW-YOLO下降幅度最小；在三層高密度堆疊場景中，YOLOv8的mAP降至72.4%，而REW-YOLO仍可保持在84.0%左右。此外，REW-YOLO在所有場景中的RMSE均控制在3cm以內(nèi)，表明其在復(fù)雜堆疊環(huán)境下具備更強(qiáng)的空間感知能力。具體可參見表3。

實驗結(jié)果顯示，隨著復(fù)雜度增加，基線模型性能下降明顯。YOLOv4在高密度場景mAP降至68.2%，主要因軸對齊框無法有效處理重疊邊界，導(dǎo)致NMS誤判率升高（約25%實例被抑制）。YOLOv8雖優(yōu)化了網(wǎng)絡(luò)結(jié)構(gòu)，但仍受限于傳統(tǒng)IoU損失，在遮擋>50%時召回率掉至60%。相比之下，REW-YOLO受益于旋轉(zhuǎn)IoU和加權(quán)損失，在中度遮擋場景mAP提升9.4%，高密度場景提升15.8%，召回率維持85%以上。這歸因于角度回歸分支的顯式優(yōu)化，能更好地擬合不規(guī)則輪廓，減少背景干擾。

此外，RMSE分析表明，REW-YOLO在所有場景中均<3cm，而基線模型在高密度堆疊時升至5.6cm，突出旋轉(zhuǎn)框在提升中心點準(zhǔn)確性的作用。進(jìn)一步可視化結(jié)果顯示REW-YOLO在遮擋區(qū)域的邊界擬合更緊致。

這些發(fā)現(xiàn)驗證了系統(tǒng)對倉儲復(fù)雜性的適應(yīng)性，為實際部署提供閾值（如遮擋>60%時建議多相機(jī)融合）。

6.誤差來源分析與討論

綜合上述實驗結(jié)果可以看出，算法誤差主要來源于以下幾個方面：

（1）深度噪聲與反射：在金屬材質(zhì)或強(qiáng)反光包裝箱表面，RGB-D相機(jī)的紅外結(jié)構(gòu)光易產(chǎn)生錯誤匹配，導(dǎo)致局部深度值突變；

（2）旋轉(zhuǎn)框擬合誤差：當(dāng)目標(biāo)邊界與背景對比度較低或邊緣模糊時，旋轉(zhuǎn)角度預(yù)測存在一定偏差，進(jìn)而影響三維中心坐標(biāo)；

（3）標(biāo)注與仿真差異：手工旋轉(zhuǎn)框標(biāo)注難以做到像素級精確，一定程度上限制了上限性能；而仿真數(shù)據(jù)與真實物理紋理存在域差異，也會對泛化效果產(chǎn)生影響。

針對上述問題，可通過引入更高精度的ToF深度相機(jī)、采用多幀深度融合與時間濾波技術(shù)，以及結(jié)合實例分割或邊緣檢測結(jié)果對旋轉(zhuǎn)框進(jìn)行二次優(yōu)化等方式進(jìn)一步降低誤差。

四

結(jié)論

面向通訊行業(yè)倉儲場景中物品種類多樣、堆疊復(fù)雜和定位精度要求高等特點，提出了一種結(jié)合REW-YOLO與RGB-D深度視覺技術(shù)的物品識別與三維定位系統(tǒng)。實驗結(jié)果表明該方法不僅為倉儲智能化提供了高效、魯棒的技術(shù)路徑，還能顯著提升盤點效率、降低人工強(qiáng)度和庫存誤差，具有重要的工程應(yīng)用價值和推廣潛力，未來通過與機(jī)器人、AGV及多模態(tài)傳感器的集成，可進(jìn)一步實現(xiàn)全流程自動化和多倉自適應(yīng)部署。

參考文獻(xiàn):

[1]Wang G,Li S,Zhu X,etal.REW-YOLO: A Lightweight Box Detection Method for Logistics[J].Modelling, 2025,6:76.

[2]艾青林,劉剛江,徐巧寧.動態(tài)環(huán)境下基于改進(jìn)幾何與運動約束的機(jī)器人RGB-D SLAM算法[J].機(jī)器人,2021,43(02):167-176.

[3]馮仁宇,夏凱,楊灝泉,等.3D視覺智能拆垛系統(tǒng)關(guān)鍵技術(shù)研究[J].物流技術(shù)與應(yīng)用,2025 30(09):114-122.

———— 物流技術(shù)與應(yīng)用融媒 ————

編輯、排版：王茜

本文內(nèi)容源自

歡迎文末分享、點贊、在看！轉(zhuǎn)載請聯(lián)系后臺。

廣告宣傳

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.