2025年1月29日
日本電氣株式會社
NEC利用圖像解析技術和生成AI,開發了能夠把握示範動作與實際作業之間差異,並生成改善建議的技術。通過利用該技術,可以自動提供從使用手指的精細作業到全身參與的作業等的適當改善建議。這將實現自我教育,使得在製造、物流、施工等各種行業型的作業現場,即使沒有指導者也能熟練掌握作業。
近年來,由於熟練操作人員的老齡化導致指導者不足,技術傳承進展緩慢成爲了一大問題。此外,隨着多品種少量生產的增加和勞動者的多樣性及流動性,指導者在進行作業教育時面臨成本增加,以及因作業教育不足導致的作業質量下降的問題令人擔憂。
本技術通過讓AI代替指導者進行建議,能夠實現對多種多樣作業的自我教育。爲此,我們開發了能夠檢測示範動作與細微動作差異的影像分析技術,以及根據差異生成能夠使行動接近示範動作的適當建議文本的生成AI技術。
在檢測差異區間的影像分析技術中,我們將示範動作與實際作業進行比較,完成同一動作區間的對應關係。此時,不僅捕捉人的運動,還要對作業對象的物體的「抓取」、「持有」等交互行爲進行捕捉,這樣即使示範動作與動作時間不同,也能進行準確的對應。通過此方法,可以檢測到以往無法檢測到的細微作業動作的差異。
在生成建議文的技術中,除了檢測到的差異區域影像外,還將腰部和膝部的動作、手指及其形狀等骨架信息輸入到大型視覺語言模型(Vision and Language Model : VLM,注)。通過輸入影像信息和骨架信息,VLM能夠準確識別需要改進的工作姿勢和動作,生成具體的建議文。通過將生成的建議文與相關部分的影像一同呈現,可以在各種行業的現場實現無需教練的作業熟練度,提高物品的細緻組裝作業、箱裝和交通作業等,極大地降低教育成本。
今後的展望
NEC針對這一技術計劃在2025年度內推進驗證和產品開發,目標是在2026年度內提供服務。
以上
- (注)大規模視覺語言模型(Vision and Language Model)是一種將圖像等視覺信息與自然語言(文本信息)結合進行分析的AI模型。它被用於圖像標題生成、基於圖像的問題回答以及多模態搜索等。
- 推特
- 分享
提升製造現場作業質量的AI自我教育 旨在支持作業教育的技術
網址:
關於該事項的客戶諮詢聯繫方式
NEC 全球貨幣創新戰略統括部
電子郵件:
NEC致力於創造安全、安心、公平和高效的社會價值,
旨在實現每個人都能充分發揮人性的可持續社會。
評論(0)
請選擇舉報原因