share_log

NEC、映像解析技術と生成AIを組み合わせ、作業改善のアドバイスを自動で生成する技術を開発

NEC將圖像解析技術與生成AI相結合,開發出自動生成工作改善建議的技術。

日本電気 ·  01/28 15:00

2025年1月29日
日本電氣株式會社

NEC利用圖像解析技術和生成AI,開發了能夠把握示範動作與實際作業之間差異,並生成改善建議的技術。通過利用該技術,可以自動提供從使用手指的精細作業到全身參與的作業等的適當改善建議。這將實現自我教育,使得在製造、物流、施工等各種行業型的作業現場,即使沒有指導者也能熟練掌握作業。

自動生成的建議示例

近年來,由於熟練操作人員的老齡化導致指導者不足,技術傳承進展緩慢成爲了一大問題。此外,隨着多品種少量生產的增加和勞動者的多樣性及流動性,指導者在進行作業教育時面臨成本增加,以及因作業教育不足導致的作業質量下降的問題令人擔憂。
本技術通過讓AI代替指導者進行建議,能夠實現對多種多樣作業的自我教育。爲此,我們開發了能夠檢測示範動作與細微動作差異的影像分析技術,以及根據差異生成能夠使行動接近示範動作的適當建議文本的生成AI技術。
在檢測差異區間的影像分析技術中,我們將示範動作與實際作業進行比較,完成同一動作區間的對應關係。此時,不僅捕捉人的運動,還要對作業對象的物體的「抓取」、「持有」等交互行爲進行捕捉,這樣即使示範動作與動作時間不同,也能進行準確的對應。通過此方法,可以檢測到以往無法檢測到的細微作業動作的差異。

通過利用對物體的交互,能夠實現準確的對應。

在生成建議文的技術中,除了檢測到的差異區域影像外,還將腰部和膝部的動作、手指及其形狀等骨架信息輸入到大型視覺語言模型(Vision and Language Model : VLM,注)。通過輸入影像信息和骨架信息,VLM能夠準確識別需要改進的工作姿勢和動作,生成具體的建議文。通過將生成的建議文與相關部分的影像一同呈現,可以在各種行業的現場實現無需教練的作業熟練度,提高物品的細緻組裝作業、箱裝和交通作業等,極大地降低教育成本。

通過結合影像信息和骨架信息生成作業姿勢和動作的改善建議文

今後的展望

NEC針對這一技術計劃在2025年度內推進驗證和產品開發,目標是在2026年度內提供服務。

以上

  • (注)
    大規模視覺語言模型(Vision and Language Model)是一種將圖像等視覺信息與自然語言(文本信息)結合進行分析的AI模型。它被用於圖像標題生成、基於圖像的問題回答以及多模態搜索等。
  • 推特
  • 分享

提升製造現場作業質量的AI自我教育 旨在支持作業教育的技術

網址:

關於該事項的客戶諮詢聯繫方式

NEC 全球貨幣創新戰略統括部
電子郵件:

大

NEC致力於創造安全、安心、公平和高效的社會價值,
旨在實現每個人都能充分發揮人性的可持續社會。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
評論 評論 · 瀏覽 342

熱點推薦

搶先評論

聲明

本頁的譯文內容由軟件翻譯。富途將竭力但卻不能保證翻譯內容之準確和可靠,亦不會承擔因任何不準確或遺漏而引起的任何損失或損害。