12 月 4 日消息,亞馬遜雲科技(AWS)發佈了一款新工具,旨在解決 AI 模型產生的幻覺問題。
注意到,在拉斯維加斯舉辦的 re:Invent 2024 大會上,AWS 推出了「自動推理檢查」(Automated Reasoning checks)工具,該工具通過交叉引用客戶提供的信息來驗證模型的響應準確性。
AWS 宣稱,這是「第一個」也是「唯一」的針對幻覺的防護措施。然而,這種說法可能不夠準確。微軟今年夏天推出的「校正」功能與「自動推理檢查」幾乎相同,都可以標記可能存在事實錯誤的 AI 生成文本。谷歌的 Vertex AI 平台也提供了一個工具,允許客戶通過使用第三方提供商的數據、自己的數據集或谷歌搜索來使模型的回答更可靠。
「自動推理檢查」通過 AWS 的 Bedrock 模型託管服務(特別是 Guardrails 工具)提供,試圖弄清楚模型是如何得出答案的,並判斷答案是否正確。客戶上傳信息以建立一種事實基礎,然後「自動推理檢查」創建規則,這些規則可以被優化並應用於模型。
當模型生成回答時,「自動推理檢查」會驗證它們,並在可能出現幻覺時,利用事實基礎得出正確答案。其會將這個答案與可能的錯誤答案一起呈現,以便客戶可以看到模型偏離正確答案的程度。
AWS 表示,普華永道已經開始使用「自動推理檢查」爲其客戶設計 AI 助手。AWS 的 AI 和數據副總裁 Swami Sivasubramanian 暗示,這種類型的工具正是吸引客戶使用 Bedrock 的原因。
但據 Techcrunch 報道,一位專家今年夏天稱,試圖消除生成式 AI 的幻覺就像試圖從水中消除氫一樣。AI 模型之所以會產生幻覺,是因爲它們實際上並「不知道」任何東西。它們是統計系統,通過識別一系列數據中的模式,並根據之前看到的例子預測下一個數據是什麼。因此,模型的響應不是答案,而是對問題應該如何回答的預測 —— 在一定的誤差範圍內。
AWS 聲稱「自動推理檢查」使用「邏輯準確」和「可驗證的推理」來得出結論,但該公司沒有提供任何數據來證明該工具的可靠性。(遠洋)