遏制AI幻覺:蘋果DeepMMSearch-R1論文揭秘“影像裁剪”搜尋術

IT之家 1 月 15 日訊息,科技媒體 Appleinsider 今天(1 月 15 日)釋出博文,報道稱蘋果發表重磅研究論文,詳細介紹名為 DeepMMSearch-R1 的 AI 模型,重點最佳化 AI 在複雜視覺場景下的搜尋邏輯,用“裁剪”治癒 AI 幻覺論文

遏制AI幻覺:蘋果DeepMMSearch-R1論文揭秘“影像裁剪”搜尋術

針對現有 AI 模型在處理複雜視覺資訊時常出現的“答非所問”或“漏看”問題,蘋果推出了 DeepMMSearch-R1 模型論文。傳統模型在面對“圖中左上角那隻鳥的最高時速是多少”這類複合問題時,往往因無法聚焦區域性細節而給出錯誤的平均資料。

DeepMMSearch-R1 引入了獨特的“視覺定位工具(Grounding Tool)”,能夠主動裁剪圖片以剔除干擾資訊,先精準識別微小目標,再進行針對性的網路搜尋驗證,從而確保答案的事實準確性論文

為確保模型僅在必要時才啟用裁剪功能以節省算力,研究人員採用了“監督微調(SFT)+ 線上強化學習(RL)”的組合訓練法論文。SFT 負責教會模型“不亂剪”,而 RL 則提升了工具呼叫的效率。

遏制AI幻覺:蘋果DeepMMSearch-R1論文揭秘“影像裁剪”搜尋術

展開全文

測試資料顯示,該模型在處理需精準圖文對應的問題上,表現顯著優於目前的 RAG(檢索增強生成)工作流及基於提示詞的搜尋智慧體,成功解決了 AI 在常識性事實檢索中的“偷懶”現象論文

遏制AI幻覺:蘋果DeepMMSearch-R1論文揭秘“影像裁剪”搜尋術

IT之家附上參考地址

本站內容來自使用者投稿,如果侵犯了您的權利,請與我們聯絡刪除。聯絡郵箱:[email protected]

本文連結://mobile.sqhhba.com/post/5451.html

🌐 /