環球創業頻道導航欄_fororder_WechatIMG203

  滾動   |   環球快訊   |   環球專訪   |   政策解讀   | 産業力 |   會員頁面  |  環球健康 |  環球能源

首頁 > 環球創業 > 正文
DeepSeek開放識圖模式 AI裝上了“賽博手指”
2026-05-14 09:43:23來源:科技日報責編:楊蕓菲

  近日,DeepSeek開始灰度測試識圖模式,並大範圍開放給用戶體驗。

  在具體的實測體驗中,開啟該模式後,用戶可以直接上傳圖片讓DeepSeek“看”世界,其能力邊界遠超簡單的文字提取。比如,網友上傳在博物館拍攝的不明文物並開啟“深度思考”後,模型不僅詳細描述該文物紋理材質,還準確推斷出其年代風格;面對時下流行的表情包或梗圖,它也能準確理解。

  DeepSeek“開眼”,與其他主流大模型有何能力差異?有哪些優勢和不足?科技日報記者就此採訪了有關專家。

  第一問:DeepSeek識圖模式與豆包等其他大模型有何區別?

  “與其他大模型相比,DeepSeek識圖模式的核心區別集中在技術路徑、算力消耗和交互邏輯上。”賽迪顧問人工智能與大數據研究中心分析師白潤軒説。

  他解釋道,DeepSeek識圖模式以“視覺原語思考”為核心。這一核心框架主打精準空間推理和複雜場景解析,而非單純的文字OCR(光學字符識別)或基礎識別。而豆包等模型更側重結合聯網搜索提升識別時效性,多依賴傳統圖像編碼後進行文本理解,空間推理精度稍弱。

  同時,這一框架在實際運行中“算力友好”。白潤軒介紹,DeepSeek處理800×800解析度圖片僅消耗約90個tokens(詞元),遠低於GPT等主流模型,響應速度更快。

  此外,DeepSeek識圖模式為獨立入口,專注純視覺理解,不額外啟用聯網功能,而豆包等大模型會自動聯動搜索。

  第二問:“視覺原語思考”的核心創新點在哪?

  伴隨識圖模式的上線,DeepSeek還公開了其背後的多模態模型技術細節,並公佈了“視覺原語思考”核心框架。

  “這一框架的核心創新點在於跳出主流模型‘堆解析度’的思路,聚焦解決傳統多模態模型的‘指代鴻溝’困境。”白潤軒解釋。

  傳統多模態大模型在面對密集場景時存在一種名為“指代鴻溝”的困境,模型雖然能看見圖片,但在推理過程中用“左邊那個大的”等模糊的自然語言構建邏輯鏈時,很容易因描述不準導致注意力漂移。

  而“視覺原語思考”框架將點、邊界框等空間視覺元素作為“思維”基本單元,融入模型推理全過程,這就像給模型裝上了一根“賽博手指”,讓AI在推理時能在“腦海”中精確指出目標物,邊想邊指,大幅提升複雜空間佈局、密集計數等場景的推理精度。

  第三問:目前存在的不足及改進方向是什麼?

  在白潤軒看來,DeepSeek識圖模式目前主要存在三項不足。

  一是知識庫更新偏滯後。其模型訓練數據截至2025年,識別2025年底後發佈的新型産品易出現型號誤判。

  二是高難度場景表現還不穩定。面對視錯覺圖片、複雜物體計數等反直覺任務時,模型給出的答案穩定性不足,偶發邏輯崩潰。

  三是功能邊界較窄。目前僅支持純視覺理解,暫不具備圖像生成、視頻理解及跨模態創作能力,且高併發時段偶有解析失敗、響應延遲的情況。

  “建議後續加快知識庫迭代、優化反直覺場景演算法;同時拓展多模態功能,進一步提升系統穩定性以適配更多用戶的需求。”白潤軒説。

最新推薦
新聞
文娛
體育
環創
城市
國際在線版權與信息産品內容銷售的聲明

1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。

2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。

3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。

已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。

任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息産品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此産生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。

4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。

5、如因作品內容、版權和其他問題需要與本網聯繫的,請在該事由發生之日起30日內進行。