環球創業頻道導航欄_fororder_WechatIMG203

  滾動   |   環球快訊   |   環球專訪   |   政策解讀   | 産業力 |   會員頁面  |  環球健康

首頁 > 環球創業 > 正文
騰訊混元視覺模型躋身全球Top3 國內排名第一
2025-10-08 16:24:28來源:中央廣電總臺國際在線責編:韓東林

  10月7日,國際大模型競技場LMArena發佈最新視覺模型榜單,騰訊混元最新視覺模型 Hunyuan-Vision-1.5-Thinking 表現搶眼,取得全球第3,國內第1的好成績。

  Lmarena第一時間在X上宣佈了這一消息,並寫道:評估具有視覺功能的人工智能模型與文本相比增加了新的複雜性。為了表現良好,模型必須從圖像中提取信息,理解這些信息,並將視覺信息與文本結合,應用於多種用例,例如:圖表解釋、文檔解析、根據視覺內容建議標題和文案,以及解決幾何問題的能力等等。

  LMArena是美國加州大學伯克利分校推出的創新AI模型評估平臺,評測核心方法是基於人類真實偏好的“盲測”機制,讓用戶對不同AI模型的回答進行匿名投票,衡量模型的表現。由於該平臺訪問量巨大,並且評測機制貼近實際體驗,是目前國際上最權威的競技場榜單。

  10月5日發佈的LMArena圖像生成榜單中,混元圖像 3.0 居第一位,超過nano-banana等頂尖閉源模型。

  Hunyuan-Vision-1.5-Thinking 具備領先的多語言多模態理解和推理能力,能夠通過多輪的反思,更加深入地理解所“看”到的內容,完成相應的指令任務。

  此外,模型在更高級的任務,如視覺推理和3D空間理解也有比較好的表現。比如,在多模態理解理解場景中,模型可以準確識別圖片中的花,也可以直接用西班牙語進行提問,識別原文為英文的圖表。

  推理能力是視覺模型升級的一個核心方向,讓模型能夠在多輪思考中學會推理,進而得到正確答案,對於提升模型識別的準確性有重要意義。

  Hunyuan-Vision-1.5-Thinking在視覺任務上的優秀表現,得益於技術團隊在模型架構上的不斷升級,據了解,混元相關模型將在10月底開源和公開技術報告。 (文/陳東)

最新推薦
新聞
文娛
體育
環創
城市
國際在線版權與信息産品內容銷售的聲明

1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。

2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。

3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。

已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。

任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息産品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此産生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。

4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。

5、如因作品內容、版權和其他問題需要與本網聯繫的,請在該事由發生之日起30日內進行。