10月7日,國際大模型競技場LMArena發佈最新視覺模型榜單,騰訊混元最新視覺模型 Hunyuan-Vision-1.5-Thinking 表現搶眼,取得全球第3,國內第1的好成績。
Lmarena第一時間在X上宣佈了這一消息,並寫道:評估具有視覺功能的人工智能模型與文本相比增加了新的複雜性。為了表現良好,模型必須從圖像中提取信息,理解這些信息,並將視覺信息與文本結合,應用於多種用例,例如:圖表解釋、文檔解析、根據視覺內容建議標題和文案,以及解決幾何問題的能力等等。
LMArena是美國加州大學伯克利分校推出的創新AI模型評估平臺,評測核心方法是基於人類真實偏好的“盲測”機制,讓用戶對不同AI模型的回答進行匿名投票,衡量模型的表現。由於該平臺訪問量巨大,並且評測機制貼近實際體驗,是目前國際上最權威的競技場榜單。
10月5日發佈的LMArena圖像生成榜單中,混元圖像 3.0 居第一位,超過nano-banana等頂尖閉源模型。
Hunyuan-Vision-1.5-Thinking 具備領先的多語言多模態理解和推理能力,能夠通過多輪的反思,更加深入地理解所“看”到的內容,完成相應的指令任務。
此外,模型在更高級的任務,如視覺推理和3D空間理解也有比較好的表現。比如,在多模態理解理解場景中,模型可以準確識別圖片中的花,也可以直接用西班牙語進行提問,識別原文為英文的圖表。
推理能力是視覺模型升級的一個核心方向,讓模型能夠在多輪思考中學會推理,進而得到正確答案,對於提升模型識別的準確性有重要意義。
Hunyuan-Vision-1.5-Thinking在視覺任務上的優秀表現,得益於技術團隊在模型架構上的不斷升級,據了解,混元相關模型將在10月底開源和公開技術報告。 (文/陳東)
1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。
2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。
3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。
已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。
任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息産品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此産生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。
4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。
5、如因作品內容、版權和其他問題需要與本網聯繫的,請在該事由發生之日起30日內進行。