首頁 > 環球財智 > 正文
輕量化小模型興起 中小企業也能搭上AI“快車”
2025-07-10 13:10:30來源:工人日報責編:韓東林

  原標題:低成本、上線快、易調試,可在特定任務上反超通用大模型 輕量化小模型興起,中小企業也能搭上AI“快車”

  閱讀提示

  隨著人工智能快速發展迭代,一些企業開始押注小模型。相較大模型,低成本、上線快、易調試的小模型,以更高的性價比為中小企業和個人用戶提供了打開人工智能大門的鑰匙。

  近兩年,人工智能快速發展迭代,大語言模型如雨後春筍般涌現,文本生成、文生圖、語音處理、代碼處理、視頻處理等生成式人工智能走進人們的生活。同時,一些企業開始發力研發可在電腦、手機端訓練的輕量化小模型。

  “我們需要高鐵、飛機、遊輪等大型交通工具,也需要私家轎車、公交車,以及摩托車、自行車等小型交通工具。因為在不同場景下,不同人群有不同需求。”在青島自然語義公司聯合創始人、首席架構師孫燕群看來,滿足特定市場的需求,是專而精的小模型興起的重要原因及其存在的價值。

  今年3月,自然語義研發的Euler模型通過中央網信辦生成式人工智能服務備案。不同於大模型動輒千億級的參數量,Euler的參數量只有2.5B(25億),是典型的輕量化小模型。相較于大模型,小模型有何特點?應用前景如何?工人日報記者對此進行了採訪。

  低成本、易調試的端側小模型興起

  關於小模型,目前並沒有明確定義。孫燕群表示,在行業內,參數量低於100B的模型就算比較小的模型。在實際應用時,要想在筆記本電腦端實現微調,模型參數量一般在3B左右。

  相較大模型,小模型在算力消耗、使用成本方面更具優勢。具體來説,一是訓練和推理所需的硬體資源較少,使得成本較低;二是使用更便捷,可在手機、電腦、物聯網設備等計算場景中實時運行;三是結構簡單,開發者能快速定位問題,易於調試。

  記者了解到,隨著大模型的比拼日益激烈,一些企業開始押注小模型。2024年8月,微軟和英偉達就相繼發佈過小型語言模型。國內不少企業也開始研發在“斷網、弱網”環境下,讓各種智慧終端具備自主思考能力的端側小模型。例如,在今年3月舉辦的中關村論壇年會期間,北京的面壁智慧公司就發佈了應用於汽車智慧座艙的純端側超級智慧助手。今年1月,廣東佛山移動牽頭聯合40家單位成立佛山市AI小模型産業聯合體,致力於通過人工智能小模型提供個性化服務,助力企業完成智慧化升級。

  “小模型讓我們實現了與科技巨頭們的錯位競爭。”提到小模型的具體應用場景,孫燕群舉例説,Euler通過備案後,已經開始面向中小企業和個人用戶提供服務。如與山東某市級檔案館合作,上線了檔案模型;與青島當地一家儀器儀錶設備公司合作,開發了內網技術相關的模型。

  退而求其次後的“主動作為”

  “客觀來説,大模型的能力強于小模型,一個參數量2.5B的模型無論如何都不可能超過200B模型的算力。”孫燕群直言,這也是大公司都在做千億級模型的原因。模型小,神經網絡參數就少,容納的知識量不夠,“體現在文本生成上,就是容易出現上下文不連貫的情況”。

  自然語義最初的目標並不是小模型。2019年底,該公司考慮要做大模型,但由於發展方向不明朗,同時在購買高算力GPU上面臨資金和貨源壓力,因此未能實施。

  “沒想到,僅過了兩年時間,國外的大模型就發佈了。”孫燕群回憶説,後來隨著越來越多大企業涌入大模型賽道,作為基礎硬體的高算力GPU價格水漲船高。“那段時間,聽説哪有GPU,我們就坐飛機去買,常常是提前交了定金也不一定能買到。”最終,公司用10多臺設備組成一個算力集群,能支撐做出7B參數的模型。

  為了在現有設備基礎上盡可能提高參數,自然語義公司工程師經過頭腦風暴,想出了新的分詞方式,以及將向量計算從實數空間轉換到復空間等各種辦法。“經過模型訓練,這些技術都達到了比較好的效果,能讓一個3B參數的模型,達到了150B參數模型60%左右的能力。”孫燕群表示。

  中國信息通信研究院人工智能研究所副總工程師王蘊韜告訴記者,小模型之所以能在“瘦身”後仍保持可觀性能,得益於一系列成熟的模型壓縮與高效架構技術,包括剪枝、量化、知識蒸餾、設計先天高效的網絡架構等。

  讓“小身材”跑出“大能量”

  “小模型發展大有可為。”在王蘊韜看來,未來面向特定應用場景的小模型,潛力將會進一步釋放。以AI終端為代表的應用形態及産品服務,將成為小模型釋放大能力的主戰場。

  關於小模型的應用前景,王蘊韜進一步解釋,一是為離線辦公、文檔摘要、私密對話等場景鋪平道路;二是隨著處理器架構和神經處理單元技術的應用,手機、車載和物聯網設備將成為小模型的天然舞臺;三是在垂直領域與“專精特新”行業,如金融、醫療、法律、教育等已出現6B及以下參數的定制模型,成本低、上線快,可在特定任務上反超通用大模型。

  “市場關心的是能否解決實際問題,不關心背後模型細節,能夠與場景深度結合,擁有行業知識,尤其是可信的小模型至關重要。”王蘊韜説。

  從用戶端來看,在實際應用中,小模型的性價比優勢也十分明顯。北京某互聯網公司演算法工程師張先生向記者表示,在現有技術條件下,想要在本地部署大模型存在一定難度。“專業GPU晶片價格太高,無法應用到低價格的終端上,如手機、機器人等配備的晶片就無法撐起大模型。另外,這些終端所配備的電池,往往也支撐不了高性能晶片的耗電等。”張先生表示,這些硬體性能有限的終端,更適合小模型施展。

  王蘊韜分析認為,未來將是大小模型混合的系統範式。“雲端大模型負責通用推理,端側小模型承擔即時響應與私域數據處理。”他還強調,小模型並非“大模型的低配版”,而是面向資源受限環境與專用任務的高性價比解法。通過配合端雲混合部署和行業數據精調,企業完全可以讓“小身材”跑出“大能量”,在AI商業落地的下一程中獲得確定性收益。(記者 陶穩)

最新推薦
新聞
文娛
體育
環創
城市
國際在線版權與信息産品內容銷售的聲明

1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。

2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。

3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。

已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。

任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息産品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此産生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。

4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。

5、如因作品內容、版權和其他問題需要與本網聯繫的,請在該事由發生之日起30日內進行。