數據來源:國家發展改革委、國家數據局製圖:沈亦伶
頭條看點
詞元(Token),大模型處理信息的最小信息單元。我國日均詞元調用量大幅增長,不僅折射智慧經濟的澎湃活力,也意味著一套新型商業邏輯正在加速演進。智慧時代,有了可計量、可定價、可交易的詞元,人工智能有望成為像水、電一樣支撐社會運轉的基礎資源。
用戶端,查資料、寫代碼、改文案;企業端,金融風控、智慧客服、代碼修正……如今,人工智能應用落地的每一個場景,都離不開對詞元(Token)的海量調用。
詞元,大模型處理信息的最小信息單元。今年3月,中國日均詞元調用量突破140萬億,兩年增長超千倍。怎麼理解詞元?詞元和人工智能産業的關係是什麼,未來發展趨勢如何?記者進行了採訪。
詞元調用量爆發性增長,背後是模型能力提升
有人疑惑,詞元和常見的數據有何不同?
“人工智能大模型的本質是一套複雜的數學運算系統,它無法像人類一樣直接讀懂文字、聽懂聲音、看懂畫面。”中國移動研究院網絡與IT技術研究所副所長唐華斌説,人工智能大模型必須先將各類原始數據轉化為自己能識別的“語言”,再通過運算輸出結果,詞元就是這套“語言”中最基礎的單元。
具體來看,文字詞元像“樂高積木”,一個單詞或一個漢字被拆成一塊塊詞元;音頻詞元像“樂譜上的音符”,一段聲音被切成極短的時間片段,每一片包含音調、音量;視頻詞元像“拼圖碎片”,每一幀畫面被切成一個個小方格,並且還要考慮時間上的連續性……
“在大模型看來,三種模態的詞元完全沒有差別。在模型眼裏,它不覺得自己是在讀文字或看視頻,它只覺得自己是在處理一串極其複雜的數字序列。”火山引擎智慧演算法負責人吳迪表示。
一個個基礎的詞元,構成了智慧經濟運行的“細胞”。今年3月,中國人工智能大模型周詞元調用量連續3周佔據領先地位,成為全球大模型應用活躍度最高的國家之一。
“詞元調用量爆發性增長,最直接的原因是模型能力的提升。每一次模型能力的提升,就會解鎖更多應用場景,從而使大模型詞元調用量進一步激增。”吳迪介紹,以Seedance(豆包視頻生成模型)2.0為例,生成1分鐘視頻大約會消耗超過100萬個詞元。
同時,新的應用形態、新的商業模式,也會驅動大模型詞元調用量大幅上漲。唐華斌表示,最近興起的智慧體和傳統單輪問答不一樣,它的運行往往意味著更長的上下文、更頻繁的模型調用、更多輪次的任務拆解,以及工具執行過程中的持續反饋。
“簡單任務,如果只需要單輪或幾輪工具調用就能搞定,消耗詞元只需要幾千;如果需要幾十輪工具調用,則需要至少消耗幾萬詞元乃至更多。”吳迪説,智慧體等新業態的涌現,讓詞元調用量又進入了一個快速增長的通道。
詞元調用集中在信息密度高、迭代週期快的領域
60億,是愛問答科技創始人李加義過去一年的詞元調用量。
走進位於北京海淀區的AI原點社區,一間約16平方米的工作室裏,李加義團隊正在調試剛剛設計完成的AI玩具。
“這個玩具要具備交互能力,離不開相應的軟體系統。放在以前,同等體量的軟體系統開發至少要半年,還得多人共同配合。”李加義説,在AI大模型與輔助編程的深度賦能下,消耗數億詞元,開發週期被壓縮至兩個月。
2025年初,非計算機科班出身的李加義接觸AI輔助編程工具後,借助新技術打破了軟體開發的專業壁壘。“一年間,我們高效地完成了兩款APP和一個AI玩具的開發設計。前不久,我們還將自研的AI硬體産品推向了國際消費電子展(CES)。”李加義説,AI助力不僅讓開發成本大大降低,也讓小微企業的創新探索有了更多可能。
軟體開發,是人工智能應用落地的典型場景之一。總體看,詞元調用量的分佈呈現出鮮明的行業與場景特徵,主要集中在那些信息密度更高、産品迭代週期更快以及模型與生産系統之間聯繫更緊密的領域。
以豆包大模型2.0為例,吳迪介紹,從行業分類看,互聯網行業詞元調用比例最高,消費電子、金融、新零售和商務服務緊隨其後。
從場景來看,非結構化信息的處理和分析佔比最大;教育、內容創作和“搜索與推薦”次之。
觀察未來的發展趨勢,軟體開發、深度研究、個人助理等智慧體應用場景或將成為詞元調用量爆發的重要領域。“特別是軟體開發,當前人工智能正從簡單寫代碼轉向理解整個項目,不僅能排查錯漏、自動優化,甚至能通過智慧體自主完成整個開發任務。代碼上下文長、交互輪次多,企業為提升效率的付費意願較強,這將成為一個巨大的需求增長點。”唐華斌説。
詞元可計量,人工智能有望成為社會運轉基礎資源
“今年1月底以來,有的模型企業創下20天收入超越2025年全年總收入的業績紀錄。這組數字背後,是一套以詞元計費為基礎的新型商業邏輯正在加速演進。”國家數據局局長劉烈宏表示。
回顧人工智能産業發展歷程,過去一段時期,行業聚焦于模型性能的比拼,技術創新與商業落地之間缺乏可量化的銜接橋梁,難以形成“技術迭代—價值産出—持續投入”的良性循環。
“詞元本身具備可計量、錨定算力能耗、跨模態通用結算的特點,使其能夠成為連接技術供給與商業需求的結算單位。打個比方,大模型輸出的智慧好比電,智算中心好比發電廠,電用千瓦時來計量,智慧調用就用詞元來計費。”聯想中國基礎設施業務群戰略管理總監黃山表示,展望未來的智慧社會,人工智能有望成為像水、電一樣運轉的基礎資源,隨取隨用,用多少買多少。
從詞元的視角出發,打造智慧經濟新形態,我國有何優勢?有哪些發展著力點?
演算法創新持續實現突破,國産大模型通過底層架構優化,與全球頂尖技術的代差逐漸縮小。吳迪説,我國的大模型廠商做了非常多的演算法創新,在推理成本、響應速度上不斷優化,能以更少的詞元完成複雜任務。
基礎設施具備領先優勢。每生成一個詞元,都在調用數據中心的算力,伴隨著電力消耗。我國已建成全球門類最全、規模最大的能源體系,電源足、電網強、市場活。唐華斌表示,我國發電供給持續提升、電力成本不斷降低,能夠有效降低詞元調用成本。
“能耗和算力是詞元調用的兩個關鍵成本。讓每個詞元用更少的算力和更少的能耗生産出來,體現的是智算中心等基礎設施的生産能力和效率。”黃山表示,要構建起安全、高效、普惠的人工智能基礎設施,持續提升大模型推理效率、降低單個詞元成本,讓人工智能最大程度走向規模化應用落地。
1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。
2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。
3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。
已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。
任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息産品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此産生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。
4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。
5、如因作品內容、版權和其他問題需要與本網聯繫的,請在該事由發生之日起30日內進行。