對人形機器人來説,拿杯子這個動作並不簡單:力度太大,杯子會被捏碎;力度太小,杯子會滑落。
學會了站立、行走、抓取這些“基本功”之後,機器人如何真正理解周圍環境、多維度感受世界,動作更精細、更有“手感”?
答案,藏在具身智慧數據裏。
3月17日,具身感知驅動通用智慧領域的“獨角獸”企業帕西尼感知科技(深圳)有限公司(以下簡稱“帕西尼”)正式宣佈,將在自貢國家高新區投建全模態超級數據採集工廠。這是繼今年1月優必選人形機器人數據採集測試中心落地後,自貢迎來的又一傢具身智慧領域頭部企業。
兩家數據採集中心,3個月內落戶同一座城市。它們為何扎堆自貢?二者要採集的數據,到底有啥區別?
要“走路幹活”
也要“感受世界”
在高新區的一棟廠房裏,優必選的數據採集中心已經運轉了近3個月。上百台機器人一遍遍演練著物流倉庫裏的基本動作“抓拿取放”,每一次動作都被轉化為可供演算法學習的數據。這個被稱為“機器人職校”的工廠,核心是讓機器人通過反復練習,掌握操作技能。
真人正在模擬洗碗動作。受訪者供圖
同為數據採集中心,帕西尼要做的是另一件事。
人體內有一個叫“帕西尼小體”的器官,是高敏性觸覺感知器官之一。這家企業要做的,就是給機器人裝上類似的“觸覺神經”,“你可以理解為,我們是在教機器人‘感受’和‘理解’真實的物理世界。”帕西尼公共事務及戰略總監羅霄恒打了個比方。
“機器人發展了幾十年,為什麼一直沒能廣泛走進日常生活?一個很重要的原因是,它缺乏觸覺感知能力。”羅霄恒説,沒有觸覺的機器人,不知道面前的水杯是什麼材質、有多重,不知道該用多大的力去抓,“要麼把杯子捏碎,要麼讓杯子滑落。”
真人正在佩戴PMEC觸覺採集手套採集數據。受訪者供圖
真人正在佩戴PMEC觸覺採集手套採集數據。受訪者供圖
與其他數據採集方案不同,帕西尼采用的是“以人為中心”的全模態數據採集體系——在採集現場,真人佩戴著PMEC觸覺採集手套,執行各種日常操作。空間內佈滿RGB和RGB-D攝像頭,從多個視角同步記錄視覺、深度信息。手套上的觸覺感測器,則實時採集手部與物體的接觸數據——拿起杯子時的力度、捏住雞蛋時的輕重、握住工具時的角度,都會轉化成壓力、振動、滑移等數據。
空間內佈滿RGB和RGB-D攝像頭,從多個視角同步記錄視覺、深度信息。受訪者供圖
採集到的高精度數據,會被怎麼處理?經過複雜的全模態時空數據對齊和融合處理後,觸覺、視覺、語音、文本、運動軌跡等多源信息被統一成標準格式。“這些數據就像為機器人撰寫的教科書。”羅霄恒説,最終形成的全模態數據集,可以讓不同構型的機器人都能從中學習。也就是説,無論機器人的尺寸、結構、高低如何,數據經過轉換後,都能適配使用。
“人是最靈活的,人的動作是最自然的。”羅霄恒解釋,通過真人採集,可以獲得最符合物理規律的真實數據,同時避免了傳統遙操作方式中動作不協調的問題。
這套體系的效率也相對較高。這種“以人為中心”方式下的數據採集速度,是傳統遙操作方式的3到6倍,且不需要依賴昂貴的機器人本體,降低了數據採集成本。
“目前具身智慧行業還在快速發展階段,需要更多的技術路徑共同探索。”帕西尼技術負責人表示,不同技術路線採集的數據,最終將共同構成機器人學習的“教科書”。在他看來,兩種方式各有側重,相互之間可以形成合力,共同為行業發展積累寶貴的數據資源。
今年,帕西尼將正式公開自己的具身智慧數據商城,向全行業開放數據購買。“我們的數據不僅自己用,也向行業開放。”帕西尼聯合創始人聶相如説,去年就已經在北京國際大數據交易所上架,後續還將通過自建網站面向各行各界提供數據服務。
三個月內落地兩家數採中心
為什麼是自貢?
今年1月,優必選落地自貢;3月,帕西尼也選擇和自貢牽手。兩傢具身智慧數據採集領域頭部企業,為何不約而同選擇了自貢?
答案跟自貢的産業佈局緊密相關。
近年來,自貢將人工智能作為轉型發展的賽道之一,以數據標注為突破口,逐步形成以智慧駕駛、具身智慧、大模型訓練數據為核心的特色標注産業。百度、騰訊雲、火山引擎等頭部企業已相繼落戶,數據標注基地累計實現産值近5億元,帶動就業5000余人。
“自貢對數據産業的規劃非常明晰。”聶相如説,從接觸到落地,自貢方面表現出的誠意和效率,讓他們堅定選擇落地這裡。
另一個重要因素是成本。
作為成渝地區的節點城市,自貢距離成都僅兩小時車程,但用地、用工成本更具優勢。“前店後廠”的模式——成都作為研發總部,自貢作為數據生産後場——成為帕西尼佈局西南的理想選擇。
與此同時,自貢正在形成的産業生態,為具身智慧提供了豐富的應用場景。低空經濟領域的無人機、新能源領域的智慧製造、文旅領域的倣真恐龍……“機器人未來要擁抱千行百業,我們希望可以擁抱到所有的場景。”聶相如説。
按照規劃,帕西尼自貢工廠將依託萬平方米級實景基地,佈局數百個標準化採集單元,具身實採數據産能預計可達數十億級規模。“滿産後,人力需求會達到上百人規模。”聶相如透露,這些崗位將包括數據採集員、數據處理工程師、演算法優化人員等,為當地創造高品質的就業機會。
近日,四川省發展和改革委員會等9部門聯合印發的《關於支持數字經濟高品質發展的若干政策措施》正式對外公佈。這份文件圍繞六個方面推出17條政策,其中“人工智能1號創新工程”明確提到:鼓勵企業牽頭建設符合國家相關標準要求的高品質數據集,安排資金支持行業高品質數據集、人工智能語料庫、數據標注公共服務平臺、數據集管理服務平臺、數據訓練場5類項目建設。單個項目安排不超過核定總投資的25%、最高1000萬元的資金支持。
“這對我們來説是重大利好。”聶相如表示,高品質數據集建設正是帕西尼的核心業務方向,支持政策的出臺將進一步降低企業創新成本,加速數據要素的價值轉化。
自貢市科技局相關負責人告訴記者,按照規劃,自貢正計劃設立數據要素聚合創新中心,聚焦數據要素“聚合—流通—應用—安全”全鏈條,推動産業數據高效流通與價值轉化。到2027年,自貢計劃落地人工智能企業100戶以上,常態化就業萬人以上。(川觀新聞記者 叢雨萌)
1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。
2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。
3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。
已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。
任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息産品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此産生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。
4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。
5、如因作品內容、版權和其他問題需要與本網聯繫的,請在該事由發生之日起30日內進行。