陳霞從未體驗過自動駕駛,但她正在做的工作卻與自動駕駛技術的AI演算法息息相關。
“把汽車框起來,把障礙物標成白色的點……”隨著滑鼠的快速滑動,螢幕上的點雲圖不斷翻轉,一個個針尖大的數據點被標注在圖中不同物體上,陳霞要做的就是對照攝像頭拍攝的圖片,賦予這些數據點以準確的含義。
“所以,數據標注就是對著圖片畫框、標顏色、劃重點。”起初,陳霞也這麼想,直到有一次出現標注誤差,“把車輪的陰影框進去了,讓模型以為陰影也是車。”她突然意識到,手中的滑鼠,連著AI的“眼睛”和“大腦”,標注的每一筆,都在教機器如何認識世界。
換言之,有多少智慧,背後就有多少人工。陳霞所擔任的數據標注師,正是人工智能的前端。常見的智慧音箱、語音助手、網絡客服、人臉識別等産品的背後,都有數據標注師的身影,創造了更多就業崗位。
作為貴陽高新區本土孵化成長企業,世紀恒通科技股份有限公司搶抓市場機遇,著力發展數據標注産業,目前已匯聚2500名數據標注師,預計到年底將增至3000人。
這個數字表面看似簡單,實則蘊含著不簡單的業務承載力與估值潛力。“3000人的專業團隊具備日處理150萬條中等複雜度標注數據的能力,年處理總量可達3至4億條。”該公司副總經理李建州介紹,當AI能力越強,對數據規模、品質的要求就越高,相應地對標注員知識背景、邏輯思考能力要求也就越來越高。
“我們正在構造‘標注師+標注平臺+標注作業基地’的産業發展模式,通過AI大模型等手段對數據標注場景進行賦能,推動數據標注從勞動密集型産業向知識型、專業型和高端型升級。”李建州説。
而在貴州鼎聯數據有限公司,3000人還不算多。“‘餵養’一個AI模型需要成千上萬甚至上億個數據樣本,這都要經過數據標注師的雙手,最終流向演算法研發方,服務AI産品。”該公司項目總監李元旭表示,“基於此,我們搭建了全流程一體化的靈活用工平臺,從業者在接受平臺線上培訓測試後即可上崗。目前,該平臺已匯聚了約10萬用戶。”
鼎聯數據于2023年在貴陽高新區成立,是一家專注于互聯網數據信息技術服務的大數據企業,致力於為智慧出行、智慧教育、新零售等多個領域提供通用性、支撐性的AI數據標注及審核服務。目前,該公司數據標注的內容已經從圖片拓展到語音、文本,語音數據除了有普通話,還包括各地方言。
“我們利用數據標注技術,通過對大量數據的處理和校準,能讓打車軟體、外賣軟體的路徑規劃更加精準高效。”李元旭透露,鼎聯數據已經與京東、滴滴等知名互聯網企業及新能源車企展開闔作。
站在風口之上,企業的發展折射出貴陽數據標注産業的蓬勃。
今年7月,省大數據管理局正式將貴陽大數據科創城數據産業園、貴陽大數據安全示範區、銅仁萬山大數據産業園統一命名為“貴州數智産業園”,明確將該園區作為貴州數據標注産業的核心載體,形成“物理空間集聚、專業服務支撐、産業鏈協同發展”的創新生態。
今年8月,2025數博會舉辦期間,中國信息通信研究院聯合貴陽市大數據發展管理局等多家單位發佈《數據標注産業發展研究報告(2025)》,系統梳理其在技術創新、行業賦能、生態培育、標準應用、人才培養和安全保障等六大核心要素方面的實踐與進展,提出“在信息化、數字化、智慧化不斷深化的今天,數據標注産業已成為推動人工智能發展的重要環節”。
“以前,我跟別人説我的職業是數據標注師,對方的臉上寫滿了問號。如今,已經有越來越多的人了解到這個行業。”行業需求的旺盛讓陳霞感到欣喜,但她還是産生了強烈的職業危機感,“我將了解更多人工智能行業的前沿趨勢,掌握語義分割、文本標注等更多技能,爭取從標注師成長為培訓師,為有志從事這個行業的人提供培訓、指導服務。”(貴州日報天眼新聞記者 楊唯)
1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。
2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。
3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。
已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。
任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息産品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此産生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。
4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。
5、如因作品內容、版權和其他問題需要與本網聯繫的,請在該事由發生之日起30日內進行。