環球創業頻道導航欄_fororder_WechatIMG203

    滾動   |   環球快訊   |   環球專訪   |   政策解讀   |   會員頁面   

崔寶秋:開源是AI的未來

2020-01-08 15:52:39  來源:中央廣電總臺國際在線  責編:王濤

  國際在線消息:1月8日,中國軟體産業最具影響力盛會——“2020中國軟體産業年會”在北京國家會議中心舉行。本次年會將探討在當前智慧化引領、數字化轉型背景下如何充分發揮軟體驅動下的數字變革,推動經濟發展的品質變革、效率變革和動力變革,以及工程教育計算機類專業認證發展趨勢等重大問題;探索軟體的進步和發展如何提升雲計算、大數據、人工智能、區塊鏈等新技術、新模式、新業態演進,以及如何為經濟發展不斷注入新動能等眾多焦點問題。

  大會現場,小米集團副總裁、集團技術委員會主席崔寶秋發表“小米在開源戰略與實踐”主題演講。

  以下為現場實錄全文:

  尊敬的各位領導、各位嘉賓,各位軟體行業的同行們大家下午好!我是崔寶秋,來自小米。今天我非常榮幸受邀參加軟體行業的盛會,也非常激動。我今天想分享一個什麼呢?關於小米在開源的一些戰略與實踐。

  開源這個話題近一兩年來由於AI的興起被政府、行業、教育界、企業界都在拼。小米在過去七八年來我們在擁抱開源,做出自己的打法和成績,我們做了很多事情,哪些可以大家借鑒的,這個就是今天分享的題目。

  講小米在開源做了哪些事情,為什麼這麼做,就不得不介紹一下什麼是開源。開源過去幾十年大概的發展路徑是什麼,為什麼小米今天要擁抱開源,為什麼制定小米這樣的開源戰略。首先我個人是一個開源軟體的愛好者,開源軟體的信仰者到今天開源運動的倡導者,開源我認為是未來軟體的未來。

  開源是一個理念,開源是一個運動,講到開源我們不得不提一下自由軟體。開源軟體的概念是1998年有的,在這之前更多提的是自由軟體。這裡是我前幾年總結的自由軟體和開源軟體的區別。開源軟體我認為在一定程度上幫助了自由軟體迅速的擴展,迅速的被企業所接受,一定程度上助長了自由軟體的快速成熟,但是自由軟體早期的理想主義純粹的打法制定了今天開源軟體背後的一些價值觀,一些邏輯,開放與共享或者一些自由,給軟體使用者一定的自由。

  這個是過去很多年來,有20多年開源的一些主要的里程碑事件。從1983年GNU這個系統的誕生,自由軟體版本的Unix的系統。到1985年自由軟體基金會的成立,這是我1995年以後最大的一個基金會。1991年Linux,自由軟體作業系統內核作業系統的誕生,到1998年Open Source,未來企業創造一個奇跡的概念。

  隨著雲計算和大數據的興起,這些背後來自於互聯網,來自於搜索引擎,來自於谷歌、雅虎這樣的公司。過去十幾年自由軟體和開源軟體在雲計算和大數據時代扮演非常重要的角色。今天在AI時代很多開源軟體都來自於這兩個時代,自由軟體發展非常迅猛,軟體在雲計算和大數據時代,波動了行業的效應。比如説Hadoop。

  到AI時代,我開始還有點擔心,AI時代大家會不會繼續擁抱開源,AI時代的開源軟體是不是有一些障礙,但是很快我這個顧慮就打消了。今天可以看到國內外很多AI巨頭都在紛紛擁抱開源。這個裏面幾個國內外的谷歌、微軟、亞馬遜、Facebook、百度。這幾個是AI時代的幾個巨頭,舉一些小的例子,系統框架到模型數據,AI時代開源愈演愈烈,包括我們政府,中國各行各業都在關注AI時代的開源。

  這個熟悉AI的人不陌生,在AI領域開源,我們最早在Torch2002年,到TensorFlow,後面就是Paddle Paddle還有Caffe,這些都代表了AI軟體做的一些事情。

  2019年初小米制定了手機+AIoT雙引擎的戰略,我堅信在AIoT時代我們更應該離不開開源,雲計算、大數據到AI,今天的AIoT,我們要打造小米分佈式連接、雲、邊緣計算到端雲計算整體的分佈式的計算環境、分佈式的能力系統,這個裏面也離不開開源。深度學習到大數據、雲計算,這個裏面開源軟體仍然是無處不在。我們今天更加離不開開源。

  所以今天大家都是軟體行業的從業人員,這句話我相信大家都認同,“開源力量、勢不可擋”。

  企業角度,過去我是開源的愛好者,今天我是代表企業,關於企業不管是初創公司,還是巨頭公司,為什麼要擁抱開源,我列了幾句話大家也不陌生。第一個就是要站在巨人的肩膀上。實際上今天在企業裏重復建設是屢禁不止的。開源軟體第一個就是讓大家站在巨人肩膀上創新,而不是從零開始。

  還有開源軟體已經非常成熟,雲計算、大數據到AI。擁抱開源軟體可以有助於企業打造良好工程文化,推動一個喜歡技術的氛圍。同時開源軟體因為它的品質,優秀的開源項目,快完成的系統價格、設置、演算法都是非常美妙。經過整個社區多人産業,它的代碼是有一定領先性的,所以擁抱開源可以幫助企業提升代碼品質。擁抱開源另外一個非常好的好處對這個企業帶來很多人才。因為很多開源軟體都是行業內的,那麼就是開源,世界上有很多這樣的人才供企業來挑選。

  開源軟體實際上有自由軟體內在的精神就是開放與共享,這兩個詞也是我們今天的一個價值觀。實際我認為在過去上世紀90年代到2000年初,到今天,我們中國的軟體行業對開源,在開源上我認為走過一條比較崎嶇的路。早期人們不太熟悉開源,不太了解自由軟體精神,初期的打法欠缺到今天人們對技術軟體已經非常了解的情況下,不同的公司還在犯不同的錯誤,很多常見的錯誤。這個裏面簡單總結一下,也是表明小米我們為什麼建立自己的開源戰略,就是解決開源中各個企業,這裡面有一些錯誤,第一個就是支出,只想拿來而不想回報,不想分享,只願意站在巨人肩膀上享受短期的回報,這是一個最簡單的錯誤。

  第二個是知識共享,但是沒有把共享做到極致,缺乏共享,或者不知道共享,不願意共享,有的人懂得共享,但是共享的渠道不知道怎麼共享,但是社區不接受。還有一個就是不夠開放,咱們國內很多企業是為了開源而開源,沒有真正把開源項目持續維護,和社區一起打造。

  所以在我加入小米的時候就告訴大家擁抱開源是應該的,是對的,我們不僅僅要站在巨人肩膀上,同時要給巨人指方向。

  圍繞這個原則我當時制定了小米的開源戰略,基本上有五大原則:第一要快。快速的掌握,這就是小米也總提的專注、極致、口碑、快這七個字也是不謀而合;第二個堅決不重造輪子,開源在我們做之前,開源建設有沒有比較成熟的軟體滿足我們的需求,堅決不要重造輪子,只是為了刷自己的存在感而重造輪子是堅決不允許的;第三個原則就是不用則已,要用則精,很多人拿了開源軟體小規模的試用,沒有真正的掌握,一旦上線用戶變大,考慮的時候,出了問題不會解決,因此就摒棄開源軟體,説開源軟體不好等等,這個就是常見的錯誤,沒有真正的掌握,我們不求完全的理解,但是要能駕馭,要精;第四個就是堅持開放與共享,避免掉到上一個PPT講的嚴重的錯誤。第五個是目前我在小米推的時候很多人不太懂,當時小米還小。小米為什麼還要極力推動自己的Committer,在重大的關鍵性,小米自己要掌握而且要小米自己的主頁。其實我是在想一定要按照小米指定的方向或者照顧到小米未來的方向,以便於小米這樣的企業長期做著巨人的服務,為什麼要推出巨人的服務?其實不是為了名,不是為了利,當然利就是為了尊重減少企業在軟體研發和維護的成本,巨人照顧企業的,企業回報、企業回饋的時候一定把自己的改進優化、通用化,讓企業在社區骨幹中的距離越來越小,大大降低企業在軟體研發上的成本。

  從2012年開始到最早期小米探討這個概念,其實最早是2010年開始,但是後來大數據時代,這個簡單記錄了小米在開源上的關鍵大事,我們用開源,貢獻把自己的項目回報給社區,雲計算、大數據、AI我們都做了。

  接下來我分享四個比較典型的案例,也是小米的一個打法。第一個就是Apache HBase,三個項目管理委員會的人,最終這個國際的開放項目主席也是小米的工程師,這樣真正到企業上為巨人去做貢獻,贏得了話語權。小米在這個項目的貢獻2018年佔23%,2019年10月份佔到了三分之一,所以這是一個案例。

  第二個案例是Pegasus是Java,因為當時這個是OCR,這些在許多關鍵的時候,它的性能是不可預測的,所以在很多對延遲、時延非常明顯的用戶環境我們不得不用這個系統,基於這兩個,我們花了兩年時間最後向外開源寫了自己的Pegasus,這個是小米的一些玩法,這是我們最近發佈的版本,這個也是得到科學院的一個一等獎。

  第三個案例在MACE,小米是一家手機公司,但是它更注重的是以手機硬體核心的移動互聯網公司,小米很多設備,未來在AI+手機的超級互聯網的基石,這麼多電視、PC、手機、手環、手錶很多智慧設備、可穿戴都需要AI技術,當時我們要強化端上的AI優化,市面上沒有我們這麼需要的,用處這麼大的,所以我們自己研發了小米自己的移動端深度學習框架,叫MACE,這個當時也花了很長時間自己研發的。2017年上線,2018年開源。今天已經是小米最火的一個內容運用的AI框架,很多也得到大家的普及認可。這是得到的一些獎勵。這是第三個小米的開源案例。

  第四個案例,正是因為小米在開源上的深度擁抱,我們打法比較純粹、比較理性的,也是非常科學的,我們也吸引到國際界比較有名的開源領域的一個牛人加盟小米,它是原來霍普金斯大學的教授Daniel Povey。這裡他除了小米的生産信息外,小米在科研化,也是吸引小米的一個主要的工具。所以今天小米開發的開源技術對小米非常重要,小米一定要注重開源技術,首先我們要打造國際開源社區。

  四個案例代表小米在開源上的一些做法,不能代表小米的全部。

  面向未來我是非常樂觀的,開源的未來是非常大的,很光明的,開源是有未來的,開源是AI的未來。在AI的時代要更加廣義的開源,不僅要代碼開源而且要數據開源。在今天的大數據,通過AI技術出來,數據的共享完全不一樣了。其中知識圖譜是一個特別特殊的數據,這些也需要大家共建。小米積極參與,包括OpenBase項目,共同參與打造全球最大的一個開放的。

  因為今天中美關係等等讓開源科技開放,我也呼籲未來打造一個更加開放,極致的開放,沒有國界,共享、平等、全球化的運動。開放共享需要平等,需要在行業的AI領域一些AI巨頭慢慢形成一種寡頭壟斷的現象。代碼式開源、項目式開源逐步開放,這個已經在使用一些國外項目的一個顧慮。

  開源更加不應該有國界,開放、共享、平等與全球化,一起讓開源沒有國界,一起讓中國的開源走向世界。謝謝大家!

 (聲明:所有會議實錄均為現場速記整理,未經演講者審閱,國際在線登載此文出於傳遞更多信息之目的,並不意味著贊同其觀點或證實其描述。)

分享到:

國際在線版權與信息産品內容銷售的聲明:

1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。

2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。

3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。

已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。

任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息産品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此産生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。

4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。

5、如因作品內容、版權和其他問題需要與本網聯繫的,請在該事由發生之日起30日內進行。