首頁  >  IT頻道  >  業界資訊  > 正文

一覽群智胡健:先成為頭牌 再造AI軟體生態

2020-05-08 11:14:55 | 來源: 鳳凰網 | 責編: 鄭思雯
分享到:

  i黑馬&黑智 | 李夜

  人工智慧技術怎麼解決問題,怎麼落地行業,如何實現商業化?

  每一個AI公司都無法回避這三個問題,尤其在資本寒冬的背景下。私募通數據統計顯示,2019上半年共有1190支基金完成募集,同比下降47.2%,新募5729.56億元,同比下降19.4%。2019上半年,中國股權投資市場投資案例數為3592起,投資金額為2610.91億元,分別同比下降39.1%和58.5%。同時,平均投資額下降至0.94億元,同比下跌25.4%。新冠疫情之下,若2020年的數據公佈,只會更慘。

  “在整個資本寒冬的情況下,大家更看重你是否有這樣的能力去賺到錢,去商業化。

  這就倒逼AI公司的短期目標和長期目標必須統一兼容。儘量把產品商業化到客戶那堨h,以客戶為導向。”一覽群智CEO胡健告訴i黑馬&黑智,“有技術同時又有商業化落地能力的公司,能夠活下來。這種公司最終將得到資本青睞。瑞雪兆豐年,活下來的、熬過這個冬天的公司會得到更多資源,而且發展得更好。”

  但落到每一個具體決策上,如何實現短期目標和長期目標的統一和兼容?如何在限制之下做決策?

  胡健認為要從公司本身出發,不同階段的公司優先級是不一樣的。幾年前,AI公司融資很容易,“資金很充裕”,應該跑馬圈地。現在,AI公司被呼喚回歸理性和商業本質。這意味著,商業公司要做出選擇,第一選擇一個有痛點、有錢且有成長空間的市場。“市場選錯了,就像男怕入錯行,入錯行,再怎麼掙扎,你也不會是一條大魚。永遠是條小魚。”

  其次,找到市場切入點,把事情做完。把事情做完之後,再考慮人效和標準化程度,看看能否複製。回歸商業本質,核心問題是“你要有收入和利潤。”“不同階段,優先級不一樣。可能在某一階段,你可以先做收入,但長期來看,還要做利潤。”而持續的利潤和更高的收入需要決策者做出截然不同的決策。比如一個年營收10億元的公司做一兩個行業或許就可以了,若要做成百億營收,則需佈局更多的行業。另外,高利潤對於核心競爭力提出更高的要求。

  “創業是一個非常動態的過程。”胡健說,“不同階段,側重點或者調整參數是不一樣的。”

  產品設計與認知智能

  2015年11月,一覽群智成立。創始團隊在微軟亞洲研究院有著深厚的技術實力積累以及場景挖掘能力。首席科學家文繼榮在一次在採訪中表示,“我自己一直在做互聯網大數據,有時候覺得幹嘛自己不做一個公司。不去試一試太可惜了。所以和朋友創立一覽群智,對我來說,還是比較自然的。”

  有媒體將一覽群智比作“中國版Palantir”。文繼榮認可這一說法,但強調一覽群智更看重技術,有更為深厚的AI基因。一覽群智用智語、智慧、智圖和智策,構建了從感知、理解到分析到決策的閉環。一覽群智為什麼打造這四大產品?背後的邏輯是什麼?

一覽群智胡健:先成為頭牌 再造AI軟體生態

  有一點可以肯定的是,這四大產品不是一覽群智團隊拍腦袋拍出來的,而是他們在解決問題的過程中,發現這幾個產品是必須要有的。比如數據,一覽群智做銀行場景、政府場景的時候,發現最大問題是數據的信息化程度有限,“70%以上的數據都是非結構數據。”解決問題,先過非結構數據這道關,否則分析和決策就無從談起。

  如何處理非結構數據?在公安場景,一覽群智如何從一堆文檔堜漼出人、地、事物、組織、機構、案件等最重要的信息?這需要先定義,再構建不同的信息抽取工具,才能從大量的非結構化數據中抽取所需要的信息。其次,抽取的信息還需與已有的結構化數據融合在一起。因為兩數據的信息密度是不一樣的。非結構化數據,準確度低,需要被清洗。

  這個過程,會碰到消歧問題。還會遇到圖數據庫的問題。比如大學畢業生小陳將戶口從A市遷到B市,數據庫婸搨n加一條新的籍貫信息。但是傳統數據庫無法支持新字段隨時加進來的情況。但圖數據庫可以,圖數據庫還可以做關係性推導,推導出不同的人之間的關係。“我們發現,某種程度上,它跟知識圖譜的概念、推理關係是一致的。我們需要一個知識圖譜的構建工具,所以有了智圖。”胡健說,“解決了抽取問題,把非結構化數據結構化。圖數據庫加上知識圖譜解決了構建問題,然後人機協同,幫助決策。”

  總的來看,一覽群智,基於自然語言處理的知識挖掘、文本挖掘平臺,將大量非結構化數據轉化為結構化數據,基於結構化的數據,構建人、地、事物、組織之間的關係知識圖譜,提供人機交互的可視化分析引擎,讓知識與人直接銜接,最終與行業場景銜接,打造行業決策引擎。

  而這背後更大的技術邏輯是人工智慧即將邁入認知智慧技術時代。一覽群智團隊認為,未來是增強人工智慧,是人與機器協作。“利用機器超強計算能力、存儲能力、加上分析推理能力,與專家經驗銜接來創造價值。”胡健說。

  動態變化的產品化率

  目前,一覽群智的產品化率約為70%。這意味著一覽群智需要針對不同場景下的不同企業做定制化的調整。“,初期,我們跟用戶A共創,A提了十個方向,根據通用性與痛點,我們選擇幾個方向,把產品做好,然後拿著這個產品從A賣到B、C、D,這個過程中,定制不斷減少,定制化程度不斷降低。”

  比如在銀行場景,一覽群智找到的一個大的、通用需求是審單。審單產品可以用於國際結算審單,外匯審單,票據審核等。隨著審單產品落地越來越多的場景,該過程是一個不斷完善的過程,“越到上面越貼近用戶,越豐富,越往下走,不斷地抽象。”

  胡健提到,一覽群智聚焦在某些行業的、具體的產品和解決方案堙A其目的是儘量減少客戶的定制化需求。這是從落地可行性的角度去考慮的。“每次去用戶那堻ㄜn定制30%。其實,難度很大。為什麼?這不是30%的難度問題,而是對於行業的理解問題,我們要花很長的時間去理解客戶的行業,要花很長的時間去幫客戶出一個解決方案,要花很長時間,把解決方案變成一個能夠Work的產品。甚至,我們還要去驗證產品是不是有效。整個週期會變得非常長。”

  據了解,一覽群智的組織結構中,有基礎研發部,負責技術組件的研發和維護。在技術組件的上層,是針對行業場景,利用技術組件打造的產品解決方案,因此也有政企事業部和金融事業部,“在具體的行業,業務部門用組件做產品,用戶可能無法感知你的技術組件,但他必然關心你是否幫我解決了問題。”

  但以上仍有兩個重要問題沒有被回答。第一,70%的產品化率是如何形成的?第二,一覽群智落地的場景愈加豐富,產品化率又將面臨什麼樣的變化?

  70%的產品化率是動態形成的。在做同一場景的不同客戶時,在修改;在做不同場景的時候,也在修改。這是一個漸進過程。“70%也許永遠停留在70%。這是因為不同行業的差異還是很大的。你做得行業越多,就會發現越往下,底層的東西,甚至不是四層,會變成五層、八層,而越往上,則不斷細分。直到哪一天,你做了十個行業,發現萬事萬物皆出於這幾個組件,但這個時候,標準化層次可能就不是70%了,可能變成50%,甚至比50%更低。”胡健提到。

  “70%不是一個絕對數字。”現階段,一覽群智主要落地兩大場景:金融和政府,胡健認為“70%是能夠解決的。”但當一覽群智做得行業越來越多,產品化率可能無法達到70%。“越來越多東西是沒法通用,可能還要往下沉。最後的產品化率可能只有50%,但這個50%是完全不一樣的。應用層以下,分層會越來越多,而現在只有三層。”

  寫過程序的胡健用“面向過程”這個概念解釋這一產品化率的變化過程。公開資料顯示,胡健先後在微軟亞洲研究院、雅虎北京研發中心、騰訊從事搜索和廣告核心算法研究和研發管理。接任一覽群智CEO之前,胡健是36氪的聯合創始人,先後擔當36氪CTO、鯨準總裁等職務。

  何為“面向過程”?據了解,一般的面向過程是從上往下步步求精,所以面向過程最重要的是模塊化的思想方法。“寫程序就是,我看到一個問題,從頭寫到尾,寫到一個函數堶情C寫出來之後,發現在多場景之下,有些功能可以封裝成一個類……

  問題在於這個函數或者組件被人使用的次數,被人使用得越多,大家對你的要求越來越高。你不斷地把它做得更通用。如果只有一個客戶,不用分層,一層就夠了。但當你有一萬個客戶的時候,產品會因不同用戶的需求變得越來越複雜,層越分越多,越分越細。”胡健強調,這個過程,越分越細並不意味著降低標準化,相反地,標準化程度越來越高。“

  落地場景與完全信息

  採訪中,胡健向i黑馬&黑智講了一個場景落地的故事。這個場景是金融行業中的國際結算業務。

  國際結算業務不是銀行的最核心的業務,但是業務量大,每年有幾百億元的收入,而且痛點足夠痛,該業務要求審核人員看得懂英文,看得懂合同,是相關專業的碩士。銀行一年需要付給一位審核員20、30萬的工資,而且還不一定可以留得住人。

  於是,一覽群智便和某銀行一起打造該業務的解決方案。期間遇到了很多困難,比如幾萬種不同格式的票據,甚至還一些票據有遮擋,怎麼樣將票據變成文本結構化信息?這就牽涉到識別OCR、識別票據等。這需要對不同非結構化數據做OCR。其次,識別完之後,需要抽取信息、分詞等。這個階段,一覽群智要給出各種字段,識別合同內涵,比如這份合同講的是一件什麼樣的事情?通過報關單上的“無破損”描述判定物品“外觀完好”等;第三,一覽群智還需要解決語義理解的問題。其中還會牽涉到知識圖譜。別無捷徑,通過大量的數據讓機器學會具體的審核邏輯。

  “邏輯很簡單,像人做一些腦力勞動的工作一樣,首先能夠看得懂是什麼,將圖片變成文字,並將文字變成結構化信息,再把結構化信息跟專家業務產品銜接,這就是知識圖譜,最終去做決策,這是標準的認知過程。”這個過程中,胡健提到針對不同行業,構建一個類似于專家的規則系統,有一個與或非的邏輯。“這個規則系統要被抽象得非常靈活。規則系統與知識圖譜結合的過程中,漸漸地被抽象成一套模具工廠;原來的知識圖譜只適用於單一的業務場景,當它應用於不同類型的場景,就被進一步抽象。每抽象一下,能解決面臨的多場景或者多業務的問題。但突然又來了十幾個不同場景,就會發現原來的知識圖譜或者規則系統還是有問題,那就需要再次抽象。這就跟達爾文的進化論一樣。適者生存,不斷進化,滿足不同需求。如此,產品越來越好用。”

  如何沉澱專家經驗?如何構建規則系統?以公安領域的反洗錢為例,一覽群智有著類似的實踐。一般反洗錢偵查中,警察會查一查大的進出口資金的流向,設置一些規則,篩選出現金流出的TOP10的帳戶,並過濾掉正常帳戶,剩下幾個只進不出的黑洞帳戶,或者進出一致的通道帳戶。順藤摸瓜,就能找到背後的主使者。一覽群智將這些專家經驗配置到模型工廠堙A把所有數據變成因子,變成與或非,或者決策分析的因子,然後拼出一個決策樹。一個決策樹就是一個經驗。規則系統的建立加上專家經驗輔助決策,才能夠產生化學反應,讓普通民警具備經偵專家的能力。

  據公開資料介紹,一覽群智落地的領域除了金融行業,還有公共安全和媒體情報。在這些領域,一覽群智有專門的專家團隊解決行業know-how問題。一覽群智的商業化戰略一直在碰撞中,“為什麼人工智慧落地難?因為要不斷碰撞。首先先用邏輯篩選一遍,這個邏輯是技術的邏輯,是商業的邏輯,也是與客戶業務相關的邏輯;其次,這些邏輯都符合,才有可能產生10個商業可能性。拿給客戶,被斃掉9個,只剩下1個,那就先做。”

  上述案例,有一個不可回避的前提是:目前人工智慧的技術限制。現階段,人工智慧只能解決一些偏重復式的工作。前面提到的國際結算業務便是偏重復式的、相對閉環的場景。在閉環場景堙A一覽群智可以知道所有可能的情況。這和張鈸院士提到的人工智慧落地的幾個經濟中的完全性經濟有相似之處。

  而在公共安全領域落地的案例,與國際結算業務相比,與人機協同相關,更加複雜。在一個大的任務堣H的腦子有限、計算能力有限、存儲能力有限、加工處理能力有限,而機器可以做這些工作。胡健指出,所謂“機器”指的是“把一些大容量的數據全部整乾淨”。機器弱點也是明顯的,它無法做出判斷。機器只能對一些已經出現過的,並生成技能樹的相關情況,做出判斷。比如找出涉嫌洗錢的嫌疑人,但這不是最終判斷。人會看一下為什麼會認為他有嫌疑?機器的建議再加上人的經驗和知覺,做出最終的判斷。人是有常識的,但機器不知道這些。這些常識需要長年累月的積累。

  “我們必須遵從人工智慧現階段的技術發展特徵,找到最適合的方式去落地。”這是一覽群智的落地思路。“我們儘量做一些確定性的、相對封閉的、完全信息的場景。而且這個場景的數據又是準備好的,且解決完之後,又能夠產生商業價值,有諸多前提。層層限制之下,真正適合AI落地的領域並不多。沒辦法,圈了一下,就這麼多。這也是AI公司扎堆落地的原因。”

  要做AI時代的軟體“特斯拉”

  “本質上,一覽群智也是一家軟體服務公司。”胡健說。

  “為什麼說是一家軟體公司,就要像微軟一樣,給客戶一張光盤,客戶直接裝就得了。Office辦公軟體可以適配不同種類的機型。這樣,毛利率才能巨高無比。才是一門好的生意。”而一家好的企業服務軟體公司的標準是較低的客戶定制化比率、較高的毛利率。“我們希望通過儘量提高標準化的比率,降低客戶化實施的成本,提升業務率。這是2B公司的商業邏輯。”

  在AI時代,這個邏輯沒有變化。在整個軟體產品上,AI可能只佔到20%。大量工作是數據治理、數據融合以及數據通路的打通和反饋。這些都是工程。AI只是其中的20%,是蛋糕上最漂亮那一塊。雖然AI是核心,但整個軟體產品還是要幫客戶解決問題。“不管怎麼強調AI,還是要幫客戶解決問題,要麼幫客戶有大的提升,要麼幫客戶多賺錢,否則為什麼要買你的產品。”

  在AI時代,胡健認為,AI是思想,是方法論。

  “我們做AI的東西,本質上是給別人做信息化軟體。幫助客戶提升運營效率。客戶不關心我們做的到底是AI還是其它。但AI可以改變用戶的整個體驗,可以解決非AI技術無法解決的問題。”為了說明AI的革命性,胡健舉了特斯拉的例子。他認為燃油車做不出特斯拉,因為傳統車商的底層邏輯與特斯拉截然不同,一個是電和數字化,一個是油和機械化,中間橫貫著跨時代的差異。“和傳統軟體公司,我們正在做的是AI時代的軟體‘特斯拉’。”

  不過,AI時代的軟體服務商和傳統軟體公司的關係不是替代關係,而是合作關係。

  胡健又舉了雲計算公司和傳統軟體公司的例子。“上雲是大趨勢。企業要上雲,傳統軟體公司沒有能力做這一塊業務,於是,雲計算公司告訴傳統軟體公司你應該用我的能力,我是不搶你的飯碗,而是我們倆聯合起來服務客戶。為什麼?因為雲計算公司不懂客戶需求,但傳統軟體公司天天和客戶在一起,知道客戶的需求,可以提供的一堆上雲的組件,服務客戶上雲,但雲計算公司歸根結底是賣服務器的。”

  未來,按照胡健的設想,一覽群智將變成一個AI賦能公司,並搭建自己的AI的軟體生態。屆時,一覽群智將和不同領域的傳統軟體公司合作,傳統軟體公司做交互軟體,一覽群智做AI層和接口。“因為應用我做過,我直接跟你對上去就行了。這個是我認為是最合理的邏輯。”據悉,去年6月,一覽群智與浪潮集團、天陽科技、中信網科簽訂戰略合作協議。在搭建自己的AI的軟體生態之前,一覽群智先嵌入別人的生態,並努力成為其中的頭牌。

一覽群智胡健:先成為頭牌 再造AI軟體生態

一覽群智CEO胡健

國際在線版權與信息產品內容銷售的聲明:

1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。

2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。

3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。

已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。

任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息產品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此產生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。

4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。

5、如因作品內容、版權和其他問題需要與本網聯絡的,請在該事由發生之日起30日內進行。